返回列表 发帖

[IT动态] (zz) 验证码——原来大家都是小白

老网民们大概都记得,刚开始上网的时候,是不存在验证码(captcha)这么一种东西的。
这造成的结果是,垃圾评论和垃圾邮件可以轻松通过任何一个网站的注册程序,通过各
种方式轰炸人民群众的眼球。


    最先想要解决这一问题的是雅虎——作为互联网时代早期最重要的免费邮件提供商
,他们一方面要解决用户们每天遇到的数以百计的垃圾邮件轰炸,另一方面,他们自己
的免费邮箱,恰恰又是垃圾邮件的最爱——耗费无数资源所阻止的垃圾邮件,都来自于
自己的服务器。这让雅虎开始认真考虑如何解决人机辨识问题。

    他们找到一位当时刚刚21岁的天才——Luis von Ahn。 而Luis Von Ahn给出的方案
,就是这个让人民群众微微皱眉,但是让计算机耸肩挠头的验证码。计算机辨识技术还
很落后,对于经过扭曲、污染的文字,无法辨识。而人类却可以轻松认出这些文字。这
是一个简单而巧妙的设计,计算机先是产生一个随机的字符串,然后用程序把这个字符
串的图像进行随机的污染,扭曲,再显示给显示器前的人或者机器。凡是能够辨识这些
字符的,即为人类。

    故事还没完,Luis Von Ahn是那种追求完美的科学家。当全世界数以十亿计的人每
天都会浪费几秒钟的时间参与辨认文字这一简单活动的时候,他开始思考,其中浪费的
人脑智力是否能得到更好的应用呢?Luis Von Ahn的最终设计是,让人们用这些脑力解
决一些计算机无法解决的“图书数字化”。

    在计算机时代以前,印刷术已经存在了数百年,但这些印刷术所产生的书本和报纸
等等,对于计算机来说都是模拟信号,仅以图像的形式存在,而非以数字化的形式存在
。但是,早期的印刷术并不精确,文字大小不一,形象有差别。而且因为印刷品年代久
远,拥有各种细微的缺损和污染。这对人眼来说不是什么大问题,但对计算机来说就麻
烦了。

    因此,2002年,luis Von Ahn开始让captcha引用各种无法被计算机辨识的文字图像
,目前,已经有上万网站采用他的新一代captcha。每天帮助辨识数以百万计的古老文档
。问题在于,对于最初的capcha来说,计算机实际上是知道答案的。而Luis希望人们辨
识的文字,计算机实际上是不知道答案的,那如何能验证返回的答案到底是不是真的呢


    解决这个问题的方法依然体现了Luis一贯的简洁和优美,他让人们每次辨识两个,
而非一个验证码,其中一个来自于计算机随机生成的字符串,而另一个则是从文档中选
取的计算机不认识的字符图像。只要人们对前一个字符串给出的答案是正确的,那么就
判定,人们对后一个验证码的辨识是正确的。

    用这一方法,luis的captcha2.0 已经帮助完成了整个纽约时报130年的报纸存档数
字化——这一本可能花费无数时间和资源的工程,在几个月之内就由各位网友们完成了
生当做明狼,死亦葬墨香
鲜花鸡蛋赠送记录

哇,太牛逼了!。。。不过最后一个办法,那要是大家都知道了第二个无所谓,就随便填,麻烦了,。。。继续改进!。。。譬如,随机哪一个是真哪一个是假。。。
哥浪的不是股,是风流。。。得大法者,亦须有大力行之。。。扰攘市井,不如闭宫自乐;口水是非,轻挥赤松拂尘;行事处世,贵在行知合一;缘来缘去,妙在顺其自然;花开赏花,能执唯有当下;秀峰美水,随意停车坐爱。。。
“用这一方法,luis的captcha2.0 已经帮助完成了整个纽约时报130年的报纸存档数
字化——这一本可能花费无数时间和资源的工程,在几个月之内就由各位网友们完成了”

牛人啊。原来我们每天浪费在验证码上的时间并非完全没有意义的。
ft,被实验了。。。
长知识了:o
原来这是他的典故的。
好厉害哦,这样子做节省了多少人力物力财力啊~~
国内也有很多公司专门做验证码的,不过用验证码来帮助图书数字化,目前还没见着
果然是天才啊
learning>>>>>>>>>>>>>>>>>>>>>>>>>>
绝不和进行人身攻击者争论,我的一条纪律。避免进行人身攻击的最简单方法是就事论事。
"一个来自于计算机随机生成的字符串,而另一个则是从文档中选
取的计算机不认识的字符图像。只要人们对前一个字符串给出的答案是正确的,那么就
判定,人们对后一个验证码的辨识是正确的。"

这句该怎麽理解?是说能认出随机字符串,就能认出更难的只有人眼能辨识的字符图像?这能100%正确吗?要是第二个我手误写错了,可是计算机又不知道,那就错着录入了?
长知识了,
好厉害
赚大家的流量以及排除那些不诚心好论坛的人,我的想法
奇怪的知识又涨了
又涨奇怪的知识,
好厉害
哈哈哈,真没想到,验证码原来是这样的
返回列表