彭博社：百度机器读图新进展能够回答人类提问

来源：中国新闻网作者： 2015-05-26 14:21:00

【字号：大 | 中 | 小】

【背景色

】

中新网5月26日电据彭博社报道，5月21日发表在康奈尔大学文库ArXiv的一篇研究论文论述了一种人工智能系统，这种系统能够学习识别图片细致的视觉特点以及与之相关的文字，进而将二者整合为词典收录在数字大脑中，这样即使系统并未见过一些图片，在回答与图片相关的问题的时也可以迎刃而解，这表明：人工智能目前已成功迈过婴儿期，能模拟学步儿童的智力。

据悉，这项研究由中国互联网搜索企业百度的专家们与加洲大学洛彬矶分校(UCLA)的在校生组成的团队联合开展。百度研究小组的杰出科学家徐伟称：“我们的目标是让电脑对语言以及现实世界的经验进行关联。这对解决常识推理问题至关重要。”

《彭博》亲自测试了百度与UCLA研发的系统，将一个小桔子放在手掌上拍了张图片，然后将图片发送给百度，并提出了问题：“我手中是什么？”软件回答称：“桔子”。

来源：彭博社

这次进步听起来虽小，但是要让计算机学会识别图片中的内容再将之与语言关联起来，事实上是十分困难的事情。这项研究涉及许多学科，而这些学科近期才开始融合。凭借该领域的进步，百度未来可以检索数百万张图片，从中找出哪辆大众巴士的车胎漏了气，或哪个碗里有七个桔子。

百度与UCLA取得的进步虽说重要性不言而喻，但远非完美。该系统还不能连续处理多个问题，比如篮子里有几种水果然后再数一数有几个苹果此类的问题。论文显示，测试中电脑给出正确答案的成率功只有64.7%，而人的成功率有94.8%。徐伟称：在当前阶段，系统还无法正式应用，错误还很多。”但是人工智能发展的速度越来越快，前景可期。自2010年名为ImageNet的大型图片识别挑战开始以来，短短几年，电脑识别物体的出错率已下降4倍。

百度在人工智能领域频频发力，也是看重其未来可应用于多个领域。徐伟称：“未来，这一研究潜在的应用领域就包括教育和移动图片搜索。”畅想明天，人工智能可以进行授课，比如问问学生他们父母周末在动物园里拍回的图片里有哪些动物。

此前，德国马克思普朗克信息学研究所、加洲大学巴克利分校、多伦多大学等多所全球著名大学以及微软等技术公司的研究员们也曾做过早期的尝试，而百度和UCLA取得的成果，让这一领域的研究前进了一大步。

关键词：彭博社，ArXiv，ImageNet，读图，桔子，人工智能，UCL

>>>更多精彩内容请进入数码频道<<<