您当前的位置:长城网>>数码频道>>焦点资讯

语音图像搜索方式趋热 精准识别度待提升

来源: 通信信息报 作者: 2015-01-30 09:53:00
【字号: | | 【背景色 杏仁黄 秋叶褐 胭脂红 芥末绿 天蓝 雪青 灰 银河白(默认色)

移动搜索仍在“一路狂奔”,语音图像搜索成为新方向。近日,2015百度移动搜索生态峰会在北京举行,会上发布了《2015年中国移动互联网发展趋势报告》。该报告显示,百度移动搜索保持高速增长,语音、图像搜索在增幅上超过了移动搜索的大盘,潜力巨大。

百度CEO李彦宏指出,“搜索引擎类应用开始进入语音时代”。移动时代用户需求在变化,要让服务与需求完美对接,语音图像搜索需要提供更加自然的人机交互,更加精准的识别理解能力,更加丰富的信息传递。搜索企业推动语音图像搜索走向成熟,仍需紧抓需求,勤修内功,创新服务。

语音图像搜索增速迅猛

语音、图像搜索技术在走向成熟,未来空间广阔。百度近日对外发布的报告显示,以语音搜索、图像搜索为代表的以新技术驱动的搜索方式,在增幅上超过了移动搜索大盘;此外,使用语音搜索和图象搜索人群呈现“低龄化”的特点。

目前,大多数互联网信息都是基于文本的,随着人工智能和深层次的学习不断转变技术,基于神经网络应用的“虚拟大脑”技术快速发展,其可以模拟脑细胞相互交流、影响,可以做到更准确地识别讲话内容,更好地理解一幅图片,而不需要依赖文字描述。现在,虚拟大脑技术进入应用阶段,语音图像搜索从中受益。

国外以谷歌、苹果Siri、微软Cortana为代表,对语音、图像搜索技术应用一直走在前列。谷歌眼镜作为代表性作品,就是基于更为直接的语音与图像搜索方式。Google对话式搜索技术能让用户如对话般不断搜索,搜索引擎基于上下对话来理解用户的问题,已经整合到Google Now和Chrome中。

国内也是成绩斐然。近日,百度获得的一项名为“交互性识别”的新专利或许可以改变整个人机交互,比Google对话式搜索技术要求更高。据了解,百度多轮识别专利,已应用在百度语音助手上,即将出现在手机百度之中。可以预见,未来多样化的搜索形态将使用户的生活更加的便利。

语音图像搜索受青睐

进入智能手机时代,社会朝着更为人性化的方向发展已成定律,语音图像搜索将众望所归。语音作为人类最为原始和自然的信息传递方式,具备高效性,满足最佳的人机交互体验。

语音图像搜索具有极大的功能性。一是满足更多生活需求,丰富移动搜索应用场景。智能语音可以成为智能汽车、智能穿戴等领域的“导流入口”,成为人与其它智能设备之间沟通的主要手段。而在生活和工作等领域,语音快速转化文字功能也将带来极大便利。此外,图像识别也可以催生“人脸”支付等应用场景。

二是满足特殊人群需要,为移动搜索带来新的用户群。2014年,智能机日活跃用户增长放缓,手机网民人口红利逐步消失。语音的非接触方式传播特点,使一些在视觉、触觉等方面存在障碍(如老年人、残障人士)或不适合(如儿童需要保护视力)的庞大特定人群加入用户群。百度首席科学家吴恩达表示,对于小孩和老年人来说,有时打字比较困难,如果能让他们使用语音搜索,就能够让他们使用方便的信息产品和服务。

智能手机的技术硬件以及语音、图像等软件开发,也为语音、图像等智能搜索提供保障。例如,智能移动设备几乎标配摄像头,这就为图像搜索提供了很大的想象空间。轻轻一按摄像头,图片搜索就能知道海报上的明星资讯,清楚心仪产品的全部信息。百度还推出过两款基于图像识别技术的APP——“百度识图”和“百度魔图”。智能手机的普及,为语音图像搜索奠定了巨大的发展潜力。

语音图像搜索的井喷式发展还得益于移动网络逐步完善。随着4G网络的普及,流量大大提升,为语音的长足进步提供了便利条件。海量的语音、图像库需要网络支持,大数据处理需要网络支持,语音图像辨识也需要网络的支持。

遵循需求驱动创新服务

2014年中国移动互联网用户已达8.75亿,语音图像等智能搜索将有很大的市场空间。李彦宏曾预测,未来五年,使用语音和图片搜索的请求量占比将超过50%,超过纯文字请求量。

语音图像为代表的智能搜索时代即将到来,但当务之急是提高其识别的准确性。识别度必然影响到语音图像交互的使用体验,对应用的丰富与发展起到重要作用。目前,语音识别面临三大问题。一是语音读取能力,搜索工具能否一次读取用户语音,重复多次的结果意味着这是失败的产品;二是去除噪声的干扰,这类良好的噪声过滤的实现需要搜索软硬件共同的努力;三是语音搜索工具的理解能力,其必须要满足对话搜索,对内容有解析能力,理解用户的问题。

现阶段,语音图像搜索可以从小应用着手,推广用户,不断创新服务。比如说语音搜索可以尝试语音翻译,玩转方言搜索等;图像搜索可以尝试拍照搜索同款购物比价,玩转人脸识别等。

市场的需求是技术革新的最大驱动力,以语音搜索、图像搜索为代表的融合了新技术的移动搜索方式发展不能脱离用户需求。报告预测,2015年移动需求缺口最大的将会是生活服务、教育培训和新闻资讯。针对这三个领域发力,适时引入创新交互技术,借助语音图片搜索方式抢占先机。搜索企业紧抓用户日趋多样化的需求,勤修内功,提高服务体验,这样才能走得更远。

关键词:移动搜索,谷歌,Cortana,人口红利,Chrome,图像搜索技

责任编辑:荧光

相关新闻