今天是“国际盲人节”,自1984年设立至今,包括我国在内的世界各国都会为盲人群体举办各种活动,以体现对他们的关怀。今年的盲人日前夕,百度推出的DuLight(百度小明)展示了用科技改变盲人生活的创想:在一片黑暗中,只有靠触摸才能感知世界的日子或将过去,“一个24岁面带微笑的女性”“一把漂亮的红色椅子”“100%纯果汁”……借助这双科技的眼睛,生活中的物品、场景从图像转变为语音,帮助盲人朋友越来越清晰地“看见”这个世界。
>>背景 将盲人生活需求转化为推动力
早在2007年,百度公司便推出百度盲道:一个为方便视障人士上网阅读信息、参与社区互动、听歌、访问互联网上其他相关网站的特殊入口。在这项功能中,百度新闻搜索、百度网页搜索、百度MP3搜索、百度贴吧、百度知道、百度百科、Hao123网址导航这7项主要搜索服务升级为盲道版,在页面设计等方面充分考虑视障人士的需求,方便他们使用。
2013年,盲人开发团队的负责人曹军致信百度CEO李彦宏,希望得到百度的资金和技术支持,开发一款盲人读屏软件。在百度团队的帮助下,曹军的公司成功研发出了帮助盲人使用手机的读屏软件。
在和盲人的接触中,百度公益的工作人员发现了譬如人民币不容易通过盲文识别、不能分辨包装大小相似的药盒等更多的制约盲人日常生活的问题,希望通过科技和人工智能得以解决。因此百度公益联合百度研究院、IDL深度学习实验室,将这些盲人实实在在的生活需求转化为推动力,试图通过图像识别、大数据等技术,打造出一款专门服务于盲人的硬件。
努力没有白费,今年9月8日,百度推出了DuLight,展示了百度用科技改变盲人生活的创想。技术的进步为DuLight的诞生提供了基础,除了原有的独立手机端应用,DuLight加入了轻量级的新型硬件,成功完成向全系列盲人个人助理操作系统的转变。至此,它将作为盲人新的生活助理和新的搜索服务的发起入口。
>>功能 打造盲人的日常生活私人助理
依托“百度大脑”的图像识别、人脸识别、语音识别以及深度学习等相关核心技术,DuLight被打造成盲人的日常生活私人助理,帮助盲人朋友了解身边的环境、进行物品识别、人物辨别,以及钱币识别等。除此之外,它还可以协助盲人在紧急或特殊情况下发起实时的远程视频协助。
面对纯牛奶和果汁等无法通过触摸辨别的商品,通过DuLight的图像识别功能,只需对准物品、进行拍照操作,DuLight便能够准确快速地将物品信息传递给盲人;纸币大小差别不大,盲文又不够清晰,弄不清手里到底是多少钱,通过图像识别功能,即使只扫到钱币的一角,DuLight也能准确地报出钱币的面值,帮助盲人朋友购物付款;老朋友已经走到面前却不知道是谁,很难通过声音辨别对面的陌生人的大致年龄和身份,这些困扰在DuLight的帮助下都可以顺利解决。
而在一些复杂的场景中,例如独自在家时需要找到特定的药品或需要在路况复杂的地段过马路时,盲人朋友总是无所适从,而今,通过DuLight,可以一键发起远程视频协助,寻求朋友的帮助,提供帮助者在接受求助后,将获得盲人朋友同样的视角,实时语音协助解决问题。
除此之外,在产品设计上,通用型界面设计与界面辅助工具相互配合,便于视弱群体更好地辨识屏幕上的文字与图像。DuLight还实现了盲人友好性语音的交互命令与对话,根据用户需求和语言命令执行对应的功能,为用户提供可调节的语音播报速度,人性化十足。触摸式硬件功能识别的工业设计也使得硬件外观的纹理设计更加合理,便于盲人通过触摸调整取景角度。
据百度企业社会责任经理卢健介绍称,DuLight目前仍处于初期研发阶段,后期将通过不断的迭代加入更多先进的技术和功能,以便更好地为盲人群体服务。
>>揭秘
1.图像识别
图像识别技术是指,通过电脑辨识图像内容并提取语义信息的过程,典型的任务包括物体识别、物体检测、图像分类标注等。它在图像类数据的智能化分析管理中扮演着至关重要的角色。
百度通过长期的努力,已经构筑了一套比较完整的图像识别系统,除了能够有效地处理特定物体的检测识别(如人脸、文字或是商品),还实现了图像的分类标注、图文综合理解的对话型识别,以及主观图像质量评估等应用。
2.人脸识别
人与人之间大量的互动让人脸识别成了最为实用的图像识别细分领域。相比于无领域限制的图像识别,聚焦在人脸上的识别技术显然能够做到更加精准与高效。
百度现有的人脸识别技术已经具备了很强的识别用户的能力,这项技术可以对用户的性别、年龄、面部表情等特征进行辨识,还可以区分不同的用户。
3.语音识别
Dulight采用领先的DNN声学模型,使得语音识别更加精准。基于大量语言模型建立起来的语音识别系统,能够实现更好的人机互动。海量文本语料做基础,同时对文本库进行实时更新,提升语音识别的效率和质量。 (于文)
[责任编辑: 李振]