王小川:当机器真正掌握语言,这世界会变成怎样?
中新网10月10日电 昨日,由《哈佛商业评论》主办的“甦盛典?新商业TALK2018”在北京举办,《哈佛商业评论》主编何刚与场景实验室创始人吴声对“长期主义”进行了全面的阐述,而搜狗CEO王小川对强人工智能到来的预言则把会场气氛引向高潮,他认为,“语言是人工智能皇冠上的明珠,当语言真正被机器掌握的时候,强的人工智能时代就到来了。”
在嘉宾介绍环节,作为主持人的吴声称王小川是“人工智能领域深耕者,却也有着朴素的生物智慧。”此次演讲中,王小川分享了“搜狗在人工智能、新物种模式下做的思考和探索”。
以创新驱动AI技术落地,掀人工智能时代的翻译革新
“人工智能已成为一种新的物种,从智能手机到音箱、机器人、同传、翻译、无人驾驶、无人超市等。”在互联网领域工作十九年,王小川对人工智能新模式有着自己的思考。他认为,在人工智能新模式中,围绕语言的AI创新是兵家必争之地:智能音箱大战如火如荼,会打电话的AI、会辩论的AI……语言“黑科技”正在不断升级。
王小川与现场观众分享了《圣经》中巴别塔的故事:人类希望通过建造一个通天塔来与上帝对话,上帝却认为建造通天塔是藐视他的权威。因此上帝让不同民族的人开始说不同的语言,通天塔计划因此失败。他认为,语言是人类在思想交流、沟通合作中最关键的环节。因此,搜狗的AI战略从语言切入。
王小川以搜狗的输入法和搜索为例,“搜索引擎需要通过语言获取信息,输入法需要通过语言来表达信息。”在搜狗“让表达与获取信息更简单”的使命下,翻译成为重点突破领域。
翻译的历史要从阿拉伯百年翻译运动说起,“这场翻译运动,将当时被纳入阿拉伯领土的希腊、罗马的文献翻译为阿拉伯语。不仅让阿拉伯的统治政权更加稳定,为其民众带来更多的文化养分,也带来了前后五百年黄金的盛世。这是跨语言文化交流的意义。”
百年来翻译技术不断发展,二十世纪七十年代首次出现基于规则的机器翻译,四十余年的技术迭代间,从SMT统计机器翻译系统到2016年上线的神经网络翻译系统,机器翻译的效果显著提升,王小川说,“随着人工智能的发展,机器翻译将取代或者扩展每个人的外部能力,在这个过程中,我们首先想的不是怎么赚钱,而是有机会参与人类文明发展进程。”
不管是出国旅游、学习,还是参加高大上的国际会议,语言不通是一个令人头大的问题,而搜狗翻译技术正解决了这一问题。2016年,搜狗与清华大学联合建立了天工研究院,对AI翻译技术进行更多的研究与应用;2017年,搜狗发布全球首次商用基于深度神经网络的同传翻译技术。目前,搜狗已经能做到61国语言的互译,并且在2017年国际赛事WMT中获得第一名。
同时,搜狗从软件到硬件都取得了落地成果,王小川介绍道,“一方面,我们在输入法、搜索中融合进翻译功能,让用户能直接通过中文,简单地跨国表达和获取信息;另一方面,翻译APP、搜狗翻译宝pro等产品的发布,也补足了学习、会议、旅游等场景下对翻译的大量需求。” 以前的翻译软件,只能通过文本进行翻译,而生活中存在大量图片、语音中需要翻译的内容,使翻译过程效率低下,搜狗翻译不断革新,目前已具备文本翻译、语音翻译、对话翻译、拍照翻译、文档翻译等多种形式。
AI拓路者:搜狗AI走向虚拟个人助理
翻译技术不断创新的背后,是搜狗以语言为核心的自然交互和知识计算的AI理念。王小川解释道,“围绕语言为核心,使得人机交互更加自然,让机器更加聪明,能够对网上的知识进行计算,我们称为‘自然交互’和‘知识计算’。”
“在人机交流过程中,更难的是理解语言承载的知识和概念,这就是知识计算。” 知识计算板块,搜狗从翻译、问答、对话三个方面发力,推出搜狗翻译APP、搜狗翻译宝pro、搜狗立知等软硬件,王小川说,“我们希望让搜索升级为问答,输入法走向对话,通过翻译连接华语世界与全世界。”
自然交互板块,搜狗在语音、图像方面已取得阶段性成果。不仅拥有中国最大的语音输入引擎——搜狗输入法,中文的语音识别率已经做到了98%,日均语音输入调入次数峰值达到4亿次,还拥有多项“黑科技”成果。大会现场,王小川“唱起了”庞麦郎的《我的滑板鞋》,当然不是现场真唱,而是向观众展示了由自己的语言数据与歌曲相结合生成的王小川版《我的滑板鞋》。该技术来自搜狗语音合成,“通过搜集少量声音素材,就可以生成具有这位说话人特色的合成音色。”
这还不够,紧接着,一条以“甦盛典?新商业TALK2018”为内容的新闻视频让观众感到震惊,竟然这么快就出新闻了?原来这是搜狗的另一项黑科技——“虚拟主播”技术,仅需向虚拟主播输入文字,即可生成主持人播报新闻的音视频内容,与真人播报无异。
在自然交互和知识计算的融合下,王小川表示,“未来,搜狗的目标是实现虚拟个人助理,实现人机交互,提供更优质的服务。”