探秘科大讯飞:人工智能比你想象的来得更快

作者:钱丽娜 | 发表时间:2017-07-06 15:31:55 0 条评论

  在中国,要证明“我妈是我妈”可是个解不开的死结。若是子女与父母不在同一户口簿上,简直不知道从哪里下手。科大讯飞在智慧城市的解决方案中利用声纹和人脸识别技术,尝试打通公安、民政、社保、教育等58个部门781类数据,只要刷脸听音,就能证明你和你妈之间具有血缘关系。6月2日,《商学院》杂志、中国经营者俱乐部带领企业家会员走进科大讯飞,全方位地感受人工智能在各领域的应用和突破。企业家们在惊讶之余,猛然意识到未来已来,再不跟上人工智能的脚步,即将面临被淘汰的风险。

  《伪装者》中曾经有这么一句话,如果一个特工的背影和声音被人记住,你不是让对方消失就要让自己消失。

  每个人的声音是如此独特而又有趣,这促使科大讯飞创始人刘庆峰从1999年开始带领团队攻克声纹难题。

  今天,当你走入科大讯飞位于合肥的园区,在展厅随时可以听到奥巴马说中文、罗振宇播新闻。你真以为高德地图中林志玲和郭德纲的声音导航来自本人?错,那是采用了科大讯飞的语音合成技术。只要采集到足够的语音样本,后台根据声纹特征,经过机器学习后便可以模拟任何当事人的声音特征,并达到以假乱真的程度。

  2000年以前,中文语音产业被微软、IBM等一众国际IT巨头垄断。科大讯飞自进入这一领域后发展迅速,2016年,科大讯飞在国际语音合成比赛中的中文语音合成分为4.5分,英文为4.2分,印地语为3.9分。在非常关键的自然度指标上,科大讯飞是4.2分,科大是唯一得分超过4.0的语音参赛系统。

  这是什么概念呢?5分是国家播音员的水平,4.5分达到省级播音员的水平。达到这一分值时,人耳已经无法分辨是机器发音还是真人发音。而4.2分的英文合成语音也战胜了微软、IBM、MIT等一众世界一流的高科技公司和研究机构。

  光有语音合成技术,也许人们尚无法深切感受语音智能是如何改变、影响我们生活的。在“走进名企”活动中,科大讯飞首次系统地向企业家们展示了人工智能技术在各个产业的落地实施情况。

  人工智能已经像互联网、像空气、像水那样潜移默化地成为我们生活中的一部分。

  一切源于语言

  《人类简史》一书中提到,人类认知革命起源于语言。而要让机器具备人类的语言能力,这一技术分为三个要点。

  一是语音合成。将任意文字信息转化为自然流畅的语言,给机器装上了人工嘴巴。

  二是语音识别。将语言中内容、说话人、语种等信息识别出来,给机器装上了人工耳朵。

  三是自然语言理解。对自然语言进行语义理解,给出适合的指令集合,给机器赋予人工大脑。

  试试这两句话:

  “爸爸没法举起他的儿子,因为他很重。”问:谁重?答:儿子。

  “爸爸没法举起他的儿子,因为他很虚弱。”问:谁虚弱?答:爸爸。

  科大讯飞市场总监任萍萍说,单这两句话中对“他”一词是谁的理解就相当于六岁孩子的认知水平。这是公司正在攻坚的“六龄童计划”,即让机器达到六岁孩子的语言认知推理能力。科大讯飞要实现的目标是让机器像人一样,不仅能听会说,还能理解思考,具备人类的思维能力。正是在认知智能领域的突破,科大讯飞获得Winograd Schema Challenge2016年比赛第一名。

  2014年8月,科大讯飞在传统人工智能(即感知智能)领域取得突破的基础上,结合承担的863类人智能重点攻关项目,正式启动“讯飞超脑计划”,研发基于类人神经网络的认知智能系统。通过对海量知识库的学习,建立语言理解能力、知识表示能力、联想推理能力以及自主学习能力。这里最难的是对自然语言的理解,国际上以通过各个国家的高考来判断人工智能的先进性。美国华盛顿大学图灵中心的目标是通过美国的生物学考试,日本则希望考上东京大学。目前科大讯飞的第一目标是达到“一本”的成绩,下一个目标是达到进入北大、清华的成绩。

热门文章
商学院微博
商学院二维码