到底是Yanny还是Laurel?人工智能陪审团已经达成一致

yanny 还是 laurel

Yanny还是Laurel”这段Vocabulary.com合成的人工音频测试已经撕裂了美国,并且在全球引发巨大争议。一项统计显示47%的人听到了“Yanny”,53%的人听到了“Laurel”,而特朗普先生听到了“Covfefe”。

已经有多家权威媒体和专业人士对“Yanny还是Laurel”的音频从声学和人类听觉范畴感知层面进行了专业分析。大致解释了为什么不同的人、不同的场景、设备和状态会听到截然不同的两个单词。

但是有一个更加发人深思的问题尚未获得满意的答案,那就是在图像识别和语音识别甚至自然语言处理方面已经直追甚至超过人类的人工智能技术,听到的是“Yanny”还是“Laurel”?

套用用人工智能的行话,“Yanny和Laurel”有些类似对抗性样本(一种迷惑机器学习算法的“指鹿为马”的脏数据样本,被一部分人看作是人工智能的阿喀琉斯之踵),不过这次对抗的对象不是机器,而是人类。

另外一个开脑洞的问题是,在业界开始探讨人工智能是否可以高度模拟人脑处理机制的今天,如果人脑是可以被计算机精确模拟的,那么人脑是否也可以像电脑一样被Hack?换个角度发问,今天的AI人工智能技术面对”Yanny还是Laurel“是否也会像人类一样产生巨大分歧?

毕竟机器不存在年龄、体质、文化和范畴感知的差异,正如《西部世界》中一位程序员所言“我宁愿相信代码也不相信人话。”

近日,多家人工智能企业试图借助人工智能技术帮我们探寻“Yanny和Laurel”的终极答案。

其中自然语言处理技术见长的Nuance将音频输入Dragon语音识别平台后,机器给出的唯一答案是Laurel。另外一家公司Voxbone的软件并未成功识别出“Laurel”或者“Yanny”。

笔者测试了手边的谷歌翻译和Siri,二者都无法识别合成音频,其中谷歌翻译偶尔会听出”yeah“,大多数情况下对测试音频”置若罔闻“。

顶级人工智能技术一致判定是Laurel

Google Home、Alexa和微软Cortana并称三大人工智能语音助理,而三者对”Yanny还是Laurel“的判断惊人的一致。

PC端的微软Cortana几乎没有任何迟疑就判定为Laurel,而另外两大人工智能语音助理Google Home和Alexa的测试也取得了一致结果,二者都判断为”Laurel“。不过据进行该项测试的人工智能创业公司Vocalize.ai首席执行官Joe Murphy透露,需要对声音指向和发音间隔进行调整才能准确识别。

为什么三大人工智能语音助理一致判定是”Laurel“?这也许并非巧合,而是因为顶级人工智能语音助理对人类语音的识别算法有些类似,会将人类单词发音分解成细粒度的”音素“,然后根据音素的组合次序(以及语法和上下文)来判断具体的单词。

另外一家人工智能语音识别软件公司Sonix也做了一个类似的实验,将这段模糊的声音灌进 谷歌、亚马逊、IBM 沃森和自己的平台进行识别。谷歌和 Sonix 在第一次尝试中就获得了成功,识别出这个合成语音是“laurel”。

至此我们基本可以宣布,包括IBM沃森(可以在人类最顶尖的智力竞答游戏中准确听题并夺冠)以及Google Home、Alexa、Cortana人工智能助理三剑客以及Nunace在内的目前最顶尖的人工智能(语音识别)技术一致判定是Laurel,没有任何一个人工智能产品听到”Yanny“。

虽然我们还不能断言,”Yanny是对人类受到对抗性样本干扰后产生的幻听“,但是,”Yanny还是Laurel“带来了两个发人深思的问题:1.听不到”Yanny“是人工智能的优点还是缺点?2.如果机器在人类擅长的图像识别、语音识别等方面的判断精度和稳定性超过人类,那么AI是否会深刻介入维持人类世界中的正义、公平,例如司法证据判定、体育裁判?

第一时间获取面向IT决策者的独家深度资讯,敬请关注IT经理网微信号:ctociocom

   

除非注明,本站文章均为原创或编译,未经许可严禁转载。

相关文章:


关于作者

        在TMT领域具有十余年的咨询和创业经验。 目前主要关注信息安全,同时密切关注云计算、社会化媒体、移动、企业2.0等领域的技术创新和商业价值。拥有美国麻省理工学院MBA学位和清华大学经济管理学院学士学位,曾任BDA中国公司高级顾问,服务过美国高通、英特尔、中国网通、SK电讯、及沃达丰等公司。联系邮件:wangmeng@ctocio.com