关灯
护眼
字体:
《外星代理人》语音应用引爆在即
上一章 目录 下一章

语音应用引爆在即

2011/11/23

多年来,语音识别技术始终磕磕巴巴、欲语还休。 首发--无弹出广告(文字首發盡在讀書閣W)现在,Siri横空出世,将这项技术推向了主流,同时还带来了非常广泛的应用前景。

语音识别并不是什么新鲜事物。多年来,消费电子产品、汽车和自动呼叫中心一直就在“倾听”使用者的指令。从2009年开始,谷歌公司(Google)就一直在采录语音信箱的信息。而在此之前三年,微软公司(microsoft)也将类似的技术置入了echnologies)的助理总监。他正在开发一种互动仿真技术,用以帮助退伍军人针对创伤后紧张症(post-traumaticstressdisorder)寻求医疗咨询服务。这款软件名为SimCoach,它的最终目的是要设法理解人们口语背后的情绪状态。里佐称:“这是个十分巨大的挑战。因为必须采集语音模式,然后得像人类的大脑那样对它们进行分析。”里佐称,人类或许能察觉自己的好友或家人情绪异常,因为这时人们的语速往往会变慢,重音也更少,但电脑要捕捉这些信号可就相当困难了。

不过这个领域的有些研究却能更快获得成果,而不用再苦苦等待。去年春天,里佐的研究伙伴——麻省理工学院(mIT)教授阿历克斯?彭特兰在美国银行(BankofAmerica)的呼叫中心开展了一项类似的语音推断技术试验,旨在分析员工的沟通对业务成功的影响。彭特兰让员工连续六周在脖子上戴着小型电子设备,它们能记录员工的实际位置以及身体语言和声音。所记录的数据能显示这些员工是在和谁沟通,他们站着时与沟通对象距离有多远,谈话的语调如何。彭特兰称:“我们发现,效率最高的员工不光与大量对象交谈,他们还与同样表现出这种特点的同事交谈。”结果,他说,只需要调整一下员工的茶歇时间,使这类员工之间的步调更为同步,这个呼叫中心每年就能节省1,500万美元。

用户现在对Siri的广泛关注很可能将大大促进这类研究,并进一步推进其应用。里佐说:“语音识别技术确实是技术领域至高无上的圣杯(holygrail)。我们已经掌握了这项技术的90%,但剩下的10%要求攻克更多难关。一旦到了引爆点,我们将迎来一片十分广阔的市场。”看起来,这个引爆点很可能非Siri莫属。


上一章 目录 下一章

随机推荐