iot10086cn 发表于 2015-5-29 18:34:22

开启未来智能家居时代的三把“钥匙”!

在各类科幻大片所描述的未来生活中,使用语音操控的炫酷场景无处不在。比如在《钢铁侠》系列电影中,男主角回到家以后,说声想喝咖啡,咖啡机便开始冲咖啡;说想查资料,电脑便接受指令开始工作……

  这样的未来并非凭空想象。从苹果、谷歌、科大讯飞等国内外科技企业对语音产业的重视和投入可以看出,业内普遍认为语音作为人类信息最自然、最便捷的交互方式,必将成为未来智能家居设备中的重要组成部分。

  而随着语音核心技术和外部环境的逐步成熟,技术瓶颈亦在慢慢被突破。以下几项关键技术也许会是开启智能家居时代的“钥匙”。

  【远场识别技术打破室内识别瓶颈】

  能随意用语音控制智能家居的一个必要条件就是在无论你在客厅哪个角落发出指令,设备都能准确的识别。

  目前室内的语音交互受到背景噪音、其他人声干扰、回声、混响等多重复杂因素影响,导致识别率低甚至无法使用,只能在相对安静、近距离的环境下使用。而远场识别技术将能够很好的解决这些问题。
http://iot.10086.cn/mediafiles/2015-05-25/1426579377181.png
  2015年3月,科大讯飞远场识别技术对外亮相发布,超过5米的语音识别技术突破了语音交互距离瓶颈,大幅度改进了语音交互的自由度。

  该技术利用麦克风阵列的空域滤波特性——在目标说话人方向形成拾音波束(BeamForming),抑制波束之外的噪声,结合独特的去混响算法,最大程度的吸收反射声,从而达到去除混响的目的。

  可以想象,有了远场识别的远距离、高识别率支撑,以后用户在客厅的任意角落,都可以通过语音轻松操控家里的一切智能硬件设备。

  【语音识别技术实现真正的Hands Free】

  在解决了远距离语音交互的混响和噪音问题后,便是“语音识别”这项关键性技术大施拳脚的时候了。

  “语音识别”技术相当于给计算机系统安装上“耳朵”,使其具备“能听”的功能。该技术经过语音信号处理、语音特征处理、模型训练及解码引擎等复杂步骤,使机器最终能够将语音中的内容、说话人、语种等信息识别出来。
http://iot.10086.cn/mediafiles/2015-05-25/1426579377179.png
  (图:主流的语音识别系统框架图)

  科大讯飞通过把国际领先的深度神经网络技术引入语音识别,通过海量训练语料基础上的高精度声学模型和语言模型训练,并结合极致的解码引擎工程技术,给识别效果和识别速度带来了跨越式的提升。大词汇连续语音识别率达到95%以上,命令词识别率达到99%以上,解码引擎可以在用户说完话40毫秒之内给出结果,真正实现“秒懂”。

  相信在这样精准快速的语音识别技术保驾护航之下,解放双手,自由随意对智能家居“发号施令”的日子必定近在眼前。

  此外,由于功耗等方面的限制,智能设备很难24小时都保持在激活状态。因此,要想在家里自由地控制智能家居设备,我们还需要能即时“唤醒”功能,也就是给智能设备加入“语音唤醒”技术。
http://iot.10086.cn/mediafiles/2015-05-25/1426579377177.png  语音唤醒,是指通过含有特定唤醒词的语音输入来“触发”语音识别系统以实现后续的语音交互。通过该技术,任何人在任何环境、任何时间,无论是近场(0.5米以内)还是远场(2~5米),面向设备直接说出预设的唤醒词,就能激活产品的识别引擎,从而真正实现全程无触控的语音交互。

  除了说单个唤醒词实现唤醒外,更自然便捷、在技术上更具有挑战性的交互方式是在连续语流中带上唤醒词,以实现唤醒产品并同时实现操控的效果。目前,科大讯飞的语音唤醒方案已在产品中取得成功应用,比如在灵犀语音助手中,说出“打电话给张三”就可以唤醒设备并自动完**名识别与拨打电话。

  【个性化识别让设备更懂你】

  每个人在说话时,口音、语速、口头禅都不一样,那么家里的智能设备只会识别一些基本词句显然是远远不够的,它们必须要更懂你。比如,懂你的口音、方言、口头禅以及时不时蹦出的专业词汇等。

  让智能设备适应每个人的使用习惯可能吗?答案是肯定的。这里要用的到就是“个性化识别技术”。

  个性化识别指的是语音识别系统具备自动学习并适应用户使用习惯的能力,你用的越多,它越懂你。一般来说,个性化识别包括发音和语言两方面。其中发音个性化主要是指系统对用户语速、口音等发音习惯的学习,而语言个性化主要是指系统可以对用户的特定词汇(例如人名、地名、口头禅、专业词汇等)具备更好的辨识性。
http://iot.10086.cn/mediafiles/2015-05-25/1426579377175.png
  (图:语言个性化方案)

  通过科大讯飞业界领先的个性化识别技术,能针对每个人的兴趣点、知识背景等来进行个性化语言模型建模,从而准确识别出个性化的词汇内容。用的越多,语音识别系统就越懂你。

  “方言”现在也不再是语音识别的障碍,目前,科大讯飞已经先后对外发布四川话、河南话、东北话、天津话等14种方言识别技术。以后,无论你使用普通话还是方言,无论你说话语速快还是慢,普通话标不标zun,在家里都能自由地使用语音控制智能设备。

  随着远场识别、语音识别、个性化识别等技术一一突破使用瓶颈,随心所欲“声”控智能家居的时代一触即发,那么这一变革多久会来?也许在明年,也许就在明天。

页: [1]
查看完整版本: 开启未来智能家居时代的三把“钥匙”!