首页 > 家居 > 家居要闻

"砍木累" 声控智能家居必过5关

[摘要]  (上海新闻网)在许多国外科幻大片所描绘的将来日子中,运用语音办法来操控家电的炫酷场景无处不在。比方在《美国队长 2》中,神盾局的头子用语音操控虚拟桌面、窗帘和...

  (上海新闻网)在许多国外科幻大片所描绘的将来日子中,运用语音办法来操控家电的炫酷场景无处不在。比方在《美国队长 2》中,神盾局的头子用语音操控虚拟桌面、窗帘和电视;在《钢铁侠》系列电影中,男主角回到家今后,说声想喝咖啡,咖啡机便开端冲咖啡;在《碟中谍 4》中,阿汤哥经过用语音来开灯和开电视。 DT.png   科幻片中这么的将来并非凭空想象,国内外的IT 巨子已先后以智能家庭商品与语音相联系的办法进入智能家庭范畴:谷歌收买 NEST 规划智能家庭,不断强化 Google Now的语音进口;苹果 HomeKit 智能家居渠道与 Siri也不断加强交融;微软近期也发布语音帮手 Cortana,为它在智能家庭范畴拓展交互进口;国内的科大讯飞亦携手京东宣告双方将在智能家居和语音技能范畴展开全面协作。从这些国内外科技大佬们对语音工业的注重和投入,能够看出智能语音与智能家庭的交融是大势所趋,业界普遍认为语音作为人类信息最天然、最快捷的交互办法,必将成为将来智能家居设备中的主要组成部分。   跟着国内外巨子们对语音交互范畴投入的添加,语音核心技能正逐步老练,曾经的技能瓶颈亦在渐渐被打破。这其间语音辨认技能是语音交互的根底与核心,「语音辨认」技能相当于给计算机体系安装上「耳朵」,使其具有「能听」的功用。该技能经过语音信号处理、语音特征处理、模型练习及解码引擎等杂乱过程,使机器终究能够将语音中的内容、说话人、语种等信息辨认出来。   了解了语音辨认的根底内容和体系结构今后咱们来看看,语音辨认技能要在智能家居日子中真实有用,必需要过哪 5 关?   一、间隔:远场辨认技能打破间隔瓶颈   近场辨认技能如今现已比较老练,如今手机上运用的语音输入功用就属于近场辨认技能,用户有必要在离手机比较近的间隔内说话,但在智能家居环境中,用户和智能终端之间的间隔被大大添加了,用户能随意用语音操控智能家居的一个必要条件即是在不管你在客厅哪个旮旯宣布指令,设备都能精确的辨认,语音辨认技能有必要打破间隔的妨碍。   如今室内的语音交互遭到布景噪音、别的人声搅扰、回声、混响等多重杂乱因素影响,导致辨认率低乃至无法运用,只能在相对安静、近间隔的环境下运用。而远场辨认技能将能够极好的处理这些疑问。   如今的远场辨认技能现已能够支撑超越 5 米的语音辨认,打破了语音交互间隔瓶颈,大幅度改进了语音交互的自由度。该技能利用麦克风阵列的空域滤波特——在方针说话人方向形成拾音波束(BeamForming),按捺波束以外的噪声,联系独特的去混响算法,最大程度的吸收反射声,然后达到去掉混响的目的,用户在客厅的恣意旮旯经过语音操控智能家电已成为实际。   二、功率:又快又准   这些年,跟着深度学习理论的爆发式发展及其在语音辨认范畴取得的显著作用,一起 Kaldi等开源语音辨认东西也在工业界和学术界逐步遍及,语音辨认的门槛持续下降,许多公司都具有了语音辨认的才干及相关商品,但本来许多运用过 Siri的国内用户都会有这么的感受: Siri的反响太慢,说出一句话一般要等候很久才干显现成果,别的,精确率也不高,离好用还有很远的间隔。   要持续优化精确率和响应速度的疑问,必需要在核心技能和商品特上做出立异,如今国内抢先的处理方案是在把深度神经网络技能引入语音辨认的根底上,根据深度神经网络的语音增强算法对输入语音进行「辨认关键信息无损」的降噪,经过海量练习语料根底上的高精度声学模型和言语模型练习,并联系极致的解码引擎工程技能,完结了在很小延迟的状况下,做到将去掉初始语音的噪声搅扰和辨认简直一起,大大提高了语音输入的响应速度和用户体会,终究实如今大词汇接连语音辨认率上能够达到 95%以上,指令词辨认率达到 99%以上,解码引擎能够在用户说完话 40 毫秒之内给出成果,真实完结「秒懂」。   三、个化:越来越懂你   每个人在说话时,口音、语速、口头禅都不一样,那么家里的智能设备只会辨认一些基本词句显然是远远不够的,它们必需要更懂你。比方,懂你的口音、方言、口头禅以及时不时蹦出的专业词汇等。   让智能设备习气每个人的运用习气或许吗?答案是必定的。这儿要用的到即是语音辨认的别的一项关键技能——个化辨认技能。个化辨认指的是语音辨认体系具有主动学习并习气用户运用习气的才干,你用的越多,它越懂你。一般来说,个化辨认包括发音和言语两方面。其间发音个化主要是指体系对用户语速、口音等发音习气的学习,而言语个化主要是指体系能够对用户的特定词汇(例如人名、地名、口头禅、专业词汇等)具有非常好的辨识   如今业界老练的个化辨认技能已能针对每个人的爱好点、常识布景等来进行个化言语模型建模,然后精确辨认出个化的词汇内容。今后你用的越多,语音辨认体系就会越懂你。   四、方言:普通话标不标 zun 也照样能用   尽人皆知,我国的语音及言语博学多才,尽管国家在推行标准普通话方面不遗余力,可是我国真实把握标准普通话的人群份额仍是比较低的,而我国的口音表象则是纷繁杂乱,乃至会呈现同城市中都有不一样口音的状况。因而,当这些带有或轻或重口音的人群在运用语音输入时,假如按一般的办法运用标准普通话数据进行模型的练习,就会产生很严重的适配疑问,然后影响语音输入时的辨认作用。   「方言」如今也不再是语音辨认的妨碍,得益于各类方言丰厚的音频数据、特别词汇、发音表象等专业资本以及充分利用深度神经网络的自学习特色,如今,讯飞输入法现已接连支撑四川话、河南话、东北话、天津话等 15 种方言辨认,这些方言辨认才干相同适用于智能家居环境中。今后,不管你运用普通话仍是方言,不管你说话语速快仍是慢,普通话标不标 zun,在家里都能自由地运用语音操控智能设备。   五、语音唤醒:真实解放双手   因为功耗等方面的限制,智能设备很难 24 小时都保持在激活状态。因而,要想在家里自由地操控智能家居设备,咱们还需要能即时「唤醒」功用,也即是给智能设备参加「语音唤醒」技能。   语音唤醒,是指经过富含特定唤醒词的语音输入来「触发」语音辨认体系以完结后续的语音交互。经过该技能,任何人在任何环境、任何时间,不管是近场(0.5 米以内)仍是远场(2~5 米),面向设备直接说出预设的唤醒词,就能激活商品的辨认引擎,然后真实完结全程无触控的语音交互。   除了说单个唤醒词完结唤醒外,更天然快捷、在技能上更具有挑战的交互办法是在接连语流中带上唤醒词,以完结唤醒商品并一起完结操控的作用,比方直接在语音帮手中说出「打电话给张三」就能够唤醒设备并主动完结人名辨认与拨打电话。   跟着语音辨认技能在间隔、功率、个化、方言、唤醒等多方面逐个打破有用瓶颈,为所欲为「声」控智能家居的年代剑拔弩张,那么这一革新多久会来?或许在下一年,或许就在明天。

上海网微信
《"砍木累" 声控智能家居必过5关》上海新闻-上海网提供,转载请注明出处:http://www.shtnews.com/jj/jjyw/2015-07-06/1267.html,谢谢合作!
[责任编辑:上海新闻网]

我要评论

评论列表(网友评论仅供网友表达个人看法,并不表明本站同意其观点或证实其描述)
上海网版权与免责声明 1、未经上海网(以下简称本网)许可,任何人不得非法使用本网自有版权作品。 2、本网转载其他媒体之稿件,以及由用户发表上传的作品,不代表本网赞同其观点和对其真实性负责。 3、如因作品版权和其它问题可联系本网,本网确认后将在24小时内移除相关争议内容。 详细声明请点击进入>>
返回上海网首页
版权所有: 上海新闻网 Copyright(c) 2010-2017 shtnews Network Center. All Rights Reserved 豫ICP备15015793号
若无意侵犯了贵司版权,请来信通知,我们会及时处理和回复,谢谢!邮箱:shtnews@163.com
未经上海新闻网书面特别授权,请勿转载或建立镜像 违者依法追究相关法律责任
中国互联网举报中心  中华人民共和国公安部  12318全国文化市场举报平台  网络110报警服务