小米宣布声学语音技术实现全面自研,部分领域已持续领先

近日,小米发布了小爱音箱Art,作为小米推出的第9款智能音箱,小米小爱音箱Art背后的声学语音技术也重磅升级,搭载第三代小爱同学,支持情感化语音交互、全屋播放及就近唤醒等。

今日,小米官方透露,小米的声学语音技术已经实现全面自研,并在自研部分领域持续领先。

多项重磅技术首次落地!小米:声学语音技术实现全面自研

首先是语音交互实现“情感化”。为了让机器加入情感元素,小米AI实验室在“情感数据量有限”的前提下,通过不同声学模型、不同声码器组合最终上线自然、拟人效果的情感TTS(Text to speech,人工语音合成),成为业内首家情感化TTS大规模落地的企业。

此次小米小爱同学Art全面支持情感化语音交互,基于有限但类型不同的情感音频数据(如开心、关心、害羞、惊讶等),通过不同技术训练并迭代声学模型,最终支持情感TTS合成并实现“小爱同学”音色情感化、拟人化。

未来,小米语音将升级此技术——支持情感TTS实时合成。

其次是,AIoT放音技术升级,首次实现一句话全屋同步播放相同音频功能。据悉,小米小爱音箱Art是首款可以实现语音支持全屋播放的设备。用户直接对小爱同学说“全屋播放XXX”,无需提前在App端进行手动设置,即可实现一句话语音交互。

第三,就近唤醒全新升级,业内首次上线跨设备关闭闹钟功能。此次小米小爱音箱Art就近唤醒全新升级,可支持跨设备关闭闹钟。远处的音箱闹钟响了,唤醒近处的音箱可以直接关闭远处的闹钟。此功能在业内首次上线,小米小爱音箱Art也是首款支持该功能的产品。

第四,两麦阵列唤醒新策略,兼顾低功耗与高性能,高效降噪,获得干净人声。小米小爱音箱Art同步支持两麦阵列唤醒技术。在麦克风阵列方面,小米采用两麦盲源分离降噪前端,通过盲源分离、降噪、回声消除等技术,在多声源的嘈杂环境、音箱自身播放音乐时,都能结合语音增强技术,消除噪音的强干扰,获得干净、准确的人声音频。

5月21日,小米小爱音箱Art正式发布,首次采用金属机身,主打设计、音质、智能,零售价349元,到手价299元。设计方面,小米小爱音箱Art采用质感金属机身,搭配1600万色极光灯带。亚光细石纹壳体,一体式无缝触控按键。在智能交互方面,支持自研茉莉情感音色,靠近一键配网。语音控制支持2000 智能设备,覆盖1600 使用生活技能。

目前,小米IoT平台连接的智能硬件数已达到2.5亿台,音箱出货量已经达到2200万台。

0

付费内容

查看我的付费内容