思必驰：语音交互迈入“拟人化”阶段_全球最新

来源：站长之家用户时间：2023-06-29 10:37:54

(资料图)

消费者在交互过程中并非孤立地依据声音、表情及动作中的单项进行沟通与交流，而是综合视觉、听觉、触觉甚至嗅觉来进行有效的沟通。同理，要使机器做到更加逼真的“拟人化”，就需要通过语音、视觉、文本等信息结合的方式来推动人机交互的优化与升级。

例如，在复杂声学环境尤其是多人同时说话的时候，语音识别性能会显著下降，此时若引入视觉信息对讲话者进行唇语识别，综合语音和视频信息则可以大幅提升说话人跟踪和语音识别准确率；又例如，在人机交互过程中，机器通过采集用户的表情、说话语气，甚至脚步的频率和急缓程度，可以分析用户的情绪状态，以采用不同的方式推进交互，提高人机交互的交互效率与质量。

不难看出，应对人机交互场景化应用不断拓展的市场需求，多模态、智能化的完整解决方案可以更好地应对不同场景的复杂变化，多模态交互成为行业发展的必然趋势。

深耕行业多年，思必驰早年便对多模态交互领域进行布局，已经成功自主研发出多模态对话交互技术。

具体来看，思必驰多模态对话交互技术联合语音、语言、视觉等多个模态的信息，能够在高噪声环境（比如地铁、家居、车载环境），大幅提升语音识别率和对话交互成功率。此外，思必驰研发打造出多模态对话交互软硬件一体的解决方案，包括高噪声环境下的多模态唤醒、说话人跟踪、语音活动检测等技术，增加了语音交互对噪声的鲁棒性，显著提升了用户体验。

目前，思必驰上述方案已应用政务民生场景中的轨道交通、智能自助设备等需要近场语音交互且环境嘈杂的场景和产品。

随着技术的不断进步，多模态交互的应用场景将会越来越广泛。可以预见的是，AI语音的发展在思必驰等技术领先企业的持续推动下，将会为人们带来更加自然、智能的交互体验。

（推广）

关键词：

图文推荐

环球观点：7天之后，四大生肖贵人齐聚，财富更上一层楼，财运滚滚

消失的证券营业部_天天热点评

中东土豪一掷千金，中国新造车继续烧钱

冰箱彩电按摩椅，哪个配置是多余？

新能源百花齐放，如何选车更合适？

有足够薪金空间认领普林斯的是马刺掘金等5队有700万交易特例_环球快讯

热门文字

精彩赏析