歌尔CES 2026首发声学与感知方案,多模态交互突破传统限制!

发布时间:2026-01-14 阅读量:584 来源: 发布人: suii

在美国举办的国际消费电子展(CES)上,歌尔展示了其面向全场景的声学与感知领域创新技术解决方案,旨在为消费电子产品提供更具沉浸感、更高精准度与更优舒适性的声学与感知体验。


新一代智能可穿戴交互范式——AI拍照OWS耳机参考设计

1768362879313.png

传统可穿戴设备的发展,在经历初期飞速增长后,已逐渐触及由固有形态与交互模式所定义的“天花板”。例如以TWS耳机为代表的设备,交互主要依赖语音,在嘈杂环境等场景下可用性骤降,且缺乏多模态AI交互和视觉感知周围情景的能力。


歌尔将声学、视觉和AI技术进行深度融合,打造出行业首个具备高质量开放式音频、AI多模态融合交互、超高清双耳拍照和高清短视频等功能的创新OWS耳机参考设计:单侧集成 1200 万像素摄像头且视角3档可调,支持通过实时直播形式进行佩戴角度校准,从而适配不同耳型;自研面部去遮挡算法和双侧图像拼接算法,实现100度以上水平视场角的超高清图片拍摄及1080P短视频拍摄。


采用自研近场人机交互拾音算法,精准过滤环境噪声与周围人声,实现“语音 + 双侧图像”的 AI多模态融合交互;自研浅入耳声学解决方案和双振膜驱动单元,有效解决OWS 耳机漏音、低频厚度不足和响度不足的行业痛点,兼顾通透舒适的聆听体验和饱满稳定的高品质声学呈现。


歌尔微电子带来了VPU骨声纹传感器,以120-125μA低功耗精准捕捉语音振动信号、隔绝环境噪音,让语音交互更灵敏精准,兼具通用音频接口特性,为 AI 眼镜的轻薄化设计与可靠交互提供了行业领先的传感解决方案。


在音频算法方面,针对高噪声环境下语音识别率显著降低的现象,歌尔采用独创ASR 语音前处理方案,以多麦克风阵列定向拾音技术搭配深度学习降噪算法,打造高噪环境下的精准交互体验 —— 实现近场 98%、远场 97% 的超高识别准确率,即便身处商场、地铁等嘈杂场景,语音指令也能被精准捕捉,且支持低功耗芯片实时运行,极大降低交互延迟与电量消耗。

220x90
相关资讯
韩国YAS斩获TCL华星8.6代OLED订单!

韩国OLED沉积设备大厂YAS近期斩获TCL华星订单,将为后者8.6代OLED产线供应蒸发源。

英特尔发布新一代EMIB-T封装技术!

英特尔旗下晶圆代工业务 Intel Foundry 近日发布了新一代 EMIB(Embedded Multi-Die Interconnect Bridge,嵌入式多芯片互连桥接)先进封装技术——EMIB-T。

英伟达新总部曝光!2030年在中国台湾启用,可容纳4000名员工

黄仁勋透露,中国台湾新总部将延续加州总部设计风格,预计2030年入驻。该基地规划面积约70万平方英尺,可容纳约4000名员工。

三星电子工会批准薪酬协议,存储芯片部门最高可获6.5亿韩元奖金!

三星电子工会成员投票批准了上周敲定的奖金方案,终结了存储芯片业务部门此前的罢工危机。

韩国工厂PKC应三星要求将半导体用氯气产能扩产50%!

据THE ELEC报道,韩国化工企业PKC宣布将在全罗北道群山工厂把半导体用高纯度氯气(Cl₂)产能提升50%,年产能由1400–1500吨扩至2100–2200吨