歌尔CES 2026首发声学与感知方案,多模态交互突破传统限制!

发布时间:2026-01-14 阅读量:465 来源: 发布人: suii

在美国举办的国际消费电子展(CES)上,歌尔展示了其面向全场景的声学与感知领域创新技术解决方案,旨在为消费电子产品提供更具沉浸感、更高精准度与更优舒适性的声学与感知体验。


新一代智能可穿戴交互范式——AI拍照OWS耳机参考设计

1768362879313.png

传统可穿戴设备的发展,在经历初期飞速增长后,已逐渐触及由固有形态与交互模式所定义的“天花板”。例如以TWS耳机为代表的设备,交互主要依赖语音,在嘈杂环境等场景下可用性骤降,且缺乏多模态AI交互和视觉感知周围情景的能力。


歌尔将声学、视觉和AI技术进行深度融合,打造出行业首个具备高质量开放式音频、AI多模态融合交互、超高清双耳拍照和高清短视频等功能的创新OWS耳机参考设计:单侧集成 1200 万像素摄像头且视角3档可调,支持通过实时直播形式进行佩戴角度校准,从而适配不同耳型;自研面部去遮挡算法和双侧图像拼接算法,实现100度以上水平视场角的超高清图片拍摄及1080P短视频拍摄。


采用自研近场人机交互拾音算法,精准过滤环境噪声与周围人声,实现“语音 + 双侧图像”的 AI多模态融合交互;自研浅入耳声学解决方案和双振膜驱动单元,有效解决OWS 耳机漏音、低频厚度不足和响度不足的行业痛点,兼顾通透舒适的聆听体验和饱满稳定的高品质声学呈现。


歌尔微电子带来了VPU骨声纹传感器,以120-125μA低功耗精准捕捉语音振动信号、隔绝环境噪音,让语音交互更灵敏精准,兼具通用音频接口特性,为 AI 眼镜的轻薄化设计与可靠交互提供了行业领先的传感解决方案。


在音频算法方面,针对高噪声环境下语音识别率显著降低的现象,歌尔采用独创ASR 语音前处理方案,以多麦克风阵列定向拾音技术搭配深度学习降噪算法,打造高噪环境下的精准交互体验 —— 实现近场 98%、远场 97% 的超高识别准确率,即便身处商场、地铁等嘈杂场景,语音指令也能被精准捕捉,且支持低功耗芯片实时运行,极大降低交互延迟与电量消耗。

220x90
相关资讯
兆易创新发布新一代大容量SPI NAND Flash,助力智能设备存储升级!

4月2日,兆易创新宣布正式发布新一代SPI NAND Flash产品GD5F4GM7/GD5F8GM8。

标普全球警告:中东冲突或影响科技巨头6350亿美元的AI投资

标普全球Visible Alpha研究主管Melissa Otto指出,当前推动股市创纪录上涨的人工智能巨额投资正面临显著挑战,主要由于中东危机对全球经济增长前景与能源成本带来不确定性影响。

全新存储芯片面世,可在 700°C 高温下稳定运行!

南加州大学团队研发新型存储芯片,可在 700°C 高温下稳定运行,且未出现性能退化迹象。

突发!传高通、联发科合计减产约1500~2000万颗4nm移动处理器

联发科和高通已开始下修于晶圆代工厂的4nm投片量,显示手机链景气明显降温

全新EM8695 5G RedCap模块上架,适用于无线工业传感器、中程物联网、资产追踪等场景

EM8695 RedCap模块基于Qualcomm SDX35基频处理器,为无需传统5G全速率或复杂功能的应用提供精简型5G解决方案