发布时间:2012-07-31 阅读量:1195 来源: 我爱方案网 作者: EchoTang
随着电子设备智能化程度及互动能力的不断提高,语音、图像和手势等人机接口相继出现,以满足消费者对速度更快、互动性更强的信息访问方式的需求。iPhone 4S富有差异化特色的Siri语音输入暨识别功能翻开了语音识别在智能手机市场的新篇章,越来越多的制造商开始希望在最短的时间内开发出媲美Siri或甚至超越Siri性能的带语音识别功能的智能手机。
目前市场上人机接口语音功能一般由主CPU来处理,效果自然不能满足越来越挑剔的消费者。主CPU除了需要处理语音识别之外,还需要处理如高清视频、3D导航等,为处理能力和存储器带宽带来了计算、资源使用的瓶颈,特别是像语音识别需要很多资源密集型应用而言,更会形成这种瓶颈。如果将此功能让分立的语音协处理器来处理,就能营造出更好的用户体验。
IDC半导体部高级分析师Michael Palma补充道:“在当今的计算设备中,CPU需要处理从高速互联网接入、高清视频到3D导航和语音识别的几乎所有任务,结果为处理能力和存储器带宽带来了瓶颈问题。利用具体应用协处理器来处理语音评分任务,可以极大地改善语音识别系统的响应能力和延迟表现,同时为CPU腾出更多处理能力以集中处理其他资源密集型应用,从而在整体上营造出更好的用户体验。”
为满足这一新兴市场的特殊要求,NOR闪存主要供应商Spansion公司最近宣布推出Spansion语音协处理器(简称Spansion ACP),这是业界首款支持语音控制系统接口的人机接口(HMI)协处理器。
图一:语音识别的实现
目前,用户接口依赖于通用型硬件和软件。Spansion语音协处理器是首款具体应用型产品,它将定制型逻辑和硬件与Nuance公司的VoCon软件引擎完美地结合起来,为诸如语音之类的自然用户接口提供了一种专用资源。
Spansion执行副总裁兼全球业务总经理Glenda Dorcha介绍说:“虽然高端应用处理器正从单核快速转向双核和四核,但人机界面(UI)仍将是一个计算密集型功能,要求独立的硬件加速器和灵活的软件算法,应用协处理器来处理语音任务,可以极大地改善语音识别系统的响应能力和延迟表现,同时可为CPU腾出更多处理能力以集中处理其他资源密集型应用。”
凭借Nuance Communications公司的语音技术,该款新产品是汽车、游戏和消费电子领域语音识别系统的理想之选。此外,该产品支持更大的语音数据库,与常规语音接口相比,可以显著提高响应时间和精度。Spansion语音协处理器由定制型逻辑和高速存储器构成,有利于加快和优化语音控制人机接口,同时还可消除常规CPU在处理语音数据时的工作负荷。
Spansion ACP专为Nuance VoCon的语音识别(Voice Recognition)引擎而优化。具体来说,Spansion ACP加速了语音识别过程的音阶分析评估阶段,将传入的数字声音与语音数据库内容进行比对。此音阶评估是Nuance语音识别技术的主要组成部分,由定制型逻辑和高速存储器构成,有利于加快和优化语音控制人机接口,同时还消除CPU在语音处理数据时候的工作负荷。
图二:Spansion语音协处理器[member]
应用处理器和DSP解决方案的不足
与仅采用应用处理器的典型系统相比,使用语音协处理器可使系统响应速度提高50%,应用处理器上的负载最多可下降50%。因此ACP定位在声控电子技术领域,并应用在汽车、消费电子和游戏机市场。
与现有的基于DSP的语音协处理器解决方案相比,Spansion市场营销和业务开发总监范承华表示:“Spansion ACP是同类中第一个以硬件为基础的协处理器,并专为Nuance VoCon的语音识别(Voice Recognition)引擎而优化。具体来说,Spansion ACP加速了语音识别过程的音阶分析评估阶段,将传入的数字声音与语音数据库内容进行比对。此音阶评估是Nuance语音识别技术的主要组成部分,因此ACP定位在声控电子技术领域,并应用在汽车、消费电子和游戏机市场。”
他强调指出,现有的欧胜(Wolfson)方案通常着重在语音识别过程的音效处理阶段;此阶段将传入的模拟语音信号转换为数字语音模式,并在执行时降低噪声、消除语音回音和形成语音波束。这些解决方案在ACP语音识别过程中有互补作用。另一家Sontia公司的产品主要针对扬声器,因此与ACP并不相关。
图三:Spansion市场营销和业务开发总监范承华
汽车是Spansion第一目标市场
Spansion ACP目前在市场上暂时还没有实力较强的竞争对手,短期内道路会比较平坦。Spansion在中国已经有益登科技、威健、北高智电子、艾睿电子和安富利五个主要分销商,以及汇新电子和亚讯科技这两个较小的分销商。
范承华表示,在中国我们目前正与有兴趣于ACP的客户合作。目前而言,讨论具体的成功案例仍言之过早。
Nuance公司移动事业部执行副总裁兼总经理Michael Thompson表示:“Spansion以特有方式整合Nuance公司的技术,为汽车制造商提供了一种极其强大的平台。专业协处理器可以使语音互动变得极其快速、更加自然、甚至更加准确。”
Spansion战略联盟及业务开发资深副总裁Ali Pourkeramati表示:“随着人机互动的不断普及,市场上出现了对更加自然的用户接口的需求,而语音则走在了前列。我们的新型语音协处理器产品进一步巩固了我们的战略,即提供具有附加价值的系统能力,推动客户产品的差异化进程,促进互联智能设备的大规模普及。凭借我们在汽车和嵌入式存储器领域的领先优势,我们设计出了一种新的系统平台,它可以快速读取和分析数据,使用户体验迈上新的台阶。”
Strategy Analytics汽车消费调查总监Chris Schreiner表示:“语音识别技术的进步缩短了我们与自然语言理解之间的距离,这对汽车市场来说是至关重要的。越来越多的汽车制造商开始在汽车中装入语音识别接口,用于管理移动连接,同时提高驾驶安全系数。精度和延迟方面的改善,就像通过Spansion语音协处理器等创新技术所实现的一样,可以给消费者带来极大的便利,并改变我们与汽车的互动方式。”
Strategy Analytics中国区汽车研究总监徐震宇表示:“到2012年,中国原始设备制造商(OEM)所提供的具备语音人机接口的信息娱乐和车载信息通讯系统(telematics)的出货量将达到300万台,并預期在2018年达到2,000万台。开发厂商诸如Spansion语音协处理器这类的语音识别解决方案,必将刺激市场接受度,加强消费满意度。”
Spansion语音协处理器充分利用了Spansion久经验证的技术,及其在各类嵌入式应用中实现即时响应、高可靠性和性能方面的领先优势。基准检测结果显示,与仅采用应用处理器的典型系统相比,使用Spansion语音协处理器可使系统响应速度提高50%。应用处理器上的负载最多可下降50%,使其可以腾出空间处理其他任务。另外,Spansion语音协处理器能够支持更大的语音数据库(包括多语言,语音性别和声调),这样一来提高了准确性并促进了自然语言理解。
Spansion技术的首次应用是在汽车市场。在该市场中,语音提供了一种更安全、更智能的驾驶连接技术,同时最大限度地减少了手持设备的视觉-手动干扰。Spansion演示平台集成了Spansion的技术和Nuance的语音识别软件,目前,多家大型汽车制造商正在对其进行评估,今年第三季度将开始提供设计样片。
Spansion ACP可媲美Siri吗?
ACP架构包括定制逻辑和高速片上闪存,两者间通过1.2GBps高速接口互连。此片上闪存基于Spansion 高性能和高可靠性的 MirrorBit NOR flash 技术,是语音数据库的存储位置。根据Spansion 的测试结果,此种独特的架构设计可提供最高性能的音效,并协助降低50%左右的反应延迟和CPU负载。
范承华说:“就我们所知,ACP是同类中第一个提供独特架构和功能,使用Nuance语音识别引擎来增进语音识别的电子系统。ACP可与DSP许多解决方案并存,协助语音处理功能。”
Siri技术智能程度已经很高,它可以联系上下文来理解说话者的意思,那么Spansion ACP能不能达到这个水平呢?范承华表示:“语音识别的准确性有赖于Nuance提供的语音数据库大小。数据库越大,语音识别结果越准确。以现有的语音数据库而言,ACP减少大约50%的延迟和50% CPU 负载,而Nuance是著名的语音和图像解决方案提供商,数据库的扩大只是时间的问题。ACP旨在支持所有使用Nuance Vocon 引擎的语言。”
此外,他强调指出:“就我们所知,Siri主要是基于连接到云端(Cloud)的网络技术。相反,Spansion ACP是为嵌入式系统设计,不论有无云端支持皆可执行语音识别。鉴于ACP是本地协处理器,相较于在大多数情况下纯粹云端提供的解决方案,我们相信ACP可提供更高的性能。”
目前,Spansion已可支持英语,而且还正在开发其他语言的功能。展望语音协处理器的未来,嵌入式系统的语音识别将朝向自然语言理解发展,人机对话将更趋于人人对话。
范承华指出:“此一趋势将需要更大量的语音数据库,因此需要配备更多运算和内存带宽的嵌入式系统。Spansion ACP具有独特的优势来支持这一趋势,藉由减少约50%的延迟和CPU负荷,并改善语音识别体验。”
在全球半导体产业加速迭代的背景下,三星电子日前披露了其第六代10纳米级DRAM(1c DRAM)的产能规划方案。根据产业研究机构TechInsights于2023年8月22日发布的行业简报,这家韩国科技巨头正在同步推进华城厂区和平泽P4基地的设备升级工作,预计将于2023年第四季度形成规模化量产能力。这项技术的突破不仅标志着存储芯片制程进入新纪元,更将直接影响下一代高带宽存储器(HBM4)的市场格局。
全球领先的物联网设备制造商MOKO SMART近期推出基于Nordic Semiconductor新一代nRF54L15 SoC的L03蓝牙6.0信标,标志着低功耗蓝牙(BLE)定位技术进入高精度、长续航的新阶段。该方案集成蓝牙信道探测(Channel Sounding)、多协议兼容性与超低功耗设计,覆盖室内外复杂场景,定位误差率较传统方案降低60%以上,同时续航能力突破10年,为智慧城市、工业4.0等场景提供基础设施支持。
半导体行业风向标企业亚德诺(ADI)最新财报引发市场深度博弈。尽管公司第三财季营收预期上修至27.5亿美元,显著超出市场共识,但受关税政策驱动的汽车电子产品需求透支风险显露,致使股价单日重挫5%。这一背离现象揭示了当前半导体产业面临的复杂生态:在供应链重构与政策扰动交织下,短期业绩爆发与长期可持续增长之间的矛盾日益凸显。
根据国际权威市场研究机构Canalys于5月23日发布的调研报告,2025年第一季度全球可穿戴腕带设备市场呈现显著增长态势,总出货量达到4660万台,较去年同期增长13%。这一数据表明,消费者对健康监测、运动管理及智能互联设备的需求持续升温,行业竞争格局亦同步加速重构。
2025年5月23日,全球领先的半导体与电子元器件代理商贸泽电子(Mouser Electronics)宣布,正式开售Raspberry Pi新一代RP2350微控制器。作为RP2040的迭代升级产品,RP2350凭借双核异构架构(Arm Cortex-M33 + RISC-V)、硬件级安全防护及工业级性价比,重新定义了中高端嵌入式开发场景的技术边界。该芯片通过多架构动态切换、可编程I/O扩展及4MB片上存储等创新设计,解决了传统微控制器在实时响应能力、跨生态兼容性与安全成本矛盾上的核心痛点,为工业自动化、消费电子及边缘AI设备提供了更具竞争力的底层硬件方案。