【珍藏资料】语音识别四大平台,九大芯片原厂及方案

发布时间:2016-11-28 阅读量:4275 来源: 发布人:

日前,科大讯飞和我爱方案网、快包联合推出的“握手AI,共创共享——2016讯飞智能语音设计大赛”正在火热报名中!虽然智能语音在智能家居、车载、可穿戴这杯方面的普及度并不高,但在手机、平板上面,相信大家都体验过它的便捷。讯飞输入法就是小编最爱的输入法,没有之一。讯飞输入法语音识别迅速且准确率高,还有离线识别功能,非常好用。



“握手AI,共创共享--2016讯飞智能语音设计大赛”报名入口  >>>


提到智能语音,不得不了解语音识别芯片。语音识别芯片也叫语音识别IC,与传统的语音芯片相比,语音识别芯片最大的特点就是能够语音识别,它能让机器听懂人类的语音,并且可以根据命令执行各种动作,如眨眼睛、动嘴巴(智能娃娃)。除此之外,语音识别芯片还具有高品质、高压缩率录音放音功能,可实现人机对话。语音识别芯片所涉及的技术包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。方案超市为大家梳理一下智能语音的四大平台以及在这个领域深耕细作的芯片商与方案公司。让大家对这个行业有更全面详细的了解。


一、语音识别分类

按照使用者的限制而言,语音识别芯片可以分为特定人语音识别芯片和非特定人语音识别芯片。

特定人语音识别芯片是针对指定人的语音识别,其他人的话不识别,须先把使用者的语音参考样本存入当成比对的资料库,即特定人语音识别在使用前必须要进行语音训练,一般按照机器提示训练2遍语音词条即可使用。

非特定人语音识别是不用针对指定的人的识别技术,不分年龄、性别,只要说相同语言就可以,应用模式是在产品定型前按照确定的十几个语音交互词条,采集200人左右的声音样本,经过PC算法处理得到交互词条的语音模型和特征数据库,然后烧录到芯片上。应用这种芯片的机器(智能娃娃、电子宠物、儿童电脑)就具有交互功能了。
非特定人语音识别应用有的是基于音素的算法,这种模式下不需要采集很多人的声音样本就可以做交互识别,但是缺点是识别率不高,识别性能不稳定。

二、语音识别基本原理

嵌入式语音识别系统都采用了模式匹配的原理。录入的语音信号首先经过预处理,包括语音信号的采样、反混叠滤波、语音增强,接下来是特征提取,用以从语音信号波形中提取一组或几组能够描述语音信号特征的参数。特征提取之后的数据一般分为两个步骤,第一步是系统"学习"或"训练"阶段,这一阶段的任务是构建参考模式库,词表中每个词对应一个参考模式,它由这个词重复发音多遍,再经特征提取和某种训练中得到。第二是"识别"或"测试"阶段,按照一定的准则求取待测语音特征参数和语音信息与模式库中相应模板之间的失真测度,最匹配的就是识别结果。(相关阅读:详解麦克风阵列技术及智能语音设备方案选型)


三、语音识别的应用场景

1、智能语音车载
曾经看过一款汽车的概念宣传广告,驾驶员通过语音指令找到自己的车;打开车锁,通过语音指令寻找导航,播放音乐等等,相当炫酷。当然对于智能车载来说更关键的是行车安全问题,对于驾驶员来说,能通过语音控制接打电话,查看自己的社交软件,绝对比在开车的过程中手忙脚乱的用手控制来的更安全。

2、智能语音家居
现在的智能家居市场之所以外热内冷,智能家居产品之所以不受消费者待见,一个非常主要的原因是现在的智能家居产品没有抓住消费者的痛点,将原本简单的事情复杂化了。在手机上找到控制app打开窗帘的过程远比消费者直接走到窗前拉开窗帘来的麻烦。而有了语音识别的智能家居则不一样,消费者只要轻轻说声“开窗帘”就能打开窗帘。

3、智能语音医疗应用
前一段时间,著名语音识别企业Nuance 在其官方博客上,公布了将发力医疗领域的消息。其产品不但能通过智能手表追踪人体运动情况和心率,还可以根据人的身体状况匹配相应的服务,如合适的餐厅或食物等。另外他们还考虑到更多场景,诸如紧急语音求助,医患对话存档,呼叫中心的对话听写等。

4、智能穿戴语音控制
我们总有那么些时间是没法使用自己的双手的。打电话,发微信,查路线,叫车,这些如果都可以用一个可穿戴设备通过语音控制实现,那该多好!

语音识别的场景非常广阔,参加2016讯飞智能语音大赛,挑战不可能!


四、语音识别四大平台

1、科大讯飞(http://www.iflytek.com/)


科大讯飞股份有限公司成立于1999年,是一家专业从事智能语音及语言技术、人工智能技术研究,软件及芯片产品开发,语音信息服务及电子政务系统集成的国家级骨干软件企业。11月23日科大讯飞轮值总裁胡郁在发布会上引述了罗永浩在 9 月锤子发布会上的演示数据,表示科大讯飞的语音输入识别成功率也达到了97%,即使是离线识别准确率也达到了95%。

2、云知声(http://www.unisound.com/)

云知声成立于2012年6月。之前1年,Siri的发布再度唤醒了大家对语音识别的关注。经过四年多的积累,云知声的合作伙伴数量超过2万家,覆盖用户超过1.8亿,其中语音云平台覆盖城市超过470个,覆盖设备超过9000万台。

3、百度(http://yuyin.baidu.com/)


百度则在11月22日宣布向开发者开放了情感合成、远场方案、唤醒二期和长语音方案等四项语音识别技术。百度语音开放平台自 2013 年 10 月上线以来每日在线语音识别请求已经达到了1.4 亿次,开发者数量超过 14 万。在如此庞大的数据支撑下,百度语音在“安静条件下”的识别准确率达到了 97%。

4、搜狗


搜狗语音团队在 11 月 21 日推出了自己的语音实时翻译技术。搜狗的这项技术主要包括两个方面,分别是语音识别和机器翻译。根据该团队的介绍,搜狗语音识别的准确率达到了 97%,支持最快 400 字每秒的听写。

五、语音识别芯片原厂及芯片方案

1、ICRoute


总部:上海
简介:ICRoute专注于开拓语音识别的芯片市场,致力于研发出高性能的语音识别,语音处理芯片。为各种平台的电子产品提供VUI(Voice User Interface)语音人机交互界面。目前提供的语音识别芯片,可以在包括蓝牙,小家电,照明开关,玩具,车载电子,遥控器等各个电子产品领域提供非特定人的语音识别/声控功能。
官网:http://www.icroute.com/

语音识别芯片:ICRoute LD3320——能在单片机上使用的语音识别芯片

由LD3320组成的语音识别系统有很广泛的应用,如语音控制的点歌系统、语音控制的手机、音控智能导航仪、音控智能家电产品等。


LD3320评估板(其中,控制MCU选用的是STC的51单片机)


2、凌阳、凌通(芯片原厂)


总部:台湾
官网:http://w3.sunplus.com/

语音识别芯片:

凌阳单片机61A——带有语音识别芯片的微控制器,可以实现语音识别功能的芯片,一般小客户只能拿到特定人识别的参考代码。


3、新唐科技


总部:台湾
官网:http://www.nuvoton.com/

语音识别芯片:——ISD9160


ISD9160是一款具有Cortex-M0内核的语音SOC,能够实现录音放音等应用。通过软件支持,ISD9160可以实现特定人和非特定人语音识别。其中非特定人语音识别支持九种语音,方便客户开发国际化的产品。客户在开发的时候,使用新唐提供的ASR Tool工具,只需将所需命令写成文本模式,然后经由工具转换,就能生成用于项目文件的语音识别代码模块,简单并且容易使用。这种语音识别方案适用于语音控制系统领域,即用语音来控制设备的运行,相对于手动控制来说更加快捷、方便,可以用在诸如智能家电、智能穿戴、声控智能玩具等许多领域。

4、全志


总部:珠海
官网:http://www.allwinnertech.com/

全志R16助力科大讯飞智能语音

科大讯飞4+1环形五麦克风阵列搭载全志R16平台


搭载全志R16平台的科大讯飞4+1环形五麦克风阵列,专为机器人等可移动、能灵活转身、有全角度拾音需求的智能硬件产品而设计,远场拾音距离可达5米。相比以往线性麦克风单维180度的覆盖维度,它可将覆盖度扩大到二维空间,即360度全平面拾音角度,而且去噪效果更好,抗环境噪音的能力更强,就算在嘈杂的环境中也能准确地识别声音。卓越的环形五麦克风远场识别技术与语音识别、语音合成、语音唤醒、声纹识别、人脸识别等交互技术相结合,让智能硬件产品拥有了更出色的人机交互能力。


5、深圳市盛矽电子科技有限公司(二次开发)


总部:深圳
简介:盛矽电子是专业从事语音方案与技术服务的提供商,由深圳总公司和北京研发中心分公司组成。专注于语音识别、智能玩具、儿童电脑、语音芯片等领域。
官网:http://www.semxi.com/

语音识别芯片:


1)特定人语音识别·录音·放音语音芯片SR150X
特定人语音识别录音放音语音芯片SR150X,最大识别词条30句,可实现录音、放音、LED发光管输出及电机控制。SR150X特定人语音识别、录音、放音、LED、音乐、电机、控制机芯可增加产品的趣味性、娱乐性,广泛应用于智能毛绒玩具、智能娃娃、塑胶娃娃、礼品等行业。


2)非特定人OTP语音识别芯片SR170X
非特定人语音识别芯片SR170X系列,内有海量词库免采库,抗噪性极佳!独有的的软件虚拟机技术,只要硬件资源能够匹配,所有软件功能可以通过Flash端实现,有效降低客人MASK风险以及库存量,多款产品可以通过同一颗芯片实现,真正实现零库存,MASK的价格,OTP的性能。

6、深圳市捷通语音技术开发有限公司(二次开发)


总部:深圳
简介:深圳市捷通语音技术开发有限公司是一家专业从事语音识别、语音合成业务的科技及贸易一体化公司。公司开创了语音识别芯片应用在玩具领域的市场。公司可根据客户的需求,提供产品的解决方案; 为特定市场的产品,设计新功能新应用,为品牌企业实现产品创新。
官网:http://www.szjtvoice.com/

7、上海华镇电子科技有限公司


总部:上海
简介:上海华镇是专门从事语音识别、语音合成、声纹识别技术的开发、研究、软件应用及提供全程技术支持和服务的高新科技企业;全面掌握核心技术,其中中文语音识别和合成技术代表了当今世界同类产品的领先水平。其技术能够应用于各种电子及通信设备,包括:智能玩具,智能家居系统,智能汽车导航及声控,智能手机Smartphone、 PDA、固定电话、移动电话,电信级的服务器及个人电脑等。
官网:http://www.wanson.cn/

语音识别芯片/模块
1)语音识别芯片/模块GM11A550
2)高端语音识别芯片/模块WS117--最多支持1000条词条识别
3)特定人语音识别(SD)芯片WS-100

8、北京承芯卓越科技有限公司


总部:北京
简介:公司成立于2006年12月,是一家立足于中关村清华科技园区的北京市高新技术企业,海淀区创新企业,是以提供具有自主知识产权的智能语音处理类专用芯片和方案为主业的高科技公司。主要致力于自主研发嵌入式语音识别芯片、应用软件技术、和智能语音应用方案。
官网:http://www.helios-adsp.com.cn/

语音识别芯片:
1)语音识别芯片-28X
2)语音识别芯片-29X
3)语音识别协处理芯片-HBR34X


9、深圳唯创知音电子有限公司


总部:深圳
简介:专注于语音技术研究、语音产品方案设计及控制等软、硬件设计的高新技术公司。杰出的语音芯片厂家,从事语音芯片研究及外围电路开发;同时为有特别需求的客户制订语音产品开发方案,并且落实执行该方案,完成产品的研发、测试,声音处理,直至产品的实际应用指导等一系列服务。业务范围涉及电话录音、汽车电子、多媒体、家居防盗、通信、家电、医疗器械、工业自动化控制、玩具及互动消费类产品等领。
官网:http://www.waytronic.cn/

语音识别芯片/模块:

WTK6900B01语音识别模块,该模块的详细信息请点击:http://www.52solution.com/index.php/Home/OneBuy/oneBuyDetail/id/4126.html



更多智能语音方案,欢迎进入方案超市>>>搜索

相关资讯
智联未来座驾!中航光电上海车展解码新能源汽车核心技术矩阵

在2025上海国际车展上,作为中国高端互连解决方案领军企业的中航光电(股票代码:002179),以整车电子电气架构革新者的姿态,携五大核心技术体系亮相,构建起覆盖"车-路-云"全场景的智能出行技术生态。

秒级响应+精准识别:解析移远通信毫米波雷达的六大核心优势与市场前景

在智能汽车传感器领域,国产化突破迎来里程碑时刻——移远通信最新发布的77GHz毫米波雷达RD7702AC,以毫米级动作捕捉、多场景抗干扰和全链路国产化优势,率先打破外资品牌垄断格局。作为全球首款集成AR增强现实的脚踢雷达方案,该产品不仅将误触发率压降至0.1%以下,更通过岸达科技国产芯片组实现30%成本优化,同步拓展至舱内活体检测、侧门防撞等智能驾驶场景。在国产替代浪潮与4D成像雷达技术迭代的双重驱动下,这款"中国芯"传感器正加速重构车载感知市场格局,为智能汽车产业链自主可控提供关键支点。

工业级MEMS加速度计革新:IIS2DULPX如何重塑智能制造与资产监测?

意法半导体(ST)推出的IIS2DULPX工业级三轴MEMS加速度计,凭借其边缘智能、超低功耗与宽温域特性,正在成为工业自动化与资产监测领域的核心组件。本文将从技术优势、竞品对比、应用场景及国产替代潜力等维度,解析其如何突破传统传感器瓶颈,推动工业智能化升级。

意法半导体2025年Q1财报:汽车芯片需求疲软致业绩"雪崩" 战略转型能否破局?

(都灵,4月24日)全球半导体行业标杆企业意法半导体(STMicroelectronics,NYSE:STM)今日发布2025财年第一季度财报,数据显示这家欧洲芯片巨头正经历周期下行带来的严峻考验。在汽车电子和工业自动化两大核心市场需求持续萎靡的背景下,公司多项财务指标出现断崖式下跌,引发资本市场对半导体行业复苏节奏的重新评估。

广达37周年释放产业信号:数据中心投资潮下 高阶服务器制造版图重构

全球电子代工龙头广达电脑(2382.TW)在成立37周年庆典上释放重磅产业信号。董事长林百里向《经济日报》披露,企业已锁定美系四大云服务商(CSP)今明两年持续增长订单,并宣布启动"自主型研发"战略转型,剑指AI服务器千亿级市场制高点。