科大讯飞能称霸智能语音领域 这五大语音交互技术功不可没

发布时间:2016-11-19 阅读量:5003 来源: 发布人:

2016年11月17日,科大讯飞携最新成果参加了我爱方案网、快包与中国可穿戴计算产业技术创新联盟联合主办探索人工智能、医疗健康、虚拟现实之间的互动论坛,论坛由我爱方案网副总王勤女士主持。论坛上,科大讯飞产品总监王磊分享了智能人机交互服务,以及最新的AI/VR方案。他表示,科大讯飞的产品之所以领先业界,与以下五大关键技术的发展密不可分。



关键技术一:语音合成

语音合成技术主要是根据韵律建模的结果,从原始语音库中取出相应的语音基元,利用特定的语音合成技术对语音基元进行韵律特性的调整和修改,最终合成出符合要求的语音。王总介绍到,语音合成技术是在讯飞在2010年开发完成的,在这方面,讯飞目前的语音合成的自然度已经超过了普通人。



明星应用场景:讯飞主流的语音技术应用场景很多,比较具有代表性的便是现今网络爆红的高德地图语音导航系统与滴滴打车,高德运用讯飞开放平台的语音合成产品,明星真声合成的语音提示带来人性化的体验,使得高德地图下载量超过平日的6倍,新增用户速率提升230%,每日活跃用户增加36%。

关键技术二:语音识别

语音识别是一门交叉学科,也被称为自动语音识别,其目标是将人类语音中的词汇内容转换为计算机可读的输入,科大讯飞的语音识别起步较晚,不过发展的很快,大概是在2014年真正落地。王总介绍到,目前科大讯飞的语音识别技术普通话识别准确率突破95%,并开放包括湖南话、粤语、闽南语等多达十八种方言。



明星应用场景:语音识别APP心声。“这种技术非常有意义,不仅方便日常文字—语音之间的转换,对于聋人群体来说也是一个福利,心声是一款语音识别APP,聋人只需要使用APP就可帮助自己去倾听别人说话,沟通会变得非常简单。”论坛上王总说到。

关键技术三:语义理解

语义理解是衡量人机交互的体验度的一个重要指标,人工智能的核心是认知,而认知的核心是语义理解技术。机器人只有在“懂”了人类的指令后,才能正确执行用户下达的指令。



明星应用场景:三宝机器人。它运用开放平台的语义理解、人脸检测、自主声源定位等技术,让三宝具有像人一样的“看”“听”“嗅”功能,全方位感知周边环境,让用户体验智能家居生活。

关键技术四:麦克风阵列

麦克风阵列,从字面上,指的是麦克风的排列。也就是说由一定数目的声学传感器(一般是麦克风)组成,用来对声场的空间特性进行采样并处理的系统。这种技术能够使机器人或者被控制产品在嘈杂环境清楚的辨识真正的语音指令,在酒店、马路等公共场所有非常广泛的应用。



明星应用场景:康力优蓝U05优友机器人。该机器人运用开放平台五麦克风阵列及语音技术,是国内第一款可量产的大型服务机器人。

关键技术五:AIUI人工智能交互界面

王工认为,在万物互联时代,要真正实现流畅的人机交互,必须满足四点:第一是远场降噪;第二是方言识别;第三是全双工,随时随地在听;第四个自动纠错,主动纠错,支持多轮对话、打断、上下文相关。只有这些都具备,才是万物互联时代真正的人机语音交互系统。在这个基础上,科大讯飞以语音为主结合图像视觉及手写识别,将整个人工智能功能集结在一起,推出了业界首个人工智能的用户交互界面——AIUI。



明星应用场景:AIUI。在之前AIUI发布会现场,科大讯飞在全球首次将演讲人的演讲同步转写成文字在大屏幕显示,接受现场数千参会者和数千万观看视频直播观众的检验。王总强调,这个技术亦将是科大讯飞未来的发展方向。

同时,由我爱方案网与科大讯飞联合主办了一场智能硬件设计大赛于今天正式开启,本次活动旨在寻找人工智能领域最具创意的设计者。借力科大讯飞成熟的人工智能交互平台,应用以上五大语音技术,快速接入人工智能风口,寻找创新的种子并共同孵化出创新的解决方案推向市场,我们为最具创意的你准备了六万现金大奖以及科大讯飞十万的语音优质资源,帮助开发者实现业务创新落地,成就你创新梦想。



凡参与本次比赛的选手均可以获得以下福利:
1、获得科大讯飞实习或者工作的机会;
2、获得我爱方案网品牌宣传,优质资源优先对接的机会;
3、获得科大讯飞语音技术支持。而通过比赛筛选入围方案以及最佳方案均将获得科大讯飞价值十万语音优质资源,还有丰厚的现金大奖等着你!

目前,活动整在火热报名中,报名时间将持续到2016年12月18日。人工智能正在改变世界,开发奖金、创业风口、投资机会正在向你招手,准备好了就来挑战吧!

活动报名入口:http://www.52solution.com/index.php/Home/Special/kdxf

相关资讯
智联未来座驾!中航光电上海车展解码新能源汽车核心技术矩阵

在2025上海国际车展上,作为中国高端互连解决方案领军企业的中航光电(股票代码:002179),以整车电子电气架构革新者的姿态,携五大核心技术体系亮相,构建起覆盖"车-路-云"全场景的智能出行技术生态。

秒级响应+精准识别:解析移远通信毫米波雷达的六大核心优势与市场前景

在智能汽车传感器领域,国产化突破迎来里程碑时刻——移远通信最新发布的77GHz毫米波雷达RD7702AC,以毫米级动作捕捉、多场景抗干扰和全链路国产化优势,率先打破外资品牌垄断格局。作为全球首款集成AR增强现实的脚踢雷达方案,该产品不仅将误触发率压降至0.1%以下,更通过岸达科技国产芯片组实现30%成本优化,同步拓展至舱内活体检测、侧门防撞等智能驾驶场景。在国产替代浪潮与4D成像雷达技术迭代的双重驱动下,这款"中国芯"传感器正加速重构车载感知市场格局,为智能汽车产业链自主可控提供关键支点。

工业级MEMS加速度计革新:IIS2DULPX如何重塑智能制造与资产监测?

意法半导体(ST)推出的IIS2DULPX工业级三轴MEMS加速度计,凭借其边缘智能、超低功耗与宽温域特性,正在成为工业自动化与资产监测领域的核心组件。本文将从技术优势、竞品对比、应用场景及国产替代潜力等维度,解析其如何突破传统传感器瓶颈,推动工业智能化升级。

意法半导体2025年Q1财报:汽车芯片需求疲软致业绩"雪崩" 战略转型能否破局?

(都灵,4月24日)全球半导体行业标杆企业意法半导体(STMicroelectronics,NYSE:STM)今日发布2025财年第一季度财报,数据显示这家欧洲芯片巨头正经历周期下行带来的严峻考验。在汽车电子和工业自动化两大核心市场需求持续萎靡的背景下,公司多项财务指标出现断崖式下跌,引发资本市场对半导体行业复苏节奏的重新评估。

广达37周年释放产业信号:数据中心投资潮下 高阶服务器制造版图重构

全球电子代工龙头广达电脑(2382.TW)在成立37周年庆典上释放重磅产业信号。董事长林百里向《经济日报》披露,企业已锁定美系四大云服务商(CSP)今明两年持续增长订单,并宣布启动"自主型研发"战略转型,剑指AI服务器千亿级市场制高点。