科大讯飞能称霸智能语音领域 这五大语音交互技术功不可没

发布时间:2016-11-19 阅读量:5068 来源: 发布人:

2016年11月17日,科大讯飞携最新成果参加了我爱方案网、快包与中国可穿戴计算产业技术创新联盟联合主办探索人工智能、医疗健康、虚拟现实之间的互动论坛,论坛由我爱方案网副总王勤女士主持。论坛上,科大讯飞产品总监王磊分享了智能人机交互服务,以及最新的AI/VR方案。他表示,科大讯飞的产品之所以领先业界,与以下五大关键技术的发展密不可分。



关键技术一:语音合成

语音合成技术主要是根据韵律建模的结果,从原始语音库中取出相应的语音基元,利用特定的语音合成技术对语音基元进行韵律特性的调整和修改,最终合成出符合要求的语音。王总介绍到,语音合成技术是在讯飞在2010年开发完成的,在这方面,讯飞目前的语音合成的自然度已经超过了普通人。



明星应用场景:讯飞主流的语音技术应用场景很多,比较具有代表性的便是现今网络爆红的高德地图语音导航系统与滴滴打车,高德运用讯飞开放平台的语音合成产品,明星真声合成的语音提示带来人性化的体验,使得高德地图下载量超过平日的6倍,新增用户速率提升230%,每日活跃用户增加36%。

关键技术二:语音识别

语音识别是一门交叉学科,也被称为自动语音识别,其目标是将人类语音中的词汇内容转换为计算机可读的输入,科大讯飞的语音识别起步较晚,不过发展的很快,大概是在2014年真正落地。王总介绍到,目前科大讯飞的语音识别技术普通话识别准确率突破95%,并开放包括湖南话、粤语、闽南语等多达十八种方言。



明星应用场景:语音识别APP心声。“这种技术非常有意义,不仅方便日常文字—语音之间的转换,对于聋人群体来说也是一个福利,心声是一款语音识别APP,聋人只需要使用APP就可帮助自己去倾听别人说话,沟通会变得非常简单。”论坛上王总说到。

关键技术三:语义理解

语义理解是衡量人机交互的体验度的一个重要指标,人工智能的核心是认知,而认知的核心是语义理解技术。机器人只有在“懂”了人类的指令后,才能正确执行用户下达的指令。



明星应用场景:三宝机器人。它运用开放平台的语义理解、人脸检测、自主声源定位等技术,让三宝具有像人一样的“看”“听”“嗅”功能,全方位感知周边环境,让用户体验智能家居生活。

关键技术四:麦克风阵列

麦克风阵列,从字面上,指的是麦克风的排列。也就是说由一定数目的声学传感器(一般是麦克风)组成,用来对声场的空间特性进行采样并处理的系统。这种技术能够使机器人或者被控制产品在嘈杂环境清楚的辨识真正的语音指令,在酒店、马路等公共场所有非常广泛的应用。



明星应用场景:康力优蓝U05优友机器人。该机器人运用开放平台五麦克风阵列及语音技术,是国内第一款可量产的大型服务机器人。

关键技术五:AIUI人工智能交互界面

王工认为,在万物互联时代,要真正实现流畅的人机交互,必须满足四点:第一是远场降噪;第二是方言识别;第三是全双工,随时随地在听;第四个自动纠错,主动纠错,支持多轮对话、打断、上下文相关。只有这些都具备,才是万物互联时代真正的人机语音交互系统。在这个基础上,科大讯飞以语音为主结合图像视觉及手写识别,将整个人工智能功能集结在一起,推出了业界首个人工智能的用户交互界面——AIUI。



明星应用场景:AIUI。在之前AIUI发布会现场,科大讯飞在全球首次将演讲人的演讲同步转写成文字在大屏幕显示,接受现场数千参会者和数千万观看视频直播观众的检验。王总强调,这个技术亦将是科大讯飞未来的发展方向。

同时,由我爱方案网与科大讯飞联合主办了一场智能硬件设计大赛于今天正式开启,本次活动旨在寻找人工智能领域最具创意的设计者。借力科大讯飞成熟的人工智能交互平台,应用以上五大语音技术,快速接入人工智能风口,寻找创新的种子并共同孵化出创新的解决方案推向市场,我们为最具创意的你准备了六万现金大奖以及科大讯飞十万的语音优质资源,帮助开发者实现业务创新落地,成就你创新梦想。



凡参与本次比赛的选手均可以获得以下福利:
1、获得科大讯飞实习或者工作的机会;
2、获得我爱方案网品牌宣传,优质资源优先对接的机会;
3、获得科大讯飞语音技术支持。而通过比赛筛选入围方案以及最佳方案均将获得科大讯飞价值十万语音优质资源,还有丰厚的现金大奖等着你!

目前,活动整在火热报名中,报名时间将持续到2016年12月18日。人工智能正在改变世界,开发奖金、创业风口、投资机会正在向你招手,准备好了就来挑战吧!

活动报名入口:http://www.52solution.com/index.php/Home/Special/kdxf

相关资讯
面板双虎6月营收承压 大摩预警第三季度价格疲软延续

中国台湾面板大厂友达光电与群创光电相继公布2025年6月营收数据,显示行业整体仍面临下行压力。友达光电6月合并营收为219.2亿元新台币,环比下滑9.3%,同比减少13.1%。群创光电当月营收185亿元新台币,较5月微降1.14%,同比略减1.23%。

三星显示加速推进,为苹果可折叠iPhone铺平OLED道路

全球显示技术领导者三星显示(Samsung Display)已正式启动为苹果公司(Apple Inc.)专属可折叠iPhone打造OLED显示屏的生产准备工作。据悉,这一关键举措的核心是在其韩国忠清南道牙山的A3工厂内,建设一条专为可折叠面板设计的全新生产线。消息人士透露,该产线所需的关键设备更换与调试工作已于2023年下半年全面展开,目前项目进展顺利,已进入最后的冲刺与收尾阶段,为后续的批量试产和最终量产奠定了坚实基础。

赛力斯2025上半年预盈超27亿,净利润同比劲增最高近97%

7月10日,中国新能源汽车领域的重要参与者赛力斯集团(601127.SH)发布了2025年半年度业绩预告。公告显示,公司预计2025年1至6月实现归属于上市公司股东的净利润在27亿元至32亿元之间,相比上年同期的16.25亿元,同比增幅达到66.2%至96.98%,展现出强劲的增长势头。

联发科Q2营收突破1500亿台币,AI与定制化芯片驱动未来增长

联发科技(MediaTek)公布2024年6月合并营收达564.34亿台币,强势重返500亿大关,创下近33个月新高。该业绩较上月增长24.9%,同比提升30.9%,显著拉动第二季度整体表现达标。

革命性零恢复特性!Nexperia发布1200V SiC二极管攻占工业能源市场

在全球能源效率需求持续提升的背景下,宽禁带半导体技术迎来爆发式增长。Nexperia作为功率电子领域的领先企业,近期扩充了其碳化硅(SiC)产品线,推出两款1200V/20A规格的肖特基二极管——PSC20120J与PSC20120L。这两款新器件瞄准工业级高能效应用场景,为解决高功率系统能量转换损耗问题提供了创新解决方案。