2016年11月17日,科大讯飞携最新成果参加了我爱方案网、快包与中国可穿戴计算产业技术创新联盟联合主办探索人工智能、医疗健康、虚拟现实之间的互动论坛,论坛由我爱方案网副总王勤女士主持。论坛上,科大讯飞产品总监王磊分享了智能人机交互服务,以及最新的AI/VR方案。他表示,科大讯飞的产品之所以领先业界,与以下五大关键技术的发展密不可分。
关键技术一:语音合成
语音合成技术主要是根据韵律建模的结果,从原始语音库中取出相应的语音基元,利用特定的语音合成技术对语音基元进行韵律特性的调整和修改,最终合成出符合要求的语音。王总介绍到,语音合成技术是在讯飞在2010年开发完成的,在这方面,讯飞目前的语音合成的自然度已经超过了普通人。
明星应用场景:讯飞主流的语音技术应用场景很多,比较具有代表性的便是现今网络爆红的高德地图语音导航系统与滴滴打车,高德运用讯飞开放平台的语音合成产品,明星真声合成的语音提示带来人性化的体验,使得高德地图下载量超过平日的6倍,新增用户速率提升230%,每日活跃用户增加36%。
关键技术二:语音识别
语音识别是一门交叉学科,也被称为自动语音识别,其目标是将人类语音中的词汇内容转换为计算机可读的输入,科大讯飞的语音识别起步较晚,不过发展的很快,大概是在2014年真正落地。王总介绍到,目前科大讯飞的语音识别技术普通话识别准确率突破95%,并开放包括湖南话、粤语、闽南语等多达十八种方言。
明星应用场景:语音识别APP心声。“这种技术非常有意义,不仅方便日常文字—语音之间的转换,对于聋人群体来说也是一个福利,心声是一款语音识别APP,聋人只需要使用APP就可帮助自己去倾听别人说话,沟通会变得非常简单。”论坛上王总说到。
关键技术三:语义理解
语义理解是衡量人机交互的体验度的一个重要指标,人工智能的核心是认知,而认知的核心是语义理解技术。机器人只有在“懂”了人类的指令后,才能正确执行用户下达的指令。
明星应用场景:三宝机器人。它运用开放平台的语义理解、人脸检测、自主声源定位等技术,让三宝具有像人一样的“看”“听”“嗅”功能,全方位感知周边环境,让用户体验智能家居生活。
关键技术四:麦克风阵列
麦克风阵列,从字面上,指的是麦克风的排列。也就是说由一定数目的声学传感器(一般是麦克风)组成,用来对声场的空间特性进行采样并处理的系统。这种技术能够使机器人或者被控制产品在嘈杂环境清楚的辨识真正的语音指令,在酒店、马路等公共场所有非常广泛的应用。
明星应用场景:康力优蓝U05优友机器人。该机器人运用开放平台五麦克风阵列及语音技术,是国内第一款可量产的大型服务机器人。
关键技术五:AIUI人工智能交互界面
王工认为,在万物互联时代,要真正实现流畅的人机交互,必须满足四点:第一是远场降噪;第二是方言识别;第三是全双工,随时随地在听;第四个自动纠错,主动纠错,支持多轮对话、打断、上下文相关。只有这些都具备,才是万物互联时代真正的人机语音交互系统。在这个基础上,科大讯飞以语音为主结合图像视觉及手写识别,将整个人工智能功能集结在一起,推出了业界首个人工智能的用户交互界面——AIUI。
明星应用场景:AIUI。在之前AIUI发布会现场,科大讯飞在全球首次将演讲人的演讲同步转写成文字在大屏幕显示,接受现场数千参会者和数千万观看视频直播观众的检验。王总强调,这个技术亦将是科大讯飞未来的发展方向。
同时,由我爱方案网与科大讯飞联合主办了一场智能硬件设计大赛于今天正式开启,本次活动旨在寻找人工智能领域最具创意的设计者。借力科大讯飞成熟的人工智能交互平台,应用以上五大语音技术,快速接入人工智能风口,寻找创新的种子并共同孵化出创新的解决方案推向市场,我们为最具创意的你准备了六万现金大奖以及科大讯飞十万的语音优质资源,帮助开发者实现业务创新落地,成就你创新梦想。
凡参与本次比赛的选手均可以获得以下福利:
1、获得科大讯飞实习或者工作的机会;
2、获得我爱方案网品牌宣传,优质资源优先对接的机会;
3、获得科大讯飞语音技术支持。而通过比赛筛选入围方案以及最佳方案均将获得科大讯飞价值十万语音优质资源,还有丰厚的现金大奖等着你!
目前,活动整在火热报名中,报名时间将持续到2016年12月18日。人工智能正在改变世界,开发奖金、创业风口、投资机会正在向你招手,准备好了就来挑战吧!
活动报名入口:
http://www.52solution.com/index.php/Home/Special/kdxf