智能语音未来趋势:垂直细分

发布时间:2016-11-28 阅读量:743 来源: 发布人:

随着人工智能技术的不断进步,智能语音技术也日趋成熟,在这里不得不提谷歌、微软、科大讯飞等科技公司在智能语音方面的带动作用,使得我们在日常生活中已经不乏看到语音技术的应用。

当前触摸屏和键盘仍然是今天人机交互主要媒介,但未来语音交互或可与之平分天下。智能语音的发展将推动人工智能的发展,使我们的生活变得更轻松更美好。

英语口语考试,你的考官不是人,而是一台计算机,它直接给你打分;一边开车一边对你的车说话下命令,“帮我打电话给妈妈”、“帮我买明天去北京的机票”、“带我去最近的面馆”;躺在病床上,不用动身体,直接开口对空调说“把温度调到26度”。

语音直接说话下命令,代替按键、触摸屏,是人更自然的体验。语音技术正让机器像人一样用语音交流。

谷歌美国公司语音技术人员向记者透露,谷歌正在各项服务中全面融入语音技术。微软的开发者大会提出“对话即平台”(Conversation as Platform)计划,简单说就是“想让你对机器说句话就把事给办了”。微软CEO纳德拉表示,语音指令正成为键盘、触摸屏之后的新一代人机对话方式。

当下正是转型关键期,各大企业的竞争也从单纯技术水平转变到应用场景的用户,“语音+各个应用场景”成为这百亿市场的制胜关键。

科大讯飞:从幕后到台前

科大讯飞自称占中文语音市场70%份额,以其为案例,或许可对这个行业略窥一二。

科大讯飞董秘江涛透露,目前科大讯飞在企业端和终端消费者端的业务占比分别是80%和20%,公司的目标是今后使这两块比重倒置,此次收购教育软件公司也是其“语音+教育”的重要一步。

科大讯飞要让终端消费者成为自己主要的用户?而科大讯飞目前的客户还是以政府、国企为主,这家具有国企背景的公司,如何能抓住互联网时代终端消费者的心?

面对记者的这一提问,科大讯飞并没有给出明确的回答,或许科大讯飞看到了市场未来的大势,但具体怎么落地实施,仍需时日来摸索。

于是记者试图从其目前技术中,梳理出科大讯飞可能的方向。要具体应用于终端消费者,首先需要确定在什么场景下、谁来用这项服务、用户有哪些需要,因此,服务的场景、用户特征需要首先锁定。换句话说,需要锁定垂直细分领域,再根据这一领域的具体场景配置技术。

比如,机器自动翻译应用在手机端。科大讯飞称,“随声译”功能达到了大学英语六级水平,一秒钟内能实现中英语音互译。

据科大讯飞公司介绍,在广东、江苏、上海、重庆、山东等10余省市的中高考英语听说考试中,开始试点用机器当考官,全年累计测试考生数近1000万。此外,用机器来改作文,也已经在安庆、合肥、湖南等地试点应用。

目前打客服电话需要通过一层层语音提示、按键,能否一次性直接得到想要的答案?“智能客服未来会替换掉50%以上的人工。”科大讯飞公司向《国际金融报》记者表示。安徽(科大讯飞起家的地方)省移动公司目前用科大讯飞的技术,可以基本实现语音直接搜索答案。科大讯飞为中国联通建设的智能语音客服——语音导航系统的试点建设,为其节省了20%以上的人工成本。另外,政府背景的金融机构、国家电网、航空公司、政府机关、医疗机构、广电行业,以及速运行业等主要呼叫中心,正在使用科大讯飞的机器语音应答。

目前已有31款车在出厂前搭载了科大讯飞的智能语音系统。同时,在政府基础设施建设上,科大讯飞也与江西、广西、吉林等省展开合作。

未来趋势:垂直细分

智能语音产业并不是以大取胜,并非范围铺的越大、叫得越响、效果就越好。一些小型创业公司反而在某些单点技术上成为最优。

例如,在真实场景中,噪音、被打断、离太远听不清,非常常见,因此不是简单一个识别率的问题而已。思必驰是一家只针对智能硬件厂商提供语音解决方案的公司,“在去年7月推出‘打断纠正’的智能交互技术,科大讯飞比它晚5个月,思必驰的语音输入板比科大讯飞早一年,但在严重噪声干扰中,准确率明显高于科大讯飞、百度语音。2015年发现了机器人对远场交互、声源定位的刚需,在去年12月推出环形‘6+1’远场麦克风阵列,讯飞是今年3月推出的。”思必驰公司市场负责人龙梦竹介绍。

但创业公司既要避开互联网大公司,又要开辟科大讯飞已经抢占市场之外的其他领域。

“我们专注的是交互,而不是识别。语音交互好不好,重点不在于识别准确率,而是垂直场景下的语义理解,以及后端服务。举个例子,如果你对机器说‘帮我放一首许巍的《生活不止眼前的苟且》’,如果机器回答你‘抱歉,找不到您要的服务’。用户只会觉得是交互不好,不智能。其实核心问题是,后端的内容不够。”龙梦竹告诉记者。

因此,“阿里年初投了思必驰,重点不是资金,而是我们看中阿里能带来的资源,比如高德、虾米音乐、神马搜索、云os等。”龙梦竹告诉记者。

这些创业公司需要非常专注在某一垂直细分领域,针对具体场景来为客户量身定制开发技术。“我们不做客服、不做教育、不做智慧城市,专注在车载、家居、机器人三个垂直领域的解决方案。车载后市场中,思必驰大约占45%市场。我们也没做方言,没做英语。但2014年以来的订单快速增加,证明了在专业领域的技术水平。”思必驰公司市场负责人告诉记者。

另一家to B的基础技术公司云知声的CEO黄伟向《国际金融报》记者表示,“在应用层面,公司提供AI芯(智能芯片)、AIUI(智能界面)、AI Service(智能服务)三大解决方案。”

人工智能芯片,即把智能程序植入芯片,例如针对空调的程序植入芯片后就可以装入各家公司的产品中,目前云知声芯片已经在美的、格力、华帝、海信植入芯片。“与讯飞、百度相比,云知声的技术定位是重点解决基于物联网设备的智能服务,尤其是从芯片级的紧密配合,直到打通云端服务。”黄伟表示。

智能界面,即人机交互界面,包括车载后市场(即出厂后车主自己配置的工具)、智能家居(在家具中植入智能语音程序)、智能机器人等。

而智能服务,是基于开放平台的SDK(软件开发工具包)。在这一方面,医院或许是个大市场。例如,医生不用再手写病历,直接说话即可自动录入。不仅如此,黄伟介绍,“云知声希望实现智能语音交互的知识问答、病历查询,进行健康风险预测和患者分群分析。目前合作伙伴包括北大医信、飞利浦医疗、北京协和医院、北京大学人民医院、江苏省肿瘤医院等。”

除了to B市场,“出门问问”是一家做2C(面向消费者)方向软硬结合的公司,谷歌公司占其一成股份。公司推出了智能手表Ticwatch,以及针对安卓穿戴、谷歌眼镜的智能语音操控应用、中文智能手表操作系统Ticwear。

总体而言,智能语音产业将呈现“多点开花、群星闪耀”的市场格局,但前提是能理解用户真实需求,否则不理解用户的语音将难以作为人工智能的切入口,而停留在语音只是语音的阶段。当下,正是该领域决胜负的关键战略期。

目前,科大讯飞语音大赛正在如火如荼报名当中,想与大咖之间合作,赶紧报名吧!

智能语音大赛:http://www.52solution.com/index.php/Home/Special/kdxfform.html


相关资讯
面板双虎6月营收承压 大摩预警第三季度价格疲软延续

中国台湾面板大厂友达光电与群创光电相继公布2025年6月营收数据,显示行业整体仍面临下行压力。友达光电6月合并营收为219.2亿元新台币,环比下滑9.3%,同比减少13.1%。群创光电当月营收185亿元新台币,较5月微降1.14%,同比略减1.23%。

三星显示加速推进,为苹果可折叠iPhone铺平OLED道路

全球显示技术领导者三星显示(Samsung Display)已正式启动为苹果公司(Apple Inc.)专属可折叠iPhone打造OLED显示屏的生产准备工作。据悉,这一关键举措的核心是在其韩国忠清南道牙山的A3工厂内,建设一条专为可折叠面板设计的全新生产线。消息人士透露,该产线所需的关键设备更换与调试工作已于2023年下半年全面展开,目前项目进展顺利,已进入最后的冲刺与收尾阶段,为后续的批量试产和最终量产奠定了坚实基础。

赛力斯2025上半年预盈超27亿,净利润同比劲增最高近97%

7月10日,中国新能源汽车领域的重要参与者赛力斯集团(601127.SH)发布了2025年半年度业绩预告。公告显示,公司预计2025年1至6月实现归属于上市公司股东的净利润在27亿元至32亿元之间,相比上年同期的16.25亿元,同比增幅达到66.2%至96.98%,展现出强劲的增长势头。

联发科Q2营收突破1500亿台币,AI与定制化芯片驱动未来增长

联发科技(MediaTek)公布2024年6月合并营收达564.34亿台币,强势重返500亿大关,创下近33个月新高。该业绩较上月增长24.9%,同比提升30.9%,显著拉动第二季度整体表现达标。

革命性零恢复特性!Nexperia发布1200V SiC二极管攻占工业能源市场

在全球能源效率需求持续提升的背景下,宽禁带半导体技术迎来爆发式增长。Nexperia作为功率电子领域的领先企业,近期扩充了其碳化硅(SiC)产品线,推出两款1200V/20A规格的肖特基二极管——PSC20120J与PSC20120L。这两款新器件瞄准工业级高能效应用场景,为解决高功率系统能量转换损耗问题提供了创新解决方案。