锤子M1助科大讯飞上头条 语音识别蓝海将到?

发布时间:2016-10-21 阅读量:1409 来源: 我爱方案网 作者: cicyxu

2016年10月18日晚上,锤子科技发布了最新旗舰智能手机M1与M1 Plus。会上,锤子科技创始人罗永浩向公众展示了新旗舰手机的多项功能,其中科大讯飞超精准的语音输入赢得了诸多观众的掌声。

据罗永浩透露,科大讯飞的语音识别率已经高达 97 %,如果不是发给那些非常咬文嚼字的人看的话,经过讯飞语音识别的文字基本可以直接发送。

▲ 讯飞语音输入获锤子力挺(Source:锤子科技微博)

语音输入比键盘输入更加方便(无需用手)、快速(人每分钟能讲出 150 个单词,却只能打出 40 个字)的优势,这是其兴起的基础。

科大讯飞的语音输入,为我们揭示了语音识别应用的冰山一角。事实上,除了让机器将语音转换成文字,语音识别还能将语音信号转换成命令,从而成为互联网场景下的控制中心。

语音识别蓝海即将到来,三大应用引期待

近年,伴随物联网技术与人工智能技术不断落地,语音识别技术重要性不断凸显。“互联网女皇”玛丽·米克尔发布的 2016 年互联网趋势报告中,将语音识别技术列为重要的技术趋势,玛丽·米克尔认为,未来的计算界面将可由键盘升级至麦克风加键盘的模式。

另外,亚马逊的 Echo 音响内置了 Amazon Alexa 语音助手、苹果在手机以及电脑上搭载了 Siri ,微软推出了小娜与小冰;谷歌正式推出了面向 Android 与 ios 系统的 Allo ……科技大佬们正积极推动语音识别技术的发展。

受以上因素刺激,业界认为,语音识别技术的蓝海即将到来,从业界的动态来看,其在搜索引擎、智能家居以及智能汽车三方面的应用备受期待。

语音识别将可取代传统的搜索引擎,成为互联网的重要入口。 Amazon Alexa 、 Siri 、微软小娜、谷歌 Allo 都在为此目标努力,取代传统搜索引擎后,语音识别技术将可收获网络营销、用户调研、收费问答等多个领域的市场。

智能家居领域,需要将多款遥控设备集成于一个设备中,供用户操作,大多时候,智能手机 APP 充当了这一功能。语音识别技术加入后,通过声音指令,即可实现对家居环境中各个联网设备的控制,这种方式更加便捷。

智能汽车领域中,自动驾驶技术无疑是重点,除此之外,语音识别技术也能有效提高汽车的智能性。比如可进行全语音交互的地图导航、又比如驾驶之外的车内交互场景(打电话、查询天气、播放音乐等)。

延时与准确两大痛点,语音识别技术待提升

语音识别技术前景无疑是美好的,不过,现阶段,语音识别还受困于技术痛点,难以大范围应用,主要体现在延时与准确性两方面。

在语音转换成文字方面,科大讯飞等企业速度已经比较能让人接受了,不过在语音指令方面,Siri、微软小娜等还会有延时的现象,机器理解并采取回应的过程需要更多时间,不过一个指令需要用户等待十秒甚至以上的,则很难被市场接受。

准确性上,有媒体对科大讯飞的语音输入做过实测,结果显示,在语速慢的情况下,科大讯飞语音能很快将语音准确地翻译成文字;不过,在语速快、中英文夹杂的情况下,准确性有所下降。

另外,语音输入的准确性还面临方言以及使用环境的挑战。

因此,未来语音识别技术还需要在速度和准确性上有所提升。尤其是准确性,业界相信,当语音识别技术准确度提高到99%的时候,将会改写当前人机交互的规则。




相关资讯
华虹半导体2025年Q1业绩解析:逆势增长背后的挑战与破局之路

2025年第一季度,华虹半导体(港股代码:01347)实现销售收入5.409亿美元,同比增长17.6%,环比微增0.3%,符合市场预期。这一增长得益于消费电子、工业控制及汽车电子领域需求的复苏,以及公司产能利用率的持续满载(102.7%)。然而,盈利能力显著下滑,母公司拥有人应占溢利仅为380万美元,同比锐减88.05%,环比虽扭亏为盈,但仍处于低位。毛利率为9.2%,同比提升2.8个百分点,但环比下降2.2个百分点,反映出成本压力与市场竞争的加剧。

边缘计算新引擎:瑞芯微RV1126B四大核心技术深度解析

2025年5月8日,瑞芯微电子正式宣布新一代AI视觉芯片RV1126B通过量产测试并开启批量供货。作为瑞芯微在边缘计算领域的重要布局,RV1126B凭借3T算力、定制化AI-ISP架构及硬件级安全体系,重新定义了AI视觉芯片的性能边界,推动智能终端从“感知”向“认知”跃迁。

半导体IP巨头Arm:季度营收破12亿,AI生态布局能否撑起估值泡沫?

2025财年第四季度,Arm营收同比增长34%至12.4亿美元,首次突破单季10亿美元大关,超出分析师预期。调整后净利润达5.84亿美元,同比增长55%,主要得益于Armv9架构芯片在智能手机和数据中心的渗透率提升,以及计算子系统(CSS)的强劲需求。全年营收首次突破40亿美元,其中专利费收入21.68亿美元,授权收入18.39亿美元,均刷新历史纪录。

Arrow Lake的突破:混合架构与先进封装的协同进化

2024年10月,英特尔正式发布Arrow Lake架构的酷睿Ultra 200系列处理器,标志着其在桌面计算领域迈入模块化设计的新阶段。作为首款全面采用Chiplet(芯粒)技术的桌面处理器,Arrow Lake不仅通过多工艺融合实现了性能与能效的优化,更以创新的混合核心布局和缓存架构重新定义了处理器的设计范式。本文将深入解析Arrow Lake的技术突破、性能表现及其对行业的影响。

暗光性能提升29%:深度解析思特威新一代AI眼镜视觉方案

2025年5月8日,思特威(股票代码:688213)正式发布专为AI眼镜设计的1200万像素CMOS图像传感器SC1200IOT。该产品基于SmartClarity®-3技术平台,集成SFCPixel®专利技术,以小型化封装、低功耗设计及卓越暗光性能,推动AI眼镜在轻量化与影像能力上的双重突破。公司发言人表示:"AI眼镜的快速迭代正倒逼传感器技术升级,需在尺寸、功耗与画质间实现平衡,这正是SC1200IOT的核心价值所在。"