产品经理坐诊语音和图像识别,帮你梳理需求,助你成功

发布时间:2015-12-17 阅读量:786 来源: 我爱方案网 作者:

【导读】我爱快包的第三次产品经理坐诊活动圆满结束,本次活动是针对语音识别和图像识别领域的前沿应用进行的探讨,我爱快包的特邀嘉宾和产品经理通过分析现状的技术和趋势,为我爱快包有需求的雇主们量身定制了最适合各自的需求文案。来具体看看本次活动都有哪些亮点吧~
 
语音识别已经成为了大公司之间的兵家必争之地,而由于其方便、几乎没有学习成本等特性,普遍被认为可以在某种程度上代表人机交互的未来。而图像识别作为机器“认识”世界的一种新方式,也一直令大家心向往之。但这样的交互方式的使用门槛很低,开发门槛却非常高,至今世界上可以说仍然没有一款完美的语音和图像识别产品。可是创客们从不会因为一个技术的实现困难就避而不做,相反,挑战困难正是创客精神中相当重要的一部分。因此仍然有无数的创客们在为实现高效的语音、图像识别和处理而努力。
 
语音识别三大巨头,Siri、微软小娜、Google Now
 
毕竟创客个人的力量是有限的,在创业过程中,肯定所有人都希望有人能帮助自己指出自己的失误,或者传授一些更好的方法和技巧。而我爱快包举办的产品经理坐诊正是为了帮助有想法的创客们梳理自己的想法,让其更容易实现。
 
本次活动大家讨论比较热烈的需求有三个:一是云中飞公司希望为他们的智能止鼾仪配备一个语音识别模块,用于识别用户发出的声音是否为鼾声。以此记录用户打鼾程度的改善情况和判断睡眠质量。让用户能更直观的体会到止鼾仪的好处。
 
对此本次活动的嘉宾图一科技的刘峰表示:此处识别的方式和一般的语音识别类似,都是将用户声音的特征与已经录入系统的声音的特征值匹配。识别鼾声,就是通过建立鼾声的音频特征库,再将录入的鼾声与之对比进行判断。技术上没有特别困难的地方。但是建立鼾声数据库可能需要花费一些精力。
 
威客们正在热烈的讨论
 
第二是睿视科技的陈总提出的安防摄像头的一个设想,在安防领域的应用,如防盗应用中,摄像头通常只能在事发后才能通过调用录像来调查事件,或者凭借其本身的存在给犯罪者一个不算太有效的心理震慑。而大多数时候无法对外来威胁做到主动防御。因此陈总希望让摄像头具备图像识别能力。让摄像头在发现可疑人员的时候主动报警。
 
最初的设想是在摄像头发现可疑人员的时候拍摄一段视频发送给用户,但视频占用的带宽太大了,因此此设想可行性很低。于是大家退而求其次,希望在发现可疑人员的时候抓拍照片发给用户。
 
这个需求是经过消费者反馈证明确实存在并且比较强烈的。但是实现起来仍然有一些障碍,经过陈总和威客们的讨论。认为问题主要出在两点:一是在现在的物业体系中,为安防设备买单的并不是最终的消费者,而是房地产商或物业公司,而他们对消费者的个性化需求并不特别在意,并且对成本相当敏感,因此并不会偏向于采购这种具有新功能的产品。另一点是目前图像识别的技术还不太成熟,受环境尤其是光照条件的影响很大。而且对人脸识别的人的角度等的要求也非常苛刻。因此效率无法得到保证。
 
而天启航空科技的付总则希望做一个应用于无人机的识图避障功能,在经过讨论会上的讨论梳理后,更是在我爱快包上发布了更新后更加确切的需求,寻找有能力完成的威客。
 
参与活动的大家的合影
 
如果您也对自己的想法有点看不太透彻,或者有问题没想明白,也欢迎您来参加我们的活动。相信我们能给您以一些启发。
 
相关资讯
半导体产业升级战:三星电子新一代1c DRAM量产布局解析

在全球半导体产业加速迭代的背景下,三星电子日前披露了其第六代10纳米级DRAM(1c DRAM)的产能规划方案。根据产业研究机构TechInsights于2023年8月22日发布的行业简报,这家韩国科技巨头正在同步推进华城厂区和平泽P4基地的设备升级工作,预计将于2023年第四季度形成规模化量产能力。这项技术的突破不仅标志着存储芯片制程进入新纪元,更将直接影响下一代高带宽存储器(HBM4)的市场格局。

蓝牙信道探测技术落地:MOKO联手Nordic破解室内定位三大痛点

全球领先的物联网设备制造商MOKO SMART近期推出基于Nordic Semiconductor新一代nRF54L15 SoC的L03蓝牙6.0信标,标志着低功耗蓝牙(BLE)定位技术进入高精度、长续航的新阶段。该方案集成蓝牙信道探测(Channel Sounding)、多协议兼容性与超低功耗设计,覆盖室内外复杂场景,定位误差率较传统方案降低60%以上,同时续航能力突破10年,为智慧城市、工业4.0等场景提供基础设施支持。

财报季再现黑天鹅!ADI营收超预期为何股价暴跌5%?

半导体行业风向标企业亚德诺(ADI)最新财报引发市场深度博弈。尽管公司第三财季营收预期上修至27.5亿美元,显著超出市场共识,但受关税政策驱动的汽车电子产品需求透支风险显露,致使股价单日重挫5%。这一背离现象揭示了当前半导体产业面临的复杂生态:在供应链重构与政策扰动交织下,短期业绩爆发与长期可持续增长之间的矛盾日益凸显。

全球可穿戴腕带市场首季激增13%,生态服务成决胜关键

根据国际权威市场研究机构Canalys于5月23日发布的调研报告,2025年第一季度全球可穿戴腕带设备市场呈现显著增长态势,总出货量达到4660万台,较去年同期增长13%。这一数据表明,消费者对健康监测、运动管理及智能互联设备的需求持续升温,行业竞争格局亦同步加速重构。

RP2350 vs STM32H7:性能翻倍,成本减半的MCU革新之战

2025年5月23日,全球领先的半导体与电子元器件代理商贸泽电子(Mouser Electronics)宣布,正式开售Raspberry Pi新一代RP2350微控制器。作为RP2040的迭代升级产品,RP2350凭借双核异构架构(Arm Cortex-M33 + RISC-V)、硬件级安全防护及工业级性价比,重新定义了中高端嵌入式开发场景的技术边界。该芯片通过多架构动态切换、可编程I/O扩展及4MB片上存储等创新设计,解决了传统微控制器在实时响应能力、跨生态兼容性与安全成本矛盾上的核心痛点,为工业自动化、消费电子及边缘AI设备提供了更具竞争力的底层硬件方案。