认知技术如何与人类互动?从智能手机到自动驾驶来看!

发布时间:2016-07-27 阅读量:1057 来源: 我爱方案网 作者:

【导读】认知技术能让终端和事物根据环境凭直觉感知(像人类一样地看和听)、推理(通过分析所处环境并进行预测需求)和行动。认知技术受人类大脑的启发可作为人类感觉的自然延伸,扩展人类的能力。这些技术还将根据环境为我们提供个性化体验,同时在终端和事物之间创造出更类似于人类的互动。

简单的说,认知技术能让智能手机/机器人等根据所处的位置和环境、以往习惯,甚至是语音识别和物体识别来提取信息,以及预测我们的需求,并在恰当的时间为我们提供相关信息。也许有些人觉得该技术与我们相距甚远,尤其是机器人领域的,现在不妨从生活应用说起。
手机扫描二维码是移动互联网时代的标志,过去我们扫描二维码都是通过专用APP去识别,这是非智能的被动识别,本质是用户告诉手机你拍到的是二维码,请帮我解析。但最近笔者使用三星Galaxy S7手机拍摄照片时候发现,如果被摄物有二维码或者条形码,手机会自动在取景时候会直接进行对象识别(无任何延迟),并提醒笔者查看内容:
点击查看信息的时候直接跳到百度搜索界面并准确搜索到了相关产品,这就是主动识别。这一功能运用得当会有意想不到的效果,比方说外出游玩时候,拍摄照片时如果含有警告字样会自动提出警告就是相当有用的功能。
认知技术包括机器学习、仿真计算机视觉、智能连接以及永久感测等,赋予机器更强大的直觉,能够更了解我们的喜好和所处环境(摄像头拍到的内容被识别为含有条形码),然后预测我们的需求(需要搜索产品的详细信息以及价格),并在恰当的时间为我们提供相关信息。认知技术受人类大脑的启发可作为人类感觉的自然延伸,扩展人类的能力。这些技术还将根据环境为我们提供个性化体验,同时在终端和事物之间创造出更类似于人类的互动。

认知技术的宽广舞台

前文中介绍手机摄像头根据拍到的内容识别条形码只是认知技术应用的冰上一角,认知技术在智能手机、汽车自动驾驶、机器人等领域还有更广阔的空间,比如我们在介绍Zeroth计算平台时提到的计算机视觉。计算机视觉是智能终端感知的重要成分,其重要性等同于人类视觉。
认知技术的宽广舞台
高通平台下的计算机视觉由Qualcomm Spectra ISP、Qualcomm Hexagon DSP、Qualcomm Adreno GPU以及CPU组成的异构运算铁三角负责。这些计算模块分别扮演了特殊的角色,能够在非常低的功耗下实现智能识别。

高通智能捕捉功能(Clever Capture)可以检测人的动作或面部微笑,然后触发照片连拍功能,自动选择最心仪的照片。下图就是运用此功能自动捕捉到的水球破裂瞬间的照片。
认知技术的宽广舞台
在过去手机摄影最难的就是瞬间捕捉,美妙的瞬间往往在毫秒间流逝,捕捉的方法只有实时感测,将按下快门之前的图像也记录下来,这就需要Hexagon DSP的鼎力协助,否则功耗将变得难以接受,所幸当今平台已经可以实现这一功能。

摄影只是计算机视觉的一部分,高通骁龙文本激活功能(Snapdragon Text Activation)可以读取和解释现实世界中的文字,并提出适当操作或应用建议。比如说当名片出现在手机的取景器中时,骁龙文本激活功能将会识别网址,并询问你是否想在浏览器中打开它;也可以识别地址,您可以选择是否直接在地图应用中打开。

环境感知是认知技术又一重要组成,这一前提就是不同的传感器会持续记录数据,并在观察我们的行为后将其智能地与数据组合在一起。这是Hexagon DSP的传感器融合技术的拿手好戏,它配备着“始终开启”的传感器。

以车载骁龙处理器为例,“始终开启”的传感器让汽车能够不断了解其周围环境,提升驾驶体验。骁龙820 Automotive芯片组具有驾驶辅助功能,能提供车道偏离警告、车辆前方碰撞探测警告,以及交通标志识别功能以避免错过那些不易看到的停车标志。增强型3D导航可进行实时更新,将车道和交通标志在地图上标识出来,提供从A点到B点的最便捷路线。
(骁龙820 Automotive芯片组)
(骁龙820 Automotive芯片组)

先进的摄像头和传感器处理能持续提供“始终开启”的预警和应急服务。芯片上的图像信号处理器能同时支持连接4到8个汽车摄像头传感器,而智能后视摄像头在倒车时可使用先进的计算机视觉来探测对象。同时,包括在V2X(车辆与万物互联)类别中的车辆与移动终端连接,以及V2V(车辆与车辆连接)警告,可以通过向汽车、智能手机应用或连接可穿戴设备发出警报来避免碰撞。
(骁龙820 Automotive芯片组)
这些终端处理的关键就是高通骁龙的异构运算设计。异构架构是移动终端在有限温度、体积以及功耗要求下实现认知技术的保障,也是未来机器人和无人机平台实现更强大功能的保证,通过机器学习和计算机视觉技术,它们能够适应我们的需求,避开环境中会遇到的问题。

再来看看智能手机方面,Zeroth平台能够在连接方面带来稳定的移动体验。新一代骁龙820处理器,集成X12 LTE调制解调器,其通过使用IP多媒体子系统(IMS),支持下一代高清LTE语音(VoLTE)和LTE视频(ViLTE)通话服务,同时还支持LTE和Wi-Fi间的通话连续性。借助Qualcomm Zeroth的认知能力,X12 LTE调制解调器能够实时监测Wi-Fi连接质量,以决定是否以及何时在LTE与Wi-Fi间切换通话。

以上简单列举了当前认知技术的一些使用场景——在拍照界面下自动识别拍摄内容是否为条形码;带来更加安全、智能的驾车体验;通过智能手机为用户带来更好的移动体验。可以看出,认知技术已经围绕在我们身边,并且未来随着技术和设计的进一步提升,认知技术必将大施拳脚,迎来更加广阔的前景。


相关资讯
华虹半导体2025年Q1业绩解析:逆势增长背后的挑战与破局之路

2025年第一季度,华虹半导体(港股代码:01347)实现销售收入5.409亿美元,同比增长17.6%,环比微增0.3%,符合市场预期。这一增长得益于消费电子、工业控制及汽车电子领域需求的复苏,以及公司产能利用率的持续满载(102.7%)。然而,盈利能力显著下滑,母公司拥有人应占溢利仅为380万美元,同比锐减88.05%,环比虽扭亏为盈,但仍处于低位。毛利率为9.2%,同比提升2.8个百分点,但环比下降2.2个百分点,反映出成本压力与市场竞争的加剧。

边缘计算新引擎:瑞芯微RV1126B四大核心技术深度解析

2025年5月8日,瑞芯微电子正式宣布新一代AI视觉芯片RV1126B通过量产测试并开启批量供货。作为瑞芯微在边缘计算领域的重要布局,RV1126B凭借3T算力、定制化AI-ISP架构及硬件级安全体系,重新定义了AI视觉芯片的性能边界,推动智能终端从“感知”向“认知”跃迁。

半导体IP巨头Arm:季度营收破12亿,AI生态布局能否撑起估值泡沫?

2025财年第四季度,Arm营收同比增长34%至12.4亿美元,首次突破单季10亿美元大关,超出分析师预期。调整后净利润达5.84亿美元,同比增长55%,主要得益于Armv9架构芯片在智能手机和数据中心的渗透率提升,以及计算子系统(CSS)的强劲需求。全年营收首次突破40亿美元,其中专利费收入21.68亿美元,授权收入18.39亿美元,均刷新历史纪录。

Arrow Lake的突破:混合架构与先进封装的协同进化

2024年10月,英特尔正式发布Arrow Lake架构的酷睿Ultra 200系列处理器,标志着其在桌面计算领域迈入模块化设计的新阶段。作为首款全面采用Chiplet(芯粒)技术的桌面处理器,Arrow Lake不仅通过多工艺融合实现了性能与能效的优化,更以创新的混合核心布局和缓存架构重新定义了处理器的设计范式。本文将深入解析Arrow Lake的技术突破、性能表现及其对行业的影响。

暗光性能提升29%:深度解析思特威新一代AI眼镜视觉方案

2025年5月8日,思特威(股票代码:688213)正式发布专为AI眼镜设计的1200万像素CMOS图像传感器SC1200IOT。该产品基于SmartClarity®-3技术平台,集成SFCPixel®专利技术,以小型化封装、低功耗设计及卓越暗光性能,推动AI眼镜在轻量化与影像能力上的双重突破。公司发言人表示:"AI眼镜的快速迭代正倒逼传感器技术升级,需在尺寸、功耗与画质间实现平衡,这正是SC1200IOT的核心价值所在。"