在居家放松的夜晚,你可能会让智能手机播放最喜爱的歌曲,或吩咐家庭助手调暗灯光。这些任务看似简单,实则由已融入日常生活的人工智能驱动。这些流畅交互的核心是边缘AI——直接运行于智能手机、可穿戴设备和物联网设备上的AI技术,提供即时直观的响应。
边缘AI指将AI算法直接部署在网络"边缘"的设备上,而非依赖集中式云数据中心。该方法利用边缘设备(如笔记本电脑、智能手机、智能手表和家用电器)的处理能力进行本地决策。
边缘AI在隐私和安全方面具有关键优势:通过减少敏感数据在互联网上的传输,降低数据泄露风险。同时提升数据处理和决策速度,这对医疗可穿戴设备、工业自动化、增强现实和游戏等实时应用至关重要。边缘AI甚至可在连接不稳定的环境中运行,以有限维护支持自主运行,并降低数据传输成本。
尽管AI已融入众多设备,但在日常设备中实现强大AI功能存在技术挑战。边缘设备在处理能力、内存和电池寿命方面受到严格限制,需在有限硬件规格下执行复杂任务。
例如,智能手机要执行复杂面部识别,必须使用尖端优化算法在毫秒内分析图像并匹配特征;耳机实现实时翻译需维持低能耗以确保电池续航。基于云的AI模型可依赖具有强大算力的外部服务器,而边缘设备只能利用现有资源。这种向边缘处理的转变从根本上改变了AI模型的开发、优化和部署方式。
能在边缘设备上高效运行的AI模型需大幅缩减体积和计算量,同时保持可靠结果。该过程通常称为模型压缩,涉及神经架构搜索(NAS)、迁移学习、剪枝和量化等先进算法。
模型优化应从选择或设计特别适合设备硬件能力的模型架构开始,然后针对特定边缘设备进行精细化调整。NAS技术使用搜索算法探索大量可能的AI模型,找到最适合边缘设备特定任务的模型。迁移学习技术使用已训练的大模型(教师模型)来训练小模型(学生模型)。剪枝涉及消除对准确性影响不大的冗余参数,量化则将模型转换为使用低精度算术以节省计算和内存资源。
将最新AI模型引入边缘设备时,开发者容易只关注基本计算(特别是"乘积累加"操作或MACs)的效率。简而言之,MAC效率衡量芯片完成AI核心数学运算(数字相乘与相加)的速度。模型开发者可能陷入"MAC隧道视野",过度关注该指标而忽略其他重要因素。
一些最流行的AI模型(如MobileNet、EfficientNet和视觉应用Transformer)在设计上极度高效于这些计算。但实际上,这些模型在手机或智能手表的AI芯片上并不总是运行良好。因为实际性能不仅取决于数学运算速度,还依赖于设备内部数据传输速度。如果模型需要频繁从内存获取数据,无论计算多快都会拖慢整体速度。
令人惊讶的是,较旧的大型模型(如ResNet)有时在现有设备上表现更好。它们可能不是最新或最精简的模型,但其内存与处理之间的协调更符合AI处理器规格。实际测试中,即使经过精简适配,这些经典模型在边缘设备上仍能提供更优的速度和准确性。
经验表明:"最佳"AI模型不一定是最炫酷的新设计或理论效率最高的模型。对边缘设备而言,最重要的是模型与实际运行硬件的匹配程度。
硬件也在快速演进。为满足现代AI需求,设备制造商开始为智能手机、智能手表和可穿戴设备配备称为AI加速器的专用芯片。这些加速器专为处理AI模型所需的计算和数据传输而构建。每年都在架构、制造和集成方面取得进展,确保硬件与AI趋势保持同步。
边缘AI模型部署因生态系统的碎片化而更加复杂。由于许多应用需要定制模型和特定硬件,缺乏标准化。当前需要高效开发工具来简化边缘应用的机器学习生命周期。此类工具应帮助开发者更轻松地优化实际性能、功耗和延迟。
设备制造商与AI开发者之间的合作正在缩小工程与用户交互间的差距。新兴趋势聚焦情境感知和自适应学习,使设备能更自然地预测和响应用户需求。通过利用环境线索和观察用户习惯,边缘AI可提供直观且个性化的响应。本地化和定制化智能将改变我们对技术和世界的体验。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。