| 首页  |  资讯  |  评测  |  活动  |  学院  |  专题  |  杂志  |  产服  |  
您现在的位置:硅谷网> 资讯> 智能>

Arm Ethos-U85 NPU:利用小语言模型在边缘侧实现生成式 AI

2025-02-26 16:57 作者:Miki 来源:硅谷网综合 关注: 编辑:GuiGu 【搜索试试

随着人工智能 (AI) 的演进,利用小语言模型 (SLM) 在嵌入式设备上执行 AI 工作负载成为业界关注的焦点。LlamaGemma 和 Phi3 等小语言模型,凭借其出色的成本效益、高效率以及在算力受限设备上的易部署性,赢得了广泛认可。Arm 预计这类模型的数量将 2025 继续增长。

Arm技术以其高性能与低功耗的显著优势,为小语言模型提供了理想的运行环境,能够有效提升运行效率,并进一步优化用户体验。为了直观展示端点 AI 在物联网和边缘计算领域的巨大潜力,Arm技术团队近期打造了一场技术演示。在演示中,当用户输入一个句子后,系统将基于该句扩展生成一个儿童故事。这项演示受到了微软 Tiny Stories 论文和 Andrej Karpathy 的 TinyLlama2 项目的启发,TinyLlama2 项目使用了 2,100 万个故事来训练小语言模型生成文本。

该演示搭载了 Arm Ethos-U85 NPU,并在嵌入式硬件上运行小语言模型。尽管大语言模型 (LLM) 更加广为人知,但由于小语言模型能够以更少的资源和较低的成本提供出色的性能,而且训练起来也更为简易且成本更低,因此越来越受到关注。

在嵌入式硬件上实现基于 Transformer 的小语言模型

Arm 的演示展示了 Ethos-U85 作为一个小型低功耗平台,具备运行生成式 AI 的能力,并凸显了小语言模型在特定领域中的出色表现。TinyLlama2 模型相较 Meta 等公司的大模型更为简化,很适合用于展示 Ethos-U85 的 AI 性能,可作为端点 AI 工作负载的理想之选。

为开发此演示,Arm 进行了大量建模工作,包括创建一个全整数的 INT8(和 INT8x16TinyLlama2 模型,并将其转换为适合 Ethos-U85 限制的固定形状 TensorFlow Lite 格式。

Arm 的量化方法表明,全整数语言模型在取得高准确度和输出质量之间实现了良好平衡。通过量化激活、归一化函数和矩阵乘法,Arm 无需进行浮点运算。由于浮点运算在芯片面积和能耗方面成本较高,这对于资源受限的嵌入式设备来说是一个关键考量。

Ethos-U85 在 FPGA 平台上以 32 MHz 的频率运行语言模型,其文本生成速度可达到每秒 7.5 到 个词元 (token),与人类的阅读速度相当,同时仅消耗四分之一的计算资源。在实际应用的系统级芯片 (SoC) 上,该性能最多可提高十倍,从而显著提升了边缘侧 AI 的处理速度和能效。

儿童故事生成特性采用了 Llama2 的开源版本,并结合了 Ethos NPU 后端,在 TFLite Micro 上运行演示。大部分推理逻辑以 C++ 语言在应用层编写,并通过优化上下文窗口内容,提高了故事的连贯性,确保 AI 能够流畅地讲述故事。

由于硬件限制,团队需要对 Llama2 模型进行适配,以确保其在 Ethos-U85 NPU 上高效运行,这要求对性能和准确性进行仔细考量。INT8 和 INT16 混合量化技术展示了全整数模型的潜力,这有利于 AI 社区更积极地针对边缘侧设备优化生成式模型,并推动神经网络在如 Ethos-U85 等高能效平台上的广泛应用。

Arm Ethos-U85 彰显卓越性能

Ethos-U85 的乘法累加 (MAC) 单元可以从 128 个扩展至 2,048 个,与前一代产品 Ethos-U65 相比,其能效提高了 20%。另外相较上一代产品,Ethos-U85 的一个显著特点是能够原生支持 Transformer 网络。

Ethos-U85 支持使用前代 Ethos-U NPU 的合作伙伴能够实现无缝迁移,并充分利用其在基于 Arm 架构的机器学习 (ML) 工具上的既有投资。凭借其卓越能效和出色性能,Ethos-U85 正愈发受到开发者青睐。

如果在芯片上采用 2,048 个 MAC 配置,Ethos-U85 可以实现 4 TOPS 的性能。在演示中,Arm 使用了较小的配置,即在 FPGA 平台上采用 512 个 MAC,并以 32 MHz 的频率运行具有 1,500 万个参数的 TinyLlama2 小语言模型。

这一能力凸显了将 AI 直接嵌入设备的可能性。尽管内存有限(320 KB SRAM 用于缓存,32 MB 用于存储),Ethos-U85 仍能高效处理此类工作负载,为小语言模型和其他 AI 应用在深度嵌入式系统中的广泛应用奠定了基础。

将生成式 AI 引入嵌入式设备

开发者需要更加先进的工具来应对边缘侧 AI 的复杂性。Arm 通过推出 Ethos-U85,并支持基于 Transformer 的模型,致力于满足这一需求。随着边缘侧 AI 在嵌入式应用中的重要性日益增加,Ethos-U85 正在推动从语言模型到高级视觉任务等各种新用例的实现。

Ethos-U85 NPU 提供了创新前沿解决方案所需的卓越性能和出色能效。Arm 的演示显示了将生成式 AI 引入嵌入式设备的重要进展,并凸显了在 Arm 平台上部署小语言模型便捷可行。

Arm 正为边缘侧 AI 在广泛应用领域带来新机遇,Ethos-U85 也因此成为推动新一代智能、低功耗设备发展的关键动力。

【对“Arm Ethos-U85 NPU:利用小语言模型在边缘侧实现生成式 AI”发布评论】

版权及免责声明:
① 本网站部分投稿来源于“网友”,涉及投资、理财、消费等内容,请亲们反复甄别,切勿轻信。本网站部分由赞助商提供的内容属于【广告】性质,仅供阅读,不构成具体实施建议,请谨慎对待。据此操作,风险自担。
② 内容来源注明“硅谷网”及其相关称谓的文字、图片和音视频,版权均属本网站所有,任何媒体、网站或个人需经本网站许可方可复制或转载,并在使用时必须注明来源【硅谷网】或对应来源,违者本网站将依法追究责任。
③ 注明来源为各大报纸、杂志、网站及其他媒体的文章,文章原作者享有著作权,本网站转载其他媒体稿件是为传播更多的信息,并不代表赞同其观点和对其真实性负责,本网站不承担此类稿件侵权行为的连带责任。
④ 本网站不对非自身发布内容的真实性、合法性、准确性作担保。若硅谷网因为自身和转载内容,涉及到侵权、违法等问题,请有关单位或个人速与本网站取得联系(联系电话:01057255600),我们将第一时间核实处理。
广告
相关
·ExecuTorch 测试版上线,加速 Arm 平台边缘侧生
·Arm宣布推出终端计算子系统CSS,提供卓越的AI体
·探索终端操作系统领域AI大模型创新趋势 OpenHarm
·若ARM与鸿蒙在笔记本领域相遇,许将掀起笔记本行
·智能家居,如何才能迎来全民普及的春天?
·挑战巅峰人生 Garmin高端智能腕MARQ系列在北京正
·GARMIN全新MARQ系列高端智能腕表在京发布
·惊艳面世,Garmin京东预售MARQ系列高端智能腕表
头条
降价!免费!圈地!大模型价格战卷到飞起 降价!免费!圈地!大模型价格战卷到飞起
巨头接连下场!降价!免费!属于大模型赛道的价格战,已彻底陷入疯狂。 近日,百度和……
·马斯克旗下xAI宣布短时间内Grok 3免费开放使
·互联网大厂接入DeepSeek姿势各异,你最看好谁
·马斯克的Grok-3,担得起“地表最强AI”之名?
·巴黎AI峰会达成全球共识,美英两国未签署包容
·Meta开发非入侵式脑机技术,利用AI读取大脑信
图文
降价!免费!圈地!大模型价格战卷到飞起
降价!免费!圈地!大模型价格战卷到飞起
OpenAI再度拉响安全警报:又一高层离职揭示巨大风险
OpenAI再度拉响安全警报:又一高层离职揭示
ZAO隐私风险 你的脸已经不仅仅是你的脸了
ZAO隐私风险 你的脸已经不仅仅是你的脸了
九号机器人,这次想用AI运载机器人送快递送外卖
九号机器人,这次想用AI运载机器人送快递送
热点
·AI又出了偏门应用:用算法“脱掉”女性衣服
·ZAO隐私风险 你的脸已经不仅仅是你的脸了
·美的AIR空间站|你用过能管理空气的空调吗?
·新橙派果汁机器人引爆中国独角兽孵化合作大会
·民宿房东的辛酸史 用安伴门锁实现了合规运营
旧闻
·时下流行骨传导耳机:这款墨镜耳机比苹果还抢
·出国出差好助手 uCloudlink(优克联)获众多
·《智能快件箱寄递服务管理办法》10月1起施行
·斑马技术《亚太仓储业愿景报告》重磅发布!
·“算命”AI问世:经600万人数据训练 可预测健
广告
硅谷精选
降价!免费!圈地!大模型价格战卷到飞起
降价!免费!圈地!大模型价格战卷到飞起
OpenAI再度拉响安全警报:又一高层离职揭示巨大风险
OpenAI再度拉响安全警报:又一高层离职揭示巨大风险
内容与技术“双引擎”驱动,芒果探索全链路AI创新
内容与技术“双引擎”驱动,芒果探索全链路AI创新
全球AI人才报告曝光:清华第三,北大第六
全球AI人才报告曝光:清华第三,北大第六
外媒称微软将向“欧洲版OpenAI”投资1500万欧元 但面临欧盟审查
外媒称微软将向“欧洲版OpenAI”投资1500万欧元 但面
新春送龙蛋,小度推出龙年首个大模型AI年宠
新春送龙蛋,小度推出龙年首个大模型AI年宠
关于我们·About | 联系我们·contact | 加入我们·Join | 关注我们·Invest | Site Map | Tags | RSS Map
电脑版·PC版 移动版·MD版 网站热线:(+86)010-57255600
Copyright © 2007-2020 硅谷网. 版权所有. All Rights Reserved. <京ICP备12003855号-2>