| 首页  |  资讯  |  评测  |  活动  |  学院  |  专题  |  杂志  |  产服  |  
您现在的位置:硅谷网> 资讯> 云计算>

【2023云栖】黄博远:阿里云人工智能平台PAI年度发布

2023-11-15 16:00 作者:Kathy 来源:硅谷网综合 关注: 编辑:GuiGu 【搜索试试
本文根据2023云栖大会演讲实录整理而成,演讲信息如下:
演讲人:黄博远 | 阿里云计算平台事业部资深产品专家、阿里云人工智能平台PAI产品负责人
演讲主题:阿里云人工智能平台PAI年度发布
01.AIGC是我们这个时代的新机遇
       今年云栖大会,阿里云机器学习平台PAI正式发布升级为人工智能平台PAI。在过去的12个月,AI生态发生了巨大的变化,AIGC已经成为继互联网时代的下一个产业时代风口,带来了很多新的机遇和挑战。
       在整个市场当中,AIGC领域可以分为三类:预训练大模型、开源生态和下游应用。
02.AI研发新范式和新挑战
       在新局势下,整个AI研发进入到新范式
           · 从预训练模型开始,快速定制、快速落地
           · AI开发门槛大大降低,AI推广加速,行业应用增长
       研发新范式升级跟以往从搞数据到0-1搭模型是非常不一样的,主要会有三类客户:
           · 上游:通用模型生产者与平台方(如阿里);
           · 中游:利用垂直行业知识对模型进行优化(生态伙伴);
           · 下游:最终AI应用的使用者(最广大的用户群体)。
       AI生态链的整合和角色分化是行业发展的方向,符合社会整体效率提高的要求,必将推动AI普惠化的进程。
03.阿里云人工智能平台PAI全面升级
       人工智能平台PAI在4.0版本里,下层是强大的基础设施,中间层“PAI灵骏智算集群”,是专门面向超大规模分布式,重点解决预训练、Finetune、推理等工作。最上层“Model as a Service”概念,能够让不懂算法,但需要应用AI的人进行全链路的AI创新。
PAI助力企业AI创新
       人工智能平台PAI将围绕以下三个效率助力企业和开发者进行AI的创新,分别是开发效率、计算效率和业务效率。
提升开发效率:人,最宝贵的资源
       AI工程化的工程师人才稀缺且昂贵,工程师从数据进来到整个开发环节再到模型生产上线,大约需要12种工具把整个AI流程走完。
阿里云PAI 全生命周期优化的AI平台
       阿里云人工智能平台PAI作为全生命周期优化的AI平台,包含iTAG智能标注、DSW交互式建模、DLC AI训练服务、EAS在线预测服务、AI工作空间、AI资产、OpenAPI等服务,打造一体化全链路的AI工程平台,全面提升行业、产业落地效率
PAI-DSW 交互式建模
       PAI平台的Notebook服务全面升级,DSW可以一站式AI开发,开箱即用,异构资源无缝对接,兼顾个人开发者及企业级协作需求,让整个开发过程变得更加高效。
       同时我们也看到数据对于AI的重要性,PAI把整个阿里云上的存储都做了无缝对接(OSS、NAS、CPFS),可以很容易的在云上获得做大模型开发的工作的环境。
PAI-DLC 分布式训练
       在分布式训练里,大模型变得至关重要,怎么同时用512卡、上千卡做训练,可能很难做分布式这些细节的管理,如果涉及底层复杂软硬件能力可能更不清楚。今天通过DLC分布式训练可以实现单机多卡、多机多卡分布式训练,云原生灵活环境配置,企业级资源管理,快速把相应的模型训练出来。
PAI 模型服务与AI推理
       未来,我们认为在模型服务领域,模型的推理一定会成为整个产业的热潮。因为在我们平台上已经看到有几十家做大模型的企业训练出来50B~100B以上的大模型,这些模型日后一定会产业落地。
       PAI EAS模型在线服务+Blade推理加速,帮助客户一站式解决AI部署和推理的全部环节。
提升计算效率:机器,如何高效的利用
       对于大模型无法逃避的一个问题就是解决机器效率,如何让机器被整个产品和平台疯狂使用,对所有人来说都是巨大的挑战。
PAI灵骏智算服务 - 让大模型训练推理简单、高效
       今年我们发布了PAI灵骏计算服务Serverless产品。使得AI的训练推理更快、更易用、更稳定,全面提升AI计算效率。
       可以想象一下,当有1024张卡甚至有数千张卡做训练的时候,很难保证系统不出错误,所以我们推出了AI Master自动容错弹性训练。让系统帮你去解决各种各样的问题。对于整个大模型训练过程有巨大的效率提升的作用。
       推出EasyCkpt秒级异步训练的快照,可以清楚知道每一个数据在整个显存、内存、缓存中存了多少,硬件或系统出现问题或者时我们不再需要做全局的checkpoint,可以通过EasyCkpt实现秒级训练精度无损的checkpoint,高效帮企业自动把这个问题恢复可执行状态。
       TorchAcc和PAI-Blade则是在大规模分布式训练和推理上做的软硬结合优化。
1.极致性能:高性能计算、网络、存储支撑的高性能AI集群
       专为密集型深度学习业务及LLM/AIGC大模型训练场景打造的高性能集群架构
2.极致稳定:软硬结合、协同保障超大规模集群超高稳定性
       集大规模集群管理、弹性AI调度、进度无损的模型保存与恢复、自动分布式性能测试于一体的稳定保障体系
3.基于PAI-DLC构建的LLM大模型强化学习训练框架RLHF
       支持人工反馈的强化学习 RLHF训练框架,快速开发定制LLM
提升业务效率:自带最佳实践,业务落地提速
       阿里云是一个自带最佳实践的云,如何基于PAI平台让不懂AI的人快速上手,让没有接触过大模型、没有做过AIGC应用的人快速跟上节奏呢?是我们一直致力于解决的问题。
       PAI平台提供了非常丰富的场景化最佳实践方案,把最佳实践产品化方式面向客户,企业开发者们可以通过接入PAI平台一步步体验模型构建的整个过程。
MaaS全链路提效
       PAI平台一站式覆盖了AI工程化的全流程,无缝对接ModelScope/Huggingface等开源社区,让算法开发者、应用开发者和业务架构师可以专注、高效的完成创新。
大模型场景化最佳实践
       人工智能平台PAI提供全面覆盖大模型生产流程的端到端最佳实践。
智码实验室-Notebook Galley
       Notebook Galley上针对热门场景、前沿模型,打造属于开发者的内容平台,让开发者快速学习上手。
       Notebook Galley上面现在已经有100多个热门AI的案例,例如:通义系列、Llama2、Stable Diffusion等案例在这上面全都可以一站式云上拉起服务,端到端体验。
为AI提供极致性能、全链路工程覆盖、端到端最佳实践的云上服务
       PAI团队持续迭代更新,面向AI、大模型、AGI领域做了三个核心工作:
       1、软硬一体协同优化云上基础设施,把高性能网络、高性能存储和高性能计算的能力和编译优化能力、容错训练能力、快速异步checkpoint的能力相结合,提供极致且稳定的环境,供大家可以高效训练大模型。
       2、提供了端到端涵盖整个AI工程链路的PaaS平台。
       3、提供丰富的场景化最佳实践。
       人工智能平台PAI在今后会再这三个领域持续大力构建云上Serverless产品,给开发者提供更加廉价、更加好用的产品力。也希望大家可以借助AIGC这波浪潮,助力业务更好发展!
【对“【2023云栖】黄博远:阿里云人工智能平台PAI年度发布”发布评论】

版权及免责声明:
① 本网站部分投稿来源于“网友”,涉及投资、理财、消费等内容,请亲们反复甄别,切勿轻信。本网站部分由赞助商提供的内容属于【广告】性质,仅供阅读,不构成具体实施建议,请谨慎对待。据此操作,风险自担。
② 内容来源注明“硅谷网”及其相关称谓的文字、图片和音视频,版权均属本网站所有,任何媒体、网站或个人需经本网站许可方可复制或转载,并在使用时必须注明来源【硅谷网】或对应来源,违者本网站将依法追究责任。
③ 注明来源为各大报纸、杂志、网站及其他媒体的文章,文章原作者享有著作权,本网站转载其他媒体稿件是为传播更多的信息,并不代表赞同其观点和对其真实性负责,本网站不承担此类稿件侵权行为的连带责任。
④ 本网站不对非自身发布内容的真实性、合法性、准确性作担保。若硅谷网因为自身和转载内容,涉及到侵权、违法等问题,请有关单位或个人速与本网站取得联系(联系电话:01057255600),我们将第一时间核实处理。
广告
相关
头条
淘宝、阿里云盘等访问故障 阿里云云产品控制台服务异常 淘宝、阿里云盘等访问故障 阿里云云产品控制
2023年11月12日下午,陆续有网友反馈阿里系多个产品出现故障,随后阿里云盘崩了、淘宝……
·淘宝、阿里云盘等访问故障 阿里云云产品控制
·联泰集群在北京发布水晶静音工作站产品 性能
·联通沃云峰会2019在北京举办 峯云5G领航数字
·全球超级计算机500强:美国蝉联冠军 中国数量
·云计算产业已达千亿元规模 互联网行业占据六
图文
淘宝、阿里云盘等访问故障 阿里云云产品控制台服务异常
淘宝、阿里云盘等访问故障 阿里云云产品控
Ai赋能智能制造自主创新大讲堂成功召开,华为云携手伙伴加速企业数字化
Ai赋能智能制造自主创新大讲堂成功召开,华
提升竞争地位,谷歌云计算业务部门裁员重组
提升竞争地位,谷歌云计算业务部门裁员重组
云计算产业已达千亿元规模 互联网行业占据六成
云计算产业已达千亿元规模 互联网行业占据
热点
·拥有专属的家庭云NAS储存是种怎样的体验?
·提升竞争地位,谷歌云计算业务部门裁员重组
·企企通科技荣获2018爱分析中国云计算创新企业
·沈昌祥院士确认出席2019世界计算机大会并发表
·《2018年云计算性能洞察报告》:企业上云迎来
旧闻
·首家!阿里云完成数据可视化服务能力评估
·“阿里云创峰会南昌站”即将举行,三大亮点抢
·IBM在云计算论坛推出全球首个多云管理解决方
·全球超级计算机500强:美国蝉联冠军 中国数量
·拥有专属的家庭云NAS储存是种怎样的体验?
广告
硅谷精选
淘宝、阿里云盘等访问故障 阿里云云产品控制台服务异常
淘宝、阿里云盘等访问故障 阿里云云产品控制台服务异
Ai赋能智能制造自主创新大讲堂成功召开,华为云携手伙伴加速企业数字化
Ai赋能智能制造自主创新大讲堂成功召开,华为云携手伙
【开发者福利】教你3步薅到免费GPU算力!
【开发者福利】教你3步薅到免费GPU算力!
Flink 斩获 SIGMOD 重磅奖项!
Flink 斩获 SIGMOD 重磅奖项!
阿里云机器学习平台PAI论文入选 SIGMOD 2023
阿里云机器学习平台PAI论文入选 SIGMOD 2023
华为擎云亮相2023西部数博会,赋能企业数字化转型
华为擎云亮相2023西部数博会,赋能企业数字化转型
关于我们·About | 联系我们·contact | 加入我们·Join | 关注我们·Invest | Site Map | Tags | RSS Map
电脑版·PC版 移动版·MD版 网站热线:(+86)010-57255600
Copyright © 2007-2020 硅谷网. 版权所有. All Rights Reserved. <京ICP备12003855号-2>