| 首页  |  资讯  |  评测  |  活动  |  学院  |  专题  |  杂志  |  产服  |  
您现在的位置:硅谷网> 资讯> 云计算>

阿里云机器学习平台PAI论文入选 SIGMOD 2023

2023-06-21 14:09 作者:Lydia 来源:硅谷网综合 关注: 编辑:GuiGu 【搜索试试

近日,阿里云机器学习平台PAI和北京大学杨智老师团队合作的论文《GoldMiner: Elastic Scaling of Training Data Pre-Processing Pipelines for Deep Learning》被SIGMOD 2023录用。论文通过对深度学习数据预处理流水线的弹性伸缩,大幅提升了训练性能和集群资源利用效率。

SIGMOD是数据库与数据管理系统领域的国际顶级会议,自1975年首次举办以来,一直对数据管理、存储和处理的发展起着深刻的推动作用,在学术和工业界均有巨大影响力。SIGMOD也重视数据管理系统与其他方向的交叉,尤其近年来也对机器学习和人工智能领域格外关注。此次入选意味着阿里云机器学习平台PAI在深度学习数据处理方向达到了全球业界先进水平,获得了国际学者的认可,展现了中国机器学习系统技术创新在国际上的竞争力。

近年来,随着GPU加速器的不断进化,以及各类软件优化技术的层出不穷,深度学习训练的计算效率正不断被提升到新的层次。但与此同时,深度学习本质上仍是一种多阶段、多资源的任务类型:不仅需要在GPU上进行大量的训练计算,同时往往也需要CPU端的数据预处理流水线(如数据增强、特征转换等),这类预处理计算是训练出高质量模型的必要步骤。因此,GPU端训练性能的提升也带来了更大的数据预处理压力,使后者成为新的性能瓶颈。

针对这一问题,在观察后发现数据预处理流水线具有无状态的特点,具有内在的资源弹性。基于此,GoldMiner将数据预处理流水线和模型训练部分分离执行,通过自动计算图分析来识别无状态的数据预处理计算,并对其实现高效的并行加速和弹性伸缩,从而缓解数据预处理瓶颈,提升训练性能。通过与集群调度器的协同设计,GoldMiner进一步发挥了数据预处理计算的资源弹性,大幅提升集群调度效率。实验显示GoldMiner可提升训练性能最高达12.1倍,提升GPU集群利用率达2.5倍。

目前阿里云机器学习平台 PAI正在将GoldMiner与PAI-DLC集成,以向用户提供数据预处理加速能力。机器学习平台PAI面向企业客户及开发者,提供轻量化、高性价比的云原生机器学习,涵盖PAI-DSW交互式建模、PAI-Designer可视化建模、PAI-DLC分布式训练到PAI-EAS模型在线部署的全流程。其中PAI-DLC提供了云原生一站式的深度学习训练平台,提供灵活、稳定、易用和高性能的机器学习训练环境。支持多种算法框架,超大规模分布式深度学习任务运行及自定义算法框架,为开发者和企业降本增效。

论文名字:GoldMiner: Elastic Scaling of Training Data Pre-Processing Pipelines for Deep Learning论文作者:赵汉宇,杨智,程羽,田超,任仕儒,肖文聪,袁满,陈浪石,刘恺博,张杨,李永,林伟论文pdf链接:https://dl.acm.org/doi/pdf/10.1145/3589773

【对“阿里云机器学习平台PAI论文入选 SIGMOD 2023”发布评论】

版权及免责声明:
① 本网站部分投稿来源于“网友”,涉及投资、理财、消费等内容,请亲们反复甄别,切勿轻信。本网站部分由赞助商提供的内容属于【广告】性质,仅供阅读,不构成具体实施建议,请谨慎对待。据此操作,风险自担。
② 内容来源注明“硅谷网”及其相关称谓的文字、图片和音视频,版权均属本网站所有,任何媒体、网站或个人需经本网站许可方可复制或转载,并在使用时必须注明来源【硅谷网】或对应来源,违者本网站将依法追究责任。
③ 注明来源为各大报纸、杂志、网站及其他媒体的文章,文章原作者享有著作权,本网站转载其他媒体稿件是为传播更多的信息,并不代表赞同其观点和对其真实性负责,本网站不承担此类稿件侵权行为的连带责任。
④ 本网站不对非自身发布内容的真实性、合法性、准确性作担保。若硅谷网因为自身和转载内容,涉及到侵权、违法等问题,请有关单位或个人速与本网站取得联系(联系电话:01057255600),我们将第一时间核实处理。
广告
相关
头条
联泰集群在北京发布水晶静音工作站产品 性能强悍 联泰集群在北京发布水晶静音工作站产品 性能
【硅谷网讯】 北京时间2019年12月26日下午14点30分,联泰集群在北京正式发布了水晶系……
·联泰集群在北京发布水晶静音工作站产品 性能
·联通沃云峰会2019在北京举办 峯云5G领航数字
·全球超级计算机500强:美国蝉联冠军 中国数量
·云计算产业已达千亿元规模 互联网行业占据六
·亚马逊旗下云计算部门的服务器产品大规模降价
图文
阿里云机器学习平台PAI论文入选 SIGMOD 2023
阿里云机器学习平台PAI论文入选 SIGMOD 202
华为擎云亮相2023西部数博会,赋能企业数字化转型
华为擎云亮相2023西部数博会,赋能企业数字
提升竞争地位,谷歌云计算业务部门裁员重组
提升竞争地位,谷歌云计算业务部门裁员重组
云计算产业已达千亿元规模 互联网行业占据六成
云计算产业已达千亿元规模 互联网行业占据
热点
·拥有专属的家庭云NAS储存是种怎样的体验?
·提升竞争地位,谷歌云计算业务部门裁员重组
·企企通科技荣获2018爱分析中国云计算创新企业
·沈昌祥院士确认出席2019世界计算机大会并发表
·《2018年云计算性能洞察报告》:企业上云迎来
旧闻
·2019年度云计算中心科技奖人才奖评选活动正式
·XSKY连续两年入选Gartner全球分布式文件与对
·企企通科技荣获2018爱分析中国云计算创新企业
·将黄沙戈壁变为创新发展新热土 一个产业如何
·神州云计算助力绿城房屋4S管理效能全面提升
广告
硅谷精选
阿里云机器学习平台PAI论文入选 SIGMOD 2023
阿里云机器学习平台PAI论文入选 SIGMOD 2023
华为擎云亮相2023西部数博会,赋能企业数字化转型
华为擎云亮相2023西部数博会,赋能企业数字化转型
思科宣布网络云愿景:简化网络,安全互联
思科宣布网络云愿景:简化网络,安全互联
XSKY连续两年入选Gartner全球分布式文件与对象存储VoC四象限报告
XSKY连续两年入选Gartner全球分布式文件与对象存储VoC
基于英特尔第二代可扩展处理器构建并优化企业数据中心IaaS云平台
基于英特尔第二代可扩展处理器构建并优化企业数据中心
华为云与时间赛跑,零代码口罩智能识别是如何实现的?
华为云与时间赛跑,零代码口罩智能识别是如何实现的?
关于我们·About | 联系我们·contact | 加入我们·Join | 关注我们·Invest | Site Map | Tags | RSS Map
电脑版·PC版 移动版·MD版 网站热线:(+86)010-57255600
Copyright © 2007-2023 硅谷网. 版权所有. All Rights Reserved. <备案号:京ICP备12003855号-2>