|  首页  |  资讯  |  评测  |  活动  |  学院  |  访谈  |  专题  |  杂志  |  产服  |  
您现在的位置:硅谷网> 资讯> 电子>

极具“杀伤力”的性能调优,从几个思路说起

2020-01-15 16:41 作者:宋文喆 来源:硅谷网综合 HV: 编辑:GuiGu 【搜索试试

在应用程序部署到服务器上以后,可能会出现CPU占用率过高,I/O吞吐量下降等性能问题,此时,就需要对程序进行优化。性能调优是一个比较复杂的过程,包括建立基准、压力测试、确定瓶颈、实施优化、确认优化这5个步骤。调优过程对程序员的知识结构要求非常高,需要非常熟悉硬件、操作系统(OS\JVM)、应用程序等多个方面。

作者:宋文喆

鲲鹏920处理器(兼容ARM架构)的整体设计思路就是通过“多核”获得强悍性能。具有更多的核数,2NUMA/Socket,L3 Cacheline为128 Byte。这些都是芯片的一些特性,这些特性对于性能调优也会产生不同的影响。

1月11日,华为鲲鹏开发者技术沙龙-杭州站,来自华为的四位技术专家分享了四个议题,分别是—基于鲲鹏处理器的性能调优;鲲鹏大数据优化实践;A-Tune自调优技术详解;iSulad容器引擎分享与实践。议题分享结束后,紧接着就是最受大家欢迎的现场编码环节。华为技术专家现场演示并指导开发者进行实操。

参会者们合影留念

鲲鹏处理器的性能调优思路

第一位分享嘉宾是,华为智能计算高级工程师苏林。他指出性能调优是一个长期的过程,建议开发者们选择一个合理的性能调优平衡点,只有最合适的才能达到最好的性能。以鲲鹏处理器来说,对性能影响比较大的两个特性,第一个是NUMA架构,第二个是L3 Cacheline。

 鲲鹏处理器支持NUMA架构,通过适当的性能调优,既能够达成很好的性能,又能够解决SMP架构下的总线瓶颈问题,提供更强的多核扩展能力,以及更好更灵活的计算能力。

 注意Cacheline伪共享,鲲鹏920和x86的Cacheline大小不一致,可能会出现在X86上优化好的程序在鲲鹏 920 上运行时的性能偏低的情况,需要重新修改业务代码数据内存对齐大小。X86 L3 Cacheline大小为64字节,鲲鹏920的Cacheline为128字节。

华为智能计算高级工程师 苏林

鲲鹏处理器支持NUMA(Non-uniform memory access, 非统一内存访问)架构,能够很好的解决SMP技术对CPU核数的制约。NUMA架构将多个核结成一个节点 (Node),每一个节点相当于是一个对称多处理机(SMP),一块CPU的节点之间通过On-chip Network通讯,不同的CPU之间采用Hydra Interface实现高带宽低时延的片间通讯,在NUMA架构下,整个内存空间在物理上是分布式的,所有这些内存的集合就是整个系统的全局内存。每个核访问内存的时间取决于内存相对于处理器的位置,访问本地内存(本节点内)会更快一些。

NUMA架构的特点

可以看到不同NUMA内的CPU core访问同一个位置的内存,性能不同。内存访问延时从高到低为:跨CPU > 跨NUMA不跨CPU > NUMA内,因此在应用程序运行时要尽可能的避免跨NUMA访问内存,可以通过设置线程的 CPU亲和性来实现。

NUMA配置方法

CPU、内存、网卡、磁盘这四个模块,系统都为我们提供了一些工具进行性能分析。

系统的瓶颈判断

鲲鹏大数据优化实践

第二位分享嘉宾是,华为鲲鹏大数据解决方案高级工程师,程硕峰。他向开发者们介绍了鲲鹏大数据的完整生态,分享开源大数据平台Ambari+HDP组件的移植经验。最后介绍了鲲鹏开发套件(Kunpeng Developer Kit)可实现对海量代码进行快速扫描和分析,并提供专业的代码移植指导,以及移植后全面的系统性能分析与可视化呈现,从而极大提升软件开发者移植与调优效率。

华为鲲鹏大数据解决方案高级工程师 程硕锋

从下图可以看到,鲲鹏大数据生态非常完善,在大数据领域,各个方面都有了一定的支持,硬件部分,泰山提供了TaiShan 2280 100/200型服务器。芯片有鲲鹏的916、920芯片可供选择,通过24核、32核、48核、64核来满足企业对不同算力的要求。大数据组件方面可以从数据源头到数据处理、存储都能够完美支持。当前支持的大数据平台有华为Fusionlnsight,还有Ambari,东方国信,美亚,他们将为大数据快速移植到鲲鹏平台上来提供支持。

鲲鹏大数据解决方案

为了将开源大数据平台Ambari+HDP组件移植到泰山,都需要移植什么内容?第一类是Jar包,有些Jar包含有So,需要在鲲鹏平台重新编译。组件本身的So文件,需要重新编译。最后是可执行二进制文件,依赖底层的芯片架构,需要重新编译。具体分为四个步骤:

 将RPM包分类,分为X86_64和Noarch两个类型

 使用checkSo工具扫描RPM

 分析RPM包,查询得出得出安装需要的依赖软件,解压获取rpm中源文件、软链接,检查/var/lib等关键目录,对比安装前后新增的源文件、软链接。

 构建RPM包

开源大数据平台Ambari+HDP组件移植经验总结

A-Tune自调优技术详解

第三位分享嘉宾是,华为2012实验室高级工程师谢志鹏。性能调优代表着时间和成本的支出。工程师往往需要搭建测试工具找到瓶颈点,依靠人工巡检查找故障原因,安装多种监控工具,汇总分析数十个数据,期间可能要花掉数个工程师数周的时间,才得以提升系统性能。

华为2012实验室高级工程师 谢志鹏

即使是在实验室的调优达到了预期的效果,但是往往在业务运行真实环境里面,业务负载都是会动态变化,而工程师的调优工作,往往都只能应对静态负载场景,对于动态负载场景束手无策。

当前系统调优的两大痛点是:

 如何使操作系统感知上层业务

 如何降低人工调优成本

基于openEuler的自调优系统A-Tune,使用系统画像技术,能识别业务匹配最佳资源模型,实时响应业务特征变化。目前,系统画像技术有两个关键技术点。第一个是感知技术,怎么去构建系统画像?主要是通过分类、聚类相结合的方法,分别在CPU、IO、网络、内存方面聚类然后通过一些具体的业务进行一些细化的分类,来达到精准识别业务的效果。

系统画像构建与感知技术

第二个关键技术点,基于机器学习算法的调优参数搜索技术对于机器学习里面的贝叶斯优化算法去做了一个调优参数的自动搜索技术,工程师只需要提供一组他认为对我们业务有性能影响的参数,以及参数范围,接下来,把这些参数和参数范围告诉我们的机器学习算法,并且给出评价指标。

iSulad的分享与实践

第四位分享嘉宾是,华为iSula容器团队架构师蔡灏旻。根据Sysdig《2019年的容器使用报告》显示,在容器密度方面,与2018年相比,每台主机中的容器密度提高了100%,从15个增加到了30个其中最大节点密度已经达到了250个。边缘节点资源敏感,留给容器基础建设的资源屈指可数,一个更轻量、更快速的容器引擎呼之欲出。

华为iSula容器团队架构师 蔡灏旻

iSula为全量的容器软件栈,包括引擎、网络、存储、工具集与容器OS;iSulad 作为其中轻量化的容器引擎,可以为多种场景提供最灵活、最稳定、最安全的底层支撑,目前已开源给大家使用。开源地址:https://gitee.com/openeuler/iSulad

iSulad具有轻、快、易、灵四个特点:

 轻:iSulad的第一个使用场景是在端侧设备上,在一个智能摄像头上使用容器来达到快速、简单切换算法应用部署的功能

 快:采用C/C++语言实现,具备运行速度快、底噪低等特性,且LXC运行时优秀的并发设计也为iSulad并发性能提供了基石

 易:iSulad为了使开发者迁移方便,正在筹备开发一系列迁移工具,帮助开发者将自己的应用平滑迁移到iSulad上来

 灵:针对不同的使用场景提供不同的模式供大家组合切换,开发者可以根据自己的使用需要灵活配置切换注重性能的performance模式和注重资源占用的light模式

iSulad的架构

热烈的调优实践

最后的调优实践上机环节是最热烈的,开发者们果然拥有最忠实的技术信仰,每一位指导老师身旁都围绕着一群开发者,从系统配置、调优思路到性能优化、故障分析,每一位开发者都沉浸在浓厚的技术探讨氛围中,我们也采访了几位开发者。

浓厚的技术探讨氛围

Q1:请问您今天参加的实践组是?感觉本次沙龙技术实践怎么样?

A:参加了iSula镜像,整体的议程感觉都很好。实践环节很好可以让我们切身,马上感受到这个产品怎么样。前面是理论讲座,后面马上就能使用是看得见摸得着的,这个非常好。

Q2:以后希望能听到鲲鹏技术沙龙更多内容分享的是?

A:更多应用指导性更强的内容,因为会在工作中用到。比如鲲鹏可以联合研究系统级别的部门和研究大数据的部门,将大数据应用系统结合起来讲解,这样能会产生更好的效果。这样应用指导性也会更强。

热烈的编码实践环节

【对“极具“杀伤力”的性能调优,从几个思路说起”发布评论】

版权及免责声明:
① 本网站部分投稿来源于“网友”,涉及投资、理财、消费等内容,请亲们反复甄别,切勿轻信。本网站部分由赞助商提供的内容属于【广告】性质,仅供阅读,不构成具体实施建议,请谨慎对待。据此操作,风险自担。
② 内容来源注明“硅谷网”及其相关称谓的文字、图片和音视频,版权均属本网站所有,任何媒体、网站或个人需经本网站许可方可复制或转载,并在使用时必须注明来源【硅谷网】或对应来源,违者本网站将依法追究责任。
③ 注明来源为各大报纸、杂志、网站及其他媒体的文章,文章原作者享有著作权,本网站转载其他媒体稿件是为传播更多的信息,并不代表赞同其观点和对其真实性负责,本网站不承担此类稿件侵权行为的连带责任。
④ 本网站不对非自身发布内容的真实性、合法性、准确性作担保。若硅谷网因为自身和转载内容,涉及到侵权、违法等问题,请有关单位或个人速与本网站取得联系(联系电话:01057255600),我们将第一时间核实处理。
广告
相关
头条
Intel为什么要停掉台积电16nm代工的Nervana芯片? Intel为什么要停掉台积电16nm代工的Nervana芯
对AI芯片市场虎视眈眈的Intel公司在去年12月中旬收购了以色列AI芯片初创公司Habana,……
·Intel为什么要停掉台积电16nm代工的Nervana芯
·苹果和博通达成价值150亿美元的芯片供应协议
·谷歌的价值不菲的AI芯片有人买单吗?客户很少
·韩国未来10年为AI半导体技术研发投资1万亿韩
·存储芯片行业撑过最糟糕的日子 价格正在迎来
图文
上海金山举办半导体行业资源对接会,创8产业云助力云端招商
上海金山举办半导体行业资源对接会,创8产
索尼生产PS5所需DRAM和快闪存储器供应遇到困难
索尼生产PS5所需DRAM和快闪存储器供应遇到
康佳半导体宣布首款存储主控芯片KS6581A量产
康佳半导体宣布首款存储主控芯片KS6581A量
三星对芯片厂增投 三星二期项目总投资150亿美元
三星对芯片厂增投 三星二期项目总投资150亿
最新
·上海金山举办半导体行业资源对接会,创8产业云助
·索尼生产PS5所需DRAM和快闪存储器供应遇到困难
·美股2020年2月24日全线下挫,费城半导体指数大跌
·ROHM开发出适用恩智浦i.MX 8M Nano系列处理器电源
·强攻设计师电脑 技嘉推出DESIGNARE DDR4内存
热点
·比第一次还刺激!5款颈椎按摩器横评,SKG获推
·美国第一个禁售令已来,电子烟还能怎么玩?
·六种口味缤纷上市!Wel鲸鱼轻烟,让电子烟流
·悦刻RELX:一家“很年轻很世界”的公司(图)
·Wel鲸鱼轻烟和RELX,谁才是中国市场上的JUUL
旧闻
·2019国际第三代半导体专业赛两大赛区决战深圳
·英特尔再曝光芯片三大漏洞 Core和Xeon皆受影
·Audible携手Roav给用户带去更好的车内电子阅
·华视电子助力广东政务服务一体机落地应用
·美国第一个禁售令已来,电子烟还能怎么玩?
广告
硅谷影像
上海金山举办半导体行业资源对接会,创8产业云助力云端招商
上海金山举办半导体行业资源对接会,创8产业云助
索尼生产PS5所需DRAM和快闪存储器供应遇到困难
索尼生产PS5所需DRAM和快闪存储器供应遇到困难
美股2020年2月24日全线下挫,费城半导体指数大跌
美股2020年2月24日全线下挫,费城半导体指数大跌
ROHM开发出适用恩智浦i.MX 8M Nano系列处理器电源管理IC
ROHM开发出适用恩智浦i.MX 8M Nano系列处理器电源
强攻设计师电脑 技嘉推出DESIGNARE DDR4内存
强攻设计师电脑 技嘉推出DESIGNARE DDR4内存
Intel为什么要停掉台积电16nm代工的Nervana芯片?
Intel为什么要停掉台积电16nm代工的Nervana芯片?
关于我们·About | 联系我们·contact | 加入我们·Join | 关注我们·Invest | Site Map | Tags | RSS Map
电脑版·PC版 移动版·MD版 网站热线:(+86)010-57255600
Copyright © 2007-2020 硅谷网. 版权所有. All Rights Reserved. <京ICP备12003855号-2>