4月9日-13日,第十三届国际性能工程学大会(ICPE2022)在线召开,大会由国际计算机协会ACM和标准性能评估组织SPEC联合举办,高效能服务器和存储技术国家重点实验室承办。此次大会吸引了300余位专家、学者报名参与,共收到各类投稿290余篇,涉及AI建模及算法、算力提升、能效测量、新型计算架构、体系结构研究等多个主题。其中专业论文70余篇,包含优秀论文58篇,论文集收录22篇。会议期间还举办了6场专题研讨会,涵盖基准测试、存储管理、软件开发等多个领域。
首次引入数据挑战专题,评估数据算法优化对服务器性能的提升情况
相对于传统应用来讲,在云、边、AI等新兴领域,数据中心的首要性能挑战主要来自不断增长的数据规模,系统内的数据流动制约了大规模、超大规模系统计算的效能,提高了系统部署及维护的复杂度和成本。根据国际权威机构Statista的统计和预测,2020年全球数据产生量预计达到47ZB,而到2035年这一数字将达到2142ZB。数据挑战带来的直观问题是超大规模系统的协同,即如何解决数据流动、系统模块之间的通信问题。为此,ICPE2022首次引入数据挑战专题,针对数据集形成算法并进行优化,同时优化服务器的性能。
来自沃尔茨堡大学的André Bauer教授介绍了一种性能改变点的自动分类方法,通过应用时间序列分析和机器学习方法,开发一个可以对潜在的性能变化点进行分类的模型,以评估不同机器学习模型的性能,并将生成的模型应用于其他未标记的数据集,以自动对性能变化点进行分类和检测,从而节省人力及设备资源,提升部署速度。
专家分享研究实践成果,从边缘到集群的性能优化
在大会Keynote演讲环节,来自维也纳理工大学、谷歌及浪潮信息的三位演讲嘉宾,分别从边缘故障预测、数据中心管理、多层数据访问优化的角度介绍了应对数据挑战所采取的方案。
维也纳理工大学教授Ivona Brandic(IEEE 云计算杂志、IEEE TPDS 和 IEEE TCC 编委),在题为《面向可持续和容错边缘系统的数据科学驱动方法》演讲中,揭示了边缘系统与物联网相结合的挑战:由于时效性、高度异构性和资源稀缺,云计算或通用分布式系统设计的故障恢复机制无法应用于边缘系统。因此,Ivona Brandic和她的团队设计了一种基于机器学习的新机制,可以评估在边缘基础设施上冗余部署的服务故障恢复能力。该方法利用动态贝叶斯网络(dbn)的概念,学习边缘服务器故障之间的时空相关性,并将其与拓扑信息相结合,以合并链路故障。最后,可推断出在服务运行时,某一组服务器发生故障或并发断开连接的概率。
SOSP、FAST、EuroSys和HotCloud的程序委员会主席,John Wilkes,长期从事谷歌计算基础设施集群管理工作,发表主题为《构建仓库规模的计算机》的演讲,他介绍谷歌内部面对几个月内增加100000 个 CPU 内核 + RAM + 闪存 + 加速器 + 磁盘的需求,可以动态地将资源分配给最迫切需要它们的产品组,准确地反映所有机器和基础设施的成本(运营支出/资本支出),并监控、控制数据中心的电源和冷却系统以实现最小的开销。
浪潮信息人工智能与高性能应用软件部高性能应用架构师,李龙翔博士发表主题为《多层数据访问优化》的演讲。随着近年CPU核心数增加及性能的不断增强,在超大规模系统并行计算时,越来越多的应用运行性能主要受数据访问速度限制。针对超大规模集群的数据存储特点,他介绍了一种多层数据访问 (Multi-Layered Data Access,MLDA) 优化方法,可以快速对超大规模并行计算性能瓶颈进行分析,通过对存储、网络、访存、CPU等设备数据访问过程优化,提升超大规模集群并行计算效率。这只是浪潮信息解决超大规模系统挑战多种技术之一,在中文巨量模型“源1.0”的训练过程中,浪潮信息采用了多种面向超大规模并行计算技术的软硬件协同优化手段,通过流水线并行、张量并行等手段自动地将模型多层数据切分到不同的节点中实现并行。“源1.0”模型包含的参数总量达 2457 亿,是 GPT-3 的 1.404 倍。
除主题演讲之外,分论坛内容同样精彩
学术论文获奖者,来自犹他大学的Richard Li表示,对于基于分布式微服务的应用程序来说,性能故障排除是出了名的困难。分析人员对性能异常的典型根源诊断首先是缩小慢速服务的范围,调查慢速组件中的高级性能指标或可用日志,最后深入到实际原因。由于缺乏领域知识和实际操作经验,这个过程可能会很长、很乏味,有时还会漫无目的。在本次大会中,他介绍了一种新的由机器学习驱动的性能分析系统,该系统可自动化与延迟相关的性能异常的故障排除过程,以方便诊断和解释根本原因。
来自于IBM的Lixiang Luo为本次大会的产业论文获奖者,他提出的三种NVMe存储虚拟化方法(PCI设备直通法、虚拟块设备法和SPDK虚拟主机目标法)通过虚拟机提供NVMe存储,同一主机上的多个虚拟机可以共用一个物理NVMe设备,以满足现代工作负载不断增长的I/O吞吐量和延迟需求。
1阅读协议
>2设置个人信息
1.服务总则
贵州省会展行业综合信息服务平台(https://guizhouexpo.cn以下简称“平台”)由中国国际贸易促进委员会贵州省委员会(贵州省博览事务局)主办,为注册平台用户提供准确、及时、权威的会展行业信息服务。本协议规定了平台用户应享受的各种服务及必须遵守的相关事项。用户必须完全接受本协议条款才能成为平台用户。
2.用户申请方式
用户可访问贵州省会展行业综合信息服务平台(https://guizhouexpo.cn),并在其首页注册区进行在线注册。
用户可自行确定在本网站使用的用户名(会员帐号)和密码并须自行负责对其会员帐号和密码的保密,且须对其在该会员帐号和密码下发生的所有行为承担责任。主办方不对因用户未能遵守本条规定而发生的任何损失或损毁负责。
3.服务变更
平台具体服务内容及方式由实际情况确定,并保留变更、终止部分或全部网络服务的权利。
4.入网规则
4.1用户在申请使用平台时,须提供详尽、准确的用户资料,并及时更新注册资料。如果注册资料包含有不正确的信息,平台有权终止用户使用资格。
4.2用户注册成功后,平台将保证用户帐号及相应的密码的唯一性,该用户帐号和密码由用户负责保管。用户应当对以其帐号进行的所有活动和事件负法律责任。
4.3用户必须同意接受平台通过手机短信、电子邮件或其他方式向用户发送的贵州省会展行业信息或其他相关信息。
4.4用户在使用平台服务过程中,必须遵循以下原则:
(a)遵守中国有关的法律和法规;
(b)遵守标准版权规定。
(c)不得以任何非法目的使用网络服务系统;
(d)遵守所有与网络服务有关的网络协议、规定和程序;
(e)如发现任何非法使用会员帐号或会员帐号出现安全漏洞的情况,应立即联系平台管理方。
4.5平台不对用户所发布信息的删除或储存失败负责。平台保留判定用户的行为是否符合平台服务网协议条款的权利。用户违背服务条款的规定,平台有权中断对其提供服务。
5.内容所有权
5.1平台提供的网络服务内容包括:文字、软件、声音、图片、录象、图表、广告等。所有这些内容受版权、商标和其它财产所有权法律的保护。
5.2用户只有在获得平台或其他相关权利人的授权之后才能使用这些内容,而不能擅自复制、再造这些内容、或创造与内容有关的派生产品。
6.服务条款的修改和服务修订
平台有权在必要时修改本服务条款和法律声明,并将在平台重要页面上向用户提示变动内容。如果用户继续享用服务,则视为接受法律声明和服务条款的变动。
7.用户隐私制度
7.1保护用户隐私是平台的一项基本政策,保证不对外公开或向第三方提供用户注册资料及用户在使用网络服务时存储在贵州省会展行业综合信息服务平台的非公开内容,但下列情况除外:
(a)事先获得用户的明确授权;
(b)根据有关的法律法规要求;
(c)按照相关政府主管部门的要求;
(d)为维护社会公众的利益;
(e)为维护平台的合法权益。
7.2平台可能会与第三方合作向用户提供相关的网络服务,在此情况下,如该第三方同意承担与平台同等的保护用户隐私的责任,则平台可将用户的注册资料等提供给该第三方。
8.免责声明
8.1用户明确同意其使用平台网络服务所存在的风险将完全由其自己承担;因其使用平台网络服务而产生的一切后果也由其自己承担,平台对用户不承担任何责任。
8.2平台不担保网络服务一定能满足用户的要求,也不担保网络服务不会中断,对网络服务的及时性、安全性、准确性也均不作担保。
8.3平台对用户在使用中可能产生的任何损害不承担责任。
9.保障
如因用户违反有关法律、法规或本协议项下的任何条款而给平台或任何其他第三方造成损失,用户必须承担由此造成的损害赔偿责任。
10.服务变更、中断或终止
10.1如因系统维护或升级的需要而暂停网络服务,平台将尽可能事先进行通告。
10.2如发生下列任何一种情形,平台有权随时中断或终止向用户提供本协议项下的服务而无需通知用户:
(a)用户提供的资料不真实;
(b)用户违反本协议中规定的使用规则。
10.3用户对条款修改有异议,或对平台的服务不满,可以行使如下权利:
(a)停止接受贵州省会展行业综合信息服务平台的服务。
(b)通知平台停止对本用户的服务。
10.4除前款所述情形外,平台同时保留在不事先通知用户的情况下随时中断或终止部分或全部服务的权利,对于所有服务的中断或终止而造成的任何损失,平台无需对用户或任何第三方承担任何责任。
11.通知和送达
本协议项下所有的通知均可通过重要页面公告、手机短信、电子邮件或常规的信件传送等方式进行;本条款所述通知于发送之日视为已送达收件人。
12.法律管辖
12.1本协议的订立、执行和解释及争议的解决均应适用中华人民共和国的法律。
12.2如发生平台服务条款与中华人民共和国法律相抵触时,则相抵触的条款将按法律规定重新解释,而其它条款则依旧保持对用户产生法律效力和影响。
13.其他规定
13.1本协议构成双方对本协议之约定事项及其他有关事宜的完整协议,除本协议规定的之外,未赋予本协议各方其他权利。
13.2如本协议中的任何条款无论因何种原因完全或部分无效或不具有执行力,本协议的其余条款仍应有效并且有约束力。
13.3本协议中的标题仅为方便而设,在解释本协议时应被忽略。
14.解释权
本服务条款的解释权归平台主办单位。