2022中国算力白皮书_第1页
2022中国算力白皮书_第2页
2022中国算力白皮书_第3页
2022中国算力白皮书_第4页
2022中国算力白皮书_第5页
已阅读5页,还剩60页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中国算力白皮书(2022年)中国算力白皮书(2022年)中国算力白皮书(2022年)2022年7月II中国算力白皮书(2022年) 中国算力白皮书(2022年)目 录概述 1算力体况 2球力体况 2国力体况 2国力业用布 3算力分类 44市规方面 4技方面 4用力 4概述 4市场 5技术 6能力 143.3.1概述 143.3.2市场 143.3.3技术 16算力 203.4.1概述 203.4.2市场 223.4.3技术 26缘力 293.5.1概述 293.5.2市场 303.5.3技术 32算力用能 34色力 344.1.1简介 344.1.2案例 34工能 35中国存力白皮书(2022年)4.2.1简介 35中国存力白皮书(2022年)4.2.2案例 35联网 354.3.1简介 354.3.2案例 36慧疗 364.4.1简介 364.4.2案例 36缘算 374.5.1简介 374.5.2案例 37联网 394.6.1简介 394.6.2案例 39算力力量系 40力力标建 40用力 40能力 405.4415.5415.645算力力型 47关念 47向影型 49力力型 516.452结语展望 58力模面 58力术面 58力标建面 58IIIIII中国算力白皮书(2022年) 中国算力白皮书(2022年)图目录图1 2021年球力模情况 2图2 2021年国力模情况 3图3 2021年国力业应分情况 3图4 近年CPU务处理出量模 5图5 2021第4度CPU场额 6图6 2021第4度GPU场额 15图7 FPGA场模计 16图8 2021第4度FPGA场额 16图9 2022年6月TOP500中分家算量 23图10 2022年6月TOP500中国算占额 23图2022年6月TOP500榜对厂份额 25图12 2002-2021国TOP100超算数据 25图13 2021年月TOP100商统数 26图14 算心件构 27图15 算络构 28图16 边计的构 30图17 2024各缘预期场额 31图18 缘备展图 31图19 里巴纪南通A栋据心绿级估34图20 缘算务功能构图 38图21 边同核活+边分示图 38图22 据心力指标建 40图23 连扑vs.CLOS时延试 43图24 连扑vs.CLOSOpenFoam性能测试 43图25 南内100G/27KMRoCE网平时延 44图26 南淄博10G/310KMRoCE网平时延 45图27 prjXiX+(X−X+)和prjX−X+(X−Xi)的形示 50图28 个据心标下正理解距离 56图29 本据正理想解的离 57IVIV中国存力白皮书(2022年)表目录中国存力白皮书(2022年)表1CPU类构览 5表22021年Intel部分处器产品 7表32021年AMDEPYC(霄龙部产概况 7表4ARM3产对比 8表5AmpereAltraMax品规格 8表6亚逊Graviton2品规格 9表7飞腾、FT2000S2500品格 9表8华为Hi1620Hi1616、Hi1612Hi1610产格 10表9芯3A5000/3B5000、芯3C5000L产规格 表10龙芯7A1000、芯7A2000产规格 12表IBM的Power1990-2019部产概况 12表12IBM的Power10概况 13表13阿的铁架能表 13表14申威SW2、架性表 14表15智算主芯类型 14表16全服器GPU场季统(位:$M) 15表17AMD分品况 17表182010-2021年Xilinx部分FPGA产品 18表192010-2021年Intel(Altera)分FPGA产品 18表202010-2021年分产商FPGA19表2113并计关领域 21表22全超发历程 22表231993-2022年界名第超算 24表24MEC缘部用软系与务端置 37表25智算领算精度 41表26算五指选取 51表27样数据 52表28数中能指分级 52表29数中能指定级 53表30不数中不指标的两较 53表31数中等比级经序转表 53表32相贴度星准表 571《新型数据中心发展三年行动计划(2021-2023年)》,工信部通信﹝2021﹞76号11《新型数据中心发展三年行动计划(2021-2023年)》,工信部通信﹝2021﹞76号1中国算力白皮书(2022年) 中国算力白皮书(2022年)1 概述算力是数据中心的服务器通过对数据进行处理后实现结果输出的一种能力,最常用的计量单位是每(FLOPS)(FP32)来进7(2021-2023年)》中提出算力发展目标:到2021年底,全国数据中心总算力超过120EFLOPS(1O0^1FLS3200O1。202111“”2025300EFLOPS。CPUGPU、FPGAAI超级计算机输出的计算能力为主;而边缘算力主要以就近为用户提供的实时计算能力为主,是以上三种算力形式的组合。2算力规模部分包含通用算力、智能算力、超算算力,边缘算力暂未纳入统计范围。22算力规模部分包含通用算力、智能算力、超算算力,边缘算力暂未纳入统计范围。2中国算力白皮书(2022年)2 算力总体情况中国算力白皮书(2022年)2.1全球算力总体情况在算力规模方面2,截止到2021年底,全球算力总规模达到521EFLOPS(FP32)。其中,通用算力为398EFLOPS(FP32),智能算力为113EFLOPS(FP32),超算算力规模为10EFLOPS(FP32)。160EFLOPS(FP32),14031275%、4%、37080604020中国日本德国英国加中国日本德国英国加中东和北非其他地区东欧其他地区其他新兴亚太地区台湾香港爱捷克共和国丹麦泰国马来西亚沙特阿拉伯土耳其通用算力(EFLOPS) 智能算力(EFLOPS) 超算算力(EFLOPS)数据来源:Gartner、IDC、TOP500,中国信息通信研究院整理图1 2021年球算规模情况2021140EFLOPS(FP32),算力规模排名全10929超算算力规模为2EFLOPS(FP32)。江苏、上海、广东、河北算力规模皆超过10EFLOPS(FP32)。北京、浙江、贵州、山东、内蒙古算力规模皆超过5EFLOPS(FP32)。33中国算力白皮书(2022年) 中国算力白皮书(2022年)1614121086420

数据来源:中国信息通信研究院整理图2 2021年国算规模情况截止到20214726%、720%左右3AI18%、4%、6%、2%、6%、2%。30302672618264政企 金融与支付 公有云 网站 视频 AI 电商 游戏 其他来源:中国信息通信研究院整理图3 2021年国算行业应分布况43来源:中国信息通信研究院测算4图3中的“其他”为互联网及非互联网类“其他”的总和。5《AI5《AIODCC,20194中国算力白皮书(2022年)3算力的分类中国算力白皮书(2022年)综述随着数字经济时代的到来,算力的发展也迎来了高潮。算力分为通用算力、智能算力、超算算力和边缘算力四种,这四种算力无论是在市场规模方面还是在技术方面均有了较大的提升。ICItel和MD9U%GPU市场份95GPU70FPGAGPUFPGAFPGA技术进一步突破,芯片制程与芯片性能不断提高。CPU提升,处理器架构不断创新,实现高性能低功耗。智能算力GPU、FPGA芯片性能不断提高,芯片内存通用算力概述CPU(CentralProcessingUnit,中央处理器)为代表。CPUCPU运算进行指导和优化的硬程序5,CPUU分为x6x86x8MMIeICa等。PU芯片行业技术壁垒高,国内外仅有少量企业能够稳定提供产品Itel、6来源:企业官网等公开资料,中国信息通信研究院整理56来源:企业官网等公开资料,中国信息通信研究院整理5中国算力白皮书(2022年) 中国算力白皮书(2022年)MDIMMISphaMIV表1 CPU各类构概览6分类 特点 引领者 优劣势x86 1. 2.

Intel、AMD、光、芯 软件生好,有率指令集实现复杂,功耗高ARM

追求多核低功耗

ma腾、华为

获得授权的厂商多,能效比高;软件生态劣于x86MIS . 2. 低功耗

龙芯 软件生弱市占率正在下降IMwr

IRISC-V基金会、阿里巴

主要应用在金融领域RISC-V架构完全开放,RISC-V 1

巴、兆易创新、华米科技、赛昉科技、芯来科技

指令精简、模块化、可扩展、开源Alpha 1. 2. 速度快

申威 软件生弱,占率小市场2018 2019 2020 2018 2019 2020 CPU服务器处理器出货量(单位:MU)272733364035302520151050数据来源:公开数据整理图4 四年CPU服器处理出货规模66中国算力白皮书(2022年)Intel与MD两家占据市场近95%1IelU处中国算力白皮书(2022年)理器市场份额的占比为%D市场份额达到了1%的市场份额分别由IMpere、MavelOrcleintel AMD IBM Ampere 其他来源:公开数据整理图5 2021年第4季度CPU市场额预计2021-2026年,全球CPU市场的年复合增长率超过5%,增长速度自2023年起趋于平稳。x86架构依然占据绝对市场优势,同时,ARM架构正在崛起,由于其体积小、功耗低、成本低、性能好等优势,广泛地被应用在许多嵌入式系统设计,增长迅速。技术.3.1x86x86(Thex86architecture)CPUIntelx86x86(一)Intel产品方面IntelUUtimro、Thrle、riklad、ey、ratley、rley和hitleU制程由008m提升至2002CPU14nm77中国算力白皮书(2022年) 中国算力白皮书(2022年)表2 2021年Intel部处理器品7PCIePCIe制程(nm)TDP(W)基本频率(GHz)发行日期 内核数 最大睿频频率(GHz)处理器产品英特尔®®tinm8368处理器

Q2'21 38 3.40 2.40 270 10 64(二)AMD产品方面200314nm霄龙处7nmAMDCPU201714nm20197nm,20225nmAMDEPYC70033AMDInfinity架构。PCIe制程(nm)TDP(W)基本频率(GHz)发行日期 内核数 最大睿频频率(GHz)处理器产品表3 2021PCIe制程(nm)TDP(W)基本频率(GHz)发行日期 内核数 最大睿频频率(GHz)处理器产品AMDEPYCTM7763 Q1'21 64 3.50 2.45 280 7 128ARMARM架构(AdvancedRISCMachine,更早称作:AcornRISCMachine),为一个32位精简指令集(RISC)处理器架构,广泛地使用在嵌入式系统设计中。基于ARM的处理器具有运行速度快、功耗低、成本低等优点,被广泛应用于通信、存储、安全系统等领域。(一)安谋(ARM)产品方面ARM11Cortex、RMA”“R”7来源:nel官网8来源:AMD官网88中国算力白皮书(2022年)表4 ARM3产品比9中国算力白皮书(2022年)特征 最新版本 应用特征 最新版本 应用Cortex-A

在所有架构配置文高能效优化运行丰富的操作系统

ARMV8ARMV9

PCCortex-R 针对有实时要求的系统进行了优化

ARMV8 安全处理器、物联网和嵌入式设备,如可rexM

设备而计 ARM

穿戴设备、小型传感器、通信模块和智能家居产品(二)安晟培半导体科技有限公司(AmpereComputing)产品方面0mpreta201mpreAltraMax128AmpereAltraMax表5 AmpereAltraMax产品规格10AmpereAltraMax发行日期 2021核心 128架构 ARMV8.2主频 3.0GHz1 64BL1I64KBL1-DL2 1MB系统级缓存 16MB内存 8×72-bitDDR4-3200工艺/典型功耗 /25w(三)亚马逊产品方面Graviton2AWSARMARMCPU架构。9httsarmomyrmachtctuecpu0来源:pereomutg官网99中国算力白皮书(2022年) 中国算力白皮书(2022年)Graviton2表6 马逊Graviton2产品规格11Graviton2发行日期 2019核心 64架构 ARMV8.2主频 2.5GHz1 64BL1I64KBL1-DL2 1MBL3 32MBShared内存 8×DDR4-3200工艺 7nm典型功耗 110W(四)飞腾产品方面150A、、150016、20、0(PSoC)64ARMV8表7 腾FT-1500AFT2000、S2500产格12FT-1500AFT2000S2500核心集成16个FTC660处理器核集成64个FTC662处理器核集成64个FTC663处理器核主频1.5GHz工作主频.8、2.0、2.2GHz2.0~2.2GHz二级缓存8MB32MB42MBL232MB三级缓存8MB/64MB存储控制器网络接口4个DDR3接口2个100Mbps以太8个DDR4接口集成8个DDR4-3200通道集成4个直连通路,每个通路组成为网调试口X4lane25Gbps,、4、8路CPU互连典型功耗35W100W150W(五)华为产品方面CPUARMV8Hi1610、Hi1612Hi1616CPU11来源:亚马逊官网12来源:飞腾官网、中国信息通信研究院整理13来源:企业官网等公开资料,中国信息通信研究院整理1013来源:企业官网等公开资料,中国信息通信研究院整理10Hi1620(920)Hi1616(916)Hi1612Hi1610中国算力白皮书(2022年)表Hi1620(920)Hi1616(916)Hi1612Hi1610中国算力白皮书(2022年)发行日期 2019 2017 2016 2015核心 24~64 32 32 16架构 Ares Cortex-A72 Cortex-A57 主频 2.4~3.0GHz 2.4GHz 2.1GHz 2.1GHz1 64BL1I64KBL1-D

48BL1I32KB

48BL1I32KB

48BL1I32KBL1-D2 512KBrivte 1M/4ores 1M/4ores 1M/43 1M/coeared 32MBN 32MBN 16MB内存 8×DDR4-3200 4×DDR4-2400 4×DDR4-2133 2×DDR4-1866典型功耗 100~200W 85WMIMIS(Microprocessorwithoutinterlockedpipelnedstages,(I981年,由MISMIS2位。MISI()IPMISCISU。7年8月6MIS获得其处理器IP龙芯产品方面,2019年年底发布龙芯3A4000/3B4000。龙芯3B4000在核心线程、频率上与芯3A400016CPU3B4000CPU400%以上。1oongrc。龙芯/3B500LoongArchLA4643B50003A50003C5000L,3A500016LA46414来源:企业官网等公开资料,中国信息通信研究院整理1114来源:企业官网等公开资料,中国信息通信研究院整理11中国算力白皮书(2022年) 中国算力白皮书(2022年)龙芯3A5000/3B5000 龙芯龙芯3A5000/3B5000 龙芯3C5000L发行日期 2021 2021核心个数 4 16处理器核

支持LoongArch®128/256422

LoongArch®指令系统;支持128/25622主频 2.3Gz–.5Gz 2.0Gz2.2Hz峰值运速度 160GFlops 560GFlops高速缓存每个处理器核包含64KB私有一级指令缓存和64KB256KB16MB内存控器 2个72位DDR4-3200控制器持ECC校验高速IO 2个HyperTransport3.0控制器支持处器数据一致性互连(CC-NUMA)功耗管理 支持主要模块时钟动态关闭;支持主要时钟域动态变频;支持主电压域动态调压

64KB64KB256KB私有二级缓存;每4个处理器核共享16MB三级缓存,共64MB三级缓存472DDR4-3200ECC4HyperTransport3.0持多处理器数据一致性互连(CC-NUMA)支持主要模块时钟动态关闭;支持主要时钟域动态变频;支持主电压域动态调压典型功耗 35W@2.5GHz 130W@2.2GHz2022年6月发布龙芯3C5000芯片。龙芯3C5000芯片是面向服务器领域的通用处理器,在兼容龙芯3C5000L主板设计的基础上,调整优化了封装形式,保持了系统和应用软件的兼容性。202277A20007A20007A20007A1000PHY15来源:IBM1215来源:IBM12中国算力白皮书(2022年)表10 芯7A1000、芯7A2000产品格中国算力白皮书(2022年)龙芯7A1000龙芯7A2000发行日期20202022处理器接口HT3.016.2GpsHT3.016.2GpsGPU支持2D、3D支持3D显存DDR316DDR432显示接口DVO*2HM*、*1功耗5~8W7~14WwrPower架构是IBM开发的一种基于RISC指令系统的架构。wrwerwrIMUerwrIMIM透过owr.rgwrIM产品方面,0年2月,IM推出了第一部采用wer架构的IM电脑被称作ICtm6000或/600IMowr0wr到we2、wrC、owr、we4、wr5、w6er1。处理器产品发行日期内核数最大睿频频率基本频率制程表11 IBM的Power1990-2019年部处理器产品发行日期内核数最大睿频频率基本频率制程(GHz)(GHz)(nm)wr6200725.03.665wr7201044.252.445wr820146/125.02.522IM的wr10采用7m2、ot16和IN8计算的I0倍、5倍和0S加IMowr101313中国算力白皮书(2022年) 中国算力白皮书(2022年)PCIe制程(nm)基本频率 TDP(GHz) (W)最大睿频频率(GHz)发行日期 内核数最多处理器产品PCIe制程(nm)基本频率 TDP(GHz) (W)最大睿频频率(GHz)发行日期 内核数最多处理器产品wr10 2020.8 15/30 4 3.5 0 7 5.0RISC-VRISC-V2010205年IVICVRISC-V指令集具有很强的灵活性,其设计使其适用于现代计算设备。RISC-V指令集的设计考虑了小型、快速、低功耗的现实情况,具有众多软件的支持,这解决了新指令集以往的弱点。20215—907,RISC-VMPU(处理器产品发行日期支持内核数单核性能主频制程其他性能表13 里的处理器产品发行日期支持内核数单核性能主频制程其他性能(coremark/MHz)(GHz)(nm)玄铁E9072021/3.8128五级流水线玄铁C9102019167.12.516十二级流水线AlphaAlpha(DECAlphaAlphaAXP)64RISCDECDECAlphaVAXVMSWindows2000beta3AlphaDECAlphaAlphaAXP210641992RISCzha2114526Mha12641998211642002AlphaAlpha21364,DEC16来源:IBM官网17来源:中国信息通信研究院整理1414中国算力白皮书(2022年)6DCa,10m90Mz。200年,申威基于ha2164开发了W/600处理器,0已经运用到神威蓝光(wayBlueLightMPP)Alpha中国算力白皮书(2022年)表14 威SW2、SW-3/SW1600框架能18处理器产品发行日期内核数主频(GHz)制程(nm)用途申威SW2200821.4130高性能计算机申威/6002010161.665超级计算机智能算力概述智能算力主要以GPU(GraphicsProcessingUnit,图形处理器)、FPGA(FieldProgrammableGateArray,现场可编程逻辑门阵列)、AI(ArtificialIntelligence,人工智能)芯片等为代表。表15 能算主要片类型19分类特点引领者1.通用性高GPU2.平行处理能力中等英伟达、AMD3.交付周期中等1.通用性中等FPGA2.平行处理能力高in(已被MD收购、Itel3.交付周期中等1.通用性低AI芯片2.平行处理能力高寒武纪、燧原、华为等3.交付周期长(一)GPU市场规模IDCGPU202171.5GPU伟达、AMD、Intel垄断。18来源:申威官网、中国信息通信研究院整理19数据来源:中国信息通信研究院整理1515中国算力白皮书(2022年) 中国算力白皮书(2022年)表16 球服器GPU市场季统计20(单位:$M)第一季度第二季度第三季度第四季度年度合计20174914585225862057201868475478066828862019570600665745258020209121091118912894481202114561521182023537150英伟达 AMD Intel2021GPU95.7,AMD4.2,Intel0.1。英伟达 AMD Intel数据来源:IDC官网图6 2021年第4季度GPU场份额(二)FPGA市场规模FPGA

已被AMD和Intel29.9%和70.1%。2020202020217.920数据来源:IDC官网1616中国算力白皮书(2022年)中国算力白皮书(2022年)

7.8 7.95.6 7.2 5.64.02.00.0

2018

2019

2020

2021数据来源:IDC官网图7 FPGA市场模计FPGA与Intel这两家公司几乎占领全60FPGAin(Dnte已收购ratti(Mirsei()。Xilinx IntelXilinx Intel数据来源:IDC官网图8 2021年第4季度FPGA市份额技术GPUGPU(上做图像和图形相关运算工作的微处理器。GUMGresIGA-rieswrRogueGPUNIDI、D等。NVIDIA在1999年定义了GPU,推动了PC游戏市场的快速发展,重新定义了现代计算机图形技术,0NIDIAmere0IDA1717中国算力白皮书(2022年) 中国算力白皮书(2022年)0NIDAmpre架构的GP0AMDGPUInstinct系列等。AMD20081TFLOPSGPUAMD在GPUAMDRadeonR9R7、AMDFireProS7100XGPU207a1nmGUInstnctI250180架构的mGPUIstintI5,00A架构的UInstnctI100,021IntnctMI00MDA2HPC型号 计算流处FP64| FP64|FP32FP32 Matrix FP16/bf16型号 计算流处FP64| FP64|FP32FP32 Matrix FP16/bf16INT4/INT HBM2e 显存带 规范单元理器Vector (Peak) (Peak) 8(Peak)ECC显存 (Peak)AMDInstnctMI50x22014,08Upo4.90 TFUpoTFUpto383.0TFUpto383.0TOPS128GB3.2TB/secOCP加速器模块AMDInstnctMI5020813,31Upo4.32 TFUpoTFUpto362.1TFUpto362.1TOPS128GB3.2TB/secOCP加速器模块FPGAFPGA(FieldProgrammableGateArray,现场可编程逻辑门阵列)PAL、GALA(IICFPGAFPGAFPGAAD于5年收购)两家垄断。国内有能力自主研发FPGA的厂商有智多晶微电子、紫光同创、安路科技、京微齐力等。(一)Xilinx方面(AMD)1985FPGA2μm64850001991FPGA——XC40002001150nm2017Xilinx28nmSpartan7FPGA21来源:AMD官网1818中国算力白皮书(2022年)Xilinx45nm、28nm、20nm、16nmSpartanSpartanDSPArtixKintexVirtex20201027,AMDXilinxAMD以发行总价值0in,MD于1ix中国算力白皮书(2022年)FPGA名称发行逻辑运算分布式I/ODSPBRAM(Mb)制程表18 2010-2021年XilinxFPGA名称发行逻辑运算分布式I/ODSPBRAM(Mb)制程日期单元RAM(Mb)(nm)Virtex-6XC6VLX760Q1'10758k8.23086425.940Virtex-7UltraScale+Q2'198938k58.42072384075.916VU19P(二)Altera方面(Intel)1984EP3001992FPGA——FLEX8000FPGA。2002DSP模块的FPGA——trtixFPA0.1mFG——neFPGAtra对A的DSP2012StratixVFPGA28nm,是28nmFPGA。2015Intel167FPGAAltera,IteloneMrri、rtix、lx01Inte(erFPGA28m1045表19 2010-2021年Intel(Altera)部分FPGA产23I/OI/O接口 DSP BRAM(Mb) 制程(nm)逻辑元素 MLABLE RAM(Mb)发行日期FPGA名称Stratix®VFPGAIntel®Stratix®10GX10MFPGAInte®giex-Series027()

Q2'10 695k 8.01 840 1963 50 28Q3'19 10200k 55 2304 3456 253 14Q2'19 2692k 28 744 8528 259 102来源:Xnx官网3来源:nel官网1919中国算力白皮书(2022年) 中国算力白皮书(2022年)(三)国内厂商方面2012Seal5000FPGA,28nm2013TitanFPGA40nm2011FPGA55nm()2017HMEM7()HMEM5(金山40nm。厂商FPGA名称发行日期逻辑单分布式 I/O接DSP嵌入式制程表20 2010-2021分国产厂商FPGA名称发行日期逻辑单分布式 I/O接DSP嵌入式制程元LERAM(Mb)口RAM (nm)西安智晶 SA5-325E微电子Q2'21326k0.650500131218.Mb 紫光同创 PGT180HQ3'15174k0.057611-9468kb 40安路信科 EG4S20BG256Q1'2119.6k0.156193-1244kb 55技京微齐力 HR03PN3Q2'213.1k-128-72kb 40AIAIAICPUGPUFPGAAI算法,但是执行效率差异较大。狭义上,将AI芯片定义为“专门针对AI算法做了特殊加速设计的芯片”。家第十四个五年规划明确提出聚焦高端芯片、人工智能关键算法等关键领域,加快布局神经芯片等前沿技术。国内华为、寒武纪、燧原科技等新兴AI芯片持续涌现。(一)华为华为昇腾I(3Dced310(310)、Ascend910(910)(Ascend)910310W(INT)4TO,6)TFLO。(二)寒武纪寒武纪开发的MLU,基于7nm制程工艺,采用寒武纪MLUv02架构。主要代表产品为思元370/29/200chipe(I30亿个晶体256OINT),02倍。(三)燧原科技24来源:中国信息通信研究院整理2020中国算力白皮书(2022年)2.0云燧T0040TFO(FP64GB1.TBs300/s中国算力白皮书(2022年)(四)百度AIAI2m(IT8256O(为18TF,120W。(五)阿里巴巴80012nm170820TOPS。(六)超聚变GPUAICPUGPU,CPUGPU,4UAI1.25AIAIHPCCPU:GPU超算算力超级计算是计算科学的重要概念,是超级计算机及有效应用的总称。超级计算利用并行工作的多台计算机系统的集中式计算资源,并通过专用的操作系统来处理极端复杂的或数据密集型的问题。超级计算机又称巨型计算机等,指能解决复杂计算的大型、快速、价格昂贵的计算机。通常这类机器包括了从标准计算机的大型集群到高度专用的硬件,主要运用于尖端科研、国防军工等大科学、大工程、大系统中,是一个国家科研实力的体现,是国家科技发展水平和综合国力的重要标志。并行计算作为超算最为核心的研究方向,其技术发展与超算生态的建设密不可分。加州大学伯克利13下:25来源:《并行计算研究前景:伯克利的视角》2125来源:《并行计算研究前景:伯克利的视角》21中国算力白皮书(2022年) 中国算力白皮书(2022年)表21 13个并计算键领域25Dwarf 排名 描述 Dwarf 排名 描述 Benchmark/例子稠密矩阵1数据是稠密矩阵或向量。(BLASLevel1Level2=矩阵-向量;Level3=矩阵-矩阵。)通常情况下,此类方法使用单位跨步内存访问从行读取数据,并使用跨步访问从列读取数据。稀疏矩阵 2 所。谱方法3多体模拟4每个(N)粒子低到(NoN)或(N。结构化网格5

块三对角矩阵,下 上 对 Gauss-Seidel共轭梯度法(CG方法)多重网格非结构化网格蒙特卡洛方法

一种不规则的网格,通常根据应用程序的底层特征选择数据任何点的更新都需要首先确定相邻点的列表,然后从这些相

非结构自适应粒子输运组合逻辑 8 使用逻函数存储实现的数。 逻辑电模拟图遍历 9 通过跟随连续边访问图中的多个节点。这些应用程序通常及许多别的接寻并且计量相较小。动态规划 10 通过求解更简单的重叠子问题来计算求解。特别适用于具大量可解的化问。

BFS/DFS回溯和分支界限算法

11 通过递归将可行区域划分为子域,然后修剪次优子问题来找构建图型 12 构造将机变表示点、将件依项表边的图。 有向无图有限状机 13 一种系统其行由状由输入当前态定的转换与转换状态关的来定义。26来源:中国信息通信研究院整理2226来源:中国信息通信研究院整理22中国算力白皮书(2022年)4”moray600Livrore和LosAlamos60中国算力白皮书(2022年)超级计算60年的演变路线可简单地分为2个阶段:Cray时代和多计算机时代。全球超算行业主要经历了以下发展历程:国防驱动阶段—公司主导阶段—蓬勃发展阶段—多向发展阶段。表22 球超发展程26时间 具体内容时间 具体内容国防驱动阶段(1950s—1960s)公司主导阶段(1960s—1970s)蓬勃发展阶段(1980s—1990s)多向发展阶段(21

早期的计算机科学研究有着浓厚的国防军事色彩。20世纪50年代后期,美国政府主要根据国家安全需求来支持情报和核武器应用研究。国家安全是开发超级计算技术的主要推动力。0世纪0年代初的IM730Streth和SperryRandUNIVACLARC显著超出顶尖商用机的数量级而被视为早期的超级计算机。206070ControlDataCrayResearch。在这一阶段,超级计算机的成本得到有效控制,同时向量处理技术的速度得到了大幅提升,大量廉价高速的计算机走向商品市场。8090NEC等,成功获取IM2080Cray1的技术MPPPE市场在全球范围内,少数国家拥有强大的高性能计算能力。中国和美国领先,从最新发布的2022年6月TOP5001731501282/3。2323中国算力白皮书(2022年) 中国算力白皮书(2022年)806040200

173 12812833312214127 6 6 6 6 6 5 5数据来源:/图9 2022年6月TOP500中分国家算数量TOP500246,法国占比4,位列前五名。美国中国日本德国法国韩国意大利俄罗斯英国荷兰巴西瑞士其他数据来源:/、中国信息通信研究院整理图10 2022年6月TOP500中国超所占额1993620226TOP5001183次。根据最新TO500FontirI54次,ra、Itel2TM、NE国家并行计算机工程技术研究中心、美国橡树岭国家实验室分别登顶1次。2424中国算力白皮书(2022年)表23 1993-2022界排名一超算27中国算力白皮书(2022年)时同名称公司国家1993.06-1993.11CM-5TMC美国1993.11-1994.06数值风润富士通日本1994.06-1994.11ragon/Intel美国1994.11-1996.06数值风洞富士通日本1996.06-1996.11SR2201日立日本1996.11-1997.06CP-PACS日立日本1997.06-2000.11ASCIRedIntel美国2000.11-2002.06ASCI WhiteI美国2002.06-2004.11地球模拟器日本电气(NEC)日本2004.11-2008.06蓝色基因/LI美国2008.06-2009.11走鹃(超级计算机)I美国2009.11-2010.11美洲虎(超级计算机)Cray美国2010.11-2011.06天河-1国防科技大学中国2011.06-2012.06京〔超级计算机)理化研究所日本2012.06-2012.1l蓝色基因/QI美国2012.11-2013.06TitanCray美国2013.06-2016.06天河-2国防科技大学中国2016.6-2017.11神威•太湖之光国家并行计算机工程技术研究中心中国2018.06-2019.11mitI美国2020.06-2020.11mptrugaku富士通日本2021.06-2021.11mptrugaku富士通日本2021.11-2022.06Frontier美国橡树岭国家实验室美国20226HPE3616.8、10。从算力来看,HP、富士通、联想排名前三,总算力市场份额分别为18.6%、18.11.1%。27来源:中国信息通信研究院整理2525中国算力白皮书(2022年) 中国算力白皮书(2022年)Lenovo HPE Inspur Atos Sugon Other数据来源:/、中国信息通信研究院整理图11 2022年6月TOP500榜对应商份额我国目前已建成包括天津、广州、深圳、长沙、济南、无锡、郑州、昆山、成都等9座国家级超算中心。2002年到2021年,超级计算机平均性能提升了七万多倍。12500093015125000930150.0968773842120000单位(TFlops单位(TFlops)8000060000400002002200320022003200420052006200720082009201020112012201320142015201620172018201920202021第一名性能 平均性能 最后一名性能数据来源:、中国信息通信研究院整理图12 2002-2021国TOP100级算数据2021TOP100100202079%。202120201.3410年的.6125PFO240PFLOPS93PFLOPS125PFLOPS。排名前三的厂商份额合计占上榜系统份额的80,分别是,联想40套系统,浪潮28套系统、中科曙光12套系统。2626中国算力白皮书(2022年)中国算力白皮书(2022年)联想 浪潮曙光 国防科大北龙超云/DELL 国家并行计算机工程技术研究中其他数据来源:、中国信息通信研究院整理图13 2021年11月TOP100厂系统数技术HPL即HghfomaneLinack(二)HPCGHPCGTOP500HPCGCHPCGINPA(基准500HPLHPCG(一)硬件架构超算核心系统由计算系统、存储系统、网络系统、管理系统、安全系统五部分构成,方案应考虑采用E级高性能计算机原型系统的计算、存储、网络、管理及基础设施支撑的技术路线。2727中国算力白皮书(2022年) 中国算力白皮书(2022年)图14 算核硬件构计算系统CPU顾不同算力业务的诉求,能够提供多元化的算力支撑。在计算硬件选型方面建议采用专用硬件加速器等先进技术手段,并且结合使用液冷等散热技术来建设绿色低碳节能环保的超算计算系统。存储系统采用分布式存储,可提供PB级别以上的容量来进行数据和算据存储。存储系统建议采用分布式融合存储系统,解决海量数据存储、读写速度缓慢等性能问题。网络系统分为存储网络、业务网络以及监控网络等多个网络平面,为超算系统间各个硬件设备以及子系统间通信提供网络互连的能力。管理网络包括资源与业务监控、告警监控、可视化等功能。资源与业务监控建议实现计算资源、应用与业务的全链路监控。告警监控建议实现故障信息以多种提醒方式快速响应运维人员以确保及时获取故安全系统可由防火墙、负载均衡、堡垒机、抗DDoS、日志审计、漏洞扫描、网络审计、DNS服务2.0(二)网络体系2828中国算力白皮书(2022年)速网络技术;中国算力白皮书(2022年)监控网络:提供带外管理网络连通,实现对所有设备的带外管理,包括远程开关机等操作。图15 算网架构(三)存储节点和高性能计算节点采用专用超高速网络IOAoteDretMmorys)MA的引入,可以解决网络传输中服务器端数据处理的延迟而产生的问题。(四)多种网络平面的融合2929中国算力白皮书(2022年) 中国算力白皮书(2022年)带宽不小于10G,核心层40G,这样既能保证多网络平面融合后的性能,又具有布线简单、维护性好、可靠性高等优势,也为未来扩容预留充足空间。E5(atonaltrtegicomutingIntativeNI(aleomptingrojetEPost-KEEuroHPCEU(umt边缘算力概述边缘算力的发展需要云边协同解决问题。边缘计算与云计算各有所长,云计算擅长把握整体,在乎全计算需要处理的数据种类日趋多样化,边缘设备既要处理结构化数据,又要处理非结构化数据。为此,边缘算力构架需要解决不同指令集和不同芯片组成的异构计算体系中各指令集和芯片高效协同工作用于边缘计算的处理器:常规物联网终端节点的处理器是一块简单的MCU(微控制单元,MicocotrolrUnt3030中国算力白皮书(2022年)采取两种方式:中国算力白皮书(2022年)MCUIP型的产品会使用第一种思路,而针对某种大规模应用的定制化产品则会采用第二种。市场国际5G2021年,边缘基础设施和终端AI处理器的收入规模达到了160202660030。28边缘计算硬件按计算算力和存储发生的位置分为两大种类:边缘设备和边缘服务器。有四个具体类型,如图16所示:DeviceedgeremsegeAccessedge城市边缘Meroed图16对边缘计算的解构29DeviceedgePremiseedge7520245Gsdge和Mtroede28数据来源:公开数据整理9数据来源:STNSLTNGP:TheBattleatomutng’sde3131中国算力白皮书(2022年) 中国算力白皮书(2022年)图17 2024年边缘段预期场份额3018图18 缘设发展比图31国内边缘算力产业链逐步完善。0数据来源:STNSLTNGP:TheBattleatomutng’sde31数据来源:IDC官网3232中国算力白皮书(2022年)多个垂直行业。中国算力白皮书(2022年)++IaasITOTT2021年中国边缘计算服务器整体市场规模达到33亿美元,较2020年增长2432。2021年,中国垂875.0。NVFIUPF以及多接入边缘计算MEC/管道检测、智慧营业厅等场景解决方案,以边缘洞察全面赋能企业业务创新。从出货规模来看,2021在2021年-2026年,中国边缘定制服务器市场预计将保持40的年复合增长率。技术AIAIAIAI相比于面临性能与能耗瓶颈的基于云数据中心的深度学习模型部署方法,结合新兴的边缘计算技术则是更好的方式,充分运用从云端下沉到网络边缘的计算能力,在具有适当计算能力的边缘计算设备上32数据来源:公开数据整理3333中国算力白皮书(2022年) 中国算力白皮书(2022年)实现低时延与低能耗的深度学习模型推理。边缘侧的负载整合则为人工智能在边缘计算的应用找到了突破口。虚拟化技术将在不同设备上独立的负载整合到统一的高性能计算平台上,实现各个子系统在保持一定独立性的同时还能有效分享计算、存储、网络等资源。边缘侧经过负载整合,产生的节点既是数据的一个汇总结点,同时也是一个控制中心。人工智能可以在结点处采集分析数据,也能在节点提取洞察做出决策。网络优化将是把人工智能运用到边缘侧的关键性技术之一。可以通过低比特、剪枝和参数量化等方法进行网络优化。Ite、NID、MM和Qualcomm33。Inte®产品如英特尔®酷睿™(Itel®or™)和英特尔凌动®(Intelom®),英特尔Movidu™U®至强®It®n®ble5GNVII(英伟达JetonrN,JetsonXavierJetsonNano2-734。AMD,AMDEPYC()嵌入式3000处MDCIC相比edrivr35。ARMARMAMDx86SRAM,而DRAM,QualcmI:D.2e高达OS瓦;D.2crd为0OS5ecrd40TO,功率为536。35roesorachtctuesmkngmchneleanngaratyfordgecmutng|nberchtctedatcm)4Jnmn,Sceolen,PsngKng,“ecmrkngPUceeatedEgeDevcs”,EEE2205httsamdcmysmfesouens000amyprdutbref.df36https://www./content/dam/qcomm-martech/dm-assets/documents/Prod-Brief-QCOM-Cloud-AI-100.pdf3434中国算力白皮书(2022年)4算力应用赋能中国算力白皮书(2022年)绿色电力简介案例10kV图19 里巴世纪联南通A栋数中心等级评估5A“10kV“10kV4)66%3%。阿里巴巴南通数据中心通过与政府、供电局、电网、发电企业探索绿色电力实施路径,2021年1月3535中国算力白皮书(2022年) 中国算力白皮书(2022年)985%3000016万吨。人工智能简介案例环首都AI0k/智能化IIItelU处理器,搭载U651TL53.GFOW。产业基地积极实现“可再生能源→超大规模算力→新业态新场景支撑”的数字经济可再生能源零碳车联网简介车联网是智能化的一体化网络。车联网是以车内网、车标网和车载移动互联网为基础,按照约定的通3636中国算力白皮书(2022年)中国算力白皮书(2022年)案例号进行识别并给出错误手势和空手势预警,支持驾驶员后部瞭望识别、驾驶员起立识别、驾驶员伏趴识AIAI5G智慧医疗简介案例5G切片和MEC5GMEC5G云+3737中国算力白皮书(2022年) 中国算力白皮书(2022年)学诊断治疗水平。5G+MECMRAR术指导三项MECMEC业务名称 业务软件及终端配置表24 MEC边缘部应用软系统业务配置业务名称 业务软件及终端配置5G三维像重建 1套云像系软件+4个终端(PAD、机、脑)5GMR辅手术划 1套规系统件+1数据服端,2个MR端,2个pad操端5GAR141ARQOSFlexE5G切片+MEC5G切片+MEC5G边缘计算简介案例国网公司变电站多站融合边缘数据中心站是特指利用变电站富余站址、供电、通信等资源开展变电站与数据中心站的融合建设、运营和运维。((IaSS扩展至边缘端,提供电力共享站、社会共享站、融合共享站、云游戏、5G边缘计算等应用解决方案。3838中国算力白皮书(2022年)中国算力白皮书(2022年)图20 缘计服务台功能构图+图21云边协同下核心多活+边缘分布示意图3939中国算力白皮书(2022年) 中国算力白皮书(2022年)物联网简介万物互联作为未来社会发展的方向,其技术进步和应用进展始终是社会关注的重点。目前信息社会案例(层、IasS层云服务;②5GCT5GVPN2C2H类端到端试点((2020)M4040中国算力白皮书(2022年)5算力五力衡量体系中国算力白皮书(2022年)ODCC2020()本白皮书,将数据中心算力的内涵进行进一步推广,融合计算、算效、存储、网络等综合概念,同时结合数据中心算力发展特点和重点影响因素,利用统计学相关方法构建衡量算力的指标体系,算力衡量指标包含通用算力、智能算力、算效、网络和存储5个方面。图22 据中算力估指标建通用算力本白皮书将继续沿用O(Flotinpoitoperationspersecond,FLOPS)CPU(FP32)智能算力算力和精度是密不可分的,必须在精度的前提下,讨论智能算力。由于智算领域应用的多样性,通常无法使用单一精度来衡量算力的大小。目前,智算领域常用的算力精度有:4141中国算力白皮书(2022年) 中国算力白皮书(2022年)表25 能算领域力精度算力精度 说明FP64 用于科计算高精真模拟等FP32 传统上于深学习以及图渲FP16 深度学训练推理TF32 新的数格式用于学习训BFloat16 用于深学习练INT8 (Floating-pointoperationspersecond,FLOPS)来评(FP32)算效将算力与功耗结合来看,单位功耗的算力是评价数据中心计算效果更为准确的一个指标。在ODCCITT设备每瓦功耗所产生的算力”(单位:FLO/):CE

CPIT设备功率网络在基础设施操作方面,在网络中实现计算功能以及一些基础设施操作的卸载,也成为网络的一种技术走向。如在网络交换机上进行All2All、BarrierAR(AdaptiveRouting)NMoveraricTrgtUO;Ic和S在网卡处理能力方面,大小消息对于网络性能的关注重点不同。网卡是网络和业务的接口,它需要4242中国算力白皮书(2022年)将应用的MessageCRC的计算等操作。对于大的MessageMessage来言,消息率(MessageRate,即网卡每秒可处理的Message的数量)HPC中国算力白皮书(2022年)在交换机性能方面,包转发率和转发方式至关重要。网络中的交换机需要对数据进行高速转发,由于交换机看不到所以交换机的包转发率Perdthrough还是tre/owrd的Cut-ThroughBuffertr/Fowrdfrfer在RDMARDMA通过A技术,可以在几乎不消耗CPU资源的前提下实现网络的线速带宽。如何以最简单的方式在数据中心内部署AnfinndDMARDMARDMA在网络带宽方面,网络带宽将进一步提升。200/s200/sE40Gb/sureHP/I1600/Infinad400bs3在网络时延方面,时延决定计算效率。算力网络时延需要向总线级看齐,提供低时延传输能力,降低跳数(消息入网的次数,降低时延,提升通信效率,缩短计算任务的完成时间。网络跳数。CLOS32%。4343中国算力白皮书(2022年) 中国算力白皮书(2022年)图23直连拓扑vs.CLOS时延测试CLOSOpenFoamCLOS2.0。图24直连拓扑vs.CLOSOpenFoam性能测试(长距无损,PFC文。同时保证链路传输的吞吐不受影响,则需要接收端有更大的缓存。大缓存则必然导致报文在设备中传输100GC438。37数据来源:华为测试数据4437数据来源:华为测试数据44450

济南市内100G/27KMRoCE网络平均时延

中国算力白皮书(2022年)409.660.00中国算力白皮书(2022年)409.648.38%43.04%48.38%43.04%20.22

50.00211.44314.4221.76长距无损vs传统方案提升比例300 40.00211.44314.4221.76长距无损vs传统方案提升比例平均时延(us)平均时延(us)

30.00179.07176.91150 20.00179.07176.9150

10.0001K 8K(典型OLTP流量) 256(典型OLAP流量字节byte传统方案 长距无损 提升比例

0.00数据来源:华为测试数据图25济南市内100G/27KMRoCE网络平均时延37300KM场景下,长距无损算法对比传统PFC方案,网络带宽打满的情况下,平均时延最高可降低49.81。38数据来源:华为测试数据4538数据来源:华为测试数据45中国算力白皮书(2022年) 中国算力白皮书(2022年)4028.1济南-淄博10G/310KMRoCE网络平均时延4028.148.09%49.81%37.59%3776.1748.09%49.81%37.59%3776.17

60.004221.434221.43

50.002021.81960.28长距无损vs传统方案提升比例3000 40.002021.81960.28长距无损vs传统方案提升比例2634.41平均时延(us)2634.41平均时延(us)

30.001500 20.00

10.0001K 8K(典型OLTP流量) 256(典型OLAP流量字节byte传统方案 长距无损 提升比例

0.00数据来源:华为测试数据图26济南-淄博10G/310KMRoCE网络平均时延38总而言之,衡量网络的指标需要各个层面来综合考虑,最终选择合适的网络,助力于算力的性能提升。5.6存储存储系统作为数据中心基础架构的组成部分,在算力准备、实现和交付的过程中起着重要的保障作用。SSDSATA、SASNMIeIDS、TAOSIe/MED以算力为中心的存储系统,不同于传统的数据中心存储系统,有着对带宽、IOPS、时延、存储容量、4646中国算力白皮书(2022年)I/NME因此全闪存阵列或者闪存阵列和硬盘阵列的组合形态将成为主要的存储设备形态。中国算力白皮书(2022年),NVMESSD、SASSSD、SATASSDHDDOS最后,在存储介质装机量的数量级达到万以上的数据中心中,存储单元的故障会成为日常发生的状O4747中国算力白皮书(2022年) 中国算力白皮书(2022年)6算力五力模型(MultitribueGropDecsionMkingMM(ultitribueDecsionMakigMM)(roupDecsionMakig,G)为了综合评价单体数据中心的算力,本章提出“算力五力模型”,将与计算能力高度相关的通用TOPSIS39。相关概念设多属性决策中的方案集为𝐴={𝑎1,𝑎2,⋯,𝑎𝑠},属性集为𝐶={𝑐1,𝑐2,⋯,𝑐𝑚}。记𝑆={1,2,⋯,𝑠},𝑀={1,2,⋯,𝑚},用𝑐𝑙(𝐴),𝑙∈𝑀表示方案A在𝑐𝑙属性下的值,并允许出现不可比较的情况。定义140{}𝑐𝑙𝑙∈𝑀任意两个方案𝑎𝑖和𝑎𝑗(𝑖≠𝑗)方案𝑎𝑖优于方案≻𝑎𝑗);方案𝑎𝑖与方案(𝑎𝑖≈𝑎𝑗);方案𝑎𝑖劣于方案≺𝑎𝑗);方案𝑎𝑖与方案(𝑎𝑖。且两方案𝑎𝑖和𝑎𝑗(满足𝑖≠𝑗)之间有且仅有{≻,≺,≈,?}中的一个关系成立,则称{≻,≺,≈,?}构成了一个偏序偏好结构。设在多属性决策问题中,各个不同的属性下各方案的属性值被划分为n+1个等级,从而将一个方案𝑘比另一个方案好的程度分为n个等级。不妨记

,(𝑖,𝑗∈𝑆;0≤𝑘≤𝑛),表示方案𝑎优于方案ak个𝑎𝑖≻𝑎𝑗

𝑖 j9吴美希杨晓彤算力五力模型:一种衡量算力的综合方法J信息通信技术与政策2023132.0张金清.序方法与均衡分析上海:复旦大学出版社,203.4848中国算力白皮书(2022年)−𝑘 𝑘中国算力白皮书(2022年)等级;𝑎𝑖≻𝑎𝑗,(𝑖𝑗𝑆0𝑘𝑛)与𝑎𝑖𝑎𝑗,(𝑖𝑗𝑆0𝑘𝑛)均表示方案𝑎𝑖k定义241令𝑛1,𝑐𝑙(𝐴𝑖)≻𝑐𝑙(𝐴𝑗),𝑖≠𝑗𝑙𝑛,𝑐𝑙2𝑛−𝑘

(𝐴𝑖

𝑘)≻

),𝑖≠𝑗𝑎𝑖𝑗𝑙=

0.5,𝑐𝑙(𝐴𝑖)≈𝑐𝑙(𝐴𝑗),𝑖≠𝑗0.375,𝑐𝑙(𝐴𝑖)?𝑐𝑙(𝐴𝑗),𝑖≠𝑗0,𝑖=𝑗−𝑛

−𝑘,𝑐(𝐴)

),𝑖≠𝑗2𝑛−𝑘

𝑙

≻𝑗{−1,𝑐𝑙(𝐴𝑖)≻𝑐𝑙(𝐴𝑗),𝑖≠𝑗()其中𝑖,𝑗∈𝑆,𝑙∈𝑀。称𝑎𝑖𝑗𝑙为属性𝑐𝑙下方案𝐴𝑖相对于方案𝐴𝑗的广义优序数。TOPSIS− −定义3设𝑋𝑝=[𝑟𝑝𝑗,𝑟𝑝𝑗]和𝑋𝑞=[𝑟𝑞𝑗,𝑟𝑞𝑗]为集合X上的两个不确定等级变量,如果我们将𝑋𝑝和𝑋𝑞通− −− −过广义优序数转变为𝑋𝑝=[𝜉(𝑟𝑝𝑗),𝜉(𝑟𝑝𝑗)]和𝑋𝑞=[𝜉(𝑟𝑞𝑗),𝜉(𝑟𝑞𝑗)],其中,𝜉(𝑟𝑝𝑗)为𝑟𝑝𝑗− − − −经广义优序数转化的值,其它类似符号同义,𝑋𝑝与𝑋𝑞形成的向量定义如下:−𝑝𝑞=[𝑛𝜉(𝑗),𝑥𝜉𝑗] ()−其中:− −𝑛𝜉(𝑗)=𝑛|𝜉(𝑗)−𝜉(𝑗|,𝜉𝑗)−𝜉𝑗,− − −− − −𝑚𝑎𝑥𝜉𝑟𝑝𝑗)=𝑚𝑎𝑥|𝜉𝑟𝑞𝑗𝜉𝑟𝑝𝑗)||𝜉(𝑟𝑞𝑗𝜉(𝑟𝑝𝑗)|) 。− −例1不妨令𝐴={𝑎1,𝑎2,⋯,𝑎𝑚}为方案集,𝐶={𝑐1,𝑐2,⋯,𝑐𝑛}为属性集,将属性𝑐𝑙(1≤𝑙≤𝑛)划分为6个等级,有等级比较集𝑅={𝑟𝑖|𝑖=−5,⋯,0,⋯,5,?},其中?表示两方案优劣关系不明的情况,𝑡=5。已知两个等级变量分别为𝑋𝑝=[𝑟2,𝑟4],𝑋𝑞=[𝑟0,𝑟4]。借助等级优序数可以将

=[𝑟,𝑟

=[𝑟,𝑟]转化为

=[5,5]

=[1,5];进而通过定义3𝑝 24 𝑞 0

𝑝 8

𝑞 26计算出𝑋𝑋𝑋

=[0,1]。𝑝 𝑞

𝑝𝑞 81张小芝,朱传喜.多属性决策的广义等级偏好优序法J系统工程理论与实践,213,331:25388.4949中国算力白皮书(2022年) 中国算力白皮书(2022年)双向投影法具有决策过程科学合理、简单易行和区分度高等特点,并且可以避免传统投影法无法处令

−𝑡−𝑋𝑖=[𝜉(𝑟𝑖𝑗),𝜉(𝑟𝑖𝑗)]为第𝑗个属性𝑐𝑗下对方案𝐴𝑖经广义优序数转换的向量。−首 先 , 在 第 𝑗个属性,将、负想解示为:𝑋+

=[𝑚𝑎𝑥𝜉(𝑟𝑖𝑗),𝑚𝑎𝑥

)],𝑋−=1≤𝑖≤𝑛 −

1≤𝑖≤𝑛−+[𝑚𝑖𝑛𝜉(𝑟𝑖𝑗),𝑚𝑖𝑛𝜉(𝑟𝑖𝑗)],其中𝑛表示备选方案的数量;正负理想解形成的向量可以表示为:𝑋𝑋=

−−𝑡

1≤𝑖≤𝑛−[𝜉(𝑟𝑖𝑗),𝜉(𝑟𝑖𝑗)],其中:−𝑡 − −𝜉(𝑟𝑖𝑗)=𝑚𝑖𝑛((𝑚𝑎𝑥𝜉(𝑟𝑖𝑗)−𝑚𝑖𝑛𝜉(𝑟𝑖𝑗)),(𝑚𝑎𝑥𝜉(𝑟𝑖𝑗)−𝑚𝑖𝑛𝜉(𝑟𝑖𝑗)))− 1≤𝑖≤𝑛

1≤𝑖≤𝑛

1≤𝑖≤𝑛−𝑡 − −𝜉(𝑟𝑖𝑗)=𝑚𝑎𝑥((𝑚𝑎𝑥𝜉(𝑟𝑖𝑗)−𝑚𝑖𝑛𝜉(𝑟𝑖𝑗)),(𝑚𝑎𝑥𝜉(𝑟𝑖𝑗)−𝑚𝑖𝑛𝜉(𝑟𝑖𝑗)))1≤𝑖≤𝑛 −

1≤𝑖≤𝑛

1≤𝑖≤𝑛

1≤𝑖≤𝑛然后,在第𝑗个属性下,𝑋与正、负理想解形成的向量可以表示为:−

[ − −−)],𝑋𝑋+=𝑖+ −+

𝑋𝑋𝑖=

𝜉),𝜉(𝑟𝑖𝑗 𝑖−−[𝜉(𝑟𝑖𝑗),𝜉(𝑟𝑖𝑗)],其中,−− − −𝜉(𝑟𝑖𝑗)=𝑚𝑖𝑛((𝜉(𝑟𝑖𝑗)−𝑚𝑖𝑛𝜉(𝑟𝑖𝑗)),(𝜉(𝑟𝑖𝑗)−𝑚𝑖𝑛𝜉(𝑟𝑖𝑗)));− − 1≤𝑖≤𝑛 − 1≤𝑖≤𝑛−− − −𝜉(𝑟𝑖𝑗)=𝑚𝑎𝑥((𝜉(𝑟𝑖𝑗)−𝑚𝑖𝑛𝜉(𝑟𝑖𝑗)),(𝜉(𝑟𝑖𝑗)−𝑚𝑖𝑛𝜉(𝑟𝑖𝑗)));− 1≤𝑖≤𝑛 − 1≤𝑖≤𝑛+ − −𝜉(𝑟𝑖𝑗)=𝑚𝑖𝑛((𝑚𝑎𝑥𝜉(𝑟𝑖𝑗)−𝜉(𝑟𝑖𝑗)),(𝑚𝑎𝑥𝜉(𝑟𝑖𝑗)−𝜉(𝑟𝑖𝑗)))− 1≤𝑖≤𝑛 − − 1≤𝑖≤𝑛−+ − −𝜉(𝑟𝑖𝑗)=𝑚𝑎𝑥((𝑚𝑎𝑥𝜉(𝑟𝑖𝑗)−𝜉(𝑟𝑖𝑗)),(𝑚𝑎𝑥𝜉(𝑟𝑖𝑗)−𝜉(𝑟𝑖𝑗)))这些向量的模可以计算为:

1≤𝑖≤𝑛 −+ 𝑚

− 1≤𝑖≤𝑛𝑡 2 −𝑡 2−|𝑋−

𝑋|=√∑𝑗=1((𝜉(𝑟𝑖𝑗))

+(𝜉(𝑟𝑖𝑗)));− 𝑚

− 2 −− 2−|𝑋−

𝑋𝑖|=√∑𝑗=1((𝜉))

+(𝜉(𝑟𝑖𝑗)));+ 𝑚

+ 2 −+ 2−|𝑋𝑖𝑋−

|=√∑𝑗=1((𝜉

+(𝜉(𝑟𝑖𝑗)))。那么余弦值𝑐𝑜𝑠(𝑋−𝑋𝑖,𝑋−𝑋+),𝑐𝑜𝑠(𝑋−𝑋𝑖,𝑋−𝑋+)可以分别表示为:5050∑𝑚

𝑡

−𝑡 −−中国算力白皮书(2022年)))中国算力白皮书(2022年)𝑖𝑐𝑜𝑠(𝑋−𝑋,𝑋−𝑋+)= − − 𝑖|𝑋−𝑋𝑖|⋅|𝑋−𝑋+|

()∑𝑚

𝑡

−𝑡 −+))𝑖𝑐𝑜𝑠(𝑋−𝑋,𝑋−𝑋+)= − − 𝑖|𝑋𝑖𝑋+|⋅|𝑋−𝑋+|进而向量𝑋−𝑋𝑖到向量𝑋−𝑋+和向量𝑋−𝑋+到向量𝑋𝑖𝑋+的投影值分别表示为:𝑝𝑟𝑗𝑋−𝑋+(𝑋−𝑋𝑖)=|𝑋−𝑋𝑖|⋅𝑐𝑜𝑠(𝑋−𝑋𝑖,𝑋−𝑋+)

()∑𝑚

𝑡

−𝑡 −−𝑗=1(𝜉(𝑟𝑖𝑗)⋅𝜉(𝑟𝑖𝑗)+𝜉(𝑟𝑖𝑗)⋅𝜉(𝑟𝑖𝑗))= − − |𝑋−𝑋+|

()𝑖𝑝𝑟𝑗𝑋𝑋+(𝑋−𝑋+)=|𝑋−𝑋+|⋅𝑐𝑜𝑠(𝑋𝑖𝑋+,𝑋−𝑋+)𝑖∑𝑚 𝑡 + −𝑡 −+𝑗=1(𝜉(𝑟𝑖𝑗)⋅𝜉(𝑟𝑖𝑗)+𝜉(𝑟𝑖𝑗)⋅𝜉(𝑟𝑖𝑗))= − − |𝑋𝑖𝑋+|

()𝑖注1如图27所示,𝑝𝑟𝑗𝑋−𝑋+(𝑋−𝑋𝑖)的值越大,则说明方案𝑋𝑖越接近正理想解𝑋+;同理,𝑝𝑟𝑗𝑋𝑋+(𝑋−𝑋+)𝑖i越大,说明方案𝑋𝑖越接近负理想解𝑋−。i图27 prjXX+(X−X+)和prjX−X+(X−Xi)的图表示最终,分别计算出方案𝑋𝑖与理想解的相对贴近度:𝒑𝒓𝒋𝑿−𝑿+(𝑿−𝑿𝒊)𝑪(𝑿𝒊)=𝒑𝒓𝒋−+(𝑿−𝑿)+𝒑𝒓𝒋

+(−+) ()𝑿𝑿

𝒊 𝑿𝒊𝑿𝑖表示每个方案的投影值到正理想解的相对贴近度,其中𝑝𝑟𝑗𝑋−𝑋+(𝑋−𝑋𝑖),𝑝𝑟𝑗𝑋𝑋+(𝑋−𝑋+)分别表示向量𝑖𝑋−𝑋𝑖到向量𝑋−𝑋+和向量𝑋−𝑋+到向量𝑋𝑖𝑋+的投影值。基于以上方法,等级双向投影模型的具体步骤如下:6.2.1𝐷6.2.2步骤6.2.3:确定正理想解𝑋+={𝑋+,𝑋+,⋯,𝑋+}和负理想解𝑋−={𝑋−,𝑋−,⋯,𝑋−};1 2 𝑚 1 2 𝑚5151中国算力白皮书(2022年) 中国算力白皮书(2022年)步骤2.𝑋−𝑋+和𝑖𝑋−𝑖,𝑖𝑋+;6.2.5(6-5)(6-6)𝑋−𝑋𝑖𝑋−𝑋+𝑋−𝑋+𝑋𝑖𝑋+𝑖的投影值𝑝𝑟𝑗𝑋−𝑋+(𝑋−𝑋𝑖),𝑝𝑟𝑗𝑋𝑋+(𝑋−𝑋+);𝑖步骤6.2.6:由(6-7)式计算方案𝑋𝑖与理想解的相对贴近度;步骤6.2.7:将相对贴近度进行大小排序(由大到小),选取贴近度最大的方案为最优方案。本文选取5个指标进行算力评估,分别为:通用算力、智能算力、算效能力、网络能力、存储能力。表26 力五指标取指标 说明通用算力 本文通算力单位用TFLOPS(FP32,精度浮算力。智能算力 本文智算力单位用TFLOPS(FP32)。算效能力 本文算的单采用GFO/W(2)。网络能力 本文主采用络带度来衡网络性能位为bi/(比特每秒),每秒输的位数。存储能力 本文采每秒写次InptOtputOpratinsr,O)衡量存储性能。本节将信息与双向投影法结合,给出利用双向投影法处理不同数据中心算力方面不同指标间信息的可,一般越理想的一端标记等级数越高。步骤6.3.2:将数据进行定级,并转化为优序数(0-1之间的实数)。6.3.10-1步骤.3.3步骤6.3.4:计算每个向量对应的模,得出余弦值𝑐𝑜𝑠(𝑋−𝑋𝑖,𝑋−𝑋+)、𝑐𝑜𝑠(𝑋−𝑋𝑖,𝑋−𝑋+),进而分别计算向量𝑋−𝑋𝑖到向量𝑋−𝑋+和向量𝑋−𝑋+到向量𝑋𝑖𝑋+的投影值𝑝𝑟𝑗𝑋−𝑋+(𝑋−𝑋𝑖),𝑝𝑟𝑗𝑋𝑖𝑋+(𝑋−𝑋+);步骤6.3.5:由式(6-7)计算得出每个数据中心最终的相对贴近度;5252中国算力白皮书(2022年)中国算力白皮书(2022年)算例65()27编号通用算力(单智能算力算效(单网络(单位:存储(单表编号通用算力(单智能算力算效(单网络(单位:存储(单位:TFLOPS)(单位:TFLOPS)位:GFLOPS/W)Mbit/s)位:IOPS)DC.161.25547.23729018.1DC.2137.3545.0340.31699.312.7DC.323.950.6123.91218.43.6DC.420.2350.32100964.915.4DC.5127.07640.6580.44376.33.3DC.616.6588.3513.24467.64.5步骤.58所示;编号 等级Ⅰ等级Ⅱ等级Ⅲ等级Ⅳ等级Ⅴ通用算(单: 0-10编号 等级Ⅰ等级Ⅱ等级Ⅲ等级Ⅳ等级Ⅴ通用算(单: 0-1010-2020-5050-100100-200智能算(单 0-9090-130130-230230-500500-1000算效(单 0-1010-2020-3030-5050-100网络 0-300300-500500-900900-15001500-2200存储 0-11-33-77-1212-20TFLOPS)位:TFLOPS)位:GFO/)(:Mbts)(:OS)步骤.:将表78据中心的等级数两两进行比较,得到相对等级数并转化为优序数,如下表29、表30、表31所示;5353中国算力白皮书(2022年) 中国算力白皮书(2022年)表29 据中能效标定级编号通用算力智能算力算效网络存储DC.145544DC.255455DC.331343DC.434545DC.555523DC.621223表30 同数中心同指标的两比较编号通用算力智能算力算效网络存储1,],,,,],,,,],,,,],]DC.2,,,,],,,,],],,],,,,]3,,,,],,,,,],,,,],,,,],,,,]4,,,,],,],,,,],,,,],,,,]5,,,,],,,,],,,,],,,,,],,,,]6,,,],,,,,],,,,],,,,,],,,,]表31 据中等级较级经序数化表通用算力

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论