2次课容
高性计算机软件3
高性计算机Top5005
高性计算机硬件2
国高性计算机介绍6
4 行计算环境
什高性计算1()什高性计算高性计算(Highperformance computing)
Highperformance computing (HPC) uses
supercomputers and computer clusters to
solve advanced computation problems Today
computer systems approaching the teraflops
region are counted as HPCcomputers
Wikipedia
1Tflops 1万亿次浮点运算秒
1Pflops 1千万亿次浮点运算秒高性计算应需求气象预报
震预报
生命科学
军事国防
球天体物理
汽车飞机设计
先进材料设计源
网站(网络游戏B2C搜索引擎)高性计算分类
计算密集型computing intensive:量
子力学计算气象石油制药等
通信密集型network intensive:搜索
引擎流媒体视频点播等
数密集型 data intensive:图处理
高物理图书馆数挖掘等
般应单种类型
结合LHC (Large Hadron Collider) 欧洲粒子
物理研究中心(CERN)型强子撞机:
2008年LHC投入实验运行年产生约15PB
数LHC实验物理分析需少10万
CPU海量数存储系统 数千物理学
家分布世界方便高效进行物理
数分析研究LHC采分级式(Tier)网格计
算台计算务分发世界网格中
心高性计算特点
高性
高稳定性
高安全性
扩展性
理性速度:Linpack测试
LINPACKFortran语言编写线性
代数软件包求解线性方程线性
方问题该软件包提供种线性系
统中求解方法 种样矩阵运算
LINPACK初衷制订测试计算
机性统标准提供常
计算方法实现该软件包广泛
样通LINPACK例程较
计算机性提供理浮点运算 核频x时
钟周期浮点运算次数x核数
效率 实际浮点运算理浮点运算(二)高性计算机硬件高性计算机体系构架
1 量计算机 PVP: 70年代 CRAY系列银
河1号NEC球模拟器 40Tflops
2 称处理机 SMP:双CPU等服务器
3 分布式享存 DSM: NUMA结构 90年代
SGI
4 规模行处理系统(MPP): 90年代 曙光
1000
5 集群结构 cluster: 曙光5000系列编程角度讲计算机体
系构架分成享存计算机(PVP
SMPDSM)分布式存计算机(
MPPCluster)相应采
行编程方法量计算机PVP02年运行600亿日元SMP Symmetric MultiProcessor
SMP结构指服务器中CPU称工作
次属关系CPU享相物理存
CPU访问存中址需时间相
扩展力非常限:享环节
造成SMP服务器扩展时瓶颈SMP言
受限制存CPU必须通相
存总线访问相存资源着CPU数量增
加存访问突迅速增加造成CPU资源
浪费NUMA:NonUniform Memory Access
NUMA构架基特征:具CPU
模块(称节点)CPU模块
CPU组成具独立存
IO槽口等节点间通互连模块进行连
接信息交互 CPU访问整系
统存访问存速度远远高
访问远存速度非致存储
访问NUMA利NUMA技术较解决原
SMP系统扩展问题物理
服务器支持百CPU
NUMA技术问题访问
远存延时远远超存
CPU数量增加时系统性
法线性增加MPP:(Massive Parallel Processing)
NUMAMPP提供外种进行
系统扩展方式SMP服务器通
定节点互联网络进行连接协工作
完成相务户角 度
服务器系统基特征:SMP服务器(
SMP服务器称节点)通节点互连网络
连接成节点访问资源
( 存存储等)种完全享结
构扩展力理扩展限制
目前技术实现512节点互连
MPP服务器问题:需种复杂
机制调度衡节点负载行
处理程集群Cluster构架
集群技术年兴起发展高性计算机
项技术组相互独立计算机利
高速通讯网络组成单计算机系统
单系统模式加理
出发点提供高性扩充性抗灾难
性集群优势具公开性济性
扩展性已成目前高性计算流构
架网络构架:网格计算
通特网进行资源享协
工作
:SETI@home蛋白质折
叠Folding@home等项目SETI@home 项利全球联网计算机
搜寻外文明科学实验计划志愿者通
运行免费程序载分析射电远镜传
数加入项目
SETI@home程序户计算机通常
屏幕保护模式台模式运行利
余处理器资源影响户正常计算机
SETI@home项目1999年5月17日开始正式
运行2004年5月累积进行5×10E21次
浮点运算处理超13亿数单元截
2005 年关闭前已吸引 543 万户
户电脑累积工作 243 万年分析量积
压数项目没发现外星文明直接证
Folding@home研究研究蛋白质折叠误折
聚合引起相关疾病分布式计算工程 斯
坦福学化学系潘德组(Pande Group)持
2000年10月1日正式启动Folding@home现时
世界分布式计算计划2007年吉尼斯世
界纪录承认Folding@home专注精确模拟蛋
白质折叠错误折叠程便更解种
疾病起发展包括阿兹海默症牛海绵状脑病
(疯牛症)(疯牛病)癌症囊胞性纤维症目
前止Folding@home 已成功模拟5—10微秒折
叠程超出先前估计模拟时段数千倍高性计算机CPU构架
cpu设计时规定系列硬件电路相配合指令系统CPU
直接认识指令
复杂指令集CISC Complex Instruction Set
Computer 奔腾强等
精简指令集RISCReduced Instruction Set
Computing : IBM Power SUN Sparc SGI MIPS
ARM MIPS神威等
显式行指令集(Explicitly Parallel Instruction
ComputingEPIC):intel安腾处理器微处理器台式计算机系统基处理部件
微处理器核心运行指令电路
指令完成务步骤组成数值
传送进寄存器进行相加运算指令
称微理器微代码(microcode)制
造商微处理器微代码系统制造
商意愿微代码做简单复杂
指令系统越丰富微处理器编程越简单
然执行速度相应越慢复杂指令集计算机(CISC)长期计算机
性提高通增加硬件复杂性
获. 软件编程方便提高程序运
行速度硬件工程师采办法断增加
实现复杂功指令种灵活编址方
式. 般CISC计算机含指令数目少
300条甚超500条.种优化方法20世纪80年代发展
起基思想量简化计算机指令
功保留功简单节拍
执行完成指令较复杂功
段子程序实现种计算机系统称
精简指令系统计算机. RISC技术精华
通简化计算机指令功指令均
执行周期减少提高计算机工作频
时量通寄存器提高子程序执
行速度神威蓝光千万亿次超级计算机采申威1600
型16核64位CPU处理器锡江南计算技术
研究研制第三代处理器2010年8月完成
采Alpha RISC架构频11G功耗3570瓦
海中芯65纳米代工工艺峰值运算速度达
秒1408亿次运算速度高日富士通研制
SPARC64 VIIIfx处理器高性计算机网络
太网:千兆万兆
Infiniband
Myrinet
SCI
……着服务器处理速度断加快户提
升网络传输速度需求越越紧迫传统
意义输入 输出技术 PCI太等
已法满足种需求更效
提高数传输速度增加效带宽成摆
面前必须解决重问题
InfiniBand 标准种情况应运生
程度解决传统输入 输出
架构传输瓶颈问题 运行速度达端
口 25Gbs 10Gbs InfiniBand 系统网络两核心部件组
成:机通道适配器(Host Channel
Adapter) InfiniBand 交换机中
HCA 机设备提供接口支持
InfiniBand 定义操作交换机
端口接收 InfiniBand 报文转发
端口支持单播播两种机制Infiniband(三)高性计算机软件操作系统
Unix Sun Solaris IBM AIX HP
UX SGI IRIX SCO UNIX Mac OS等
Linux Redhat Suse等
Windows 少SGI IRIXIBM AIXMAC OSRedhat Linux编译器
GNU Fortran CC++
Intel Fortran CC++
PGI
Netliborg
Intel MKL
AMD ACML行计算
目前行编程方式:消息传递模式
(MPIPVM等)享存行模式(
OpenMPpthreads)两种模式时
混合模式• 2006 年IBM 蓝色基(BlueGeneL
)超级计算机已成功进行3200
亿原子分子动力学模拟时
CPU数目达131072
• 目前国外超算中心作业规模非常通
常千万核心美国橡树林国
家实验室3万核心计算占5049万
核心计算占18国海超算
中心2009年统计国60务16核
心160核仅占1方面国规模行数值模拟软件
非常落国外购买者
国外免费开源软件国规模
行计算软件方面非常落硬件方面
已改善应场合应软件
量化计算:Gaussian QChem
MOLPRO GAMESS等
密度泛函理:VASP PWSCF等
天气预报:MM5 WRF Grapes等
分子动力学:LAMMPS Gromacs
AMBER NAMD等
……(四)高性计算机Top500中国2日2美国5法国12011年11月Top500第名
新2011年底Top500排名中日富士通
制造K computer计算机1051 pflops排第位
采705024SPARC64处理器核心K computer
富士通20 GHz 8核 SPARC64处理器
705024核心
1410048 Gb存
功率1265989 kW
Tofu network interconnect
Tofu optimized MPI and openMPI
Linux系统2011年11月Top500第二名
新2011年底Top500排名中中国天津国
家超算中心天河1号A2566 pflops排第二位天河号
天河号硬件系统计算阵列加
速阵列服务阵列互连通信子系统IO
存储子系统监控诊断子系统等组成示计
算阵列2560计算节点 计算节点
配置2Intel四核处理器(Xeon E5540
253GHz)32GB存加速阵列2560
加速节点加速节点配置2AMD图形
加速处理器(ATI Radeon HD 4870 575MHz)
2GB显存服务阵列512服务节点
服务节点配置2Intel处理器(Xeon
E5450 30GHz)32GB存显卡GPU提供数倍CPU计算力
Radeon HD 4870显卡例理浮点运
算力达12TFlops时期CPU
14倍
天河号系统6144通处理器
(24576核心)5120图形加速处理器
(GPU)存总容量达98TB峰值速度达
1206 TFlopsLinpack实测性
5631TFlops配置双核处理器普通微
型计算机运算性约百亿次秒天河号Linpack值5631Tflops峰值
12062 Tflops效率467天河1号A
X5670 293GHz 六核处理器186368核心
7168块Tesla显卡2048颗国产飞腾八核处理器
Linpack性2566PFlops(秒千万亿次)峰
值4701 PFlops排名Top500第二
功率4040kWTop500统计 – 19932011年
生产厂商国家构架领域CPU种类CPU种类网络操作系统性Top500 2011年11月统计
500台机器中美国占526中国仅次美国
占148日位第三占6
IBMHP分占446282
Lunux占914绝优势Windows1台
Cluster构架占82MPP占178
Intel AMDCPU占80
太网占448Infiniband占41802年cluster 186 MPP 406
09年cluster 834 MPP 162
02年Linux 144 Unix 826
09年Linux 892 Unix 5
02年Intel IA32 102 PARISC 226
Power 21 Sparc 176
09年Intel 804 中EM64T 792
AMD 84Power 104 Sparc 04目前高性计算机发展趋势
Cluster 构架成流
Linux操作系统成流
X86 CPU成流intel CPU
核GPU云计算绿色低耗(五)国高性计算机简介2011年全国HPC计算机排名前十神威蓝光
位国家超级计算济南中心采8704片16核神威
1600处理器峰值速度达1100万亿次持续运行速度
738万亿次2011年排名国第2全球第14曙光5000A
曙光5000A 高性计算机采新四核
AMD Barcelona (频19GHz)处理器采基
刀片架构30720颗计算核心
12288TB存700TB数存储力采低
延迟 20GbInfiniband网络互联
售价高效1亿元民币年运营(含空
调系统)耗电约800万度
Window HPC2008 浮点运算速度峰值23347 Tflops
Linpack测试速度1806Tflops效率
774 南京学高性计算机1SGI 4700型机 (享存结构)
64CPU结点 结点含二双核Itanium2
16GHz18MB Cache CPUDDR II 533MHz
8GB存 总计256核512GB存
1IO结点 含两300GB SAS 硬盘
光盘驱动器
节点采NUMA Link 互联带宽85GBs
1FPGA 编程模块
14TB光纤磁盘阵列SUSE Linux
安装GNU Fortran CC++编译器
Intel Fortran CC++编译器
Intel MKL数学库
MPI行环境
PBS Pro务理系统
户安装种应程序2 IBM Bladecenter刀片
IBM BladeCenter HS22 cluster
400节点节点含两颗Intel Xeon 5550
266GHz 四核CPU3200核心
网络:Infiniband
Redhat Linux
Intel 编译器数学库
浮点运算力约 32 Tflops(32万亿次)
效率92 全国第2009年全国排名第7世界排名203
2011年排名全国70
《香当网》用户分享的内容,不代表《香当网》观点或立场,请自行判断内容的真实性和可靠性!
该内容是文档的文本内容,更好的格式请下载文档