平台资源¶
嘉庚创新实验室智能计算中心(简称“嘉庚智算中心”)于 2022 年建成投用,不但配置先进液冷技术,实现绿色节能,更是配备了先进的计算硬件(390 个 CPU 计算节点、6 个 GPU 计算节点和 2 个胖节点),能支持模型训练、模拟仿真、大规模科学计算。
硬件资源¶
- 390个双路CPU计算节点(2*Intel 6338 Xeon CPU ,共64 CPU核心, 256 GB内存,240GB SSD硬盘
- 6个8卡GPU计算节点(2*Intel 8358 Xeon CPU,共64 CPU核心,1536 GB内存,8*Tesla A100 GPU)
- 2个FAT胖节点(2*Intel_8358_Xeon CPU, 共64 CPU核心,1024 GB内存,2*240GB SSD硬盘,2*2TB SSD硬盘)
- 4个管理节点(2*Intel 6338 Xeon CPU,共64 CPU核心, 512 GB内存,2*240GB SSD硬盘)
- 1个登录节点
- 1个监视节点
专业智算服务¶
人工智能应用电化学实验室(AI4EC Lab)团队面向能源化学材料方向,基于嘉庚创新实验室智算中心发展出特色异构化(CPU/GPU/非冯架构)软硬件一体化智算平台。该平台支持:
- 开箱即用的电化学智能科学计算软件
- 定制化的计算环境与支撑算法部署
- 数据的高通量生产、存储、调用和管理
- 专用科学智能模型的训练及应用
使用¶
智算中心算力需要,请联系ikkemhpc@xmu.edu.cn,相关申请流程可参见开户流程。 电化学专业智算服务,请联系ai4ec@xmu.edu.cn。
更新日志¶
集群公告详见重大更新公告。
软硬件资源详情¶
管理节点(3个)¶
用于系统管理
节点名 | CPU | 内存 | 硬盘 | 高速网络 | 型号 |
---|---|---|---|---|---|
mu010-mu012 |
2*Intel 6338 Xeon CPU,共64 CPU核心 | 512 GB | 2*240GB SSD硬盘 | HDR 100Gbps InfiniBand | 浪潮NF5280M6 |
登录节点(1个)¶
- 用于用户登录、编译与通过作业调度系统提交管理作业等。
- 禁止在此节点上不通过作业调度系统直接运行作业。
节点名 | CPU | 内存 | 硬盘 | 高速网络 | 型号 |
---|---|---|---|---|---|
mu012 |
2*Intel 6338 Xeon CPU,共64 CPU核心 | 512 GB | 2*240GB SSD硬盘 | HDR 100Gbps InfiniBand | 浪潮NF5280M6 |
GPU计算节点(6个)¶
适合GPU应用,加速性能:https://developer.nvidia.com/hpc-application-performance。
节点名 | CPU | 内存 | GPU | 硬盘 | 高速网络 | 型号 |
---|---|---|---|---|---|---|
gpu001-gpu006 |
2*Intel 8358 Xeon CPU | 536 GB | 8*Tesla A100 | 2*2TB SSD硬盘 | HDR 200Gbps InfiniBand | 浪潮NF5688LM6 |
双路CPU计算节点(390个)¶
节点名 | CPU | 内存 | 硬盘 | 高速网络 | 型号 |
---|---|---|---|---|---|
cu001-cu390 |
2*Intel 6338 Xeon CPU | 256GB DDR4-3200MHz | 240GB固态硬盘 | HDR 100Gbps InfiniBand | 浪潮NF5160LM6 |
双路CPU大内存计算节点(2个)¶
适合大共享内存应用。
节点名 | CPU | 内存 | 硬盘 | 高速网络 | 型号 |
---|---|---|---|---|---|
fat001-fat002 |
2*Intel 6338 Xeon CPU | 2TB DDR4 3200MHz | 2*2TB NVMe | HDR 100Gbps InfiniBand | 浪潮NF8260LM6 |
存储系统及软件环境¶
- 容量: 配置裸容量4.57PB,单盘容量 14TB,可用容量 3.15PB,采用 RAID6保护模式,采用 7200RPMNL-SAS 硬盘
- 网络:通过 Infiniband 高速计算网络接入系统,配置4个200Gbps HDR Infiniband接口,单口速率 200Gbps,Infiniband 网络所有端口总速率 800Gbps
- 单流读性能 6GB/s; 单流写性能 5GB/s; 并行文件系统总写性能 40GB/s,并行文件系统总读性能 50GB/s。
- 编译器:Intel、NVIDIA HPC SDK和GNU等C/C++ Fortran、GPU编译器
- 运算处理器: 存储控制器的 CPU 运算处理器为 8 架构,每节点配置2颗运算处理器
- 并行环境:HPC-X、Intel MPI和Open MPI等,支持MPI并行程序;各节点内的CPU共享内存,节点内既支持分布式内存的MPI并行方式,也支持共享内存的OpenMP并行方式;同时支持在节点内部共享内存,节点间分布式内存的混合并行模式。
- 资源管理和作业调度:Slurm