跳转至

平台资源

嘉庚创新实验室智能计算中心(简称“嘉庚智算中心”)于 2022 年建成投用,不但配置先进液冷技术,实现绿色节能,更是配备了先进的计算硬件(390 个 CPU 计算节点、6 个 GPU 计算节点和 2 个胖节点),能支持模型训练、模拟仿真、大规模科学计算。

硬件资源

  • 390个双路CPU计算节点(2*Intel 6338 Xeon CPU ,共64 CPU核心, 256 GB内存,240GB SSD硬盘
  • 6个8卡GPU计算节点(2*Intel 8358 Xeon CPU,共64 CPU核心,1536 GB内存,8*Tesla A100 GPU)
  • 2个FAT胖节点(2*Intel_8358_Xeon CPU, 共64 CPU核心,1024 GB内存,2*240GB SSD硬盘,2*2TB SSD硬盘)
  • 4个管理节点(2*Intel 6338 Xeon CPU,共64 CPU核心, 512 GB内存,2*240GB SSD硬盘)
  • 1个登录节点
  • 1个监视节点

专业智算服务

人工智能应用电化学实验室(AI4EC Lab)团队面向能源化学材料方向,基于嘉庚创新实验室智算中心发展出特色异构化(CPU/GPU/非冯架构)软硬件一体化智算平台。该平台支持:

  • 开箱即用的电化学智能科学计算软件
  • 定制化的计算环境与支撑算法部署
  • 数据的高通量生产、存储、调用和管理
  • 专用科学智能模型的训练及应用

使用

智算中心算力需要,请联系ikkemhpc@xmu.edu.cn,相关申请流程可参见开户流程。 电化学专业智算服务,请联系ai4ec@xmu.edu.cn

更新日志

集群公告详见重大更新公告

软硬件资源详情

管理节点(3个)

用于系统管理

节点名 CPU 内存 硬盘 高速网络 型号
mu010-mu012 2*Intel 6338 Xeon CPU,共64 CPU核心 512 GB 2*240GB SSD硬盘 HDR 100Gbps InfiniBand 浪潮NF5280M6

登录节点(1个)

  • 用于用户登录、编译与通过作业调度系统提交管理作业等。
  • 禁止在此节点上不通过作业调度系统直接运行作业。
节点名 CPU 内存 硬盘 高速网络 型号
mu012 2*Intel 6338 Xeon CPU,共64 CPU核心 512 GB 2*240GB SSD硬盘 HDR 100Gbps InfiniBand 浪潮NF5280M6

GPU计算节点(6个)

适合GPU应用,加速性能:https://developer.nvidia.com/hpc-application-performance

节点名 CPU 内存 GPU 硬盘 高速网络 型号
gpu001-gpu006 2*Intel 8358 Xeon CPU 536 GB 8*Tesla A100 2*2TB SSD硬盘 HDR 200Gbps InfiniBand 浪潮NF5688LM6

双路CPU计算节点(390个)

节点名 CPU 内存 硬盘 高速网络 型号
cu001-cu390 2*Intel 6338 Xeon CPU 256GB DDR4-3200MHz 240GB固态硬盘 HDR 100Gbps InfiniBand 浪潮NF5160LM6

双路CPU大内存计算节点(2个)

适合大共享内存应用。

节点名 CPU 内存 硬盘 高速网络 型号
fat001-fat002 2*Intel 6338 Xeon CPU 2TB DDR4 3200MHz 2*2TB NVMe HDR 100Gbps InfiniBand 浪潮NF8260LM6

存储系统及软件环境

  • 容量: 配置裸容量4.57PB,单盘容量 14TB,可用容量 3.15PB,采用 RAID6保护模式,采用 7200RPMNL-SAS 硬盘
  • 网络:通过 Infiniband 高速计算网络接入系统,配置4个200Gbps HDR Infiniband接口,单口速率 200Gbps,Infiniband 网络所有端口总速率 800Gbps
  • 单流读性能 6GB/s; 单流写性能 5GB/s; 并行文件系统总写性能 40GB/s,并行文件系统总读性能 50GB/s。
  • 编译器:Intel、NVIDIA HPC SDK和GNU等C/C++ Fortran、GPU编译器
  • 运算处理器: 存储控制器的 CPU 运算处理器为 8 架构,每节点配置2颗运算处理器
  • 并行环境:HPC-X、Intel MPI和Open MPI等,支持MPI并行程序;各节点内的CPU共享内存,节点内既支持分布式内存的MPI并行方式,也支持共享内存的OpenMP并行方式;同时支持在节点内部共享内存,节点间分布式内存的混合并行模式。
  • 资源管理和作业调度:Slurm