AI4EC logo
当前位置:首页 - 发现 - 智算中心

嘉庚智算中心

概述

嘉庚创新实验室智能计算中心(简称“嘉庚智算中心”)于2022年建成投用,不但配置先进液冷技术,实现绿色节能,更是配备了先进的计算硬件*(390个CPU计算节点、6个GPU计算节点和2个胖节点),能支持模型训练、模拟仿真、大规模科学计算。

高性能硬件:

  • CPU计算单节点:2 x Intel Xeon Gold 6338(32核,2.0GHz), 256GB DDR4-3200MHz内存
  • GPU计算单节点:8 x Nvidia A100 80GB SXM,1.5TB DDR4-3200MHz内存
  • 胖节点:2 x Intel Xeon Gold 8358(32核,2.6GHz),2TB DDR4-3200MHz内存

*:数据存储空间高达3PB,数据读写速率>50GB/s

专业智算服务:

人工智能应用电化学实验室(AI4EC Lab)团队面向能源化学材料方向,基于嘉庚创新实验室智算中心发展出特色异构化(CPU/GPU/非冯架构)软硬件一体化智算平台。该平台支持:

  • 开箱即用的电化学智能科学计算软件
  • 定制化的计算环境与支撑算法部署
  • 数据的高通量生产、存储、调用和管理
  • 专用科学智能模型的训练及应用
使用

智算中心算力需要,请联系ikkemhpc@xmu.edu.cn,相关申请流程可参见《用户手册》
电化学专业智算服务,请联系ai4ec@xmu.edu.cn

附件: 用户手册

Q&A
  1. 收费标准
    平台集群总费用为CPU,GPU和存储三者的费用之和。CPU 资源按核时收费,GPU 资源按卡时收费。具体费率标准请发送邮件至ikkemhpc@xmu.edu.cn咨询。
  2. 单个作业最长运行时间是多长
    具体时间限制可以通过 scontrol show partition 命令查看 MaxTime 参量
  3. 为什么我的作业运行结果是作业运行结果是node_fail,该怎么处理?
    node_fail是提示由于计算节点故障导致作业运行失败
  4. 为什么我在登录节点上的程序会被终止,我能否在登录节点运行程序?
    登录节点用于文件编辑、作业提交、小型应用编译、文件下载等轻量级工作。而科学计算、大文件校验等计算密集型任务,会占用较多计算资源,影响其他用户正常使用。我们为了保障用户体验,在登录节点设置了任务检测服务,查杀不正常占用登录节点资源的任务。
  5. 如何在集群上安装软件?
    集群上软件安装,请依次判断适用哪种情况:若为商业软件,请自行获取软件使用权并安装;若为常用开源软件,请先根据应用软件 文档,确定集群是否已有安装;
    1)若未安装,请先考虑是否能用conda方法安装;
    2)再考虑在自己家目录下使用源码安装,遇到问题,请将可复现的步骤,发至hpc 邮箱获取帮助;
    3)软件还有容器安装的方法;
    4)我们也将对常用开源软件进行评估,以便全局部署。欢迎邮件联系我们。
  6. 集群上是否提供商业软件?
    暂时没有
  7. 普通用户如何使用 sudo 安装软件?
    有别于独占的个人电脑和工作站,高性能计算用户共享软硬件设施,使用 sudo 特权操作极有可能影响其他用户的程序和数据,因此普通用户禁止使用 sudo。通常普通用户无需 sudo 就能在家目录中安装和使用软件,且使用sudo安装的软件会被错误安装在本地文件系统上而不能在计算节点上运行。请参考当前集群提供的软件模块或通过hpc 邮箱告诉我们需要安装的软件。普通用户也可以使用容器的方式安装,容器内用户拥有“模拟root权限”,
  8. 如何在论文中致谢嘉庚智算中心?
    致谢模版如下。欢迎大家将已接收的高质量成果邮件分享给我们。
    (中文)本论文的计算结果得到了嘉庚创新实验室智算中心的支持和帮助;
    (英文)The calculation results of this paper have been supported and helped by ikkem Intelligent Computing Center
  9. 有没有机时奖励政策?
    暂无
  10. 忘记密码或密钥丢失怎么办?
    如用户忘记密码,或者密钥丢失可利用用户申请时的联系邮箱发送密码重置需求到ikkemhpc@xmu.edu.cn邮箱或是在微信服务群内联系管理员进行重置。
  11. 使用过程中发现的问题请查阅《用户手册》或通过邮件联系我们。