中科曙光近日在HAIC大会发布了scaleX万卡超集群,它的智能管理能力,简直是运维党的梦中情“机”!能精准复刻物理集群的运行状态,实现故障定位、修复等全流程可视化智能管理。以前运维万级节点的集群,光是排查故障就要耗费大量时间,现在通过数字孪生系统,任何小问题都能精准定位,修复效率直接翻倍。 更厉害的是,智能化运维平台能支撑集群长期可用性达到99.99%,对于动不动1个月连续24小时不间断运行的AI训练任务来说,太福音了。 算力

中科曙光近日在HAIC大会发布了scaleX万卡超集群,它的智能管理能力,简直是运维党的梦中情“机”!能精准复刻物理集群的运行状态,实现故障定位、修复等全流程可视化智能管理。以前运维万级节点的集群,光是排查故障就要耗费大量时间,现在通过数字孪生系统,任何小问题都能精准定位,修复效率直接翻倍。 更厉害的是,智能化运维平台能支撑集群长期可用性达到99.99%,对于动不动1个月连续24小时不间断运行的AI训练任务来说,太福音了。 算力

作者最新文章
热门分类
汽车TOP
汽车最新文章