快科技7月4日消息,摩尔线程公司日前宣布其AI旗舰产品——夸娥(KUAE)智算集群解决方案实现重大技术升级,成功将集群规模从千卡级别扩展至万卡规模。这也意味着摩尔线程在国产通用加速计算平台领域迈出了重要一步,为国内AI技术的发展提供了强大的基础设施支持。
夸娥万卡智算集群以全功能GPU为底座,具备万P级浮点运算能力,专为处理万亿参数级别的复杂大模型训练而设计。这一解决方案不仅大幅提升了计算性能,还实现了超大显存容量和超高速卡间互联总带宽,为AI模型训练提供了坚实的算力基础。摩尔线程夸娥智算集群的核心特性包括超大算力、超高稳定性、极致优化和全能通用性,集群的平均无故障运行时间超过15天,周均训练有效率在99%以上。
此外,通过系统软件、框架和算法的优化,夸娥万卡集群实现了高效率训练,MFU(模型训练效率)最高可达60%。此次升级还特别强调了生态友好性,夸娥万卡集群支持多种大模型架构,基于MUSA编程语言和完整兼容CUDA能力,提供了高效易用的生态适配工具,加速新模型的迁移和业务上线。
此外,摩尔线程还与中国多家知名企业就万卡集群项目进行了战略签约,共同构建好用的国产GPU集群。
0 留言