您的位置: 首页 > 实时讯息 >

摩尔线程开源MT-MegatronLM、MT-TransformerEngine AI框架

0次浏览     发布时间:2025-03-17 18:28:00    

IT之家 3 月 17 日消息,摩尔线程官方今日发文宣布,已正式开源 MT-MegatronLM 与 MT-TransformerEngine 两大 AI 框架。这两大框架通过深度融合 FP8 混合训练策略和高性能算子库,在国产全功能 GPU 上实现混合并行训练和推理,提升了训练效率与稳定性。

据介绍,MT-MegatronLM 是面向全功能 GPU 的开源混合并行训练框架,支持 dense 模型、多模态模型及 MoE(混合专家)模型的高效训练;MT-TransformerEngine 主要用于 Transformer 模型的训练与推理优化,通过算子融合、并行加速策略等技术,释放摩尔线程全功能 GPU 高密度计算的潜力和 memory bound 算子效率。两大框架的技术突破体现在硬件适配与算法创新的深度协同:

  • 混合并行训练:支持 Dense、多模态及 MoE 模型的混合并行训练,可灵活应对不同模型架构的复杂运算场景;

  • FP8 混合训练策略:结合摩尔线程 GPU 原生支持的 FP8 混合精度训练策略,能够有效提升训练效率;

  • 高性能算子库:通过高性能算子库 muDNN 与通信库 MCCL 的深度集成,系统性优化了计算密集型任务与多卡协同的通信开销;同时结合摩尔线程开源 Simumax 库,可自动进行并行策略搜索,并针对不同模型和加速环境 spec 最大化并行训练性能;

  • 异常训练处理:框架内置的 rewind 异常恢复机制,可自动回滚至最近稳定节点继续训练,大幅提升大规模训练的稳定性;

  • 完整的兼容性:两个框架兼容 GPU 主流生态,既保障了现有生态的平滑迁移,也为开发者构建自有的 AI 技术栈提供了底层支撑。

实际应用效果如下:

  • 高效训练:在全功能 GPU 集群上,Llama3 8B 模型的训练任务,可以利用 FP8 在 loss 几乎无损的情况下 MFU 达到 90% 以上;(如下图所示)

▲ 利用摩尔线程 FP8 混合精度加速技术在 loss 无损的情况下得到 28% 的加速
  • 复现 DeepSeek 满血版训练:摩尔线程已深度集成并开源对 DeepSeek 并行算法 DualPipe 的高效支持,MT-DualPipe 可以完整接入 MT-Megatron 框架和 MT-TransformerEngine 框架,成功实现 DeepSeek V3 训练流程的完整复现,支持 MLA、MTP 及多种专家平衡策略;

  • 性能大幅优化:通过多种 Transformer 算子融合技术,显著提升了内存带宽利用率,有效缓解 memory bound 瓶颈,进一步释放国产 GPU 的硬件潜力。

摩尔线程官方表示将持续优化 MT-MegatronLM 与 MT-TransformerEngine 框架,并引入系列功能,具体如下:

  • Dual Pipe / ZeroBubble 并行策略:进一步降低气泡率,提升并行训练效率;

  • 多种 FP8 优化策略:独创的 FP8 优化策略,提高训练的性能和稳定性;

  • 异步 checkpoint 策略:提高训练过程中的容错能力和效率;

  • 优化后的重计算策略:减少计算和显存开销,提高训练速度;

  • 容错训练策略:独创的容错训练算法,增强训练过程中的容错能力;

  • 集成摩尔线程 FlashMLA 和 DeepGemm 库:进一步释放摩尔线程 GPU 的算力和 FP8 计算能力,提升计算性能和效率。

IT之家附开源地址如下:

  • MT-MegatronLM 开源地址:
    https://github.com/MooreThreads/MT-MegatronLM

  • MT-TransformerEngine 开源地址:
    https://github.com/MooreThreads/MT-TransformerEngine

  • 摩尔线程 Simumax 开源地址:
    https://github.com/MooreThreads/SimuMax

相关文章

看好公司前景和未来发展 一脉阳光核心高管自愿锁定股份

作为国内最大的第三方医学影像服务平台,一脉阳光(02522.HK)正通过"传统影响医疗+数据智能"的深度融合,打造医学影像全产业链服务平台,重塑行业未来格局。6月9日,公司发布公告,董事长及两位执行董事承诺至12月31日不减持。坚定看好公司前景和未来发展。聚焦三大增长极,夯实传统医疗智能化核心底盘通
2025-06-09 10:42:00

硅谷集体失眠!互联网女王340页AI趋势报告刷屏

当地时间5月30日,玛丽·米克尔(Mary Meeker)发布了长达340页的“AI趋势报告”。报告显示,AI的发展速度前所未见,用户增长、使用量和资本支出均呈现出爆炸式增长,其影响力可能远超技术本身。玛丽·米克尔是美国风险投资家,曾就职于摩根士丹利和凯鹏华盈(Kleiner Perkins),于2
2025-06-03 10:23:00

太平人寿重庆分公司打造“一站式”消保驿站

为有效强化消费者权益保护、提升金融服务质效,让消费者享受贴心便捷的保险服务,加强消保文化渗透,太平人寿重庆分公司在渝中、永川两家中支网点打造“消保驿站”场景,创建“金融宣教区”、“保险服务区”、“权益保护区”、“创新共建区”四大功能区,推动消保工作体系化、具体化,切实践行以人民为中心的价值取向。金融
2025-05-22 15:55:00

逐“绿”前行 向“新”发力

逐“绿”前行,向“新”发力。连日来,襄垣县“源网荷储”一体化项目(一期)5万千瓦光伏项目建设如火如荼。在位于下良镇南桥院村的光伏项目110KV升压站施工现场,机器轰鸣,挖掘机铁臂高举,运输车有序穿梭,各项工作正在有序推进。为构建绿色低碳、安全高效的现代能源体系,近年来,襄垣县立足资源优势和产业基础,
2025-05-19 15:24:00

刚刚,福布斯发榜!武汉第四!

5月11日2025 福布斯中国人工智能科技企业TOP 50评选及子评选结果发布武汉共有9家企业上榜位列全国第四仅次于上海、北京和深圳武汉人工智能研究院院长王金桥获评2025福布斯中国人工智能影响力人物过去五年,武汉人工智能产业复合增长率超40%,已聚集1000多家人工智能相关企业,核心产业规模超50
2025-05-11 18:20:00

智元将主办机器人比赛:奖金池6万美元,冠军1万美元

IT之家 5 月 9 日消息,智元机器人今日宣布与 OpenDriveLab 联合主办的机器人赛事 AgiBot World Challenge 开启报名,比赛将于 5 月 26 日正式开启。据介绍,本次赛事基于智元的技术矩阵及 OpenDriveLab 的经验优势,通过开放核心基础设施与创新资源,
2025-05-09 20:21:00

网站内容来自网络,如有侵权请联系我们,立即删除!
站长邮箱 admin@99-bm.com Copyright © 99便民 鲁ICP备19046937号-5