您的位置: 首页 > 实时讯息 >

摩尔线程开源MT-MegatronLM、MT-TransformerEngine AI框架

0次浏览     发布时间:2025-03-17 18:28:00    

IT之家 3 月 17 日消息,摩尔线程官方今日发文宣布,已正式开源 MT-MegatronLM 与 MT-TransformerEngine 两大 AI 框架。这两大框架通过深度融合 FP8 混合训练策略和高性能算子库,在国产全功能 GPU 上实现混合并行训练和推理,提升了训练效率与稳定性。

据介绍,MT-MegatronLM 是面向全功能 GPU 的开源混合并行训练框架,支持 dense 模型、多模态模型及 MoE(混合专家)模型的高效训练;MT-TransformerEngine 主要用于 Transformer 模型的训练与推理优化,通过算子融合、并行加速策略等技术,释放摩尔线程全功能 GPU 高密度计算的潜力和 memory bound 算子效率。两大框架的技术突破体现在硬件适配与算法创新的深度协同:

  • 混合并行训练:支持 Dense、多模态及 MoE 模型的混合并行训练,可灵活应对不同模型架构的复杂运算场景;

  • FP8 混合训练策略:结合摩尔线程 GPU 原生支持的 FP8 混合精度训练策略,能够有效提升训练效率;

  • 高性能算子库:通过高性能算子库 muDNN 与通信库 MCCL 的深度集成,系统性优化了计算密集型任务与多卡协同的通信开销;同时结合摩尔线程开源 Simumax 库,可自动进行并行策略搜索,并针对不同模型和加速环境 spec 最大化并行训练性能;

  • 异常训练处理:框架内置的 rewind 异常恢复机制,可自动回滚至最近稳定节点继续训练,大幅提升大规模训练的稳定性;

  • 完整的兼容性:两个框架兼容 GPU 主流生态,既保障了现有生态的平滑迁移,也为开发者构建自有的 AI 技术栈提供了底层支撑。

实际应用效果如下:

  • 高效训练:在全功能 GPU 集群上,Llama3 8B 模型的训练任务,可以利用 FP8 在 loss 几乎无损的情况下 MFU 达到 90% 以上;(如下图所示)

▲ 利用摩尔线程 FP8 混合精度加速技术在 loss 无损的情况下得到 28% 的加速
  • 复现 DeepSeek 满血版训练:摩尔线程已深度集成并开源对 DeepSeek 并行算法 DualPipe 的高效支持,MT-DualPipe 可以完整接入 MT-Megatron 框架和 MT-TransformerEngine 框架,成功实现 DeepSeek V3 训练流程的完整复现,支持 MLA、MTP 及多种专家平衡策略;

  • 性能大幅优化:通过多种 Transformer 算子融合技术,显著提升了内存带宽利用率,有效缓解 memory bound 瓶颈,进一步释放国产 GPU 的硬件潜力。

摩尔线程官方表示将持续优化 MT-MegatronLM 与 MT-TransformerEngine 框架,并引入系列功能,具体如下:

  • Dual Pipe / ZeroBubble 并行策略:进一步降低气泡率,提升并行训练效率;

  • 多种 FP8 优化策略:独创的 FP8 优化策略,提高训练的性能和稳定性;

  • 异步 checkpoint 策略:提高训练过程中的容错能力和效率;

  • 优化后的重计算策略:减少计算和显存开销,提高训练速度;

  • 容错训练策略:独创的容错训练算法,增强训练过程中的容错能力;

  • 集成摩尔线程 FlashMLA 和 DeepGemm 库:进一步释放摩尔线程 GPU 的算力和 FP8 计算能力,提升计算性能和效率。

IT之家附开源地址如下:

  • MT-MegatronLM 开源地址:
    https://github.com/MooreThreads/MT-MegatronLM

  • MT-TransformerEngine 开源地址:
    https://github.com/MooreThreads/MT-TransformerEngine

  • 摩尔线程 Simumax 开源地址:
    https://github.com/MooreThreads/SimuMax

相关文章

国务院发文,支持种植、养殖等农业领域智能应用

国务院关于深入实施“人工智能+”行动的意见国发〔2025〕11号各省、自治区、直辖市人民政府,国务院各部委、各直属机构:为深入实施“人工智能+”行动,推动人工智能与经济社会各行业各领域广泛深度融合,重塑人类生产生活范式,促进生产力革命性跃迁和生产关系深层次变革,加快形成人机协同、跨界融合、共创分享的
2025-09-01 18:47:00

武功高新区创新服务机制 全面走访企业 优化营商环境

本报讯(通讯员 蒋宇凡)近日,武功高新区组织开展了覆盖高新区企业的全面走访活动,主动深入生产一线,详细了解企业生产经营状况与发展需求,同步更新企业基本信息,并重点向企业宣传推广了“项目管家”“企业保姆”服务制度及驻企专员机制,旨在以更精准、更高效的服务助推企业高质量发展。此次走访中,高新区工作人员系
2025-08-22 20:26:00

台江县:一站式联审联批 高效推进以工代赈项目落地​

近日,台江县召开以工代赈项目决策评估会议,通过“一站式”联审联批模式,集中审议台盘乡村篮球文化景区旅游配套基础设施、萃文街道展福村人居环境整治两个重点项目,县发改局、财政局、农业农村局、自然资源局、林业局、水务局、州生态环境局台江分局及萃文街道、台盘乡相关负责同志参会。会上,县发改局汇报了黔东南州台
2025-08-22 12:08:00

AI Agent能力持续拓展,混合式AI龙头配置价值凸显

近日,华泰证券发布研报称生成式AI正迈入以AI智能体为主导的新发展阶段,智能体引发了“无就业增长”与“超级个体”并存现象。报告显示,全球AI产业链重构,从平行发展到竞合新常态,以联想集团为代表的中国科技七巨头从2025年1月开始,股价显著跑赢美国七姐妹。华泰证券认为一方面要关注Agent AI、物理
2025-08-22 00:04:00

太重电气科技公司变频器产线达产达效

  8月7日,太重电气科技公司传来消息——高压变频器装配产线实现达产达效,稳定迈入高效、可靠批量生产新阶段。产线具备年产超500台高压变频器的制造实力,将进一步助力公司提升自主化、国产化制造水平。  高压变频器作为一种工业自动化控制设备,广泛应用于电力、矿山、冶金、煤炭等领域,能够有效支持各类装备降
2025-08-09 09:15:00

屏南:深化作风建设 提升服务质效

“局长详细给我说明了政策,讲得浅显易懂、耐心细致,还热情告诉我所需要的材料及具体流程,服务真是太好了。”近日,正值“局长服务日”活动,陈女士在屏南县政务服务中心窗口办理业务后赞不绝口。群众在政务服务中心办理业务(屏南县政务服务中心供图)屏南县深入推行“局长服务日”工作机制,要求进驻部门的主要领导每月
2025-07-27 18:14:00

网站内容来自网络,如有侵权请联系我们,立即删除!
站长邮箱 admin@99-bm.com Copyright © 99便民 鲁ICP备19046937号-5