您的位置: 首页 > 实时讯息 >

华泰证券:DeepSeek有望加速模型训练与CUDA解耦

0次浏览     发布时间:2025-02-21 08:00:00    

华泰证券研究认为,DeepSeek在V3中使用了相比CUDA更底层的PTX 来优化硬件算法,PTX是CUDA编译的中间代码,在CUDA和最终机器码之间起到桥梁作用。而NSA则使用了OpenAl提出的Triton编程语言高效编写GPU代码,Triton的底层可调用CUDA,也可调用其他GPU语言,包括AMD的rocm以及国产算力芯片语言,如寒武纪的思元590芯片和海光信息的深算一号(DCU)内置的HYGON ISA指令集。LLM的训练短期内虽未完全脱离CUDA 生态,但DeepSeek NSA的推出使其初步呈现出与CUDA解耦的趋势,并为后续适配更多类型的算力芯片奠定基础。以异腾为代表的国产算力已经很好的适配了DeepSeek-R1 等国产模型,并取得了高效推理的效果,华泰证券认为,伴随海外算力的受限,针对国产算力的优化或将有持续进展,值得重视。

相关文章

屏南:深化作风建设 提升服务质效

“局长详细给我说明了政策,讲得浅显易懂、耐心细致,还热情告诉我所需要的材料及具体流程,服务真是太好了。”近日,正值“局长服务日”活动,陈女士在屏南县政务服务中心窗口办理业务后赞不绝口。群众在政务服务中心办理业务(屏南县政务服务中心供图)屏南县深入推行“局长服务日”工作机制,要求进驻部门的主要领导每月
2025-07-27 18:14:00

提升影视服务效能 广东举办电影协拍服务技能培训活动

为深入贯彻落实《关于推动广东影视产业高质量发展的若干政策措施》,加快构建公益性省级影视综合服务平台,完善“1+21”省市联动拍摄服务网络,推动广东影视协拍服务规范化、高效化发展,7月20日至22日,由广东省电影局主办,广东省广播影视协会、广东影视综合服务平台承办,中共东莞市委宣传部协办的“电影协拍服
2025-07-27 08:41:00

更强的235B来了!白山云已上线升级版Qwen3模型

导语:450元大模型API体验金,速领~7月22日,阿里千问宣布推出 Qwen3-235B-A22B-FP8 非思考模式(Non-thinking)的更新版本,命名为 Qwen3-235B-A22B-Instruct-2507-FP8。白山云科技已在第一时间火速完成部署上线,用户可通过访问“白山智算
2025-07-24 00:04:00

广西打造“超级接口”汇聚技术、市场与资源

图为南宁市一家企业的人工智能展厅。叶子榕摄(中经视觉)近来,位于广西南宁五象新区的中国—东盟人工智能创新合作中心(以下简称“南A中心”)吸引着无数关注的目光:今年以来已签约国内人工智能项目43个,涵盖算力算法研发、智算设备制造及智能体应用开发等领域;6月29日,首批16家东盟国家企业完成签约,人工智
2025-07-20 06:59:00

华为盘古团队回应开源模型抄袭:严格遵循开源许可证的要求

新京报贝壳财经讯(记者韦博雅)近日,网络上有声音质疑华为盘古大模型涉嫌抄袭阿里巴巴通义千问模型。7月5日,华为盘古Pro MoE技术开发团队发表声明称,盘古Pro MoE开源模型是基于昇腾硬件平台开发、训练的基础大模型,并非基于其他厂商模型增量训练而来。开发团队称,盘古Pro MoE开源模型部分基础
2025-07-06 08:44:00

数据筑基、破界而立:羊城晚报描绘“媒体+”融合新图景

当传统报章遇上智能时代,一场以数据激活文化基因、以技术重构产业生态的传媒变革,正在岭南大地上澎湃涌动。6月24日,《羊城晚报报业集团(羊城晚报社)推进系统性变革实施方案》(以下简称《方案》)发布,其提出的18类63项改革任务中,强化数据赋能,探索“媒体+”跨界融合,成为这一文化大报系统性变革中的核心
2025-06-29 12:46:00

网站内容来自网络,如有侵权请联系我们,立即删除!
站长邮箱 admin@99-bm.com Copyright © 99便民 鲁ICP备19046937号-5