您的位置: 首页 > 实时讯息 >

华泰证券:DeepSeek有望加速模型训练与CUDA解耦

0次浏览     发布时间:2025-02-21 08:00:00    

华泰证券研究认为,DeepSeek在V3中使用了相比CUDA更底层的PTX 来优化硬件算法,PTX是CUDA编译的中间代码,在CUDA和最终机器码之间起到桥梁作用。而NSA则使用了OpenAl提出的Triton编程语言高效编写GPU代码,Triton的底层可调用CUDA,也可调用其他GPU语言,包括AMD的rocm以及国产算力芯片语言,如寒武纪的思元590芯片和海光信息的深算一号(DCU)内置的HYGON ISA指令集。LLM的训练短期内虽未完全脱离CUDA 生态,但DeepSeek NSA的推出使其初步呈现出与CUDA解耦的趋势,并为后续适配更多类型的算力芯片奠定基础。以异腾为代表的国产算力已经很好的适配了DeepSeek-R1 等国产模型,并取得了高效推理的效果,华泰证券认为,伴随海外算力的受限,针对国产算力的优化或将有持续进展,值得重视。

相关文章

全国首个交通基建垂类大模型·灵筑智工亮相

工人日报-中工网记者 甘皙6月12日,成都首届垂类大模型产业大型活动——“大模型・全连接・新增长”城市论坛落幕。现场重磅发布得助大模型平台3.0、得助智能音视频服务平台3.0两大技术平台底座,推出银行、证券、汽车三大行业垂类大模型解决方案,并联合宁夏交建交通科技研究院正式发布全国首个交通基建垂类大模
2025-06-13 16:23:00

看好公司前景和未来发展 一脉阳光核心高管自愿锁定股份

作为国内最大的第三方医学影像服务平台,一脉阳光(02522.HK)正通过"传统影响医疗+数据智能"的深度融合,打造医学影像全产业链服务平台,重塑行业未来格局。6月9日,公司发布公告,董事长及两位执行董事承诺至12月31日不减持。坚定看好公司前景和未来发展。聚焦三大增长极,夯实传统医疗智能化核心底盘通
2025-06-09 10:42:00

认识中华文化,先要从语言文字入手 四川日报连版推出“文化传承发展百人谈”大型人文融媒报道第八十四期

(点击图片进入报道专题)四川日报全媒体“文化传承发展百人谈”大型人文融媒报道持续推出,今日《四川日报》连版推出第八十四期,专访著名汉学家、法国首任汉语总督学白乐桑。白乐桑,著名汉学家,法国当代汉语教育泰斗。法国东方语言文化学院教授,全欧首位汉语教学法博士生导师,法国汉语教师协会创始人,法国教育部首任
2025-06-06 08:20:00

硅谷集体失眠!互联网女王340页AI趋势报告刷屏

当地时间5月30日,玛丽·米克尔(Mary Meeker)发布了长达340页的“AI趋势报告”。报告显示,AI的发展速度前所未见,用户增长、使用量和资本支出均呈现出爆炸式增长,其影响力可能远超技术本身。玛丽·米克尔是美国风险投资家,曾就职于摩根士丹利和凯鹏华盈(Kleiner Perkins),于2
2025-06-03 10:23:00

太平人寿重庆分公司打造“一站式”消保驿站

为有效强化消费者权益保护、提升金融服务质效,让消费者享受贴心便捷的保险服务,加强消保文化渗透,太平人寿重庆分公司在渝中、永川两家中支网点打造“消保驿站”场景,创建“金融宣教区”、“保险服务区”、“权益保护区”、“创新共建区”四大功能区,推动消保工作体系化、具体化,切实践行以人民为中心的价值取向。金融
2025-05-22 15:55:00

逐“绿”前行 向“新”发力

逐“绿”前行,向“新”发力。连日来,襄垣县“源网荷储”一体化项目(一期)5万千瓦光伏项目建设如火如荼。在位于下良镇南桥院村的光伏项目110KV升压站施工现场,机器轰鸣,挖掘机铁臂高举,运输车有序穿梭,各项工作正在有序推进。为构建绿色低碳、安全高效的现代能源体系,近年来,襄垣县立足资源优势和产业基础,
2025-05-19 15:24:00

网站内容来自网络,如有侵权请联系我们,立即删除!
站长邮箱 admin@99-bm.com Copyright © 99便民 鲁ICP备19046937号-5