您的位置: 首页 > 实时讯息 >

华泰证券:DeepSeek有望加速模型训练与CUDA解耦

0次浏览     发布时间:2025-02-21 08:00:00    

华泰证券研究认为,DeepSeek在V3中使用了相比CUDA更底层的PTX 来优化硬件算法,PTX是CUDA编译的中间代码,在CUDA和最终机器码之间起到桥梁作用。而NSA则使用了OpenAl提出的Triton编程语言高效编写GPU代码,Triton的底层可调用CUDA,也可调用其他GPU语言,包括AMD的rocm以及国产算力芯片语言,如寒武纪的思元590芯片和海光信息的深算一号(DCU)内置的HYGON ISA指令集。LLM的训练短期内虽未完全脱离CUDA 生态,但DeepSeek NSA的推出使其初步呈现出与CUDA解耦的趋势,并为后续适配更多类型的算力芯片奠定基础。以异腾为代表的国产算力已经很好的适配了DeepSeek-R1 等国产模型,并取得了高效推理的效果,华泰证券认为,伴随海外算力的受限,针对国产算力的优化或将有持续进展,值得重视。

相关文章

呼和浩特市人力资源和社会保障局:以实干担当撑起劳动者维权保护伞

“您好,我是呼和浩特市人力资源和社会保障局劳动监察科的工作人员,请问您于3月27日扫描‘欠薪找我’二维码在智慧劳动监察系统反映的拖欠工资问题得到解决了吗?”近日,市人社局劳动监察科工作人员对今年受理的欠薪线索办理情况进行了电话回访。近年来,为解决群众急难愁盼问题,市人社局想实策、出实招、办实事,推行
2025-04-30 07:48:00

起步早、生态好、政策足!模速空间“C位出道”的阶跃星辰点赞“模都”

4月29日上午,习近平总书记在上海考察时,来到位于徐汇区的上海“模速空间”大模型创新生态社区调研。记者获悉,在“模速空间”展馆中,上海大模型独角兽企业阶跃星辰演示了旗下基础大模型的技术发展和应用情况。“国家高度重视人工智能的发展,其中基础大模型起到重要作用,是一场需要定力和实力的‘科技长征’。”阶跃
2025-04-29 23:26:00

一克商评|从“经验驱动”到“数据驱动”,四川场道以科技为翼实现“智能建造”

封面新闻记者 张越熙 易弋力科技创新+管理优化,四川场道打造精品工程4月25日,记者从四川省场道工程有限公司获悉,在数字化浪潮奔涌的当下,广安市政工程以科技为翼,通过无人机、智能安全帽、高边坡智能检测、物料验收系统、安全视频监控,实现数字底盘与实体工程的同步映射。面对山地仿古建筑复杂结构,团队创新应
2025-04-25 20:10:00

成都高新区产业基金规模超3200亿!

今日,2025年成都高新区产业基金协同发展大会在成都高新区菁蓉汇举办。会上,成都高新区正式发布产业发展图谱,建立“3+6+6”现代化产业体系,并宣布打造目标规模20亿元的“中试基金”和50亿元“数字文创母基金”,力争通过“中试+基金”模式,助力科研成果从实验室研发向规模量产快速转化。推出3000亿规
2025-04-25 18:07:00

卫星太多,AI帮忙管!我国首款航天私域大模型迭代升级

昨天,在2025年“中国航天日”活动中,我国首款航天私域大模型“华山”的升级迭代产品——软硬一体化大模型“华山大模型一体化系统”正式亮相。它有望打破以往大模型应用对服务器及配置环境要求高、投入成本高的问题,并大幅降低人工智能应用于航天场景的成本。卫星数量爆发,AI帮忙管理随着卫星互联网、千帆星座等计
2025-04-25 10:04:00

均联智行联合东风汽车、黑芝麻智能实现舱驾一体方案量产突破 东风多款车型搭载C1296芯片

人民财讯4月24日电,4月23日,上海国际车展现场,宁波均联智行科技股份有限公司(简称“均联智行”)、东风汽车集团有限公司(简称“东风汽车”)与黑芝麻智能科技有限公司(简称“黑芝麻智能”)共同宣布,三方联合开发的舱驾一体化方案正式进入量产阶段。基于黑芝麻智能武当C1296芯片打造的该方案,将率先搭载
2025-04-24 14:33:00

网站内容来自网络,如有侵权请联系我们,立即删除!
站长邮箱 admin@99-bm.com Copyright © 99便民 鲁ICP备19046937号-5