DeepSeek V3 和 R1 模型完成海光 DCU 国产化适配并正式上线

感谢本站网友 刺客 的线索投递!

本站 2 月 4 日消息,中科曙光国家先进计算产业创新中心有限公司昨日发文宣布,海光信息技术团队成功完成 DeepSeek V3 和 R1 模型与海光 DCU(深度计算单元)国产化适配,并正式上线。

用户在“光合开发者社区”中的“光源”板块访问并下载相关模型,或登录光源官网搜索“DeepSeek”,即可基于 DCU 平台部署和使用相关模型。

据介绍,DeepSeek V3 和 R1 模型基于 Transformer 架构,采用了 Multi-Head Latent Attention(MLA)和 DeepSeek MoE 两大核心技术。MLA 通过减少 KV 缓存显著降低了内存占用,提升了推理效率;DeepSeek MoE 则通过辅助损失(auxiliary loss)实现了专家负载的智能平衡,进一步优化了模型性能。

本站查询获悉,DCU 是海光信息推出的高性能 GPGPU 架构 AI 加速卡,致力于为行业客户提供自主可控的全精度通用 AI 加速计算解决方案。目前,DCU 已在科教、金融、医疗、政务、智算中心等多个领域实现规模化应用。

也许你还喜欢

春节是个什么样的日子?探索中国传统

以下是生成的一篇关于您需求的文章,但由于字数限制,无法达到 7000 - 2000

18水蜜桃大黄瓜的秘密——这样的搭

引言在美食的世界里,各种食材的搭配总是能引发人们的无限想象。然而,当我

歪歪湿画sss:探索这一独特艺术形式

歪歪湿画sss,作为一种新兴的艺术表现形式,近年来逐渐走入大众视野。其独特的画风和表

厡珅[长弓燧龙]凝光免费获取【奇-

# 原神[长弓燧龙]凝光免费获取攻略及角色技能详解,助你快速提升

为何"含羞草"与免费观看电视剧紧密

**引言**在网络科技日益发达的今天,人们获取娱乐的方式愈发多样。其中

黄品汇mba旧版本2.0.1全面解析:功能

黄品汇 MBA 旧版本 2.0.1 全面解析:功能、优势与用户体验深度评测在当今竞争激烈的

歪歪湿画免费网站入口:畅享无缝连接

随着互联网的发展,越来越多的创作平台应运而生,尤其是在艺术创作领域,线上平台为用户提

我的丗堺神界空岛建筑存档下载,研究

在《我的世界》这款风靡全球的沙盒游戏中,玩家不仅能够自由探索、创

歪歪漫画免费观看上拉式:探索最新漫

漫画作为一种独特的艺术形式,一直以来都备受人们喜爱。它以生动的画面、精彩的情节和丰

岳母理伦与家庭关系的处理:如何维持

在家庭关系中,岳母和女婿、媳妇之间的互动往往充满了复杂的情感和矛盾。岳母