i黑马讯 近日,北京电子数智科技有限责任公司(以下简称“北电数智”)依托其“宝塔·模型适配平台”成功完成DeepSeek V3/R1全尺寸模型与海光DCU、华为、壁仞科技、沐曦等多款国产芯片的混元算力适配,为开发者和企业提供了更灵活、高效的算力支持。
技术创新:DeepSeek模型性能领先
DeepSeek模型作为国产AI技术的代表,采用了多项创新技术,包括混合专家系统(DeepSeekMoE)、多头潜在注意力机制(MLA)以及自研训练框架。这使DeepSeek在大幅减少算力开销的情况下实现了R1模型与OpenAI o1相当、V3模型与OpenAI 4o相当的性能表现,展现出高推理效率和低训练成本的优势。
宝塔·模型适配平台:抹平芯片差异,异构算力高效支撑模型
北电数智“宝塔·模型适配平台”抹平了不同芯片架构的差异,快速实现对DeepSeek模型的优化支持和硬件适配。用户无需关注底层硬件技术细节,平台会根据模型调用需求自动匹配合适的算力资源,大幅降低了开发门槛。目前,该平台已完成24款基座大模型的适配工作,为开发者提供了更多算力选择。
混元推理技术:优化效率,降低成本
针对DeepSeek类超大模型的推理任务,数据中心的集群化推理技术显得尤为重要,例如PD分离(Prefill-Decode分离)技术就可由不同芯片完成不同阶段推理任务实现。北电数智的混元推理技术路线与DeepSeek的技术路线高度契合,能有效解决算力不足问题,为大规模AI应用创造便利条件。
推动国产算力发展:从适配到生态建设
DeepSeek的发展为行业带来了深刻启示:只有满足国产原生模型的算力需求,才能真正推动包含国产算力在内的中国AI产业发展。为全面挖掘国产芯片性能潜力与适配能力,北电数智还推出了“星火·国产算力AI原生适配认证”,促进国产模型与国产算力的深度融合,推动国产芯片在AI原生应用场景中的迭代与创新。
企业版内测上线:助力AI应用落地
目前,北电数智已正式开通企业版内测服务,通过“北京数字经济算力中心”为广大企业和开发者提供便捷、高效的算力支持。无论是模型训练还是推理任务,用户都可以在多芯混元算力环境下轻松构建和部署基于DeepSeek模型的AI应用。
北电数智的一系列举措,为国产AI芯片与模型的协同发展提供了新思路。未来,随着更多企业和开发者加入,国产算力生态也将迎来更加广阔的发展空间。