联想AI服务器首次实现低于1TB本地部署DeepSeek满血大模型
3月4日消息,近日,联想集团宣布基于联想问天WA7780 G3服务器,在行业内首次实现单机部署DeepSeek-R1/V3 671B大模型,以低于行业公认1TGB显存(实际768GB)承载100并发用户流畅体验。据联想实测数据显示,在512 token标准测试环境下,该系统可支持100个并发用户持续获得每秒10 token的稳定输出,首token响应时间压缩至30秒内。
[本文作者佚名,i黑马原创。如需转载请联系微信公众号(ID:iheima)授权,未经授权,转载必究。]