月之暗面研究员透露:为了省钱,未能更早将“长思维链”作为高优选项
据澎湃新闻,2月17日,人工智能初创公司月之暗面在其官方微信公众号分享了其前段时间刚刚发布的Kimi k1.5多模态思考模型诞生的过程。
这款模型与DeepSeek-R1同日发布,但由于后者过于火爆,使得前者的发布消息几乎被淹没。在热潮日渐平静之际,月之暗面研究员Flood Sung在分享中透露,长思维链的有效性其实在一年多前就已经知道了,但为了省钱,他们优先选择攻关长文本而不是长思维链(Long-CoT:Long Chain of Thought);在去年9月OpenAI o1推出后,月之暗面决定出手长思维链。
[本文作者佚名,i黑马原创。如需转载请联系微信公众号(ID:iheima)授权,未经授权,转载必究。]