阿里开源最新多模态模型 Qwen2.5-VL-32B:主打视觉语言,数学推理也很强
阿里通义千问发布 Qwen2.5-VL-32B-Instruct。此前开源家族视觉语言模型 Qwen2.5-VL 包括 3B、7B 和 72B 三种尺寸。这一次的 32B 版本进一步兼顾尺寸和性能,可在本地运行。同时经过强化学习优化,在三个方面改进显著:回答更符合人类偏好;拥有更强的数学推理能力;在图像解析、内容识别以及视觉逻辑推导等任务中,表现出更强的准确性和细粒度分析能力。
[本文作者佚名,i黑马原创。如需转载请联系微信公众号(ID:iheima)授权,未经授权,转载必究。]