阿里云通义开源首个多模态推理模型QVQ，视觉推理比肩OpenAI o1_快讯

阿里云通义开源首个多模态推理模型QVQ，视觉推理比肩OpenAI o1

2024-12-26 17:18 AI

12月25日，阿里云通义千问发布业界首个开源多模态推理模型QVQ-72B-Preview。QVQ展现出超预期的视觉理解和推理能力，在解决数学、物理、科学等领域的复杂推理问题上表现突出。多项评测数据显示，QVQ超越了此前的视觉理解模型Qwen2-VL，整体表现与OpenAI o1、Claude3.5 Sonnet等推理模型相当。目前，开发者可在魔搭社区和HuggingFace平台上直接体验。