华人团队爆火InstructBLIP抢跑看图聊天,开源项目横扫多项SOTA
近日,华人团队开源了多模态基础模型InstructBLIP,是从BLIP2模型微调而来的模型。InstructBLIP模型更擅长「看」、「推理」和「说」,即能够对复杂图像进行理解、推理、描述,还支持多轮对话等。最重要的是,InstructBLIP在多个任务上实现了最先进的性能,甚至在图片解释和推理上表现优于GPT4。(腾讯新闻)
[本文作者佚名,i黑马原创。如需转载请联系微信公众号(ID:iheima)授权,未经授权,转载必究。]