眸思(MouSi)多模态大模型是由复旦大学语言与视觉团队联合提出基于多视觉专家混合架构的视觉-语言大模型。基于新架构的眸思将擅长图文匹配、光学字符识别(OCR)和图像分割等多种经典视觉任务的专家巧妙地融为一体,显著地提高了多模态大模型在多模态对话中传统视觉任务上的表现效果。
数据统计
数据评估
关于mousi特别声明
本站kk编程驿站提供的mousi都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由kk编程驿站实际控制,在2024-07-18 13:03收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,kk编程驿站不承担任何责任。
相关导航
暂无评论...