小红书开源性能跃升顶尖梯队最新多模态大模型dots.vlm1

小红书HI Lab宣布开源自研视觉语言模型 dots.vlm1,该模型融合12亿参数NaViT视觉编码器与DeepSeek-V3语言模型,在多模态领域实现突破。其可精准解析复杂图表、解答高考数学题,并通过色盲测试图验证识别精度,文本创作能力同样出色。这是小红书首次开源多模态大模型,为AI研究者提供新工具,推动多模态技术发展。

个人中心
今日签到
有新私信 私信列表
搜索