人工智能

深度求索开源多模态大模型DeepSeek-VL系列

字号+作者: 来源:站长之家 2024-03-13 09:23 评论(创建话题) 收藏成功收藏本文

站长之家(ChinaZ.com) 3月13日 消息:3月11日,DeepSeek-AI开源了全新多模态大模型DeepSeek-VL系列,分为1.3b 和7b 两种规模,共有4个版本。它具有融合语言和'...

站长之家(ChinaZ.com) 3月13日 消息:3月11日,DeepSeek-AI开源了全新多模态大模型DeepSeek-VL系列,分为1.3b 和7b 两种规模,共有4个版本。它具有融合语言和视觉能力,可以在不损失语言理解能力的情况下处理多模态任务,识别高分辨率图像中的细小物体。这个模型结合了视觉和语言信息,通过预训练微调的方法,在种领域中展现出很好的性能。2OJ品论天涯网

在数据构建阶段,DeepSeek VL 模型使用了多种不同领域的数据集,包括公开数据集如 ShareGPT4V、LAION-GPTV、LVIS-Instruct4V 等,以及纯文本数据集如 DeepSeek-LLM。2OJ品论天涯网

模型训练过程分为三个关键阶段:视觉 - 语言适配器训练、联合视觉 - 语言预训练和监督微调,以确保模型在不同任务和领域中的准确性和鲁棒性。2OJ品论天涯网

据悉,深度求索(DeepSeek),成立于2023年,专注于研究世界领先的通用人工智能底层模型与技术,挑战人工智能前沿性难题。2OJ品论天涯网

微信截图_20240313092554.png2OJ品论天涯网

包括:2OJ品论天涯网

deepseek-vl-1.3b-chat:2OJ品论天涯网

https://modelscope.cn/models/deepseek-ai/deepseek-vl-1.3b-chat2OJ品论天涯网

deepseek-vl-7b-chat:2OJ品论天涯网

https://modelscope.cn/models/deepseek-ai/deepseek-vl-7b-chat2OJ品论天涯网

deepseek-vl-7b-base:2OJ品论天涯网

https://modelscope.cn/models/deepseek-ai/deepseek-vl-7b-base2OJ品论天涯网

deepseek-vl-1.3b-base:2OJ品论天涯网

https://modelscope.cn/models/deepseek-ai/deepseek-vl-1.3b-base2OJ品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱[email protected]