DeepSeek-VL2 AI 视觉模型开源：支持动态分辨率、处

时间：2024-12-23 17:19 作者：[db:作者]

IT之家 12 月 14 日新闻，DeepSeek 官方大众号昨日（12 月 13 日）宣布博文，发布开源 DeepSeek-VL2 模子，在各项评测指标上均获得了极具上风的成就，官方称其视觉模子正式迈入混杂专家模子（Mixture of Experts，简称 MoE）时期。IT之家征引官方消息稿，附上 DeepSeek-VL2 亮点如下：数据：比一代 DeepSeek-VL 多一倍优质练习数据，引入梗图懂得、视觉定位、视觉故事天生等新才能架构：视觉局部应用切图战略支撑静态辨别率图像，言语局部采取 MoE 架构低本钱高机能练习：继续 DeepSeek-VL 的三阶段练习流程，同时经由过程负载平衡适配图像切片数目不定的艰苦，对图像跟文本数据应用差别流水并行战略，对 MoE 言语模子引入专家并行，实现高效练习DeepSeek-VL2 模子支撑静态辨别率，仅应用一个 SigLIP-SO400M 作为图像编码器，经由过程将图像切分为多张子图跟一张全局缩略图来实现静态辨别率图像支撑。这一战略让 DeepSeek-VL2 最多支撑 1152x1152 的辨别率跟 1:9 或 9:1 的极其长宽比，适配更多利用场景。DeepSeek-VL2 模子还得益于更多科研文档数据的进修，能够轻松懂得种种科研图表，并经由过程 Plot2Code，依据图像天生 Python 代码。模子跟论文均已宣布：模子下载：https://huggingface.co/deepseek-aiGitHub 主页：https://github.com/ deepseek-ai/DeepSeek-VL2告白申明：文内含有的对外跳转链接（包含不限于超链接、二维码、口令等情势），用于通报更多信息，节俭甄选时光，成果仅供参考，IT之家全部文章均包括本申明。]article_adlist--> 　　申明：新浪网独家稿件，未经受权制止转载。 -->