DeepSeek推出文生图模型“Janus-Pro”　性能超越OpenAI

杭州消息——中国人工智能（AI）新创公司深度求索（DeepSeek）近日再度引发关注。该公司于除夕凌晨在GitHub发布了多模态大模型“Janus-Pro”，正式进军文字生成图像（文生图）领域。根据发布的测试结果，“Janus-Pro”在多项基准测试中表现优于OpenAI的DALL-E 3和Stability AI的Stable Diffusion。

突破性的多模态技术

“Janus-Pro”是一款开源的多模态模型，具有高效且多功能的设计。该模型不仅擅长生成逼真的图像，还能执行复杂的视觉推理任务。深度求索指出，相较其前身“JanusFlow”，“Janus-Pro”在训练策略和数据量上进行了显著优化，使得模型在理解文本提示和生成图像的稳定性方面取得了突破。

此外，DeepSeek分享的数据显示，在文本生成图像基准测试GenEval和DPG-Bench中，“Janus-Pro”表现远超对手。其中，Janus-Pro-7B的准确率分别达到80%和84.2%，优于OpenAI的DALL-E 3和Stable Diffusion。

强大的竞争力引发关注

作为“JanusFlow”的升级版本，“Janus-Pro”优化了多模态理解与指令跟踪功能，其技术进步为行业树立了新标杆。市场观察人士认为，这一技术的突破可能迫使全球竞争对手加速研发，进一步推动人工智能领域的创新发展。

然而，这一进展也带来市场不安情绪。DeepSeek此前发布的开源语言模型“DeepSeek-R1”，凭借低训练成本却媲美OpenAI的o1模型，引发了投资者的广泛关注，并对全球科技股带来一定冲击。

创新与挑战并存

DeepSeek的持续突破表明，中国AI公司在技术研发方面正不断缩小与国际巨头的差距。随著“Janus-Pro”的推出，业内普遍预计文生图领域的竞争将愈加激烈。未来，DeepSeek是否能保持这一技术优势并应对市场挑战，值得继续关注。

突破性的多模态技术

强大的竞争力引发关注

创新与挑战并存

最新新闻

日本千叶爆发禽流感疫情扑杀54万只鸡