DeepSeek推出文生图模型“Janus-Pro” 性能超越OpenAI

杭州消息——中国人工智能(AI)新创公司深度求索(DeepSeek)近日再度引发关注。该公司于除夕凌晨在GitHub发布了多模态大模型“Janus-Pro”,正式进军文字生成图像(文生图)领域。根据发布的测试结果,“Janus-Pro”在多项基准测试中表现优于OpenAI的DALL-E 3和Stability AI的Stable Diffusion。

突破性的多模态技术

“Janus-Pro”是一款开源的多模态模型,具有高效且多功能的设计。该模型不仅擅长生成逼真的图像,还能执行复杂的视觉推理任务。深度求索指出,相较其前身“JanusFlow”,“Janus-Pro”在训练策略和数据量上进行了显著优化,使得模型在理解文本提示和生成图像的稳定性方面取得了突破。

此外,DeepSeek分享的数据显示,在文本生成图像基准测试GenEval和DPG-Bench中,“Janus-Pro”表现远超对手。其中,Janus-Pro-7B的准确率分别达到80%和84.2%,优于OpenAI的DALL-E 3和Stable Diffusion。

强大的竞争力引发关注

作为“JanusFlow”的升级版本,“Janus-Pro”优化了多模态理解与指令跟踪功能,其技术进步为行业树立了新标杆。市场观察人士认为,这一技术的突破可能迫使全球竞争对手加速研发,进一步推动人工智能领域的创新发展。

然而,这一进展也带来市场不安情绪。DeepSeek此前发布的开源语言模型“DeepSeek-R1”,凭借低训练成本却媲美OpenAI的o1模型,引发了投资者的广泛关注,并对全球科技股带来一定冲击。

创新与挑战并存

DeepSeek的持续突破表明,中国AI公司在技术研发方面正不断缩小与国际巨头的差距。随著“Janus-Pro”的推出,业内普遍预计文生图领域的竞争将愈加激烈。未来,DeepSeek是否能保持这一技术优势并应对市场挑战,值得继续关注。

author

    Related Articles