頂級AI發布圖像生成模型　擁抱MIT開源一舉超越DALL-E 3等對手

今天凌晨，中國一款備受歡迎的大型語言模型「DeepSeek」發布了其最新產品「Janus-Pro」。該模型主要面向圖像生成領域，成為業界關注的焦點。

在最新的GenEval和DPG-Bench基準測試中，由70億參數構成的「Janus-Pro-7B」大放異彩，成功擊敗了OpenAI旗下的DALL-E 3以及其他熱門模型如Stable Diffusion、Emu3-Gen等。值得一提的是，「Janus-Pro」採用MIT開源協議，這意味着其將在商業場景中得到廣泛應用。

Janus-Pro採用MIT開源協議（deepseek）

據了解，「Janus-Pro」是「JanusFlow」大模型的高級版本，並於2024年11月13日正式發布。相較於之前的模型版本，「Janus-Pro」經過優化訓練策略並擴大了訓練數據範圍，同時模型參數數量也有所提升。

DeepSeek成AI黑馬登App Store榜首　Meta對下一代 Llama有這焦慮中國新AI大模型DeepSeek強在哪裏？基準測試排名升至全類別第3位

延伸閱讀：微軟提供免費AI圖片產生器　GPT-4隨便用　更能生成16:9長方形圖（點擊連結看全文）

這一系列改動為「Janus-Pro」的發展注入了強大動力，在多模態理解和文本到圖像指令跟蹤功能方面取得了顯著進步，並且增強了文本到圖像生成的穩定性。儘管該模型目前只能處理384x384分辨率的圖像，但考慮到其結構相當緊湊而能達到如此高水平，實屬難得。

Janus-Pro目前只能處理384x384分辨率的圖像（deepseek）

除了文生圖的功能外，「Janus-Pro」還具備圖片描述、地標景點識別、文字識別以及圖片知識介紹等多種功能。總體而言，這款多模態大模型引起了廣泛的關注，並展示了其在行業內所具備的實力與潛力。

延伸閱讀：生成式AI應用100強　ChatGPT霸榜挑戰者出現　消費者最愛是這些（點擊連結看全文）

+14

Perplexity、Claude、ChatGPT實測　3款生成式AI誰可提升工作效率大英百科全書正式跨入AI市場　活化石有新把戲　IPO預估10億美元 WhatsApp正研發AI智能對話服務　聊天或似ChatGPT更可自訂角色 Elon Musk推出Grok AI聊天機器人　功能強大使用簡便但有這些限制 ChatGPT全球大死機　用戶哀號連Siri也受影響　OpenAI：努力修復 AI浣熊IG上狂吸14萬粉　文案簡單有共鳴外　背後故事竟是如此暖心

【本文獲「中關村在線」授權轉載。】

DeepSeek發布Janus-Pro圖像生成模型 70億參數打造擊敗DALL-E 3

DeepSeek發布Janus-Pro圖像生成模型　70億參數打造擊敗DALL-E 3