DeepSeek發布Janus-Pro圖像生成模型 70億參數打造擊敗DALL-E 3

撰文:中關村在線
出版:更新:
今天凌晨,中國一款備受歡迎的大型語言模型「DeepSeek」發布了其最新產品「Janus-Pro」。該模型主要面向圖像生成領域,成為業界關注的焦點。
在最新的GenEval和DPG-Bench基準測試中,由70億參數構成的「Janus-Pro-7B」大放異彩,成功擊敗了OpenAI旗下的DALL-E 3以及其他熱門模型如Stable Diffusion、Emu3-Gen等。值得一提的是,「Janus-Pro」採用MIT開源協議,這意味着其將在商業場景中得到廣泛應用。

+6
據了解,「Janus-Pro」是「JanusFlow」大模型的高級版本,並於2024年11月13日正式發布。相較於之前的模型版本,「Janus-Pro」經過優化訓練策略並擴大了訓練數據範圍,同時模型參數數量也有所提升。
延伸閱讀:微軟提供免費AI圖片產生器 GPT-4隨便用 更能生成16:9長方形圖(點擊連結看全文)
+2
這一系列改動為「Janus-Pro」的發展注入了強大動力,在多模態理解和文本到圖像指令跟蹤功能方面取得了顯著進步,並且增強了文本到圖像生成的穩定性。儘管該模型目前只能處理384x384分辨率的圖像,但考慮到其結構相當緊湊而能達到如此高水平,實屬難得。
除了文生圖的功能外,「Janus-Pro」還具備圖片描述、地標景點識別、文字識別以及圖片知識介紹等多種功能。總體而言,這款多模態大模型引起了廣泛的關注,並展示了其在行業內所具備的實力與潛力。
延伸閱讀:生成式AI應用100強 ChatGPT霸榜挑戰者出現 消費者最愛是這些(點擊連結看全文)
+14
Perplexity、Claude、ChatGPT實測 3款生成式AI誰可提升工作效率大英百科全書正式跨入AI市場 活化石有新把戲 IPO預估10億美元WhatsApp正研發AI智能對話服務 聊天或似ChatGPT更可自訂角色Elon Musk推出Grok AI聊天機器人 功能強大使用簡便但有這些限制ChatGPT全球大死機 用戶哀號連Siri也受影響 OpenAI:努力修復AI浣熊IG上狂吸14萬粉 文案簡單有共鳴外 背後故事竟是如此暖心
【本文獲「中關村在線」授權轉載。】