DeepSeek發布Janus-Pro圖像生成模型 70億參數打造擊敗DALL-E 3

DeepSeek發布Janus-Pro圖像生成模型 70億參數打造擊敗DALL-E 3
撰文:中關村在線
出版:更新:

今天凌晨,中國一款備受歡迎的大型語言模型「DeepSeek」發布了其最新產品「Janus-Pro」。該模型主要面向圖像生成領域,成為業界關注的焦點。

在最新的GenEval和DPG-Bench基準測試中,由70億參數構成的「Janus-Pro-7B」大放異彩,成功擊敗了OpenAI旗下的DALL-E 3以及其他熱門模型如Stable Diffusion、Emu3-Gen等。值得一提的是,「Janus-Pro」採用MIT開源協議,這意味着其將在商業場景中得到廣泛應用。

Janus-Pro採用MIT開源協議(deepseek)
Janus-Pro採用MIT開源協議(deepseek)
+6

據了解,「Janus-Pro」是「JanusFlow」大模型的高級版本,並於2024年11月13日正式發布。相較於之前的模型版本,「Janus-Pro」經過優化訓練策略並擴大了訓練數據範圍,同時模型參數數量也有所提升。

延伸閱讀:微軟提供免費AI圖片產生器 GPT-4隨便用 更能生成16:9長方形圖(點擊連結看全文)

+2

這一系列改動為「Janus-Pro」的發展注入了強大動力,在多模態理解和文本到圖像指令跟蹤功能方面取得了顯著進步,並且增強了文本到圖像生成的穩定性。儘管該模型目前只能處理384x384分辨率的圖像,但考慮到其結構相當緊湊而能達到如此高水平,實屬難得。

Janus-Pro目前只能處理384x384分辨率的圖像(deepseek)

除了文生圖的功能外,「Janus-Pro」還具備圖片描述、地標景點識別、文字識別以及圖片知識介紹等多種功能。總體而言,這款多模態大模型引起了廣泛的關注,並展示了其在行業內所具備的實力與潛力。

延伸閱讀:生成式AI應用100強 ChatGPT霸榜挑戰者出現 消費者最愛是這些(點擊連結看全文)

+14

【本文獲「中關村在線」授權轉載。】

正在加載