Logo
圖像模型

先進通義千問影像AI生成器

阿里巴巴革命性的200億參數多模態擴散變壓器,具備業界領先的文本渲染能力。在字母文字同表意文字的複雜多行文本集成方面表現卓越,支援專業影像編輯、風格轉換同對象操作。具備Apache 2.0許可證、卓越的中文文本渲染以及包括對象檢測同語義分割在內的先進計算機視覺任務。

🎯 探索50+模型
公開
*

Qwen Image YouTube 影片

觀看社區演示同教程,了解 Qwen Image 模型的 AI 影像生成同編輯能力

  • Qwen Image Edit 2509 Tutorial | Multi-Image Prompting in ComfyUI (8GB VRAM) - AIdea Lab
  • ComfyUI Tutorial Series Ep 64 Nunchaku Qwen Image Edit 2509 - pixaroma
  • This new free AI image generator is WILD! Qwen Image tutorial - AI Search
  • Qwen-Image: Generation and Editing with Complex Text Rendering - PaperVideos
  • 🚀 Meet Qwen-Image: Crafting with Native Text Rendering - Qwen

Qwen Image YouTube 影片

觀看社區演示同教程,了解 Qwen Image 模型的 AI 影像生成同編輯能力

Qwen Image 在 X 上的熱門評價

看看大家在 X (Twitter) 上對 Qwen Image 的評價

Now you can easily create training data for @Alibaba_Qwen Qwen-Image-Edit-2509 in Lorata, and export dataset to @ostrisai's AI Toolkit for training! Everything runs on your local machine👀 Btw, the target image here is also generated using Qwen Image Edit, pretty nice quality✨

Radionic
Radionic
@Radionic0

Just open-sourced Lorata, a new data labeling tool for the GenAI era. You can now easily prepare training data for the text-to-image, image-editing models, and more!✨ An image editor with drawing and cropping tools is also built-in!

Reply
Reel · Specifications

什麼是通義千問影像

阿里巴巴前沿的影像生成AI,具備革命性的文本渲染技術

  1. · 01阿里巴巴技術驅動
  2. · 02200億參數規模
  3. · 03多語言卓越性能
  4. · 04Apache 2.0開源

通義千問影像係200億參數的多模態擴散變壓器,為影像內文本集成設立新標準,在字母文字同表意文字的多行文本渲染方面表現卓越。

Reel · Capabilities

通義千問影像的強大功能

探索令通義千問影像在AI影像生成領域表現卓越的先進功能

  1. Feature 01 / 12

    先進的文本渲染

    擅長渲染字母同表意文字的複雜多行文本,包括在影像中準確生成中文字元

  2. Feature 02 / 12

    200億參數模型

    利用200億參數多模態擴散變壓器的強大功能,實現卓越的影像質量同細節

  3. Feature 03 / 12

    多風格支援

    生成各種藝術風格的影像,從逼真相片到抽象藝術、動漫同數碼插畫

  4. Feature 04 / 12

    靈活的解析度

    支援從256x256到2048x2048像素的自定義影像尺寸,完美適配任何使用場景

  5. Feature 05 / 12

    快速模式

    啟用快速生成模式,用於快速迭代同創意想法的快速原型製作

  6. Feature 06 / 12

    提示詞翻譯

    內置翻譯支援,將提示詞轉換為英文以獲得最佳效果,支援全球用戶

  7. Feature 07 / 12

    提示詞最佳化

    智慧提示增強,提高生成質量,確保更好地實現您的創意願景

  8. Feature 08 / 12

    可調引導強度

    微調引導強度從1到20,控制影像與提示詞的匹配程度

  9. Feature 09 / 12

    可變步數控制

    自定義推理步數從10到50,在質量同生成速度之間找到完美平衡

  10. Feature 10 / 12

    種子可重現性

    使用種子值獲得一致同可重現的結果,對迭代設計工作至關重要

  11. Feature 11 / 12

    Apache 2.0許可證

    採用寬鬆的Apache 2.0許可證的開源模型,適合個人同商業使用

  12. Feature 12 / 12

    基於積分的定價

    高效的積分系統,根據解析度動態定價,每張圖片僅需5積分起

FAQ

關於通義千問影像的常見問題

獲取關於通義千問影像AI模型及其功能的常見問題解答

通義千問影像以其出色的文本渲染能力脫穎而出,特別係在複雜多行文本同中文字元方面。作為一個200億參數的多模態擴散變壓器,他擅長將文本直接高精度地融入影像中,呢個係好多其他模型難以做到的。他仲支援多種藝術風格,並採用Apache 2.0開源許可證。
通義千問影像支援從256x256像素到2048x2048像素的靈活自定義解析度,以64像素為增量。預設解析度為1024x1024,但您可以獨立調整寬度同高度,創建符合您需求的任何縱橫比的影像,從正方形到寬景觀或高肖像。
可以!通義千問影像包含內置翻譯支援,可以自動將提示詞轉換為英文以獲得最佳結果。呢個使得全世界的用戶都可以使用,無論他們的母語係乜東西。該模型在生成的影像中渲染中文文本方面都有特殊優勢,非常適合多語言內容創作。
通義千問影像使用動態的基於積分的定價系統。基礎成本為每張圖片5積分,但最終價格會根據您選擇的解析度進行調整。更高的解析度由於計算需求增加而需要更多積分。例如,生成2048x2048影像比1024x1024影像成本更高。
快速模式係一個速度最佳化功能,可以實現更快的影像生成,用於快速迭代同原型製作。當您正在試驗不同的提示詞或需要快速結果時特別有用。雖然可能會略微降低生成質量,但他顯著加快咗過程,非常適合頭腦風暴會議或當您需要快速獲得多個變體時。
係的,通義千問影像採用Apache 2.0許可證發布,呢個係一個非常寬鬆的許可證,允許個人同商業使用。您可以將生成的影像用於商業目的、營銷材料、產品設計等,無需額外的許可費用。呢種開源方式使初創公司、企業同個人創作者都能輕鬆使用。

如何使用通義千問影像進行文本生成影像

掌握通義千問影像先進文本渲染能力的專業影像生成技巧

精心製作詳細提示詞

用任何語言編寫描述性提示詞 - 通義千問影像在簡單同複雜描述方面都表現出色。包含關於風格、構圖、光照以及希望在影像中渲染的任何文本的具體細節。模型內置的翻譯功能確保無論您的輸入語言如何都能獲得最佳結果。

如何使用 Qwen-Image 進行圖生圖

掌握 Qwen-Image 的高級圖生圖變換功能

準備基礎影像

從清晰、高質量的影像開始。Qwen-Image 在保持構圖的同時,能根據詳細提示詞變換風格元素方面表現出色。

Pricing · Choose Yours

價格

選擇適合您的計劃。沒有隱藏費用,沒有意外。

一次性 支持加密貨幣支付 (BTC, USDT, ETH, 350+)

月付帳單

免費版

免費試用

0
一次性
USD
免費
32積分
3 影片
32 圖片
多模型支援
文字轉影片
圖片轉影片
影片轉影片
角色一致性
AI 動畫生成器
模板與特效
AI 影片增強
互動社區
更快生成速度
無浮水印輸出
更多鏡頭運動
影片隱私控制
複製保護
優先支援
熱門

專業版

提升您的AI體驗

29.99
1 月
USD
800
800積分1 月
80 影片1 月
800 圖片1 月
3 任務(並行任務)
多模型支援
文字轉影片
圖片轉影片
影片轉影片
角色一致性
AI 動畫生成器
模板與特效
AI 影片增強
互動社區
更快生成速度
無浮水印輸出
更多鏡頭運動
影片隱私控制
複製保護
優先支援

輕量版

開始您的AI之旅

9.99
1 月
USD
200積分1 月
20 影片1 月
200 圖片1 月
3 任務(並行任務)
多模型支援
文字轉影片
圖片轉影片
影片轉影片
角色一致性
AI 動畫生成器
模板與特效
AI 影片增強
互動社區
更快生成速度
無浮水印輸出
更多鏡頭運動
影片隱私控制
複製保護
優先支援