先進通義千問圖像AI生成器

阿里巴巴革命性嘅200億參數多模態擴散變壓器,具備業界領先嘅文本渲染能力。喺字母文字同表意文字嘅複雜多行文本集成方面表現卓越,支持專業圖像編輯、風格轉換同對象操作。具備Apache 2.0許可證、卓越嘅中文文本渲染以及包括對象檢測同語義分割在內嘅先進計算機視覺任務。

公開
0 / 8192
*

Qwen Image YouTube 視頻

觀看社區演示同教程,了解 Qwen Image 模型嘅 AI 圖像生成同編輯能力

Qwen Image 在 X 上的熱門評價

看看大家在 X (Twitter) 上對 Qwen Image 的評價

Now you can easily create training data for @Alibaba_Qwen Qwen-Image-Edit-2509 in Lorata, and export dataset to @ostrisai's AI Toolkit for training! Everything runs on your local machine👀 Btw, the target image here is also generated using Qwen Image Edit, pretty nice quality✨

Radionic
Radionic
@Radionic0

Just open-sourced Lorata, a new data labeling tool for the GenAI era. You can now easily prepare training data for the text-to-image, image-editing models, and more!✨ An image editor with drawing and cropping tools is also built-in!

Reply

什麼是通義千問圖像

阿里巴巴前沿嘅圖像生成AI,具備革命性嘅文本渲染技術

通義千問圖像代表咗阿里巴巴通義千問團隊喺AI圖像生成技術方面嘅突破性進展。作為一個200億參數嘅多模態擴散變壓器(MMDiT)基礎模型,佢為圖像內文本集成設立咗新標準,喺字母文字同表意文字方面提供咗無與倫比嘅能力。該模型喺複雜多行文本渲染、專業圖像編輯同計算機視覺任務方面表現卓越,同時保持Apache 2.0開源可訪問性。

通義千問圖像嘅強大功能

探索令通義千問圖像喺AI圖像生成領域表現卓越嘅先進功能

先進嘅文本渲染

擅長渲染字母同表意文字嘅複雜多行文本,包括喺圖像中準確生成中文字符

200億參數模型

利用200億參數多模態擴散變壓器嘅強大功能,實現卓越嘅圖像質量同細節

多風格支持

生成各種藝術風格嘅圖像,從逼真相片到抽象藝術、動漫同數碼插畫

靈活嘅解像度

支持從256x256到2048x2048像素嘅自定義圖像尺寸,完美適配任何使用場景

快速模式

啟用快速生成模式,用於快速迭代同創意想法嘅快速原型製作

提示詞翻譯

內置翻譯支持,將提示詞轉換為英文以獲得最佳效果,支持全球用戶

提示詞優化

智能提示增強,提高生成質量,確保更好地實現您嘅創意願景

可調引導強度

微調引導強度從1到20,控制圖像與提示詞嘅匹配程度

可變步數控制

自定義推理步數從10到50,喺質量同生成速度之間搵到完美平衡

種子可重現性

使用種子值獲得一致同可重現嘅結果,對迭代設計工作至關重要

Apache 2.0許可證

採用寬鬆嘅Apache 2.0許可證嘅開源模型,適合個人同商業使用

基於積分嘅定價

高效嘅積分系統,根據解像度動態定價,每張圖片僅需5積分起

關於通義千問圖像嘅常見問題

獲取關於通義千問圖像AI模型及其功能嘅常見問題解答

通義千問圖像以其出色嘅文本渲染能力脫穎而出,特別係喺複雜多行文本同中文字符方面。作為一個200億參數嘅多模態擴散變壓器,佢擅長將文本直接高精度地融入圖像中,呢個係好多其他模型難以做到嘅。佢仲支持多種藝術風格,並採用Apache 2.0開源許可證。
通義千問圖像支持從256x256像素到2048x2048像素嘅靈活自定義解像度,以64像素為增量。默認解像度為1024x1024,但您可以獨立調整寬度同高度,創建符合您需求嘅任何縱橫比嘅圖像,從正方形到寬景觀或高肖像。
可以!通義千問圖像包含內置翻譯支持,可以自動將提示詞轉換為英文以獲得最佳結果。呢個使得全世界嘅用戶都可以使用,無論佢哋嘅母語係乜嘢。該模型喺生成嘅圖像中渲染中文文本方面都有特殊優勢,非常適合多語言內容創作。
通義千問圖像使用動態嘅基於積分嘅定價系統。基礎成本為每張圖片5積分,但最終價格會根據您選擇嘅解像度進行調整。更高嘅解像度由於計算需求增加而需要更多積分。例如,生成2048x2048圖像比1024x1024圖像成本更高。
快速模式係一個速度優化功能,可以實現更快嘅圖像生成,用於快速迭代同原型製作。當您正在試驗不同嘅提示詞或需要快速結果時特別有用。雖然可能會略微降低生成質量,但佢顯著加快咗過程,非常適合頭腦風暴會議或當您需要快速獲得多個變體時。
係嘅,通義千問圖像採用Apache 2.0許可證發布,呢個係一個非常寬鬆嘅許可證,允許個人同商業使用。您可以將生成嘅圖像用於商業目的、營銷材料、產品設計等,無需額外嘅許可費用。呢種開源方式使初創公司、企業同個人創作者都能輕鬆使用。

如何使用通義千問圖像進行文本生成圖像

掌握通義千問圖像先進文本渲染能力嘅專業圖像生成技巧

step1

精心製作詳細提示詞

配置生成設置

生成同優化您嘅圖像

如何使用 Qwen-Image 進行圖生圖

掌握 Qwen-Image 嘅高級圖生圖變換功能

step1

準備基礎圖像

編寫詳細提示詞

調整強度參數

優化結果

價格

選擇適合您的計劃。沒有隱藏費用,沒有意外。

年付帳單,享受50%折扣

熱門

Pro

Elevate your AI experience

29.99
15
1 月
USD
800points
1 月
Up to 80 videos
1 月
Up to 800 images
1 月
Parallel Tasks: 3 tasks
Multi-Model Support
Text to Video
Image to Video
Video to Video
Consistent Character
AI Animation Generator
Templates & Effects
AI Video Enhancers
Interactive Community
Faster Generation Speed
No-watermark Outputs
More Camera Movement
Private Video Visibility
Copy Protection
Priority Support

Max

Unlock more advanced features

99.99
50
1 月
USD
2800points
1 月
Up to 280 videos
1 月
Up to 2800 images
1 月
Parallel Tasks: 3 tasks
Multi-Model Support
Text to Video
Image to Video
Video to Video
Consistent Character
AI Animation Generator
Templates & Effects
AI Video Enhancers
Interactive Community
Faster Generation Speed
No-watermark Outputs
More Camera Movement
Private Video Visibility
Copy Protection
Priority Support

Ultra

Powerful support for your team

499.99
250
1 月
USD
16000points
1 月
Up to 1600 videos
1 月
Up to 16000 images
1 月
Parallel Tasks: 3 tasks
Multi-Model Support
Text to Video
Image to Video
Video to Video
Consistent Character
AI Animation Generator
Templates & Effects
AI Video Enhancers
Interactive Community
Faster Generation Speed
No-watermark Outputs
More Camera Movement
Private Video Visibility
Copy Protection
Priority Support