Open source models are crazy. Alibaba just dropped Wan 2.2 Animate, a new model that can animate any character based on a simple souce image. It handles facial expressions and body movements like no other model. 10 insane examples: (sound on)
WAN 2.2
Alibabaの次世代ビデオ生成モデルで、270億のパラメータとステップあたり140億のアクティブパラメータ、Mixture-of-Expertsアーキテクチャ、そして向上した視覚品質を特徴としています。改善されたモーション制御、高速な生成速度、拡張されたトレーニングデータで、シネマティックビデオ生成において画期的なパフォーマンスを実現します。
Wan 2.2 YouTube動画
Wan 2.2の強力なAI動画生成と長尺動画機能を紹介するデモンストレーションとチュートリアルをご覧ください
WAN 2.2 X での人気レビュー
X (Twitter) で WAN 2.2 Animate について何を言っているか見てみましょう
Wan 2.2 Animate is CRAZY and it actually excels at 3 things from my tests: 1. Lip syncing (so far the best open source I have seen, beating Runway Act2) 2. Consistent lighting & shadows with color tone replication when you swap a character 3. It keeps the replacement character
Wan 2.2 Animate Lip syncing Test. Definitely way better than Runway Act2 in my opinion. Takes about 8 minutes for a HD video to be processed at 720p vertical (reels style)
You've probably seen viral character swaps from Wan 2.2 Animate. But now you can swap the character AND background using a reference video + new image. I turned myself into a YouTuber in Paris. How it works 👇
New tool to swap characters in a video: Wan 2.2 Animate Spent a few hours testing it out this weekend and have some thoughts on strengths + weaknesses. It's particularly strong at videos like this where you need to replicate lip sync and body movement. Other tips ⬇️
Wan 2.2 Animate is actually Crazy!! You can replace characters from a simple source image. No need to first frame anymore. It handles facial expressions and body movements like no other model I have ever seen. It is open source and free to use, that's the crazy part!
pretty much the end for dancing influencers lol… wan 2.2 animate can not only copy crazy camera moves, but it literally mimics body moves and.. even facial expressions accurately like honestly… can you even tell which one’s the real video?
omg... it's over... Hollywood has officially been left behind you can swap out any actor from any film in one click using Higgsfield’s Wan Replace, it even works with intense camera motion now, anyone can achieve Hollywood level motion control using AI here’s how to do it:
Just tried Wan2.2-Animate... and HOLY SMOKES, it's PERFECT! 🤯 @Alibaba_Wan
What used to take hours in After Effects now takes just ONE prompt. Nano Banana, Seedream 4, Wan 2.2, Runway Aleph et al are pioneering instruction-based editing -- collapsing complex VFX pipelines into a single, implicit step. Here's everything you need to know in 10 mins:
WAN 2.2とは
革命的なアーキテクチャと映画的品質を持つAlibabaの画期的なMixture-of-Expertsビデオ生成モデル
WAN 2.2はAIビデオ生成技術における量子的飛躍を表し、270億の総パラメータと各ノイズ除去ステップあたり140億のアクティブパラメータを持つ革命的なMixture-of-Experts(MoE)アーキテクチャを導入しています。前身と比較して65.6%多い訓練画像と83.2%多い訓練ビデオを使用し、WAN 2.2は前例のない映画的品質、動きの忠実性、生成効率を実現し、AI駆動のビデオ制作の新しい基準を設定します。
WAN 2.2はAIビデオ生成技術における量子的飛躍を表し、270億の総パラメータと各ノイズ除去ステップあたり140億のアクティブパラメータを持つ革命的なMixture-of-Experts(MoE)アーキテクチャを導入しています。前身と比較して65.6%多い訓練画像と83.2%多い訓練ビデオを使用し、WAN 2.2は前例のない映画的品質、動きの忠実性、生成効率を実現し、AI駆動のビデオ制作の新しい基準を設定します。
WAN 2.2とは
革命的なアーキテクチャと映画的品質を持つAlibabaの画期的なMixture-of-Expertsビデオ生成モデル
WAN 2.2の高度な機能
Mixture-of-Expertsアーキテクチャと前例のない映画的品質を特徴とする、最も強力なAIビデオ生成モデルWAN 2.2の最先端機能を探索してください
Mixture-of-Expertsアーキテクチャ
270億の総パラメータとステップあたり140億のアクティブパラメータを持つ革命的なデュアルエキスパートシステムで、専門化された高ノイズと低ノイズの専門家を使用して最適な計算効率と優れたビデオ品質を実現します。
大規模に拡張された訓練データ
WAN 2.1と比較して65.6%多い画像と83.2%多いビデオで訓練され、照明、構図、カラーグレーディングの詳細なラベルを持つ美的データを含み、映画的な出力を実現します。
強化されたモーション一貫性
滑らかなオブジェクトの相互作用、複雑な身体の動き、流体のカメラ動作による例外的な時間的一貫性を提供し、現実世界の物理学と動力学を正確にシミュレートします。
マルチ解像度サポート
16:9、9:16、1:1、4:3、3:4を含む設定可能なアスペクト比で480pと720pの両方のビデオ生成をサポートし、多様なクリエイティブアプリケーションとプラットフォーム要件に対応します。
柔軟なフレーム制御
8-30 FPSで65-257フレーム(最大5秒)のビデオを生成し、様々なクリエイティブニーズに対してビデオ持続時間と時間的ダイナミクスの精密な制御を提供します。
高度なテキスト-ビデオ生成
強化された言語処理により、詳細なテキストプロンプトを高品質ビデオに変換し、複雑な説明、アクションシーケンス、シーン構成の優れた理解を実現します。
プレミアム画像-ビデオ変換
140億A14Bモデルで静止画像を動的ビデオに変換し、視覚的一貫性を維持しながら静止画像にリアリスティックな動きと時間的深度を追加します。
コンシューマーGPU最適化
NVIDIA RTX 4090および類似のコンシューマーハードウェアで効率的に動作し、エンタープライズレベルの機器なしでクリエイターにプロフェッショナルグレードのビデオ生成を提供します。
高品質映画的出力
強化された視覚的忠実性、リアリスティックな照明、プロフェッショナルなカラーグレーディング、従来のビデオ制作に匹敵する自然なモーションブラーで映画品質のビデオを制作します。
インテリジェントプロンプト処理
高度なプロンプト拡張と安全性チェック機能により、洗練された言語理解を通じてコンテンツの適切性とクリエイティブな意図を維持しながら最適な結果を保証します。
呼び出し可能タスクシステム
組み込まれたタスク呼び出し機能により、保留中または処理中のビデオ生成の取得が可能で、シームレスなワークフロー継続性と効率的なリソース管理を提供します。
オープンソースアクセシビリティ
Apache 2.0ライセンスの下で完全なモデル重みと推論コードが利用可能にリリースされ、研究者と開発者が革新的なアプリケーションのためにこの技術を基に構築することを可能にします。
WAN 2.2 よくある質問
WAN 2.2のMixture-of-Expertsアーキテクチャ、機能、使用方法に関する最も一般的な質問への回答を見つけてください
WAN 2.2をテキスト-ビデオ生成に使用する方法
WAN 2.2の高度なMixture-of-Expertsアーキテクチャと映画的制御を使用して、テキストプロンプトからプロ品質のビデオを作成する技術をマスターしてください
テキストプロンプトを作成
ビデオパラメータを設定
生成と改良
WAN 2.2 画像から動画の使い方
WAN 2.2の高度な画像から動画生成機能を使用して、静止画を映画的な動画に変換する方法を学びます
画像をアップロード
モーション記述を書く
生成とダウンロード
料金
あなたに合ったプランを選んでください。隠れた料金や予期せぬ費用はありません。
年間請求で50%割引