
本記事では、Grok ImagineでI2Vを活用し、キャラクターの動作やカメラワークを自在に指示する方法をわかりやすく解説していきます。
Grok Imagineは、無料で使える画像・動画生成AIです。
Sora 2と並んで、いまSNS上でもかなり話題になっていて、わたし自身も気づけばハマってしまいました。
特徴のひとつが「Spicyモード」。これは、いわゆるNSFW(センシティブ表現)も扱えるモードで、この自由度の高さが注目されています。そして、「無料でここまでできるのか…!」と驚くくらいの性能です。
中でも、Grok Imagineの動画生成機能がとても優秀で、I2V(画像→動画)形式で、アニメ風から実写っぽいものまで幅広く生成できるのが魅力です。
実際に使ってみた感想としては、
…といった感じで、あまりにも楽しくて、つい課金までしてしまいました。
今回の記事では、特に「カスタムモード」に注目します。
このモードでは、自分でプロンプトを組み立てて、動画を思い通りに生成していくことができます。
たとえば、
「最初に歩く」→「笑顔になる」→「手を振る」といった動作を順番に実行させたり、
途中で「顔にズームイン」するといったカメラワークの指示も、きちんと反映してくれるんです。
こうしたことができると分かってからは、もう完全に楽しくなって、時間が溶けています‥‥。
というわけで、Grok Imagineで動画を生成するためのプロンプトの書き方やコツについて、これまで試してきたことをまとめてご紹介していきます。
ちなみに、Grok Imagineをまだ触ったことがない方には、
下記の記事で「どこから使えばいいのか」「どう指示すればいいのか」をプロンプトごと紹介しているので、よければそちらもぜひ活用してください。
Grok Imagineでキャラクターを動かす基本プロンプトの使い方
それでは、まずキャラクターを動かすための基本的なプロンプト指示から見ていきましょう。
キャラクターの動かし方を解説しながら、まずは再現性が高く、最初に試しやすい動作系プロンプトを紹介していきます。
これらを実際に触ってみると、Grok Imagineでの動画生成の流れが自然とつかめてくるはずです。

カスタムモードで動画を生成する場合は、入力欄に直接プロンプトを書き込んでいきます。
以前は少し違うデザインでしたが、最近のアップデートでUIがより分かりやすくなりました。
ためしに「reaching towards viewer(カメラに手を伸ばす)」と入力してみましょう。

その後、「動画を作例」を選択すると、動画生成が始まります。おおよそ10秒ほどで処理が完了し、すぐに結果が表示されます。
生成された動画を見ると、指示通りの動作がしっかりと再現されているのが分かります。どんな仕上がりになったか、ぜひ確認してみてください。
よく使う動作プロンプト一覧
以下に、立ち絵キャラクターの動作指示として使いやすいプロンプトをいくつか紹介します。
内容 | プロンプト |
---|---|
カメラに手を伸ばす | reaching towards viewer |
カメラに向かってあるく | walking at viewer |
横を向いてもらう | profile view shot |
後ろを向いてもらう | facing away shot, from behind shot |
ジャンプする | jumping |
しゃがむ | squatting |
宙に浮く | flying, midair |
これらのポーズ系プロンプトは、画像生成AIで使われる指示をそのまま動画生成にも活用できるのが特徴です。
さらに、下記の記事では多様なポーズのプロンプトをより詳しく紹介しています。動画生成の練習にも役立つ内容なので、ぜひ参考にしてください。
Grok Imagineで複数の動作を順番に再生するためのプロンプト
続いて、複数の動作を連続して実行させるプロンプトの書き方について紹介します。
まずは、以下の作例を見てみてください。
これは、いくつかの動作を順番に組み合わせて指示し、動画を生成したものです。
ざっくりと、以下のような動作を順番に指示しています。
「歩いて近づく」「カメラを首を傾けて覗き込む」「ズームイン」「笑顔」「ズームアウト」「踊る」「後ろを向く」
これらすべてが、指示した通りの順番でしっかりと再現されました。
このように、複数の動作を連続して実行させるためのプロンプトの書き方について、ここから詳しく解説していきます。
licking candy, and then, closed eyes, hand on own cheek
内容 | プロンプト |
---|---|
複数の動作を繋げる | and then |
わたしが試していて、一番手軽に動作をつなげられた方法がこちらです。
今回は、「licking candy(キャンディーを舐める)」という動作から、「closed eyes, hand on own cheek(目を閉じて、頬に手を当てる)」という動作へ、and then を使ってつないでいます。
とてもシンプルですが、これだけでしっかり動作の連続性を表現できます。
「and then」を使えば、3つ以上の動作を順番に繋げることも可能です。
動作を区切りながら自然な流れで指示できるので、とても便利な構文です。
licking candy, and then, closed eyes, hand on own cheek, and then, head tilt, open eyes
前回の動画に、さらに「and then, head tilt, open eyes」という動作を加えてみました。
つまり、
キャンディーを舐める → 目を閉じて頬に手を当てる → 目を開けて顔を傾ける
という3つの動作を、順番に実行しています。
実際に試してみたところ、動作の再現性も安定していて、特に破綻もなく自然な仕上がりになりました。
ここからは、「and then」でつなげることで自然な流れになる、おすすめの動作組み合わせをすぐに使えるプロンプトと一緒にいくつか紹介していきます。
どれも日常的な仕草や流れを想定しており、カスタムモードのテストにも使いやすい組み合わせです。
holding skirt edge, and then, turning around
スカートの裾をつまんで、くるりと回る
picking up flower, and then, smelling it
花を拾ってから、香りを嗅ぐ
putting hand on chest, and then, nodding slightly
胸に手を当てて、小さくうなずく
このように、ちょっと複雑な動作もしっかり再現してくれます。
looking at phone, and then, turning the phone around to show its screen with an SNS feed to the viewer
Grok Imagine、ほんとうにすごいですよね。
これは「スマホを操作したあと、画面をこちらに見せる」という動作なのですが、英文でしっかり意図を書けば、ちゃんとスマホを裏返して画面を向けてくれました。
‥‥可愛いです。
このような「A and then B」の構文を使った、自然な動作のペアをいくつかまとめてみました。どれも日常的な流れの中で使える組み合わせばかりで、カスタムモードのテスト用プロンプトとしてもぴったりです。
以下に表で紹介しますので、ぜひ参考にしてみてください。
I2V向けの自然な動作組み合わせプロンプト一覧
事前に動作の開始となる元画像を用意してから表のプロンプトを使うイメージです。
動作の流れ・意味 | プロンプト例 |
---|---|
微笑んでから手を振る | smiling, and then, waving hand |
周囲を見回して、何かに気づく | looking around, and then, noticing something |
歩いてから立ち止まり、微笑む | walking forward, and then, stopping and smiling |
目を閉じて深呼吸する | closing eyes, and then, taking a deep breath |
首を傾けて、やさしく笑う | tilting head, and then, laughing softly |
下を向いてから視聴者を見上げる | looking down, and then, looking up at viewer |
髪に触れてから恥ずかしそうに微笑む | touching hair, and then, smiling shyly |
手を上げてから前を指さす | raising hand, and then, pointing forward |
カップを飲んでから、ホッと息を吐く | drinking from cup, and then, exhaling with relief |
スマホを見てから、くるっと回してSNS画面を視聴者に見せる | looking at phone, and then, turning the phone around to show its screen with an SNS feed to the viewer |
スカートの裾をつまんで、くるりと回る | holding skirt edge, and then, turning around |
傘を持ってから、空を見上げる | holding umbrella, and then, looking up at sky |
花を拾ってから、香りを嗅ぐ | picking up flower, and then, smelling it |
髪をかき上げてから、やさしく微笑む | brushing hair aside, and then, smiling gently |
帽子を整えてからウィンクする | adjusting hat, and then, winking |
キャンディを舐めてから、目を閉じて頬に手を添える | licking candy, and then, closed eyes, hand on own cheek |
本を読んでから、顔を上げて微笑む | reading book, and then, looking up and smiling |
髪に風を受けて、静かに目を閉じる | catching wind in hair, and then, closing eyes peacefully |
プレゼント箱を持って、ゆっくり開ける | holding present box, and then, opening it slowly |
胸に手を当てて、小さくうなずく | putting hand on chest, and then, nodding slightly |
Grok Imagineの動画生成にカメラアングルとカメラワークを組み込む方法
それでは次に、動作をつなぐ「and then」のプロンプトに、カメラアングルやカメラワークの指示も組み合わせてみましょう。
ここでは、以前紹介したグラビアアイドルのポーズをベースにしたAIイラストを使って、具体的なプロンプト例をいくつか紹介していきます。
ポーズに合わせてズームインするプロンプト例
standing, and then, arms at sides, looking back, zoom in on the face, and then , one eye closed
こちらは、グラビアアイドル風の一連の動作をプロンプトで指示した例です。
膝立ちの座りポーズ(元画像)から立ち上がり、後ろを向いて振り返り、最後にウィンク。そこにさらに、「zoom in on the face(顔にズームインする)」というカメラワークの指示を加えています。
ほんとうに、簡単にプロンプトを書くだけでしっかり再現してくれるのが驚きです。
基本の考え方としては、前の章で紹介したように、「and then」で動作を順に追加していき、その合間にカメラの指示を入れるという構成になります。
ちなみに、動画生成AIで使えるカメラワークのプロンプトを、以下の記事で詳しく紹介しています。
寝ポーズをオービットショットで映すプロンプト例
orbit shot around the heroine, and then, smile and waving
「orbit shot around the heroine」は、キャラクターを中心にしてカメラがぐるりと回り込むように映す手法です。
今回は、そこに「笑顔で手を振る」という動作を組み合わせたプロンプト構成になっています。
実際に生成された映像を見ると、カメラワークも含めてしっかり再現されているのが分かります。
カメラを右にパンして別キャラクターを映すプロンプト例
The camera pans right slowly, revealing a black-haired ponytail girl standing. and then, black-haired ponytail girl is smiling and waving
「camera pans right slowly」は、カメラをゆっくり右に移動させる(パンする)という指示です。
続く「revealing a black-haired ponytail girl standing」で、黒髪ポニーテールの女の子が画面に映り込む流れを作っています。
さらに、その女の子が笑顔で手を振っているという状態までを一つのプロンプトで表現しています。
ここまで細かく制御できるのはすごいですね。しかもこの黒髪の女の子は、元の画像には登場していないキャラクター。それでもGrok Imagineが絵柄や文脈を読み取って、新たに自然なキャラを描いてくれています。中々に便利です。
ちなみに、グラビアアイドルのポーズを再現するプロンプトを以下で詳しく紹介しています。結構好評な記事なので、興味のあるかたはぜひご覧になってください。
まとめ
今回は、Grok Imagineを使ってキャラクターを自然に動かすためのプロンプトの書き方や、「and then」構文を活用した動作の連続指示、さらにカメラワークの組み込み方法まで、動画生成に役立つ具体的なテクニックを一通り紹介してきました。
特に、カスタムモードを使えば、複数の動作を順番に指示したり、ズームやパンといったカメラアングルも思い通りに加えることができます。
実例を見ながら少しずつ試していくことで、Grok Imagineの動画生成の幅がどんどん広がっていく感覚がつかめてくると思います。
複雑なようで、実はどれもシンプルで簡単なので、ぜひ本記事のプロンプトを活用して遊んでみてください。

最後まで読んでいただき、ありがとうございました。