本記事では、3月25日に強化されたChatGPT(GPT-4o)の画像生成機能を使って、様々なイラストの作成方法を紹介します。日本語だけで自然に指示でき、幅広い画風・スタイルのカスタマイズも可能です。
OpenAIは2025年3月25日、GPT-4oの画像生成機能を発表しました。
今回のアップデートで、最も大きな進化といえるのが、ネイティブ画像生成に対応したことです。
これまでは、DALL·Eのような外部モデルを呼び出して画像を生成していました。
しかしGPT-4oでは、テキストと画像をひとつのモデルで統合的に理解・生成できるようになりました。
実際にいくつかのパターンを試してみたところ、想像以上に便利で高性能。
使い方次第で、表現の幅が一気に広がります。
本記事では、GPT-4oで画像生成を試した結果をもとに、
どんなことができるのか、どこがすごいのかをわかりやすく整理して解説していきます。
なお、以下記事にてLINEスタンプを簡単に作る方法も紹介しています。
GPT-4oの画像生成、何がすごいの?
【表でサクッと理解】GPT-4oの画像生成ポイントまとめ
項目 | 内容 |
---|---|
✅ ネイティブ画像生成(GPT-4o内蔵) | 最初から画像生成機能を搭載。DALL·Eのように外部モデルを呼び出す必要なし。テキストと画像を同一モデルで理解・生成できるため、精度と一貫性が向上。 |
🎨 特徴的な生成力 | 実用的な画像生成に対応: ・フォトリアル ・イラスト ・インフォグラフィック ・ミーム ・デザイン ・商品画像 特に「文字を含む画像」「複雑な構図」が得意。 例:手書き風レシピカード付きのカクテル画像、高級感ある韓国料理店のメニューなど。 |
🔄 マルチターン対応(会話での画像進化) | 会話を重ねて、キャラクターや背景を一貫して調整可能。 ゲームキャラの成長やシリーズ企画にも対応。 |
📸 具体的な生成指示の例 | ・魔法の標識を読んでいる20代の魔女2人 ・ピクニックでポーカーをする4匹の動物 ・海上を走る1%サイズの馬 |
🧪 誰でも使える? | ChatGPT上でテキストで指示するだけで画像生成が可能。プログラミング不要。 Plus、Pro、Team、Freeユーザーが対象。 |
🎯 カスタマイズ性の高さ | 色指定(#hexコード)、アスペクト比、背景透過なども指示可能。詳細なカスタムに対応。 |
⚠️ 現時点での制約 | ・縦長ポスター画像の端が切れることがある(クロップ) ・多言語(非ラテン文字)に弱い傾向あり ・顔の編集で一貫性が保たれないことがある ・非常に小さな文字はつぶれる場合がある |
OpenAIの公式発表をもとに、画像生成機能の進化ポイントをざっくり表にまとめました。
それでは実際に、新しいGPT-4oの画像生成機能でどのようなことができるのか。
いくつか試してみたので、具体例を交えてご紹介していきます。
誰でも簡単!ChatGPTで漫画が作れる時代に
一番すごいと思ったのはこれです。すごく簡単に漫画が作れてしまいます。今までChatGPTでの画像生成は文字などが入ると、謎の象形文字みたいになってあまり実用性はありませんでした。しかし、今回はかなり高い精度で日本語をイラスト内に入れてくれます(ただし、長いとまだ崩れますのでなるべくシンプルなほうがいいです)。
【手順つき】イラスト漫画の作り方とコツを紹介
セルフレジの使い方を説明するゆるキャラ風カラー漫画を日本語で作成してください。日本語はシンプルで短めにお願いします。
日本語で「漫画」を作成してくださいと指示することでこのようなイラスト漫画を作成することができます。
成功させるコツは「日本語をシンプルに短め」に指定することです。長いと字体が崩れたり謎の言語が生成されます。

キャラの一貫性もOK!連続イラストが作れるようになった
最初にイラストを作ってもらい、そのキャラクターを別の背景で再生成し、さらに別の背景でも展開する――こうした一連の流れが、キャラ設定を維持したままできるようになりました。
今までは一貫性を保ったイラスト生成を行うためにシード値を活用していました。それが、日本語での会話を通じて自然に指示できるようになった点が大きな魅力です。
ラフから完成まで!キャラ性を保ったままカラー化する方法
添付画像をベースにしてカラーのイラストを作成してください
上記のプロンプトで指示することで、ラフスケッチをカラーのイラストにすることができます。


背景だけ差し替えOK!キャラクターを維持した画像生成術
このキャラクターを使ってヨーロッパの街並みを旅しているイラストを作成してください
と指示することで、キャラ性を維持した状態でイラスト生成ができます。後ろ姿も問題なく作成することができます。すごい‥。


キャラクター性を維持しつつ喜怒哀楽の表情を作成する

添付キャラクターの喜怒哀楽の表情のイラストを作成してください。
日本語で指示するだけであっという間に作ってくれます。

写真みたいな画像も一発で!写実イラストが超簡単に
ChatGPTの画像機能の魅力はなんといっても、日本語プロンプトでOKなこと・手軽さ・容易さです。「写真を作って」と指示するだけで高品質な画像が作れるようになりました。
【プロンプト例あり】ChatGPTでリアル写真風イラストを作るコツ
一番のコツは「写真を作って」とシンプルにお願いするのが良さそうです。「今まではフォトリアルに」、「写実的に」など様々なプロンプトで写真に近づけていましたが、そのようなことは不要になりました。
和服をきた銀髪のロングポニーテールの女性が和室で立っている写真を作成してください

このような画像が「写真を作って」と指示するだけで生成されます。
○○風イラストがすごい!画風・スタイルを自在に指定できる
○○風イラストを作ってください
1.元画像 | 2.ドラゴンボール風 | 3.セーラームーン風 |
4.東京喰種風 | 5.ファイナルファンタジー風 | 6.新海誠風 |

1.元画像 | 2.ジブリアニメ風 | 3.名探偵コナン風 |
4.ワンピース風 | 5.ジョジョの奇妙な冒険風 | 6.カイジ風 |

以下のような画風・スタイルがChatGPTの画像機能では生成できるようです。
アニメ・漫画風のイラストもこの通り
- ドラゴンボール風
- BLEACH風
- 進撃の巨人風
- ナルト風
- 鬼滅の刃風
- ジブリ風(例:千と千尋風、もののけ姫風)
- 新海誠風(アニメ映画っぽく)
- 鋼の錬金術師風
- セーラームーン風(レトロ魔法少女感)
- 東京喰種風(ダークで退廃的)
ゲーム風のビジュアルも自由自在
- ファイナルファンタジー風(リアル寄り・幻想感)
- ゼルダの伝説風(トゥーン or ブレスオブザワイルド)
- ペルソナ5風(スタイリッシュ・影強め)
- ポケモン風(カートゥーン調)
- スプラトゥーン風(ポップ&ストリート感)
アート風もいける!有名画家風の表現力
- ピカソ風(キュビズム)
- ムンク風(表現主義)
- 北斎風(浮世絵)
- バロック絵画風
- スチームパンク風
- サイバーパンク風
- ロー・ポリゴン風(3DCGゲームっぽく)
映画・ジャンル風もOK!世界観の再現力がすごい
- ハリーポッター風(魔法学校・クラシカル)
- マッドマックス風(世紀末)
- ディズニー風(ディズニープリンセス風など)
- マーベル風(アメコミタッチ)
以下に普段のイラスト作成に有効な画風のプロンプト集もまとめてあります。今回のChatGPTの画像機能アプデに対応した情報になっていますので、参考になれば嬉しいです。
【GIF対応】アニメっぽい動きも作れるように!
英語プロンプトを使わずに、日本語で指示するだけで簡単にゲーム風のイラストが作れます。そしてそれをスプライトシートにしてGifアニメーションまで作れるようになりました。

ピクセルアートでレトロゲーム風キャラを作る方法
ファンタジーRPGゲームに出てきそうなピクセルアートの女の子のキャラクターを描いてください
日本語で普通に指示するだけで作成することができます。

スプライトシートも生成可能!驚きの画像連携力
先ほど作ったキャラクターのスプライトシートを描いてください。
これも日本語で普通に指示するだけで作成することができます。

GIFアニメもここまできた!動きのある画像を試してみた
このスプライトシートを分解してGIFアニメーションを作成してください。
まだ少し座標がズレて怪しいですが、Gifアニメーションも作ってくれます。このズレはプロンプトの指示で工夫できるかもしれません。
主にY軸方向にズレているのですが、バウンディングボックスの取得→キャンバス中央揃え→意図的なYオフセット調整をChatGPTに指示してみましたが、変化がありませんでした。この辺りはまだ機能の限界なのかもしれません。対策がもし分かりましたら追記する予定です。
コントロールネットの代替として使う・ポーズ抽出機能

1枚目の添付画像のキャラクターに2枚目の添付画像の動きを付けてイラストを作成してください。
これでポーズ抽出が可能です。Stable DiffusionのControlNet(コントロールネット)っぽいことができます。


1枚目の添付画像のキャラクターに2枚目の添付画像の動きを付けてイラストを作成してください。
……なるほど(笑)
……便利ですね。

まとめ:ChatGPTの画像機能を使ってみての感想
今回のChatGPTの画像生成機能は、AIによるビジュアル制作のハードルを大きく下げたと感じています。
英語プロンプトを使わなくてもOK。
誰でも、言葉だけでアイデアを視覚化できるようになりました。
しかも対応しているスタイルは、漫画・イラスト・写真・アニメーションと非常に幅広いです。
たとえばこんなふうに、ざっくりした指示でもしっかり形にしてくれます。
- 「こういう世界観のキャラを作りたい」
- 「この資料に合うイラストがほしい」
- 「雰囲気だけ伝えて画風を変えてみたい」
以前から、GPT-4oは“空気を読むような文章生成”が得意でしたが、
画像生成でも同じように、こちらの意図を汲んで再現してくれる感覚があります。
一方で、惜しかったのはGIFアニメーションの部分。
おそらく、もう少しプロンプトを工夫すれば、しっかり動くものが作れると思います。
ただ現時点では、「日本語で一発」というレベルにはまだ届いていませんでした。
とはいえ、これは時間の問題かもしれません。
近いうちに、「このキャラでGIFアニメ作って」と言えば、完璧なものが返ってくる未来が来ると思います。
おそらく、1年もかからず実現しているのではないでしょうか。
また、画風についても、従来のDALL·Eとはかなり違いがあります。
今後は、GPT-4oでどこまで多彩なアート表現が可能なのかをさらに試していきたいと思います。
最後まで読んでいただき、ありがとうございました。
本記事の情報が役に立つと嬉しいです。
また、それ以外にもGPT-4oを使った様々な画像生成テクニックがあります。


コメント