
巷ではChatGPTの画像生成機能を活用してジブリ風イラストやビックリマンシール風イラストを作成する方法が話題になっています。
こうしたブームを機にChatGPTの画像生成に興味を持った人も多いでしょう。しかし、いざ実際に自分でやってみると簡単そうに見えて意外と難しい。思ったような画像が全然生成されずに「惜しいんだけど、なんか違うんだよなあ…」とモヤモヤ感を抱えることも少なくありません。
実はこれ、とあるテクニックを使うだけで解決できるんです。
伝わらない原因、その答えは「言語」にあるかも
ChatGPTで画像をうまく生成するための「たった一つのコツ」。
それは、「プロンプト(指示)を英語で書くこと」です。
え、それだけ?…と思うかもしれませんが、本当にそれだけなんです。
理由はシンプル。ChatGPTの学習データの差にあります。ChatGPTは英語での学習量が圧倒的に多く、その結果、「英語のテキスト」と「画像」を結びつけた学習も豊富に行われています。
例えば、bright room(明るい部屋)という英語表現は、AIが何万回も画像と一緒に学習しているため「bright roomなら、こういう画像を求めているんだよね!」という共通認識が精度高く備わっているんです。
つまり、英語の方が1on1で“言葉とビジュアル”が直結しやすく、言葉に対する解像度が非常に高いんです。
一方で、日本語の理解自体はかなり進化していますが「日本語テキスト → 画像」の変換精度はまだ不十分。「明るい部屋?明るい部屋ってどんな画像のことだろう…」とAIが日本語で「どんな絵を求めているのか」をまだうまく捉えきれていません。
特にAIは「雰囲気」・「スタイル(~風)」・かわいい、おしゃれなどの「主観的形容詞」、「構図・視点」などの理解は苦手と言われています。
英語で書けない?そのときこそChatGPT
でも「英語でプロンプトを書くなんて無理…」と私を含め多くの方が思うでしょう。
そういうときこそ、ChatGPTにこう頼めばいいんです。
このプロンプトを英語に翻訳して。
「(日本語のプロンプト)」
と。すると、AIが自然な英語に翻訳してくれます。あとはその英語プロンプトをテキストボックスに貼り付けて画像生成をするだけ。たったこれだけで、あなたのイメージ通りの画像生成にグッと近づくはずです。
いま、ChatGPTの無料ユーザーは1日の画像の生成枚数が限られています。的確なプロンプトを出せるかどうかは非常に重要です。
注意して欲しいのは、英語のプロンプトを使えば必ず思い通りの画像を生成できるわけではないということ。あくまで「私とAIとの認識のズレを減らすためのテクニック」ということをお忘れなく。
文/峯亮佑