
いま仕事で生成AIを使おうとなれば、やはり「ChatGPT」が第一候補になるだろう。これに含まれている「DALL-E 3」を使ってゼロから画像を生成することもできる。
しかし、よりクリエイティブな世界、例えばPhotoshopやIllustratorといったAdobe製品を活用している人たちは、「Firefly」というAdobeAIを使いこなしているようだ。
ChatGPT、DALL-E 3とAdobeAIは何が違うのか。特に画像生成についての違いは何か。
仕事で画像素材が必要な場合や、デザイン会社などに業務委託して成果物を作ってもらうときなどで実際にAdobe製品を活用する機会がある場合を想定し、ビジネスパーソンとして知っておきたいこれらの特長や認識しておきたいリスクを本記事でまとめた。
■ChatGPT(DALL-E 3)とFireflyのスペック比較
DALL-E 3は入力されたプロンプト(指示文)の理解力が高く、創造性に富んでいる。
一方、Fireflyは商業利用を考慮して著作権リスクを低減しているため、生成される画像の意外性は低いものの、Adobe製品と直接連携できる点が強みである。
またFireflyは無料で試せるがウォーターマークが付き、有料版はプランごとに生成できる画像・動画量である「クレジット」量が異なっている。DALL-E 3のほうは1日2回まで無料で使えるが3回以上使いたい場合は課金が必要である。尚、DALL-E 3が使える類似サービス「Bing Image Creator」で生成した画像は商用利用ができない。
ちなみにPhotoshopでは、アプリを起動してすぐに画像生成AIを呼び出し、画像を出力できる。ChatGPTのような対話型のインターフェイスではないため、壁打ちしたり様々なパターンを思考したりしながらの出力はできない。が参考イメージを読み込ませることはできるので、DALL-E 3でアイディア出し的に出力した画像を使い、Fireflyで生成すればアウトプットの精度がより良くできそうだ。
DALL-E 3とFirefly。実際の出力結果を比較してみた
Fireflyでは、前述のとおりPhotoshopアプリでAI生成した画像をすぐに編集できる。Web版のFireflyでは、図のように生成した画像を直接Adobe Expressに送り、編集作業を続けることができる。彩度調整や文字入力・装飾などをワンストップでできるので作業が捗る。DALL-E 3では生成した画像をダウンロードしてアプリで読みこます分手間がかかる。
またFireflyではAIモデルにGPT系を選択しての画像生成もできるが、商用利用を考えるならばFirefly系のモデルを使った方が、著作権リスクが低い。
同じプロンプトを用いて出力の違いを2ケース調べてみたところ、Fireflyのほうが彩度が高い写真の生成ができた。
●入力したプロンプト1:【ファンタジー風写真:森林内に位置する、苔むした石造りの古橋】
◎生成画像1(上:ChatGPT(DALL-E3)、下:Firefly)
●入力したプロンプト2 :【モダンなキッチンカウンターに置かれた、焼きたてのクロワッサンとコーヒーカップ、浅い被写界深度、写真】
◎生成画像2(上:ChatGPT(DALL-E3)、下:Firefly)
これは雰囲気の評価であり、好みや価値観にもよるが、DALL-E 3の方が「ファンタジー風」や「モダンな」といった指示をより忠実に再現し、かつ創造力を刺激するような仕上がりになっている印象である。独創的に見えるアウトプットを提案してくれることもあるため、ゼロからアイデアを生み出す際の「壁打ち」相手として役立つ。
画像生成プロンプト入力時の工夫方法
ここで、DALL-E 3、Fireflyの利用に関わらず画像生成時のプロンプトのコツをまとめておく。以下にまとめた2つの工夫ができれば、思い描いたイメージに近づけやすくなる。
■画像生成時のプロンプトのコツ
(1)どのような場面の画像を出力したいか具体的に記述する
→写真の被写体・動作・背景・スタイル・雰囲気・構図の指定をできるだけ入れる
(2)出来るだけあいまいな表現は避け、またシンプルに記述する
→助詞(てにをば)の利用を避けて、要素を区切ってつなげたほうがAIは理解しやすい
●良い例
ファンタジー風写真:森林内に位置する、苔むした石造りの古橋
●悪い例
・古い橋、森林、石造り
・ファンタジー風での石造りの古い橋の写真で、森林の中にあって苔むしている
プロンプトを行う際は、著作権リスクについても考えておきたい。Fireflyの学習データが、著作権リスクが無いように工夫されていたとしても、出力画像が偶然に、著作物に似てしまうことは避けられない。
そのため、画像生成AIを使ったときは、以下のようなリスク低減策を行なっておくことが大切だ。
万が一類似の著作物が見つかったときは、プロンプトを書き換えて類似性を落としたり、著作者に許諾を得る必要がある。
・入力に使用したプロンプトや生成日時、「参考用にINPUTした画像」の記録を残す:自ら作った“オリジナリティ”を主張できるようにしておく。
・プロンプトには固有名詞やキャッチコピーを使わない
・Google画像検索やAdobe Stockの類似検索などで検索し、構図や色合いがそっくりなものが無いか探す
結論としては「DALL-E 3 と Fireflyの良いとこ取りをするのが正解!」
FireflyとDALL-E 3は、競合するツールとして比較されがちだが、ビジネスでの利用を考えると相互補完できるツールとしてとらえたほうが、より良いアウトプットが作れるといえる。
具体的には、ChatGPTとDALL-E 3で生成する画像イメージをリサーチして、初期案を作成し、これを参考画像として、Fireflyに文字プロンプトと共に入力し、本番用の写真やイラストなどを生成し仕上げる使い方だ。両方のメリットを理解した上で、上手く活用してもらいたい。
文/久我吉史