ideogram.aiとは
私がStable Diffusionなどの画像生成AIを使う最大の用途は表紙画像の生成です。小説のテーマと関連し、しかもターゲット読者層の興味をひきつける画像を生成するため、小説を出版するたびに毎回百枚近い画像をStable Diffusionなどを使って生成し、その中からベストのものを選びます。
選んだ画像を更にAdobe Photoshopで手を加えたり、複数の画像を組み合わせたりして、Adobe Illustratorで文字と画像を配置して表紙デザインを作成します。
その際に意外に苦労するのが文字と画像のバランスです。基本的にテキストは縁をつける(袋文字)にすることで、背景となる画像と文字が同色・同輝度にならないようにしたいところですが、毎回それに苦労します。
もしAIがテキストを含む画像を生成してくれれば、表紙画像の作成が非常に簡単になるのですが……。
そんな問題を解決してくれそうなAIが現れました。2023年8月22日に立ち上げられたIdeogram.AIです。同社ウェブサイトによると、テキストを含む画像を生成するだけではなく、以下の通り書かれていました(DeepLで翻訳。)
当社の設立チームは、グーグルブレイン、カリフォルニア大学バークレー校、CMU、トロント大学で革新的なAIプロジェクトを率いてきた世界的に有名なAIの専門家で構成されています。私たちのAIにおける基本的な仕事には次のようなものがあります:
- デノイジング拡散モデル
- Imagen: Googleのテキスト画像合成システムImagen
- ビデオ合成のためのImagen Video
- 音声合成のためのWaveGrad
- ニューラル音声認識
- ニューラル機械翻訳
- 視覚表現学習のための対照学習
- 生成的敵対的模倣学習
とにかく使ってみましょう
https://ideogram.ai にアクセスし、Googleアカウントでサインインすると、ChatGPTやBardのようなシンプルな入力画面になりました。入力欄に以下のように入力しました。
質問:Create cover of “Love Over A Hundred Years” a scifi romance novel written by “Aimu A.I.”
サイエンスフィクションのロマンス小説である「百年の恋」の英語版の表紙を作成してほしいという要求です。これに対して、以下のような返事が返ってきました。
一発回答としてはよくできています。彼らはサイエンスフィクション・ロマンス小説の表紙とはどのようなものであるべきかを熟知しており、また文字が画像に溶け込まずに際立つ方法を心得ているようです。但し、文字には不正確な部分があり、3回試行して生成された12枚の表紙デザインでそのまま使用可能なものは2つだけでした。
いずれにしても現時点では「商用利用は不許可」と書いてあるので、ideogram.ai で生成したデザインをそのまま使うことはできません。私としては画像と文字の配置、文字の色と縁取り、全体の雰囲気を教えてくれるので、最良のものを参考にして(真似て)表紙画像をデザインすることができます。
本の表紙デザインの場合は一般的に多くの文字を配置する必要があるので ideogram.ai にとっても難しいのでしょうが、簡単なテキストを1~2行入れるだけなら、一発で完璧な画像を生成することも可能です。テキストプロンプトに対する画像の的確さという点では最新のStable Diffusion XL 1.0と同等に優秀という印象でした。
商用利用の問題については、そのうち許可されるか、有料版のみ許可されるようになるのではないかと期待しています。
便利なツールを提供してくれた Ideogram.ai に感謝しています。