AIと共に創る異世界:Stable Diffusionで描く「異星人の都市」制作秘話

異星人の都市
当ページのリンクには広告が含まれています。
目次

AIと共に創る異世界:Stable Diffusionで描く「異星人の都市」制作秘話

AIアート生成は、創造性を刺激する魅力的な分野です。デジタルツールが、私たちの想像力をかつてない形で視覚化する手助けをしてくれます。この記事では、私がAI画像生成ツール「Stable Diffusion」を用いて、ユニークな「異星人の都市」の画像を生成したプロセスを段階的にご紹介します。

今回のテーマ設定の背景には、単なる空想の風景を描きたいというだけでなく、個人的なインスピレーションがありました。それは、私が日頃サイクリングで目にする地元・下関市の自然と産業が織りなす風景の対比と、1/72や1/700スケールの模型製作に適した緻密なデザインをAIアートで表現したいという思いです。以前の記事でStable Diffusionの環境設定については触れていますので、ここではプロンプトエンジニアリングの過程に焦点を当てます。

プロンプトエンジニアリング:アイデアを洗練させる旅

AIイラスト生成の鍵を握るのが「プロンプトエンジニアリング」です。AIに何をどのように描いてほしいかを、言葉で的確に伝える技術と言えるでしょう。今回の「異星人の都市」制作における、プロンプトの変遷と思考プロセスをご覧ください。

  • ステップ1:最初のアイデア
    • 思考プロセス: まずは基本的なコンセプト「先進技術を持つ異星人の都市」をAIに伝えます。具体的すぎず、AIの解釈に幅を持たせることを意図しました。
    • プロンプト (英語): alien city with advanced architecture and technology
    • 結果と課題: 興味深い画像が生成されましたが、全体的にぼんやりとしており、特にスケールモデルとして再現するにはディテールが不足していました。深みや独自性ももっと欲しいところです。
  • ステップ2:スタイルの明確化とディテールの追加
    • 思考プロセス: より具体的で視覚的に印象的な画像を目指し、プロンプトエンジニアリングのガイド(例: Stable Diffusion prompt: a definitive guide)を参考にスタイルと要素を追加。「hyper-realistic(超写実的)」なスタイルを指定し、「crystalline spires(水晶の尖塔)」や「glowing energy conduits(光るエネルギー導管)」といった特徴的な要素、「cinematic lighting(映画的な照明)」でドラマ性を加えました。
    • プロンプト (英語): hyper-realistic alien city with crystalline spires and glowing energy conduits, futuristic architecture, cinematic lighting
    • 結果と課題: 未来的な雰囲気は格段に向上しましたが、依然として細部が潰れがちで、小さなスケールモデルにした際の視認性に課題が残りました。
  • ステップ3:個人的なインスピレーションの融合
    • 思考プロセス: 画像に独自性と個人的な物語を与えるため、私のインスピレーションの源である下関の風景を取り入れることにしました(風景プロンプトの参考: 55+ Best Stable Diffusion Landscape Prompts)。夕暮れ時の岩場の海岸線(Shimonoseki’s rocky shore at dusk)と、そこに浮かぶ漁船(fishing boats)を背景に設定。異質な要素の対比によって、ユニークな世界観を狙います。
    • プロンプト (英語): hyper-realistic alien city with crystalline spires and glowing energy conduits, floating above Shimonoseki’s rocky shore at dusk, fishing boats in the background, dramatic lighting
    • 結果と課題: 下関の風景と異星の都市が融合し始め、面白い対比が生まれました。しかし、下関の港湾風景をより反映させるために、産業的な要素がもう少し欲しいと感じました。
  • ステップ4:背景要素の追加と視覚効果の強化
    • 思考プロセス: 下関らしさを加えるため、港でおなじみの「industrial cranes(産業用クレーン)」を背景に追加。さらに、都市の先進性を視覚的に際立たせるため、「neon reflections on water(水面のネオン反射)」という要素を加え、光の効果を豊かにしました。
    • プロンプト (英語): hyper-realistic alien city with crystalline spires and glowing energy conduits, floating above Shimonoseki’s rocky shore at dusk, fishing boats and industrial cranes in the background, neon reflections on water
    • 結果と課題: 全体のバランスが良くなり、都市の雰囲気も向上しました。しかし、当初の目標である「模型製作に適したディテール」という点では、まだ改善の余地がありました。
  • ステップ5:スケールモデルを意識した詳細化
    • 思考プロセス: 模型製作、特に1/72スケールでの再現性を考慮し、より詳細な描写をAIに要求する必要がありました。模型コミュニティ(例: r/StableDiffusion on Reddit)での議論も参考に、「highly detailed for 1/72 scale model」という具体的な指示を追加しました。これにより、細部の構造や質感が明確になることを期待します。
    • プロンプト (英語): hyper-realistic alien city with crystalline spires and glowing energy conduits, floating above Shimonoseki’s rocky shore at dusk, fishing boats and industrial cranes in the background, neon reflections on water, highly detailed for 1/72 scale model, dramatic lighting
    • 結果と課題: 水晶の尖塔の細かな形状やエネルギー導管の輝きなど、ディテールが大幅に向上。模型キットのデザインとして十分な情報量を持つイメージに近づきましたが、全体的な画像の品質、特にノイズや不要な要素の排除にもう一工夫欲しいところです。
  • ステップ6:最終調整(ネガティブプロンプトと解像度指定)
    • 思考プロセス: 画像の品質を最終的に高めるため、望ましくない要素(ぼやけ、低品質、カートゥーン調、不自然な形状など)を生成しないよう指示する「ネガティブプロンプト」の重要性を学び(参考: Stable Diffusion prompt: a definitive guide)、これを追加。さらに、出力画像のサイズ(1024×1024 pixels)も指定し、クリアで高解像度な結果を目指しました。
    • 最終プロンプト (英語):hyper-realistic alien city with crystalline spires and glowing energy conduits, floating above Shimonoseki’s rocky shore at dusk, fishing boats and industrial cranes in the background, neon reflections on water, highly detailed for 1/72 scale model, dramatic lighting, 1024x1024 pixels, negative prompt: blurry, low detail, cartoonish, extra limbs
    • 結果: これにより、ディテールが豊富でクリア、かつ意図しない要素が排除された、模型製作のインスピレーション源としても最適な画像が完成しました。

完成したAIアート:アイキャッチ画像に込めた想い

そして、この練り上げられた最終プロンプトによって生成されたのが、まさにこの記事の冒頭を飾るアイキャッチ画像です。

ご覧ください。下関の夕暮れの海岸線に浮かぶ、水晶のような尖塔と光るエネルギーラインを持つ異星の都市。背景には漁船と産業クレーンが共存し、水面には都市のネオンが反射しています。1/72スケールモデルとしても魅力的なディテールが、この画像には凝縮されています。私の個人的なインスピレーションと、AIの持つ表現力が融合した結果と言えるでしょう。

まとめと今後の展望

今回の制作プロセスは、AIアートにおけるプロンプトエンジニアリングの重要性を改めて教えてくれました。シンプルなアイデアから出発し、スタイル、設定、ディテール、そしてネガティブプロンプトといった要素を段階的に調整・追加していくことで、具体的で、かつ個人的な想いを反映した複雑なイメージを創り出すことが可能です。

特に、地元の風景という個人的な要素をプロンプトに組み込むことで、ありふれたテーマに独自性を与え、より愛着の湧く作品を生み出すことができました。これは、AIという技術と、個人の経験や感性を融合させる試みの一例です。

AIアートの可能性は、プロンプト一つで無限に広がります。この記事が、皆さんがAIアートの世界を探求し、ご自身のアイデアやインスピレーションを形にするための一助となれば幸いです。ぜひ、AIとの対話を楽しむように、様々なプロンプトを試してみてください。

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

山口県下関市に住む30歳のフリーランスデザイナーです。地元の大学でグラフィックデザインを学び、東京で広告業界での経験を積んだ後、2020年に下関に戻りました。趣味は写真撮影とサイクリングで、自身のスマートホーム実践記録を中心に、IoT技術の基本から最新トレンドまで、地域に根ざした視点から、下関市ならではの生活課題へのテクノロジー活用事例も紹介していきます。

コメント

コメントする

CAPTCHA


目次