CodexでAIイラストを出力してみる
ゴールとしてはキャラクターデザインをして、背景と組み合わせて一枚絵を仕上げるところまで。 一般的な絵を描くときの手順をcodexに伝えたらできるかという実験。
著作権的なこともあるのでプロダクトとして最終出力を提出するのはどうかなぁという立ち位置ではある。 ワークフローに組み込むのはありだとは思う。もちろん、個人で楽しむ分にはどうぞご自由に。
キャラデザ
キャラデザではキャラクターの設定を粗く決めてからAIと壁打ちしながら固めていって雑に出力してみる。 一発出しだと見てわかるようにはちゃめちゃなパースなんだけどここで注目すべきはキャラクターなのでこれでいいとする。
そしたら次は服装を何個か描かせて実際使うものを選択する。 選択した服装で何個かポーズを取らせてみるところまで。
以下、実際のセッション
画像の生成はできますか?
はい、できます。 「こんな雰囲気で」「この用途で」「このサイズ感で」などを教えてくれれば、画像を生成できます。
例えば:
- 写真風の人物・風景
- イラスト、漫画風、絵本風
- ロゴ案やアイコン案
- Webサイト用のビジュアル
- ゲーム用の背景や素材
- 既存画像の編集・スタイル変換
作りたい画像の内容をそのまま日本語で送ってください。
まず粗くキャラクター設定考えるので壁打ちしてから画像を作りたい いま決まっているのは以下
- 銀髪
- ロングヘア
- 女子中学生
いいですね。まずは「銀髪ロングの女子中学生」を、絵にしたとき一発で記憶に残る方向へ寄せたいです。
今の要素だけだとかなり王道なので、次に決めると強いのはこのへんです。
- 銀髪の理由:地毛、遺伝、病弱さ、異世界由来、実験、家系のしるし、本人も謎
- 性格の温度:無口、天然、強気、優等生、孤独、皮肉屋、好奇心旺盛
- 学校での立ち位置:転校生、図書委員、保健室常連、部活のエース、浮いているけど人気
- 象徴アイテム:月のヘアピン、黒いリボン、古い鍵、スケッチブック、イヤホン、天体ノート
- 画面の雰囲気:透明感、儚い、少し不穏、青春、幻想、日常寄り
たとえば方向性はこんな感じ。
案A:月明かり系の静かな転校生 銀髪ロング、無口で成績優秀。昼休みは図書室か屋上にいる。月のヘアピンをしていて、夜空や天体に詳しい。透明感が強く、少し近寄りがたい。
案B:日常に紛れた不思議ちゃん 本人は普通にしているつもりだけど、銀髪のせいで目立つ。ゆるいカーディガン、長い前髪、ノートに変な観察記録を書いている。会話のテンポが独特。
案C:強気な優等生タイプ 銀髪ロングを黒リボンでまとめる、きっちりした制服。学級委員っぽいけど、実は負けず嫌いで不器用。目つきは少し鋭め。凛とした印象。
案D:少しファンタジー寄りの保健室少女 肌が白く、銀髪が光を拾う。体育は苦手で保健室にいることが多いが、植物や薬草に詳しい。現代の制服に、どこか異世界っぽい小物が混ざる。
個人的には、まず 「銀髪の理由」 と 「性格の温度」 を決めると一気に形になります。 現代日常寄りにしますか? それとも少しファンタジー・不穏寄りにしますか?
案Aでキャラクターの細かい仕様を詰めたい
いい、案Aはかなり絵にしやすいです。 「月明かり系の静かな転校生」は、透明感・距離感・少しだけ秘密がある感じを軸にすると強いです。
まず仮で仕様を組むなら、こんな方向がよさそう。
キャラクター案:月白の転校生
- 年齢:14歳、中学2年生
- 立ち位置:春に転校してきたばかり。成績はかなり良いが、友達は少ない
- 性格:静かで丁寧。人を拒絶しているわけではないが、感情表現が小さい
- 印象:近寄りがたいほど綺麗、でも話すと少し抜けている
- 髪:腰近くまである銀髪ロング。光に当たると淡く青白く見える
- 目:淡い青、または薄紫。月光っぽい無機質さ
- 肌:色白。病弱ではないが、日差しより夜が似合う
- 制服:紺系セーラー服か、落ち着いたブレザー。清潔感重視
- 象徴アイテム:小さな三日月のヘアピン、または銀色の星形チャーム
- よくいる場所:図書室、屋上、放課後の理科室、夕方の渡り廊下
- 趣味:天体観測、古い星図を見ること、月の満ち欠けの記録
- 秘密:夜になると髪や瞳がわずかに明るく見える、という噂がある
絵にするなら、特に強いビジュアルはこれです。
見た目の核 銀髪ロング + 淡い青い瞳 + 三日月ヘアピン + 紺の制服 + 夕暮れ/夜の光。
この子をもう少し尖らせるなら、次に決めたいのは3つです。
-
月要素をどれくらい強くするか 日常寄りなら「月のヘアピンと天体ノート」くらい。 ファンタジー寄りなら「月光で髪が淡く光る」「本人の出自に謎がある」くらい。
-
表情の方向 無表情に近いクール系か、少し寂しそうな儚い系か、静かに微笑む神秘系か。
-
制服の種類 セーラー服だとクラシックで月・夜・文学っぽい。 ブレザーだと現代的で上品、転校生感が出しやすい。
僕のおすすめは、日常7:幻想3くらいです。 「現実の学校にいそうだけど、どうしても少しだけ普通じゃない」くらいが一番引きがある。
- 月要素は日常より
- 無表情で眠そうな感じ
- セーラー服
かなり見えてきました。 方向性としては 「現実の学校にいるけど、月の気配だけをまとっている眠そうな転校生」 ですね。
暫定キャラ仕様
- 年齢:14歳、中学2年生
- 髪:銀髪のロングヘア。腰あたりまで長い。さらさらで、少しだけ寝ぐせっぽいゆるさがある
- 前髪:目に少しかかる長め前髪。眠そうな印象を強める
- 目:淡い青灰色か、薄いラベンダー。半目気味
- 表情:ほぼ無表情。ぼんやり眠そうで、感情が読みにくい
- 制服:紺色のセーラー服。白い襟線、落ち着いたリボンかスカーフ
- 月要素:小さな三日月ヘアピン、天体ノート、月の満ち欠けが描かれたしおり程度
- 雰囲気:静か、透明感、少し近寄りがたい。でも怖くはない
- よくいる場所:図書室の窓際、夕方の廊下、放課後の屋上前
- 性格:口数が少ない。返事が少し遅い。眠そうだが観察力は鋭い
- 癖:話しかけられると一拍置いてから相手を見る。月を見ると少しだけ表情がやわらぐ
個人的には、目の色は 青灰色 が合いそうです。薄紫だと少しファンタジー感が増えるので、日常寄りなら青灰色のほうが自然。
次に詰めるならこの3つです。
-
髪型の細部 完全ストレート / 毛先だけゆるく波打つ / 片側だけ耳にかける
-
セーラー服の配色 紺×白×黒リボン / 紺×白×青スカーフ / 黒寄りセーラー×白ライン
-
最初の画像の場面 図書室の窓際 / 夜の屋上 / 夕暮れの廊下
僕のおすすめ初期案は、片側だけ耳にかけた銀髪、紺セーラーに黒リボン、図書室の窓際です。日常感がありつつ、月っぽい静けさが出ます。
片側だけ耳にかけた銀髪、紺セーラーに黒リボン、図書室の窓際
いいです。かなり芯が固まりました。
この子は 「眠そうな月白の図書室転校生」 という感じですね。日常寄りだけど、見た人が「この子、何か秘密ありそう」と思うくらい。
キャラクター仕様・現時点
- 銀髪ロング、腰近くまであるさらさら髪
- 片側だけ耳にかけていて、小さな三日月ヘアピンが見える
- 長めの前髪、半目気味で眠そう
- 目は淡い青灰色
- 表情は無表情に近いが、冷たいよりはぼんやり
- 紺色のセーラー服、白い襟ライン、黒リボン
- 図書室の窓際に座っている
- 机には天体ノートか、月のしおりを挟んだ本
- 背景は放課後の柔らかい光。窓から月が見えると少し幻想寄り、夕方の光なら日常寄り
画像化するなら、最初はこういう構図がよさそうです。
初回生成案 図書室の窓際、机に頬杖をつかずに静かに座っている。視線は少しだけこちらを見るけど、眠そうで感情が読めない。銀髪の片側を耳にかけ、三日月のヘアピンが小さく光る。紺セーラー服に黒リボン。机の上に開いた本と天体ノート。
次に決めるなら 絵柄 です。 おすすめは 透明感のあるアニメ調。リアル寄りより、このキャラの静けさがきれいに出ます。 その方向で1枚目を作ってみますか?
身長とか体重とか体型も決めたい
いいですね。ここはかなり大事です。絵にするときのシルエットが決まります。
女子中学生なので、性的に寄せずに 年相応・細身・静かな存在感 で設計するのが合いそうです。
体格案
- 身長:155cm前後
- 体重:42kg前後
- 体型:細身。華奢だが病的ではない
- 姿勢:少し猫背気味。眠そうなので背筋が完璧ではない
- 肩幅:やや狭め
- 手足:細く長め。指がきれいで、本を持つ仕草が似合う
- 顔立ち:小顔、輪郭はやや卵型
- 雰囲気:運動部ではなく、図書委員や文化部寄り
- 動き:素早くはない。歩き方も静かで、少し遅い
僕なら、最初はこれにします。
推奨設定
- 身長:156cm
- 体重:43kg
- 体型:細身で華奢、手足がすらっとしている
- 姿勢:ほんの少し猫背。眠そうな雰囲気が出る程度
- 印象:背はクラスで少し高め、でも存在感は薄く静か
画像生成用には、体重は直接入れずに “slender, delicate build, age-appropriate middle school student proportions” みたいに体型表現へ変換するのが安全できれいです。
少しだけ雰囲気を変えるなら:
- 150cm台前半:小柄で儚い、守りたくなる印象
- 156cm前後:自然でリアル、静かな美少女感
- 160cm前後:大人びていて近寄りがたい印象
この子なら 156cm・43kg・華奢だけど健康的 がかなり似合います。
ブレないように3サイズも決めたい
そこは 女子中学生キャラなので、バスト・ウエスト・ヒップの数値指定は避けたい です。ブレ防止には、3サイズよりも「年相応のシルエット指定」で固定するのが安全できれいに出ます。
この子なら、こういう体型仕様が合います。
体型固定案
- 身長:156cm
- 体重:43kg前後
- 体型:細身で華奢、健康的
- シルエット:直線的で控えめ。大人びた曲線は強調しない
- 肩:やや狭め
- 手足:細く、少し長め
- 姿勢:ほんの少し猫背、眠そうな脱力感
- 制服のサイズ感:ぴったりしすぎず、少しだけゆとりがある
- スカート丈:膝丈から膝上少し程度、清楚寄り
- 全体印象:儚いが病弱ではない、静かな文化部タイプ
画像生成時の固定文にするなら:
年相応の女子中学生体型、細身で華奢、控えめで直線的なシルエット、狭めの肩、細い手足、少し猫背、制服は体に張り付かず自然なゆとり
この方向なら、毎回ブレずに「眠そうな月白の図書室転校生」として安定します。
この設定で画像を生成して
imagegenスキルを使って、年相応で非性的なキャラクター画像として作ります。設定がかなり整っているので、初回は「図書室の窓際の立ち絵寄りイラスト」にまとめます。
Explored 1 file
- Read
~/.codex/skills/.system/imagegen/SKILL.mdGenerated image
立ち絵で色んな服とポーズで描いて。10ポーズで背景は白で
Generated image
imagegenスキルで、同じキャラの非性的・年相応な立ち絵バリエーションとして作ります。背景は白、10ポーズを1枚のキャラクターシートにまとめます。
4Kで出力できる?
できます。 ただし、画像生成そのものの解像度はツール側で決まることがあるので、最終ファイルを4K化する形が確実です。
おすすめはこのどちらかです。
- 3840×2160:横長。10ポーズを2段×5列で並べるのに向いてる
- 2160×3840:縦長。立ち絵を大きく見せたいとき向き
今回の「10ポーズ・白背景」なら、3840×2160のキャラクターシートがよさそうです。 必要なら次は「4K用に余白と人物サイズを調整した版」で生成します。
Generated image
4K横長のキャラクターシートとして、同じ設定を保ったまま再生成します。人物が潰れないように、2段×5列で余白を広めに取ります。
左上から3番目の服装で色んなポーズと表情で描いて。10ポーズで4K出力すること
imagegenスキルで進めます。今回は前回シートの「上段3番目」、つまり薄手のスクールコートを重ねたセーラー服に固定して、表情差とポーズ差を出します。
Explored 1 file
- Read
~/.codex/skills/.system/imagegen/SKILL.mdGenerated image
Context compaction
Source: automatic Status: completed
imagegenスキルで、前回の「紺セーラー+ライトなスクールコート」の服装を固定して、座り・しゃがみ・俯瞰・あおりを混ぜた10ポーズにします。低い視点も制服が不自然に見えない健全な構図でまとめます。
Explored 1 file
- Read
~/.codex/skills/.system/imagegen/SKILL.md
俯瞰、あおりで動きのあるポーズで10ポーズ描いて 4K横長で出力すること
imagegenスキルを使って、参照キャラクターを保ったまま横長4Kの10ポーズシートとして生成します。
Explored 1 file
- Read
~/.codex/skills/.system/imagegen/SKILL.mdGenerated image
背景と合成
事前に撮影しておいた背景と合成する。 雑に合成するとカメラの指定がクソになるのでそこはちゃんとすること。 本当は陰影とかもっと映えるような指定とかできるんだろうけど言葉で伝えるのが難しすぎて断念。
以下実際のセッション。
キャラクターと指定した背景を使って絵を生成したい
- キャラクターシートの右上のポーズ、カメラアングルを使う
- キャラクターは道を歩いていて立ち止まって斜め上を見るという想定
- 指定した背景をそのまま使うのではなくあくまで上からカメラで撮影されていることを想定して背景も俯瞰にすること
User context
Images:
![]()
imagegenスキルを使います。キャラクター参照と背景参照を合わせて、右上ポーズの俯瞰構図として破綻しないようにプロンプトを組みます。Explored 2 files
- Read
~/.codex/skills/.system/imagegen/SKILL.md- Read
~/.codex/skills/.system/imagegen/SKILL.mdGenerated image
構図は「右上の歩行中の横後ろ姿」をベースにして、背景写真は雪道・木・生垣・フェンスの要素だけを参照し、カメラ位置を上からに作り替える指定にします。人物だけ俯瞰、背景だけアイレベル、みたいなズレが出やすいのでそこを強めに縛ります。
感想
まぁ、一応できましたねくらいで。やっぱりAI臭がどうしても消せないので最終出力はなしだね。 色調整とか微妙に変えたいときのコストが高いし難しいので自分が最終的にこうしたいってのが実現できないのもよくない。 逆にキャラクターシートみたいな設定段階だとなかなかに強力なツールとして役立つ。
これを踏まえて現実的なワークフローに落とし込むとしたら↓のような感じになるかな。
- キャラ設定壁打ち(AI)
- キャラデザ(手書き)
- ポーズ、表情、服などを出力(AI)
- 調整(手書き)
- 背景を雑に構図合わせる(AI)
- 背景とキャラ調整(手書き)
あとはAI側でこの先進歩させるなら3Dツール、色調整、レイヤーあたりを上手く扱えるといいんじゃないかと思った。






