Stable Diffusionを使っていて、「顔は可愛いのに、体型がイメージと違う…」と悩んだことはありませんか?
実は、AI画像生成において体型のコントロールは、顔の生成と同じくらい奥が深く、そして少しのコツで劇的にクオリティが変わるポイントなんです。
特に、「スリム」「ぽっちゃり」「筋肉質」といった大まかな指示だけでは、なかなか思い通りのスタイルになってくれないことも多いですよね。
そこで今回は、私が実際に試して効果のあった体型指定の呪文(プロンプト)や、崩れを防ぐためのテクニックを余すところなくお伝えします。
この記事を読むと、以下の4点についてしっかりと理解できるようになります。
- 思い通りの体型を出力するための具体的なプロンプト(呪文)
- 体型指示が効きにくい時の「重み付け」テクニック
- 手足の崩れやバランスの悪さを防ぐ設定方法
- 生成AIスキルを仕事レベルに引き上げるための道筋
Stable Diffusionで体型プロンプトを使いこなす

Stable Diffusionで理想のキャラクターを作るためには、まず適切な体型プロンプトを知ることが第一歩です。
ただ単に「痩せている」と入力するだけでなく、ニュアンスの違う言葉を使い分けることで、AIへの伝わり方が驚くほど変わります。
ここでは、基本的かつ効果的なプロンプトを整理して紹介しますね。
基本の体型プロンプト一覧
まずは、汎用性の高い基本的な体型指定の呪文を見ていきましょう。
私がよく使うものを表にまとめましたので、コピペして試してみてください。
| 体型の種類 | プロンプト(英語) | 特徴・ニュアンス |
| 標準・平均 | average body | 最も癖のない、自然な標準体型 |
| スリム・細身 | slender, slim body | 健康的で引き締まった細身 |
| ガリガリ・華奢 | skinny, thin | 骨感が出るほど細い、華奢な印象 |
| 小柄・低身長 | petite, short stature | 小柄で可愛らしい印象 |
| グラマラス | curvy, voluptuous | 女性らしい曲線美、出るとこが出ている |
| ぽっちゃり | plump, chubby | 柔らかい肉付き、可愛らしい太め |
| 肥満・太め | overweight, fat | 明確に太っている状態 |
| 筋肉質 | muscular, athletic | 鍛えられた体、スポーツマン体型 |
これらをプロンプトの先頭付近に入れることで、AIは「どんな体型を描くべきか」を優先的に理解してくれます。
例えば、単に可愛い女の子を描きたい場合でも、slenderを入れるかcurvyを入れるかで、全体の雰囲気がガラッと変わるのが面白いところです。
部位ごとの詳細な指定方法
全体的なシルエットだけでなく、特定の部位を強調したい場合もありますよね。
そういった時は、部位ごとのプロンプトを組み合わせるのがおすすめです。
バストのサイズ指定
- 巨乳:
large breasts,huge breasts - 微乳:
small breasts,flat chest
下半身の指定
- 太もも:
thick thighs(太い太もも),thigh gap(太ももの隙間) - お尻:
wide hips(広い骨盤),big ass(大きなお尻)
お腹周り
- 腹筋:
abs,toned stomach
実は、これらの部位指定を入れることで、AIが体の構造をより意識するようになり、結果として全身のバランスが整うという副次的な効果もあります。
漠然と「全身」と指示するよりも、「どのような特徴がある体なのか」を具体的に教えてあげることが大切です。
プロンプトの重み付けで強調する
いくらプロンプトを入れても、「なかなか反映されないな…」と感じることはありませんか?
そんな時は、プロンプトの重み付け(強調)を行いましょう。
Stable Diffusionでは、単語をカッコ()で囲むことで、その要素を強調できます。
さらに、数字を加えることで強弱を細かく調整可能です。
(muscular:1.2)→ 筋肉質を1.2倍強調する(plump:1.3)→ ぽっちゃり感を1.3倍強調する(skinny:0.8)→ 細身の要素を少し弱める
私が調整するときは、まずは1.1から1.2くらいの数値で試してみます。
いきなり1.5以上にすると、画像が破綻したり、画風がおかしくなったりすることがあるので注意が必要です。
「少しずつ足していく」のが、きれいな体型を作るコツですよ。
モデル(Checkpoint)による体型の違い
ここで一つ、忘れてはいけない重要なポイントがあります。
それは、使用するモデル(Checkpoint)によって、得意な体型やデフォルトの体型が異なるということです。
例えば、リアル系(実写系)のモデルである「ChilloutMix」などは、比較的リアルな肉付きの表現が得意ですが、アニメ系のモデルは極端に細身になりやすい傾向があります。
もし、プロンプトを入力しても全然体型が変わらない場合は、モデル自体の特性が強い可能性があります。
このため、極端な体型(例えば力士のような体型や、極度の肥満など)を作りたい場合は、その体型学習に特化したLoRA(追加学習ファイル)を導入するのも一つの手です。
プロンプトだけで頑張るよりも、LoRAを一つ足すだけで、驚くほど簡単に理想の体型が出せることがよくあります。



Stable Diffusionの体型生成で失敗しないためのコツ

体型を指定するプロンプトは分かっても、「手足が伸びすぎる」「体がねじれる」といった失敗はつきものです。
ここからは、きれいな全身像を出力し、失敗画像を減らすための実践的なテクニックを紹介します。
ネガティブプロンプトで奇形を防ぐ
きれいな体型を出すためには、「描いてほしくないもの」を指定するネガティブプロンプトが非常に重要です。
体型崩れを防ぐために、以下の単語は必ず入れておきましょう。
bad anatomy(変な解剖学的構造)bad hands(変な手)missing limbs(手足の欠損)extra limbs(多すぎる手足)long neck(長い首)mutation(突然変異、奇形)
これらを入れることで、AIは「人体として不自然な構造」を避けようと努力します。
特に全身画像(Full body)を生成する際は、顔のアップよりも描画範囲が広くなる分、AIの処理が追いつかずに体が崩れやすくなります。
だからこそ、ネガティブプロンプトでのガードが必須になるのです。
解像度とHires. fixの活用
全身を描こうとすると、顔が崩れたり、体がぼやけたりすることがありますよね。
これは、学習元の画像サイズと生成サイズのミスマッチや、情報量不足が原因です。
この対策として、以下の2ステップをおすすめします。
- 縦長のサイズで生成する:人間は縦に長いので、512×768 や 512×1024 のような縦長のアスペクト比に設定すると、全身が収まりやすくなります。
- Hires. fix(高解像度化)を使う:「Hires. fix」にチェックを入れると、一度生成した画像を拡大しながら細部を描き込んでくれます。これで、全身画像でも顔や体のディテールがくっきりします。
ただ単に解像度を上げるだけではPCへの負荷が高くなりますが、Hires. fixを使えば、効率的に高品質な全身画像が得られますよ。
確実なスキルを身につけるなら
ここまで、プロンプトや設定のコツをお話ししてきましたが、生成AIの世界は奥が深く、さらに狙った通りのポーズや構図を完璧にコントロールするには「ControlNet」などの高度な技術も必要になってきます。
もしあなたが、「趣味だけでなく、もっと自在に画像を操りたい」「あわよくば、このスキルを仕事にしたい」と考えているなら、独学で悩み続けるよりも、体系的に学ぶのが一番の近道かもしれません。
例えば、「バイテック生成AIスクール」のような専門スクールでは、Stable Diffusionの基礎から、今回触れたような体型コントロール、さらにはControlNetを使った高度な画像生成までを実践的に学べます。
特にここは、「実務活用」や「収益化」に特化しているので、単に絵を作るだけでなく、「クライアントの要望通りの画像(LP用画像やバナーなど)を作るスキル」が身につくのが特徴です。
ポートフォリオ作成や案件獲得のサポートもあるので、AIクリエイターとしての一歩を踏み出したい方には、頼もしいパートナーになるはずですよ。
ControlNetでポーズと体型を固定する
少し高度な話になりますが、前述のスクールなどでも詳しく扱われるControlNetという機能についても触れておきます。
これは、棒人間のような骨組み(OpenPose)を使って、AIにポーズを指定する機能です。
プロンプトだけで「座って足を組んでいる」と指定しても、なかなかうまくいかないことがありますよね。
ControlNetを使えば、ポーズをガチッと固定したまま、体型プロンプト(slenderやchubbyなど)だけを変更して生成することができます。
つまり、同じポーズで「痩せているバージョン」「太っているバージョン」を作り分けることが可能になるのです。
これは、ゲーム制作や広告素材の作成など、統一感が求められる場面で非常に役立つテクニックです。

AIを使って副業を始めたいけれど、「独学だと挫折しそう」「本当に案件が取れるか不安」という方は、実務と収益化に特化したスクールを検討してみるのも近道です。
\ ※完全オンライン・スマホで1分で予約完了 /
実際に、未経験から月5万円の収益化を目指せるバイテック生成AIというスクールについて、評判やカリキュラムの実態を詳しく検証してみました。
▼続きはこちらの記事で解説しています

Stable Diffusion体型変更のまとめ
- 基本の体型は
slender(スリム)、curvy(グラマラス)、plump(ぽっちゃり)などで指定する - プロンプトが効かないときは
(word:1.2)のように重み付けを行う - 使用するモデル(Checkpoint)によってデフォルトの体型傾向が異なる
- 極端な体型を作りたい場合はLoRAの導入を検討する
- 部位ごとの指定(バスト、太もも等)を加えると全身のバランスが整いやすい
- ネガティブプロンプトには
bad anatomyなどを必ず入れて崩れを防ぐ - 全身画像は縦長サイズ(
512x768など)で生成するのが基本 - 顔や体のディテールアップにはHires. fixが必須
- Hires. fixはPC負荷を抑えつつ高画質化できる便利な機能
- ポーズを固定したまま体型を変えるにはControlNetが有効
- ControlNetを使えば同じ構図で体型バリエーションを作れる
- 独学が難しい場合はバイテック生成AIスクールなどの活用も視野に入れる
- 実務レベルのスキル習得には体系的な学習が近道である
- プロンプトの強弱は
1.1から徐々に上げていくのが失敗しないコツ - AIは具体的な指示ほど理解しやすいため、形容詞をうまく組み合わせる
参考資料・出典
- Stable Diffusion(画像生成AIの基本モデル)
- Stability AI Official Website
- 開発元であるStability AI社の公式サイト。モデルの仕様や最新情報の一次情報源です。
- CLIP(AIが「言葉」を理解する仕組み)
- OpenAI Research: CLIP (Connecting Text and Images)
- Stable Diffusionがプロンプト(「slender」や「muscular」などの単語)をどのように認識し、画像と結びつけているかの技術的根拠となるOpenAIの研究発表です。
- ControlNet(ポーズや体型の制御技術)
- arXiv: Adding Conditional Control to Text-to-Image Diffusion Models
- 記事内で紹介した「ControlNet」の技術的詳細が記された学術論文(一次情報)。ポーズ固定技術の信頼性を裏付ける資料です。

