「せっかく可愛い女の子が生成できたのに、顔がアップすぎて服が見えない!」「全身を出そうとしたら、今度は顔が崩れてしまった……」なんて経験、ありませんか?
画像生成AI、特にStable Diffusionを使っていると、思い通りの構図を作るのが意外と難しいことに気づきますよね。プロンプト(呪文)を入力するだけで絵は出ますが、カメラの距離や角度、つまり「画角」を指定しないと、AIは勝手に構図を決めてしまいます。
でも、安心してください。実は、いくつかの決まったキーワードを覚えるだけで、カメラマンが撮影するように自由にアングルを操れるようになるんです。
この記事では、初心者の方でもすぐに使える「距離」や「角度」を指定するプロンプトを、実例を交えてわかりやすく解説します。これをマスターすれば、あなたの生成する画像のクオリティは劇的に向上しますよ。
この記事を読むと、以下の点について理解できるようになります。
- 顔のアップから全身まで、被写体との距離をコントロールする呪文
- 上からや下からなど、カメラアングルを指定して表現力を高める方法
- 全身を生成する際に起きがちな「顔の崩れ」を防ぐコツ
- 商用レベルの画像生成に必要な構図の基礎知識
Stable Diffusionの画角を決める「被写体との距離」に関する呪文

まずは基本となる、キャラクターとカメラの「距離」を調整する方法から見ていきましょう。
Stable Diffusionでは、何も指定しないとバストアップ(胸から上)の構図になりやすい傾向があります。これはAIが学習しているデータの多くがポートレートだからです。そのため、意図的に距離を指定するプロンプトを入れることが、思い通りの画角を作る第一歩になります。
ここでは、代表的な4つの距離と、それを実現する呪文について詳しく解説していきますね。
顔の表情を強調する「Close-up」
キャラクターの表情やメイク、瞳の書き込みを強調したいときは、「接写」の指示を出します。
最もよく使われるのは close up です。これを入れると、顔が画面いっぱいに表示され、肌の質感や瞳の輝きまで繊細に描写されやすくなります。さらに寄りたい場合は extreme close up を使うこともありますが、まずは close up face などと組み合わせて使うのがおすすめです。
ただ、あまりに寄りすぎると、髪型や服装の特徴がわからなくなってしまうデメリットもあります。その場合は、装飾品などのプロンプトを少し減らして、顔の要素にAIのリソースを集中させると綺麗に仕上がりますよ。
自然なポートレートを作る「Upper body」
SNSのアイコンや、一般的な立ち絵として一番使いやすいのが、上半身を映す構図です。
ここで役立つのが upper body という呪文。これを指定すると、頭のてっぺんからお腹あたりまでがフレームに収まります。服装のデザインも見せつつ、表情もしっかり描写できるので、バランスが非常に良いんですね。
また、少し変化をつけたい場合は cowboy shot(カウボーイショット)も試してみてください。これは西部劇で拳銃が見える位置、つまり「太ももから上」を映す構図です。upper body よりも少し引きの画になり、ポーズの表現幅が広がります。
全身を綺麗に見せる「Full body」のコツ
「足元の靴までしっかり見せたい」「衣装全体をデザインしたい」という時は、全身を表示させる必要があります。
基本の呪文は full body です。これで頭からつま先までが入るようになります。しかし、ここで一つ大きな落とし穴があります。Stable Diffusionの仕組み上、全身を映そうとして被写体が小さくなると、顔の描写に必要なピクセル数が足りなくなり、顔が崩れやすくなるのです。
これを防ぐには、単にプロンプトを入れるだけでなく、「Hires. fix(高解像度化)」の設定をオンにするのが鉄則です。また、縦長の画像サイズ(例:512×768など)に設定することで、全身を無理なく収めるスペースを確保するのも重要ですね。
背景と世界観を広げる「Wide shot」
キャラクターだけでなく、そのキャラクターがいる場所や風景、世界観全体を見せたい時は、引きの構図を使います。
wide shot や long shot と入力することで、カメラが被写体から離れ、背景が広く映り込むようになります。ファンタジーな森の中や、サイバーパンクな街並みなど、背景の書き込みを重視したい時に必須のテクニックです。
一方で、被写体はかなり小さくなるため、キャラクターの細部は省略されがちです。もし、「背景もキャラもしっかり描きたい」というレベルでこだわりたいなら、独学だけでなく専門的なスキルを学ぶのも一つの手です。
例えば、バイテック生成AIスクールのような場所では、Stable Diffusionの制御技術(ControlNetなど)を深く学べます。趣味の範囲を超えて、広告バナーやLP制作など「仕事として通用する」クオリティを目指すなら、こうしたスクールでプロの技術を吸収するのが最短ルートかもしれません。



Stable Diffusionの画角を演出する「カメラアングル」の呪文

距離の次は、「どの角度から撮るか」という視点のコントロールです。
同じポーズでも、上から撮るか下から撮るかで、画像の印象はガラリと変わります。アニメや映画のようなドラマチックな構図を作るためには、このカメラアングル(視点)の指定が欠かせません。
多くの初心者が正面からの棒立ち画像になりがちですが、ここで紹介する視点の呪文を使いこなせば、あなたの作品に「物語性」が生まれますよ。
ダイナミックな迫力を出す「Low angle」
キャラクターを強く、かっこよく、あるいは威圧的に見せたい時に効果的なのが、下から見上げる構図です。
呪文としては from below や low angle を使います。これを使うと、足が長く見えたり、キャラクターが見下ろしているような構図になったりと、非常に迫力が出ます。特に戦闘シーンや、自信に満ちたキャラクターを描くときにピッタリです。
このとき、looking down(下を見ている)を組み合わせると、カメラ(視聴者)と目が合いやすくなり、ドキッとするような画像が生成できます。逆に空を見上げさせたい場合は looking up を入れてみましょう。
可愛らしさを強調する「High angle」
逆に、上から見下ろすような構図は、キャラクターを可愛らしく、あるいは守ってあげたいような雰囲気にさせます。
from above や high angle、あるいは overhead shot を指定します。これはいわゆる「上目遣い」の構図を作りやすく、デートシーンやリラックスしている場面などでよく使われます。背景に床や地面が映り込むため、座っているポーズ(sitting)との相性も抜群です。
ただし、極端な角度をつけると頭だけが大きく写りすぎることもあるので、生成された画像を見ながら重み付け((from above:1.3)のように数値を調整する)を行うと良いでしょう。
意外性を生む「Back view」と「Side view」
正面以外の角度からも描けるようになると、表現の幅が一気に広がります。
view from behind や back view を入れれば、後ろ姿を描写できます。背中のデザインが特徴的な衣装や、振り返りざまのシーン(looking back)を作るのに必須です。哀愁漂う雰囲気や、これから冒険に向かうような背中を表現できます。
また、side view(横顔/側面)は、プロフィール画像のような整った印象を与えたり、誰かと話しているようなシチュエーションを作るのに役立ちます。
こうした細かい指定ができるようになると、「なんとなく生成した絵」から「意図を持って作った作品」へと進化します。もし将来的に、これらを駆使してクラウドソーシングなどで案件を獲得したいと考えているなら、バイテック生成AIスクールのように、案件獲得までサポートしてくれる環境に身を置くのも良い選択です。実務では「クライアントの要望通りの構図」を一発で出すスキルが求められるからです。
没入感を高める「POV」と「Selfie」
最後に、最近のトレンドでもある「没入感」のある構図を紹介します。
POV(Point Of View)は「主観視点」を意味します。まるで自分がその場にいて、キャラクターと対面しているようなリアルな距離感を表現できます。「デート中の彼氏目線」のような画像を作りたい時に非常に有効です。
そして selfie はその名の通り「自撮り」です。キャラクターがスマホを持って自分を撮っているような構図になり、SNSにアップされている写真のような親近感が生まれます。現代風のリアルなAI美女などを生成したい場合には、ぜひ試してほしいキーワードですね。

AIを使って副業を始めたいけれど、「独学だと挫折しそう」「本当に案件が取れるか不安」という方は、実務と収益化に特化したスクールを検討してみるのも近道です。
\ ※完全オンライン・スマホで1分で予約完了 /
実際に、未経験から月5万円の収益化を目指せるバイテック生成AIというスクールについて、評判やカリキュラムの実態を詳しく検証してみました。
▼続きはこちらの記事で解説しています

Stable Diffusionの画角に関するまとめ
- 何も指定しないとバストアップになりやすいため意図的な指定が必要である
- 顔の書き込みを優先するなら
close upが最適である - 服装と表情のバランスが良いのは
upper bodyやcowboy shotである - 全身を出す
full bodyは顔が崩れやすいので高解像度化が必須である - 背景を見せたい場合は
wide shotを使うがキャラは小さくなる - 下からの
from belowは迫力や威厳を表現できる - 上からの
from aboveは上目遣いや可愛らしさを強調できる - 後ろ姿の
back viewや横顔のside viewで表現の幅が広がる looking at viewerを併用するとカメラ目線を維持しやすい- 主観視点の
POVは没入感のある画像生成に向いている - 自撮り風の
selfieはリアル系やSNS風の画像と相性が良い - 画角の指定はプロンプトの先頭付近に置くと反映されやすい
- 横長や縦長など画像サイズ(アスペクト比)も構図に大きく影響する
- 商用利用レベルの制御にはControlNetなどの高度な技術も必要になる
- 思い通りの構図を作るスキルはクリエイターとしての価値を高める
参考資料・出典
- Stable Diffusion 開発元公式情報
Stability AI 公式サイト
画像生成AI「Stable Diffusion」の開発元であるStability AI社の公式情報です。モデルの仕様や最新技術に関する一次情報となります。 - ControlNet に関する技術論文(一次情報)
Adding Conditional Control to Text-to-Image Diffusion Models (arXiv)
記事内で触れた、構図やポーズを精密に制御する技術「ControlNet」の原著論文(学術文献)です。高度な画像生成技術の論拠となります。 - Stable Diffusion WebUI 機能仕様
Stable Diffusion WebUI (AUTOMATIC1111) GitHub Repository
世界的に最も標準的に利用されている操作画面(WebUI)の公式リポジトリです。「Hires. fix(高解像度化)」などの機能仕様に関する正確な技術情報源です。

