前回に引き続きゲーミングPCのレビューをしてみたいと思います。今回は生成画像AIのベンチマークとなります。
参考
画像生成AIの環境の設定
いろいろと迷いながら環境設定を行っていましたが、ようやく準備が整いました。単体のベンチマークツールというものはなく、Stable Diffusion WebUI
に特定のパラメータ、プロンプト、モデルを使用したものを使用してその時間を計測するというのが一般的な計測方法のようです。
ベンチマークということもあるので今回は事前にPython
、Git
をインストールしてGitHub
からStable Diffusion WebUI Automatic1111
をインストールした環境下で行うことにしました。
ベンチマーク手法はハローアスカベンチ
、神里綾華ベンチ
、神里綾華(LORA使用)ベンチ
の3タイプを行ってみることにしました。今回のPCの以外の数値との比較が一番重要なのでその比較値はちもろぐさんのサイトの結果を使用させていただきます。
ハローアスカベンチ(512x512)
ハローアスカベンチは統一した設定で10枚の画像を生成し、その時間を計測するというものです。10枚の画像を生成するのは他のベンチマーク手法も同じです。アスカ
はおなじみのエヴァンゲリオンのキャラクターですね。
ハローアスカベンチ設定値
使用モデル
使用するモデル → nai.ckpt
パラメータ値
- Sampling Steps → 28
- Sampling method → Euler
- Width → 512
- Height → 512
- Batch count → 10
- Batch size → 1
- CFG Scale → 12
- Seed → 2870305590
プロンプト
Prompt
masterpiece, best quality, masterpiece, asuka langley sitting cross legged on a chair
Negative Prompt
lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts,signature, watermark, username, blurry, artist name
生成画像と結果
無事に10枚の画像が生成されました。アスカにみえますね。
以下が計測値になります。
ちもろぐさんのデータを参照すると、今回使用しているゲーミングノートPCでは、デスクトップ版のRTX 2060
~RTX 3060
ぐらいのパフォーマンスが出ているようです。
神里綾華ベンチマーク(512x768)
このキャラクターがよくわからないのですみません(原神というゲームの登場するらしいです)。先程とは違って生成される画像のサイズが512x768になっています。
神里綾華ベンチマーク設定値
使用モデル
使用するモデル → AbyssOrangeMix2_nsfw
パラメータ値
- Sampling Steps → 20
- Sampling method → DPM++ 2M Karras
- Width → 512
- Height → 768
- Batch count → 10
- Batch size → 1
- CFG Scale → 7
- Seed → 1091979662
プロンプト
Prompt
masterpiece, best quality, soft lighting, absurdres, looking at viewer, solo, ponytail, kamisato ayaka, serafuku, kamisato ayaka (heytea), official art, official alternate costume, blunt bangs, hair bow, hair ribbon, red ribbon, school uniform, sailor shirt, sailor collar, pleated skirt, 1girl, skirt, black bow, cate, genshin,
Negative Prompt
nsfw, (worst quality, low quality, extra digits, male:1.4)), bad_prompt,
生成画像と結果
無事に10枚の画像が生成されましたが、数枚の画像の髪色が違い特定のキャラクターを生成となっていません。プロンプトの情報だけではやはり生成の揺れがあるようです。
以下が計測値になります。
ちもろぐさんのデータを参照すると、先程の結果よりも結果がよく、RTX 2060
~RTX 3060
よりも少し速いスコアが出ているようです。この結果はゲームのベンチマークなどとは大きく違う傾向なので、生成画像AI用のベンチマークが早く確立されるといいなと思います。
神里綾華(LORA使用)ベンチ(512x768)
先程は目的のキャラクターを生成できていない(別人が生成されていた)ので、LORAモデル
を使用することで目的のキャラクターを生成してみます。LORA
を使用すること生成速度が低下しますが、かなりの確率で目的の画像に近づけることができます。
基本的な設定値は神里綾華ベンチ(512x768)と同じで、LORAモデル
部分の設定が追加されています(プロンプトに現れます)
神里綾華(LORA使用)ベンチ設定値
使用モデル
使用するモデル → AbyssOrangeMix2_nsfw
LORAモデル
使用するLORAモデル → Kamisato Ayaka (Springbloom Missive)
パラメータ値
- Sampling Steps → 20
- Sampling method → DPM++ 2M Karras
- Width → 512
- Height → 768
- Batch count → 10
- Batch size → 1
- CFG Scale → 7
- Seed → 1091979662
プロンプト
Prompt
masterpiece, best quality, soft lighting, absurdres, looking at viewer, solo, ponytail, serafuku, kamisato ayaka (heytea), official art, official alternate costume, kamisato ayaka, blunt bangs, hair bow, hair ribbon, red ribbon, school uniform, sailor shirt, sailor collar, pleated skirt, 1girl, skirt, black bow, cate <lora:kamisatoAyakaSpringbloom_v10:1>
Negative Prompt
nsfw, (worst quality, low quality, extra digits, male:1.4)), bad_prompt,
生成画像と結果
こちらも無事に10枚の画像が生成されました。今度は特定のキャラクターを生成してくれているのがわかります。
以下が計測値になります。
ちもろぐさんのデータを参照すると、RTX 2060
~RTX 3060
より10%以上高速化できているようです。LORA
を使用したらもう少し遅くなるかなと思っていたのですが、微々たる差で驚きました。RTX40シリーズ
は世代が変わっているということなのかもしれません。
おわりに
ゲームのベンチマークでは見えない性能差があるのかなと思います。特にゲームではRTX 30シリーズ
とRTX 40シリーズ
は明らかな差がありますが、どちらのシリーズでもミドルレンジクラスではそこまでの差がないように感じます。画像生成AIのベンチマークがゲームベンチマークで計られるのはちょっと問題。新しくいい指標をもつベンチマークが生まれるといいなという気がします。
また、今回本格的に画像生成AIであるStable Diffusion WebUIをプロンプト
、モデル
、LORA
を使用して行ってみましたが、ここまでできるようになっているとは思いませんでした。2024年はAIが更に進化し、予想だにしないことも生まれでてくるのではないかと思ってワクワクします。
参考