前回に引き続きゲーミングPCのレビューをしてみたいと思います。今回は生成画像AIのベンチマークとなります。

参考

画像生成AIの環境の設定

いろいろと迷いながら環境設定を行っていましたが、ようやく準備が整いました。単体のベンチマークツールというものはなく、Stable Diffusion WebUIに特定のパラメータ、プロンプト、モデルを使用したものを使用してその時間を計測するというのが一般的な計測方法のようです。

uepon.hatenadiary.com

note.com

ベンチマークということもあるので今回は事前にPython、GitをインストールしてGitHubからStable Diffusion WebUI Automatic1111をインストールした環境下で行うことにしました。

github.com

ベンチマーク手法はハローアスカベンチ、神里綾華ベンチ、神里綾華（LORA使用）ベンチの3タイプを行ってみることにしました。今回のPCの以外の数値との比較が一番重要なのでその比較値はちもろぐさんのサイトの結果を使用させていただきます。

chimolog.co

ハローアスカベンチ（512x512）

ハローアスカベンチは統一した設定で10枚の画像を生成し、その時間を計測するというものです。10枚の画像を生成するのは他のベンチマーク手法も同じです。アスカはおなじみのエヴァンゲリオンのキャラクターですね。

ハローアスカベンチ設定値

使用モデル

使用するモデル　→　nai.ckpt

パラメータ値

Sampling Steps　→　28
Sampling method　→　Euler
Width　→　512
Height　→　512
Batch count　→　10
Batch size　→　1
CFG Scale　→　12
Seed　→　2870305590

プロンプト

Prompt

masterpiece, best quality, masterpiece, asuka langley sitting cross legged on a chair

Negative Prompt

lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts,signature, watermark, username, blurry, artist name

生成画像と結果

無事に10枚の画像が生成されました。アスカにみえますね。

以下が計測値になります。

ちもろぐさんのデータを参照すると、今回使用しているゲーミングノートPCでは、デスクトップ版のRTX 2060～RTX 3060ぐらいのパフォーマンスが出ているようです。

神里綾華ベンチマーク（512x768）

このキャラクターがよくわからないのですみません（原神というゲームの登場するらしいです）。先程とは違って生成される画像のサイズが512x768になっています。

神里綾華ベンチマーク設定値

使用モデル

使用するモデル　→　AbyssOrangeMix2_nsfw

パラメータ値

Sampling Steps　→　20
Sampling method　→　DPM++ 2M Karras
Width　→　512
Height　→　768
Batch count　→　10
Batch size　→　1
CFG Scale　→　7
Seed　→　1091979662

プロンプト

Prompt

masterpiece, best quality, soft lighting, absurdres, looking at viewer, solo, ponytail, kamisato ayaka, serafuku, kamisato ayaka (heytea), official art, official alternate costume, blunt bangs, hair bow, hair ribbon, red ribbon, school uniform, sailor shirt, sailor collar, pleated skirt, 1girl, skirt, black bow, cate, genshin,

Negative Prompt

nsfw, (worst quality, low quality, extra digits, male:1.4)), bad_prompt,

生成画像と結果

無事に10枚の画像が生成されましたが、数枚の画像の髪色が違い特定のキャラクターを生成となっていません。プロンプトの情報だけではやはり生成の揺れがあるようです。

以下が計測値になります。

ちもろぐさんのデータを参照すると、先程の結果よりも結果がよく、RTX 2060～RTX 3060よりも少し速いスコアが出ているようです。この結果はゲームのベンチマークなどとは大きく違う傾向なので、生成画像AI用のベンチマークが早く確立されるといいなと思います。

神里綾華（LORA使用）ベンチ（512x768）

先程は目的のキャラクターを生成できていない（別人が生成されていた）ので、LORAモデルを使用することで目的のキャラクターを生成してみます。LORAを使用すること生成速度が低下しますが、かなりの確率で目的の画像に近づけることができます。

基本的な設定値は神里綾華ベンチ（512x768）と同じで、LORAモデル部分の設定が追加されています（プロンプトに現れます）

神里綾華（LORA使用）ベンチ設定値

使用モデル

使用するモデル　→　AbyssOrangeMix2_nsfw

LORAモデル

使用するLORAモデル　→　Kamisato Ayaka (Springbloom Missive)

パラメータ値

Sampling Steps　→　20
Sampling method　→　DPM++ 2M Karras
Width　→　512
Height　→　768
Batch count　→　10
Batch size　→　1
CFG Scale　→　7
Seed　→　1091979662

プロンプト

Prompt

masterpiece, best quality, soft lighting, absurdres, looking at viewer, solo, ponytail, serafuku, kamisato ayaka (heytea), official art, official alternate costume, kamisato ayaka, blunt bangs, hair bow, hair ribbon, red ribbon, school uniform, sailor shirt, sailor collar, pleated skirt, 1girl, skirt, black bow, cate <lora:kamisatoAyakaSpringbloom_v10:1>

Negative Prompt

nsfw, (worst quality, low quality, extra digits, male:1.4)), bad_prompt,

生成画像と結果

こちらも無事に10枚の画像が生成されました。今度は特定のキャラクターを生成してくれているのがわかります。

以下が計測値になります。

ちもろぐさんのデータを参照すると、RTX 2060～RTX 3060より10%以上高速化できているようです。LORAを使用したらもう少し遅くなるかなと思っていたのですが、微々たる差で驚きました。RTX40シリーズは世代が変わっているということなのかもしれません。

おわりに

ゲームのベンチマークでは見えない性能差があるのかなと思います。特にゲームではRTX 30シリーズとRTX 40シリーズは明らかな差がありますが、どちらのシリーズでもミドルレンジクラスではそこまでの差がないように感じます。画像生成AIのベンチマークがゲームベンチマークで計られるのはちょっと問題。新しくいい指標をもつベンチマークが生まれるといいなという気がします。

また、今回本格的に画像生成AIであるStable Diffusion WebUIをプロンプト、モデル、LORAを使用して行ってみましたが、ここまでできるようになっているとは思いませんでした。2024年はAIが更に進化し、予想だにしないことも生まれでてくるのではないかと思ってワクワクします。

参考

chimolog.co

uepon日々の備忘録

日々メモ

デルアンバサダープログラムに当選したのでゲーミングPCのレビューしてみました2023（その4）

画像生成AIの環境の設定

ハローアスカベンチ（512x512）

ハローアスカベンチ設定値

使用モデル

パラメータ値

プロンプト

生成画像と結果

神里綾華ベンチマーク（512x768）

神里綾華ベンチマーク設定値

使用モデル

パラメータ値

プロンプト

生成画像と結果

神里綾華（LORA使用）ベンチ（512x768）

神里綾華（LORA使用）ベンチ設定値

使用モデル

LORAモデル

パラメータ値

プロンプト

生成画像と結果

おわりに