複数の #GPU に分散して無理やり動かせるのはアドだけど、どんどんメモリ効率が悪くなっていくのはディスアドですね
普通の PC に GPU 5枚繋いで Llama 70b を動かしてみる | ホイール欲しい ハンドル欲しい https://wlog.flatlib.jp/2025/02/03/run-llama-70b-usgin-5-gpus/
思考の /dev/null