新しいものを表示

鶴見をスタート地点にして、大回り乗車 (鶴見→東神奈川→八王子→高麗川→高崎→赤羽→品川→川崎) するか

スレッドを表示

に乗りに行きたいかと聞かれれば乗りに行きたいんですが、乗ったところで何をするのかという問題がある

喪中 さんがブースト

Xeon Platinum+128GB ECC Men+RTX3060 12GB x2というバカのLLMサーバでollamaによるQwen3-Coder-30Bのテスト
Q5K_Mで21GByteモデルというそこそこ贅沢なモデルだけど、XeonのAVX-512とクアッドチャンネルメモリの暴力で入れた本人がちょっとびっくりするレベルの推論速度出てわろてる。
MoEモデルなんでそもそもGPU間通信が従来型モデルより圧倒的に少ないんでマルチGPUでもボトルネックにならへんのやろなあ

LLMをメモリ帯域で殴るとCPUでも勝てるなるほど

喪中 さんがブースト

というわけで27日の東海道ではこのへんの話をする予定。鹿さん来るようだったら突っ込んでもらおっと

喪中 さんがブースト

ある程度予測はしてたんだけど、クアッドチャンネル以上積んでるXeonやスリッパ、最近のMoEモデルで使ってローカルLLMすると、DDR5デュアル並みかそれ以上の性能出るはずじゃね?という予測がもろに的中して笑っちゃう推論速度叩き出してたんでちょっとハイになって錯乱気味なわけですね

喪中 さんがブースト

なんもなければ 20:00 JST からメンテします。パッケージ更新とかも含むので数分程度の停止をしても怖がらないでください。

@camo それだけバッテリがバッチリ重い説

の創業30周年記念にして閉店セールにきたが、転売能力がないパンピーには、もう買うものがなかった。技適が危ないワイヤレスマウスは要らないしなあ

古いものを表示
:realtek:

思考の /dev/null