**Tora** @[email protected] · 2026年04月13日 00:40

**Tora** @[email protected] · 2026年04月13日 00:40

Tora @[email protected]

AMD CPU では、Lemonade の中の FastFlowLM NPU のリポジトリを取得して、その中からモデルを選ぶとエコらしい。リポジトリ非表示だったから気が付かなかった。

**Tora** @[email protected] · 2026年04月13日 00:40

**Tora** @[email protected] · 2026年04月13日 00:40

Tora @[email protected]

チャッピーのおすすめ

■ 実務的なおすすめ

あなたの環境なら：

◎ 試すべき順
* phi4-mini-it-4b-FLM（最優先）
* llama3.2 3b（軽さ確認）
* translategemma（用途特化確認）

**Tora** @[email protected] · 2026年04月13日 00:41

**Tora** @[email protected] · 2026年04月13日 00:41

Tora @[email protected]

チャッピー曰く NPU 向けにしてはとても重いからやめとけ

△ 後回し
* deepseek-r1
* qwen3.5-9b

**Tora** @[email protected] · 2026年04月13日 00:48

**Tora** @[email protected] · 2026年04月13日 00:48

Tora @[email protected]

phi4-mini-it-4b-FLM （NPU）さん、自身のことはよく知らないそうです。GPU のヤツと比べてちょっとお馬鹿かも。

**Tora** @[email protected] · 2026年04月13日 01:16

**Tora** @[email protected] · 2026年04月13日 01:16

Tora @[email protected]

NPU対応モデルのうち
qwen3.5-9b-FLM は重すぎてバグる。
qwen3.5-4b-FLM はギリギリ動くが、ときどき中国語になる。（画像）

**Tora** @[email protected] · 2026-04-13T01:17:07Z

Tora @[email protected]

翻訳専門の translategemma-4b-FLM ってのがあるんだよね。ローカル翻訳できるから便利かもしれん。

**Tora** @[email protected] · 2026年04月13日 01:24

**Tora** @[email protected] · 2026年04月13日 01:24

Tora @[email protected]

NPU 対応の AI 凄いね。説明によると 2W 程度で動くとあるが、ケーブルのワットチェッカー（システム全体）は 28w を示している。エコだ。

**Tora** @[email protected] · 2026年04月13日 01:25

**Tora** @[email protected] · 2026年04月13日 01:25

Tora @[email protected]

なお速度は遅い。eGPU をゴリゴリ回すより2～4倍の時間がかかっている。

**Tora** @[email protected] · 2026年04月13日 01:36

**Tora** @[email protected] · 2026年04月13日 01:36

Tora @[email protected]

ソースコードを吐き出させようとするとタイムアウトで生成途中で止まってしまう模様。

**Tora** @[email protected] · 2026年04月13日 01:36

**Tora** @[email protected] · 2026年04月13日 01:36

Tora @[email protected]

翻訳には良いかもしれんが、NPU で処理するモデルはあんまり使えないかも。

**Tora** @[email protected] · 2026年04月13日 01:45

**Tora** @[email protected] · 2026年04月13日 01:45

Tora @[email protected]

translategemma-4b-FLM （NPU翻訳）は実用的な精度と速度で使えることを確認。これは凄い。