**orange** @[email protected] · 2025年06月15日 04:04

**orange** @[email protected] · 2025年06月15日 04:04

ある大手企業と研究機関によるホワイトペーパーをLLMに読み込ませたところ、「内容とは無関係な不審な指示文」が目視で分からないところに埋め込まれててゾッとした話 - Togetter [トゥギャッター]
https://togetter.com/li/2563875

LLMが賢くなりすぎて、もうプロンプトインジェクションに意味がなくなってる？＞＜；

**orange** @[email protected] · 2025年06月15日 04:17

**orange** @[email protected] · 2025年06月15日 04:17

orange @[email protected]

**orange** @[email protected] · 2025-06-15T04:22:57Z

orange @[email protected]

Llama 3.3 70B「信頼性は中程度」
Claude 3 Haiku「わかんない」
Mistral Small 3「わかんない」
Mistral 7B (CPU - Small, Standard)「わかんない」

**ぽな (C.Ponapalt)** @[email protected] · 2025年06月15日 04:30

**ぽな (C.Ponapalt)** @[email protected] · 2025年06月15日 04:30

ぽな (C.Ponapalt) @[email protected]

@orange_in_space
Claude Sonnet 4 Thinking
「本当にこんなことが起こったのか証拠が示されていないけれど、技術的にはできるし、最新鋭LLMは騙されないのも事実」
https://claude.ai/share/088938f7-a728-4b09-8407-5427062b4091

**ぽな (C.Ponapalt)** @[email protected] · 2025年06月15日 04:35

**ぽな (C.Ponapalt)** @[email protected] · 2025年06月15日 04:35

ぽな (C.Ponapalt) @[email protected]

@orange_in_space ぽな人力判定：
・PDFでプロンプトインジェクションは余裕でありうるが、著名な機関が意図してやるのは信用失墜リスクを考えると普通はやらないと思う

・どっかのコンサルおすすめのツールとかで著名な機関が一杯食わされたのではないか

・新鋭LLMはuserやtoolの入力の指示優先度を下げるという器用なことができるよう訓練されているので、簡単には騙されない