**orange** @[email protected] · 2026-05-18T01:25:19Z

orange @[email protected]

AIエージェントが試験で一生懸命「カンニング」していることが発覚 - GIGAZINE https://gigazine.net/news/20260517-benchmark-hacking/

Anthropicの内部観測技術の発表の時に書いてあった倫理テストの事例(※1)を参考に考えれば、倫理テストですと明言すればカンニングしなくなるのでは？＞＜

(※1 それの時は「これは状況的に考えてリアルケースではなく倫理テストである」とClaudeが推論して倫理的行動をとった(それ自体が恐ろしい話ではあるけど＞＜；))

2026年05月18日 01:25 · · SubwayTooter · · ·