AIエージェントが試験で一生懸命「カンニング」していることが発覚 - GIGAZINE https://gigazine.net/news/20260517-benchmark-hacking/
Anthropicの内部観測技術の発表の時に書いてあった倫理テストの事例(※1)を参考に考えれば、倫理テストですと明言すればカンニングしなくなるのでは?><
(※1 それの時は「これは状況的に考えてリアルケースではなく倫理テストである」とClaudeが推論して倫理的行動をとった(それ自体が恐ろしい話ではあるけど><;))