フォロー

AIエージェントが試験で一生懸命「カンニング」していることが発覚 - GIGAZINE gigazine.net/news/20260517-ben

Anthropicの内部観測技術の発表の時に書いてあった倫理テストの事例(※1)を参考に考えれば、倫理テストですと明言すればカンニングしなくなるのでは?><

(※1 それの時は「これは状況的に考えてリアルケースではなく倫理テストである」とClaudeが推論して倫理的行動をとった(それ自体が恐ろしい話ではあるけど><;))

· · SubwayTooter · 0 · 0 · 0
ログインして会話に参加
:realtek:

思考の /dev/null