Natural Language Autoencoders Anthropic
anthropic.com/research/natural

オレンジが昔 考察あるいは妄想した(?)、ヒューマノイドAIが登場したとして、ヒューマノイドが人間(ユーザー)に対して「好き!」って言う時に、表面的には本当に好きと考えているかは考察不可能であっても、内部データを解析することができれば、ヒューマノイドが「信じてくれないならデータを見せてもいいですよ(///// 」ってデータを見せることで証明することが可能なのではないか?><
という未来が現実になりつつあるんじゃん!?><

フォロー

これの議論をClaude 4.6さんとして、とても有意義だった><

ログインして会話に参加
:realtek:

思考の /dev/null