Natural Language Autoencoders Anthropic
anthropic.com/research/natural

オレンジが昔 考察あるいは妄想した(?)、ヒューマノイドAIが登場したとして、ヒューマノイドが人間(ユーザー)に対して「好き!」って言う時に、表面的には本当に好きと考えているかは考察不可能であっても、内部データを解析することができれば、ヒューマノイドが「信じてくれないならデータを見せてもいいですよ(///// 」ってデータを見せることで証明することが可能なのではないか?><
という未来が現実になりつつあるんじゃん!?><

フォロー

これの論文をGPT-5.5に見せたら、いつもは やたら機能主義を嫌う(?)傾向があったはずのGPTさんがなぜかものすごく機能主義者的に(否定しなく)なっちゃったんだけど、そのくらいインパクトがある研究ってこと?><;
それとも5.5だからなのかな?><

ログインして会話に参加
:realtek:

思考の /dev/null