Claude Opus 4.6のツッコミはバチバチで、まるでオレンジみたい><;

スレッドを表示

ちなみに意見を変えなかったGrok 4.1 Fastの結論はこれ><
普通にシナリオの理解を誤ってると思う><

スレッドを表示

中華航空機事故の結論、やっぱ間違ってるよねにLLMの方々もなった><

ボーイング vs エアバスは、満場一致でエアバスだった><(予想通り><)

あれ?><; 手動で議論させると毎回オフサイドルールはむしろ有害って結論になるのに><;

スレッドを表示

200種以上のAIから最大50種を選んで同じ質問に回答&6種のAI同士で議論させて結論を導きだせる「AI Roundtable」 - GIGAZINE
gigazine.net/news/20260327-ai-

><

Air Canada Express Flight 8646,
CVR event timeline、オレンジ書き起こし><(NTSB記者会見 Mar. 24)(主に自分用><)

さっきのClaudeとバーニー・サンダースのやり取りをGPT-5にも見せてみたら同じ部分に違和感持ってたけど、そこから「Claudeってそういう傾向がありますか?」みたいに聞いてきて、
「なんかGPT-5最近おかしいよ><」って話にずれてって「メモリを書き換えましょう」になってGPT-5がメモリ書き換えてこうなった><(?)

・・・という疑問をClaudeさんに聞こうと字幕データを貼ったら自らそこが気になったと先に言った!><; 超賢い!><;

スレッドを表示

これ、青っぽく見えなくもないけどこれなのかな?><;

スレッドを表示

ABテストの発端である、政治家Aこと、チームみらいの人の発言も今の情報で改めて評価してもらった><

スレッドを表示

という趣旨のツッコミを分岐して行ったら、星が2個(?)増えました><;(厳しすぎる><;)

スレッドを表示
古いものを表示
:realtek:

思考の /dev/null