新しいものを表示

@numpad0 AI同士で議論させると堂々巡りしてポンコツ具合がわかるけど><;
でも、何らかの指摘に対して「この部分に矛盾が含まれるか?」とか「別の方法でも説明できるか?」みたいな点に関しては、Gemini 2.5とかGPT 4o辺り以上であれば、そこらの人と比べるとかなりしっかりしてるかも><
欠けてる点は、人間の主張側に矛盾があった時に、具体的にどの辺りでおかしいかって注目させないと見逃しちゃう事がそこそこあることかも><(今回いろんなLLMにこの話を投げたのもそれのテスト)

とはいえ、人間でもよほどの議論好きじゃなければ、そこまで議論中の矛盾発見能力がある人ってそんなに居ないと思う><

@numpad0 矛盾点があればどう矛盾があるか指摘するってしてるわけであって、つまり矛盾を指摘できるってことは矛盾がある主張なわけじゃん・・・?><
矛盾部分の撤回を進めていけば、結果的に矛盾がより少ない結論に近づくかも><(矛盾がゼロは無理だけど)

後で自分でも読みたくなるかもだからログ共有><
g.co/gemini/share/e369d0929c12

議論の本題かもしれない部分は、 "では、実際にその点について考察してみるとどうでしょうか?><" 以降かも><
最初の方は、Geminiが矛盾を見つけられるかをテストしたくてやってた部分だからあんまりおもしろくないかも><

自分が議論したい内容の大半についての知識を持ってくれてる議論相手って人間ではめったに見つからないよ?><;

orange さんがブースト

個人的にはLLMと会話することの意味はまだよくわかんないな……

全部読みたい人いる・・・?><;

動的型付けって不要ではって話で、Geminiは「究極の安全性要件」("宇宙船の制御システムや医療機器など、絶対に失敗が許されないシステムにおいて")は、実行時にもバリデーションするじゃん」って話をしてきたけど、「実行時のバリデーションは動的型付けと関係ないだろ>< むしろバリデーションの必要な範囲を実行前に検出するのも静的型検査だろ><」って説明するのにAda/SPARKを使った><

スレッドを表示

ちょうどさっきAda/SPARKで遊んだからこその結論かも><;

こんな感じ>< 

簡単に言うと、人間がかかわらずとも完璧にプログラミングできるAIなるものが出来たとして、
完璧に動作するプログラムは、実行前に型がすべて決定されている(とりうる範囲が全て想定されている)物の事を言う(実行時にしかわからないものに関してバリデーションコードの漏れも無い状態)であるので、
未来の完璧なAIがコーディングした完璧なコードなるものは、完成の時点で既に型が決定しているので、
つまりそれは、定義上、静的型付けである><
みたいな感じで合意が得られたかも><

Geminiの主張の矛盾を(部分的に言及せずに終わったのもあるけど)片っ端から指摘していったら、仮にAIがとても賢くなったとして、消えるのは定義上、動的型付け言語の方であろうという結論で合意できたかも><;

ガチガチの議論好きの人間相手の議論みたいになってるけど、相手が人間の時と違って相手のごはん食べる時間とか寝る時間とか気にしなくていいの素晴らしい><;

なんか、Geminiに最初普通に感想を聞く形でさっきの記事について聞いたら、全然矛盾を見つけられなくてオレンジの指摘でやっと見つけられるという残念なことになったので、「この点とこの点とこの点について、このような矛盾がないか検証してほしい」みたいに注目させるプロンプトで聞いたら、
矛盾は相変わらず見つけられなかったけどなんかものすごい議論モードでの返答になって、そこからバチバチの議論になって超おもしろい><><

4oでも一発で矛盾を見抜きそうと思いきや見抜けなかった><;
指摘したら「確かにそう」ってなったけど><;

スレッドを表示

まつもとゆきひろさん「Programming Language for AI age」~RubyKaigi 2025 3日目キーノート | gihyo.jp
gihyo.jp/article/2025/05/rubyk

なんで、コミュニケーションでのエラーの話を、統合された認識(知識)内でのエラーの話に挿げ替えてるの?><

"...AIが出力したコードを読んで人間が修正したり、人間が書いたコードをAIが手直ししたりなど、AIと人間が相互にやり取りする場合、一般的には静的型付け言語が使いやすいと言われています。..."
"...ただ、未来のことを考えた場合、本当に静的型付けは必要だろうか、とまつもとさんは問いました。人間はうっかり型を間違えることがありますが、賢い人間は型エラーを起こさないので、十分に賢いAIは静的型付けなどなくても型エラーを起こさない、と言います。"

最初の記事は「ブログ始めます」なので、現在アクティブな内容がある記事は、たったひとつ、MySQL 5.7のドキュメントを参照している記事のみって事かも?><;

orange さんがブースト

あれ、3記事目だったんだ。前の記事で参照しているMySQLのドキュメントがバージョン5.7で「あー、ね」となった。
honda-techblog.hatenablog.com/

興味がある人はAda/SPARKを使ってみよう><
公式パッケージマネージャはこれ><
Alire -
alire.ada.dev/

なんというか、静的型検査の超進化版っぽさ><

古いものを表示
:realtek:

思考の /dev/null