AdaのSPARKみたいな形式検証をプログラミング言語環境側に用意してあったら、ハルシネーションの大半にAIが自身で気づけるかもだし、形式検証とAIって相性どうだと思う?><(意訳)って、Geminiさんに聞いてみたら、
「(形式検証で検出できる範囲において)単にハルシネーションに気づけるだけではなく、AIが形式検証エラーのメッセージを読むことで自律的に学習出来るので、SPARKみたいな形式検証とAIの組み合わせはすごくいいはず。でも、規模が大きいプロジェクトでは、AIが出力する契約プログラミングのコードが膨大になって、形式検証の実行に時間がかかってボトルネックになりそう」(意訳)
みたいに言われた><
コーディングエージェントの現状の整理とエンジニアの仕事の変化について https://azukiazusa.dev/blog/coding-agents-and-developers-work
いま話題の(?)これ読んでて思いついたけど、
AIの自立型プログラミングでのハルシネーション抑制に、AdaのSPARKのように『契約プログラミングの記述を使った形式検証環境』をプログラミング言語側に用意したら、『形式検証で検出できる範囲のハルシネーションによる誤り(=実行時にエラーを起こして停止するような誤りの大半)』は、AIがSPARKみたいなのを動かして形式検証エラーのエラーメッセージを読む事で自分で自分のハルシネーションに気づけるようになると思うんだけどどうだろう?><
FreePats project - World and Rare Percussion
https://freepats.zenvoid.org/Percussion/world-and-rare-percussion.html
『10インチモニター搭載メカニカルキーボード』を発売 | サンコー株式会社のプレスリリース
https://prtimes.jp/main/html/rd/p/000000312.000111905.html
おもしろそうだけど、DellやhpのRyzen 3のラップトップが買えるお値段><;
「自分の頭で考えること」を学ぶ - いつか博士になる人へ
https://www.ki1tos.com/entry/2020/04/14/174739
何日か前にこれを読み返して思いついたけど(あんまり直接は関係ないんだけど)
課題とテストを分けるって方式にする手もありそう><
課題は行って持ってくるけど、課題に関する問題は提出後に出題されるので、問題への回答部分で不正ができない方式><
つまり自分が提出した課題に対する理解がなければ答えられない問題を後から出して、課題ではなくて後からのテストのほうで評価する方式><
「個人のブログで発信されていたような情報がYouTubeに流れていっている」そうなのか。「動画は、テキストに比べて効率が悪すぎる」見る側も効率が悪いが動画を作る側も相当労力がいるから継続できるのか問題
---
情報収集の仕方を模索している - 下林明正のブログ
https://shimobayashi.hatenablog.com/entry/2025/05/31/000014
#bookmarks