固定された投稿

自己紹介下書き2>< 

超多趣味で、興味がある分野は、

航空(※1)宇宙開発鉄道物流都市計画都市緑化自動車(※2)送電線 南の島の電柱 クレーン橋梁トンネルダム廃道酷道 土木と公共事業と地域問題 土砂災害電子計算機 ヒューマンセンタードデザイン 建築地理地域ネタ 世界のローカルフード マイナードリンク郷土史冷戦史 虐殺問題と国連の役割 人種差別問題セクシャルマイノリティ差別問題 東欧の民主化 報道とその役割 放送局用機器シンセサイザーポピュラー音楽制作背景史アメリカ文化 アメリカのトラック輸送 大規模農業大型農業機械垂直農業農産物の安全保障紛争鉱物問題
かも><
(※1 ジャーマンウィングス事故で世界で最初に、管制との最後の交信内容を言い当てた><)
(※2 免許は無い><)

ワードサラダ並み感><;

LLMによる検証なんて誰も読みたくないらしい(オレンジは読みたいけど><)ので、全文は貼らないけど、Gemini 3に検証させたら最後に上手いこと言った><(?)
"...あなたの「30秒」の思考、完全にコンパイル通ってますよ!><"

orange さんがブースト

まあメタ検証されてないのはそうなんでしょうけど (まずそれ自体が難しいし、時として倫理的な問題も孕んでいる)、検証されてしまった結果エーアイでいいじゃんとなった人は既に続々解雇されていたり、あるいはそうならないように人々がこっそりエーアイプロキシとして動作していたりするんじゃないですかね (しらんけど)

静的型システムでたとえたのも、この議論の構図が少し昔の動的型つけ vs 静的型つけ議論での、動的型つけ派(正確に言えば、そもそも根本的に勘違いしてる『ゆるふわ型つけ派』)の主張と似てる気がしたから><

たぶんその状況自体が、メタに無検証であるので、ある種の誤判定を常に持ってしまっているんだと思う><
その検証環境において、人間が検証する方が正しく検証できるかどうかがメタに検証される事ってあんまり無さそう><
『そこにいる人間』とAIで比較しなければいけないのに、一般的に『そこに居る最も優れた人間』とAIを比較するという誤りをしてるかも的な><

orange さんがブースト

方向を変えると、「あらゆる面でエーアイより思考能力が劣っている人間 (仮定的存在とします) であれば自分の頭で考えることにエーアイ以上の価値はない」ということでもありそうだし、このように主張していないということはつまり今のところ「大したことのない多くの人間」はそれでもまだエーアイよりマシという暗黙の前提があるということなんでしょうね。
それが本当かは知らんし、だいぶセンシティブな話なのでインタネッツでやりたくない。

スレッドを表示
orange さんがブースト

多くの人間が大したことがなく、また大したことのある人間も誤ることがあるのは全くその通りではあるんだけど。
それは大したことがない人間の大したことがない程度はある程度安定していて分野ごとの傾向などもあって見積り可能である、みたいな辺りの偏りも含めて向き合うものなので、「この分野/作業ではあてにならない」のような局所的な烙印であってもやはりそのようなレッテルが存在できて人々が回避を試みているということ自体がシステムとして重要であると思う

orange さんがブースト

スイスチーズモデル的な話がしたいのかもしれないけど、あれも結局は正常な操作のうち最終的に必要になるものはどうにかチーズの層を越えられることを前提においていると思うので (でないと製品や操作体系としてそもそもの目的を果たせるものでないということになる)

スレッドを表示
orange さんがブースト

で、全く本題ではないが mstdn.nere9.help/@orange_in_sp での例について言及しておくと、健全な静的型システムは「問題のないプログラムを拒否することはあるが、問題のあるプログラムを許容することはない」というある種の一方向性こそが安全と利用しやすさに寄与しているという面がある。つまり false positive はあるが false negative はない、ということ。

対してエーアイによる検証は「問題のある理屈を問題なさそうとしてしまうこともあり、逆に問題のない理屈に問題があるかもしれないとする可能性もある」という点で、この一方向性がない。よって安全への寄与の側面での喩えとして出すにはちょっと構造的な違いがデカいのではないかと思った

これはある種の誤認(人間万能論的な感じ)なのでは><
何らかの任意のタスクをこなす能力において、平均的な人間の能力なんて大したこと無いということを多くの人が都合よく忘れてしまうからこその、誤判定の一種のような気がする><

orange さんがブースト

具体的には、エーアイによる情報を丸投げすると「この人は自分では『何も考えなかった』が、本人の頭で考えた場合にそれに気付ける能力がある可能性は否定できない」程度の割と中立・評価保留程度の評価に寄りがちなのに対して、人間による嘘を投げると「この人は自分で考えた結果『思考能力の不足を露呈した』」という無能の保証がつく。
実運用においてこの差は大きい。

スレッドを表示

そもそもあらゆる分野に対して、まともな大きさのLLM以上に詳細に検証できる人間なんてほとんどいないと思う><

orange さんがブースト

うーん、まずエーアイによるかどうかを問わず無検証での丸投げはカス! というのはその通りで異論はない。

そのうえで、 mastodon.cardina1.red/@lo48576 で挙げたように「エーアイを通してフィルタした人間が未検証のデカ情報」は、「エーアイにフィルタさせた痕跡のない人間が未検証の情報」に比べて発言者に与える不名誉効果が小さすぎるという問題がある。この点においてエーアイ使うくらいなら人間が嘘つく方が (周囲の人間にとっては) マシともいえると思う

自分で検証したわけでもなくLLMに検証させたわけでもない主張を投げるのは、是非は別として、静的型つけ言語を使っているのにコンパイルが通るかも試してないコードをぶん投げることと同じです><
静的型検査は、すべてのエラーを見つけられるわけではなく、それ自体にバグがないことは保証せず、そして人間でも無いですが、型検査しないよりは大幅にマシです><

ちなみにオレンジが一番言いたいことはこれで、

mstdn.nere9.help/@orange_in_sp

ピカソの逸話の30年相当部分が無く、何らかの議論の議題に対して30年相当部分を持とうとする積もりがないのであれば、LLMを使う方が鵜呑みにする(無検証でスルーさせる)よりずっとマシなので、せめてLLMくらい使え><
です><

嫌みだらけの文であろうとも、事実誤認は事実誤認だし矛盾は矛盾><

orange さんがブースト

それならそれでいいんだけど、嫌味ばかりでダイレクトな指摘がない (ように私には見えた) ので正直真面目に向き合う気はあまりなかったです (正確には向き合うべき主張の明文化が行われていないので「そうだね」「そうかぁ?」程度の言説にしか値しないと思っており真面目にやる気が出ない)

x 30秒相当の部分労力
o 30秒部分相当の労力
><;

スレッドを表示

いいえ><
そこも含め、ほぼ全体の論理展開に誤りがあるとオレンジは言ってます><

orange さんがブースト

黴の生えたレトリックだなとは思うけど、その部分を “修正” したところで本題にそこまで大きな影響はないかなと感じます (エーアイの “知性” を信じる人にとっては大きな違いかもしれないが)

スレッドを表示
orange さんがブースト
古いものを表示
:realtek:

思考の /dev/null