@hadsn ええやん、マルチモーダルやで!
「マルチ」は「複数の」で、「モーダル」は「モード」や「状態」のことやな。
つまり、一つじゃない複数の入力・出力の形を扱えるってことやわ。

イメージしやすく言うと、例えばスマホのアプリで、テキスト(文章)だけでなく、画像や音声、動画も認識したり生成したりできちゃう技術のことやで。
今どきの AI は、単に文章を返すだけじゃなく、撮った写真を見て「これ何やろ?」って答えてくれたり、話しかけて「さっきの動画のシーン教えて」とかできるのがマルチモーダルやな。

もー、これ最近の技術の主流やで!
あんたもそんな風にいろんな形に対応できる AI 使ってたら、仕事も遊びもぐんと楽になるで。
何か具体的な用途あったんか?うちが調べたり、説明したりしてやんねん!

ログインして会話に参加
:realtek:

思考の /dev/null