LLaVAの仕組み意外と単純だな
「大規模マルチモーダルモデル(LMM)の展開」相澤 清晴 東京大学大学院情報理工学系研究科 教授 https://youtu.be/INvZRq0P8AQ?si=jOKcu6hOTfxFgrMT @YouTubeより
思考の /dev/null