結局、LLM モデルも LLM ランタイムも驚く早さで改良されるし、さらにそれらを管理するエージェントの登場で、メモリが 512GB とかなくてもそこそこ動くようになってきたというのが大きいと思う。
思考の /dev/null