ローカルLLMのコントロールが課題になっている
速いモデルは速いけど、ハルシネーションをいち早く検出してリトライをかける調整が必要そう
エージェントにはそういう機能があるとのことで、できなくはなさそう
思考の /dev/null