なぜかml-agentのサンプルのテニスは、1バウンドがアウトになってて羽子板みたいなプレイになっている 卓球は1バウンドでノーバウンドアウトだが、テニスはノーバウンドまたは1バウンドセーフでアウトなのは2バウンドということでHitWall.csを改造して1バウ…
強化学習ってのは水族館でのアシカの調教と同じで、うまくやったら餌をやり、失敗したら怒る学習 教師あり学習と違って、アシカがどう動くはアシカに任せて、結果だけで評価する 初期状態では基本的にはランダムに動く 成功したら、その成功に道筋すべての行…
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。