Reinforcement learning function approximation. Kiến ba khoang.

Bupati palu. 什麼 時候 不能 吃 香蕉.