Approximate Policy Iteration With Deep Minimax Average Bellman Error Minimization

Approximate Policy Iteration With Deep Minimax Average Bellman Error Minimization | IEEE Journals & Magazine | IEEE Xplore