Convergence and Near Optimality of Q-Learning with Finite Memory for Partially Observed Models

Convergence and Near Optimality of Q-Learning with Finite Memory for Partially Observed Models | IEEE Conference Publication | IEEE Xplore