Convergence Results for Single-Step On-Policy Reinforcement-Learning Algorithms

aroocarmineΤεχνίτη Νοημοσύνη και Ρομποτική

29 Οκτ 2013 (πριν από 4 χρόνια και 6 μήνες)

108 εμφανίσεις