Convergence Results for Single-Step On-Policy Reinforcement-Learning Algorithms

aroocarmineΤεχνίτη Νοημοσύνη και Ρομποτική

29 Οκτ 2013 (πριν από 4 χρόνια και 12 μέρες)

102 εμφανίσεις