Convergence Results for Single-Step On-Policy Reinforcement-Learning Algorithms

aroocarmineΤεχνίτη Νοημοσύνη και Ρομποτική

29 Οκτ 2013 (πριν από 3 χρόνια και 7 μήνες)

90 εμφανίσεις