区块链前沿 | 文献

区块链前沿

注册登录

搜索范围

主题
作者

发表时间

全部
SEP
OCT
NOV
DEC
2026
2025
2024
2023 OCT 18
2023 OCT 16
2023 OCT 15
2023 OCT 13
2023 OCT 11
2023 OCT 10
2023
2022
2021
2020
2019
2018
2017
2016
2015
2014
2013
2012
2011
2010
2009
2008
1995

更新日期

深度强化学习在解决部分可观察马尔可夫决策过程(POMDP)问题中应用的最新进展【第2部分—在交通、工业、通信和网络等领域的应用】

2021
Xiang, Xuanchen; Foo, Simon; Zang, Huanyu

该系列论文由两部分组成，对解决部分可观察马尔可夫决策过程(POMDP)问题的深度强化学习(DRL)的最新进展进行了调查。强化学习（RL）是一种模拟人类自然学习过程的方法，其关键是让智能体通过与随机环境的交互来学习。智能体对环境信息的访问有限这一事实使人工智能能够有效地应用于大多数需要自学的领域。进行有组织的调查是至关重要的——在各种应用程序中应用DRL时，我们可以进行良好的比较并选择最佳的结构或算...