DeepMind开源强化学习游戏框架,25款线上游戏等你来挑战
选自GitHub
强化学习算法没有游戏训练?DeepMind 开源 OpenSpiel 平台了。研究者可在线部署游戏环境,快速开始实验。
项目地址:https://github.com/deepmind/open_spiel
单人或多人博弈;
完美信息或不完美信息博弈;
带有随机性的博弈;
普通的多玩家「一步」或二人玩家的多步博弈;
交替行动(如下棋)或同时行动的游戏;
零和博弈和非零和博弈(如需要合作的博弈等)。
C++11
Python 3
以及一个支持 Swift 语言的缩减版


import random
import pyspiel
game = pyspiel.load_game("kuhn_poker")
state = game.new_initial_state()
while not state.is_terminal():
legal_actions = state.legal_actions()
if state.is_chance_node():
# Sample a chance event outcome.
outcomes_with_probs = state.chance_outcomes()
action_list, prob_list = zip(*outcomes_with_probs)
action = np.random.choice(action_list, p=prob_list)
state.apply_action(action)
else:
# The algorithm can pick an action based on an observation (fully observable
# games) or an information state (information available for that player)
# We arbitrarily select the first available action as an example.
action = legal_actions[0]
state.apply_action(action)
virtualenc -p python3 venv
source venv/bin/activate
pip3 install -r requirements.txt
mkdir build
cd build
CXX=g++ cmake -DPython_TARGET_VERSION=3.6 -DCMAKE_CXX_COMPILER=${CXX} ../open_spiel
make -j$(nproc)
ctest -j$(nproc)
./open_spiel/scripts/build_and_run_tests.sh
export PYTHONPATH=$PYTHONPATH:/
export PYTHONPATH=$PYTHONPATH://build/python
关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

随时掌握互联网精彩
赞助链接
排名
热点
搜索指数
- 1 中拉十年合作跑出“加速度” 7904766
- 2 国台办回应特朗普突然提到“统一” 7808133
- 3 外交部:中方对美芬太尼反制仍然有效 7712476
- 4 这次部长级会议为何多国元首都来了 7617069
- 5 多名在英国中国公民失踪失联 7523889
- 6 印巴谁赢了?发布会这7秒说明了很多 7425408
- 7 网红千惠戛纳红毯足足走了3分钟 7329895
- 8 为救同学缺考的男生可以考试了 7234372
- 9 93年女子嫁65年丈夫 当事人发声 7138803
- 10 知名女演员重病归来 曾四登春晚 7039726