DeepMind开源强化学习游戏框架,25款线上游戏等你来挑战
选自GitHub
强化学习算法没有游戏训练?DeepMind 开源 OpenSpiel 平台了。研究者可在线部署游戏环境,快速开始实验。
项目地址:https://github.com/deepmind/open_spiel
单人或多人博弈;
完美信息或不完美信息博弈;
带有随机性的博弈;
普通的多玩家「一步」或二人玩家的多步博弈;
交替行动(如下棋)或同时行动的游戏;
零和博弈和非零和博弈(如需要合作的博弈等)。
C++11
Python 3
以及一个支持 Swift 语言的缩减版


import random
import pyspiel
game = pyspiel.load_game("kuhn_poker")
state = game.new_initial_state()
while not state.is_terminal():
legal_actions = state.legal_actions()
if state.is_chance_node():
# Sample a chance event outcome.
outcomes_with_probs = state.chance_outcomes()
action_list, prob_list = zip(*outcomes_with_probs)
action = np.random.choice(action_list, p=prob_list)
state.apply_action(action)
else:
# The algorithm can pick an action based on an observation (fully observable
# games) or an information state (information available for that player)
# We arbitrarily select the first available action as an example.
action = legal_actions[0]
state.apply_action(action)
virtualenc -p python3 venv
source venv/bin/activate
pip3 install -r requirements.txt
mkdir build
cd build
CXX=g++ cmake -DPython_TARGET_VERSION=3.6 -DCMAKE_CXX_COMPILER=${CXX} ../open_spiel
make -j$(nproc)
ctest -j$(nproc)
./open_spiel/scripts/build_and_run_tests.sh
export PYTHONPATH=$PYTHONPATH:/
export PYTHONPATH=$PYTHONPATH://build/python
关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

随时掌握互联网精彩
赞助链接
排名
热点
搜索指数
- 1 不忘来时路 7978037
- 2 16亿美元反华宣传被甲亢哥干翻了 7998806
- 3 今年清明为何是4月4日 7837975
- 4 这些道路用烈士的名字命名 7742656
- 5 尹锡悦被罢免总统职务 7635683
- 6 哈尔滨市公安局回应美网络攻击 7582936
- 7 身上多处被烤熟的鹅坚强已能进食 7469508
- 8 一家三口被撞案六旬母亲:没有后代了 7347496
- 9 67岁老戏骨哭穷 曾志伟回应 7226642
- 10 清明节你最思念谁 7119835