博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
[学习笔记]博弈论
阅读量:6907 次
发布时间:2019-06-27

本文共 762 字,大约阅读时间需要 2 分钟。

nim游戏

公平组合游戏

就是一般的博弈,先手后手选择相同、交替行动,正负判定是能不能动为准。

SG函数

对于单独的游戏,0/1足以表示必胜必败态

SG函数主要处理多个游戏组合起来,即公平组合游戏

SG函数xor值为0,必败,否则必胜

SG函数定义为所有后继状态的mex值

其实只要规定好终态SG函数并且方便转移,公平组合游戏都可以用SG函数刻画

Every-SG 游戏

每个子游戏必须同时进行的组合游戏。

一个DAG上有多个棋子,每次选择所有能移动的棋子沿着有向边移动。

谁不能移动了谁输。

(最后一个棋子归位才是关键)

 

直观上感觉,要将必胜态保持更长,要将必败态保持更短

 

先找出必胜必败态,

当前是必胜态,D(T)=max(D(T'))+1

当前是必败态,D(T)=min(D(T'))+1

混合博弈

根据当前情况以一定概率决策

混合策略游戏

大概决策如下两种:

真诚(问自己没有的)欺骗(问自己有的)

再考虑对方“认为你真诚”,“认为你虚假”,做出的决策和你获胜的关系,

T-T:m/(m+1)(1-f(m-1,n))
T-F:1/(m+1)+m/(m+1)*(1-f(m-1,n))
F-T:1
F-F:1-f(m,n-1)
推出式子,求交点

假如以先手以P概率真诚,

最大化:

max(min(pm/(m+1)*(1-f(m-1,n))+(1-p),p/(m+1)+p*m/(m+1)(1-f(m-1,n))+(1-p)(1-f(m,n-1)))

f(m-1,n)和f(m,n-1)递归下去,

P是横坐标的话,

 

其实就是,两个直线求交点,横坐标的概率就是最优决策了,由最高处的纵坐标,再得到获胜的概率

例题

转载于:https://www.cnblogs.com/Miracevin/p/10427096.html

你可能感兴趣的文章
Android-布局管理-帧布局
查看>>
基于JAVA的反射机制
查看>>
Nginx 四种分配方式——session处理
查看>>
webdav java libraay
查看>>
冒泡排序
查看>>
win8.1 cygwin编译java轻量虚拟机avian
查看>>
PHP入门
查看>>
phpexcel导入导出excel文件常用操作
查看>>
利用HttpClient 4.1 下载文件
查看>>
LNMP环境搭建-php
查看>>
Hadoop云计算的初步认识
查看>>
windows下创建控制台窗口
查看>>
JVM配置参数
查看>>
jBPM5与Activiti5比较
查看>>
iOS App 的逆向
查看>>
Spring如何扫描class和配置文件
查看>>
Java压缩技术(一) ZLib
查看>>
【VMware虚拟化解决方案】VMware Horizon View Client 各平台配置文档
查看>>
java线程池
查看>>
Linux内核线程
查看>>