[学习笔记]博弈论-白红宇

强烈建议你试试无所不能的chatGPT，快点击我

[学习笔记]博弈论

阅读量：6907 次

发布时间：2019-06-27

本文共 762 字，大约阅读时间需要 2 分钟。

nim游戏

公平组合游戏

就是一般的博弈，先手后手选择相同、交替行动，正负判定是能不能动为准。

SG函数

对于单独的游戏，0/1足以表示必胜必败态

SG函数主要处理多个游戏组合起来，即公平组合游戏

SG函数xor值为0,必败，否则必胜

SG函数定义为所有后继状态的mex值

其实只要规定好终态SG函数并且方便转移，公平组合游戏都可以用SG函数刻画

Every-SG 游戏

每个子游戏必须同时进行的组合游戏。

一个DAG上有多个棋子，每次选择所有能移动的棋子沿着有向边移动。

谁不能移动了谁输。

（最后一个棋子归位才是关键）

直观上感觉，要将必胜态保持更长，要将必败态保持更短

先找出必胜必败态，

当前是必胜态，D(T)=max(D(T'))+1

当前是必败态，D(T)=min(D(T'))+1

混合博弈

根据当前情况以一定概率决策

混合策略游戏

大概决策如下两种：

真诚（问自己没有的）欺骗（问自己有的）

再考虑对方“认为你真诚”，“认为你虚假”，做出的决策和你获胜的关系，

T-T:m/(m+1)(1-f(m-1,n))

T-F:1/(m+1)+m/(m+1)*(1-f(m-1,n))

F-T:1

F-F:1-f(m,n-1)

推出式子，求交点

假如以先手以P概率真诚，

最大化：

max(min(pm/(m+1)*(1-f(m-1,n))+(1-p),p/(m+1)+p*m/(m+1)(1-f(m-1,n))+(1-p)(1-f(m,n-1)))

f(m-1,n)和f(m,n-1)递归下去，

P是横坐标的话，

其实就是，两个直线求交点，横坐标的概率就是最优决策了，由最高处的纵坐标，再得到获胜的概率

例题

转载于:https://www.cnblogs.com/Miracevin/p/10427096.html

你可能感兴趣的文章

Android-布局管理-帧布局

基于JAVA的反射机制

Nginx 四种分配方式——session处理

webdav java libraay

win8.1 cygwin编译java轻量虚拟机avian

phpexcel导入导出excel文件常用操作

利用HttpClient 4.1 下载文件

LNMP环境搭建-php

Hadoop云计算的初步认识

windows下创建控制台窗口

JVM配置参数

jBPM5与Activiti5比较

iOS App 的逆向

Spring如何扫描class和配置文件

Java压缩技术（一） ZLib

【VMware虚拟化解决方案】VMware Horizon View Client 各平台配置文档

Linux内核线程

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！-- 愿君每日到此一游！

当前时间: 2025-02-03 02:45:29 当前IP: 3.135.216.199 联系邮箱:javaeecc@qq.com Copyright © 2020 - 2022 baihongyu.com 京ICP备2021015314号-2

强烈建议你试试无所不能的CHAT-GPT，快点击我

强烈建议你试试无所不能的CHAT-GPT，快点击我