首页>>后端>>java->464. 我能赢吗 : 博弈论 DP 运用题

464. 我能赢吗 : 博弈论 DP 运用题

时间:2023-12-06 本站 点击:0

题目描述

这是 LeetCode 上的 464. 我能赢吗 ,难度为 中等。

Tag : 「博弈论 DP」、「记忆化搜索」、「状态压缩」

在 "100 game" 这个游戏中,两名玩家轮流选择从 $1$ 到 $10$ 的任意整数,累计整数和,先使得累计整数和 达到或超过  $100$ 的玩家,即为胜者。

如果我们将游戏规则改为 “玩家 不能 重复使用整数” 呢?

例如,两个玩家可以轮流从公共整数池中抽取从 $1$ 到 $15$ 的整数(不放回),直到累计整数和 >= $100$。

给定两个整数 maxChoosableInteger (整数池中可选择的最大数)和 desiredTotal(累计和),若先出手的玩家是否能稳赢则返回 true ,否则返回 false 。假设两位玩家游戏时都表现 最佳 。

示例 1:

输入:maxChoosableInteger = 10, desiredTotal = 11输出:false解释:无论第一个玩家选择哪个整数,他都会失败。第一个玩家可以选择从 1 到 10 的整数。如果第一个玩家选择 1,那么第二个玩家只能选择从 2 到 10 的整数。第二个玩家可以通过选择整数 10(那么累积和为 11 >= desiredTotal),从而取得胜利.同样地,第一个玩家选择任意其他整数,第二个玩家都会赢。

示例 2:

输入:maxChoosableInteger = 10, desiredTotal = 0输出:true

示例 3:

输入:maxChoosableInteger = 10, desiredTotal = 1输出:true

提示:

$1 <= maxChoosableInteger <= 20$

$0 <= desiredTotal <= 300$

二维博弈论 DP(TLE)

这是一道博弈论 DP 的题,为了方便,我们使用 $n$ 来表示 $maxChoosableInteger$,使用 $t$ 来表示 $desiredTotal$。

由于 $n$ 数据范围为 $20$,且每个数只能选一次,我们可以使用一个二进制数 $state$ 来表示 $[1, n]$ 范围内的被选择的数的情况:二进制表示中 $1$ 的位置代表数已被选择,否则代表尚未选择。

首先朴素二维状态表示相对容易想到:定义 $f[statue][k]$ 为当前已被选择的数为 $state$,轮数为 $k$ 时,「原始回合的先手」能否获胜($1$ 代表能,$-1$ 代表不能),其中 $k$ 从 $0$ 开始,通过 $k$ 的奇偶性可知是原始回合的先手还是后手。

设计递归函数来实现「记忆化搜索」,函数 int dfs(int state, int tot, int k) 表示当前状态为 $state$,$tot$ 对应累计和,$k$ 代表轮数,最终答案通过判断 dfs(0, 0, 0) 是否为 $1$ 来得知。

转移过程中,如果发现当前回合的决策,能够直接使得累积和超过 $t$,说明当前回合玩家获胜;或者如果当前决策能够导致下一回合的玩家失败的话,当前回合玩家也获胜,否则当前玩家失败。

代码:

class Solution {    int n, t;    int[][] f = new int[1 << 20][2];    // 1 true / -1 false    int dfs(int state, int tot, int k) {        if (state == ((1 << n) - 1) && tot < t) return -1;        if (f[state][k % 2] != 0) return f[state][k % 2];        int hope = k % 2 == 0 ? 1 : -1;        for (int i = 0; i < n; i++) {            if (((state >> i) & 1) == 1) continue;            if (tot + i + 1 >= t) return f[state][k % 2] = hope;            if (dfs(state | (1 << i), tot + i + 1, k + 1) == hope) return f[state][k % 2] = hope;        }        return f[state][k % 2] = -hope;    }    public boolean canIWin(int _n, int _t) {        n = _n; t = _t;        if (t == 0) return true;        return dfs(0, 0, 0) == 1;    }}

时间复杂度:共有 $2^{n} \times 2$ 个状态,每个状态转移需要 $O(n)$ 复杂度,整体复杂度为 $O(2^{n + 1} \times n)$

空间复杂度:$O(2^{n + 1})$

优化状态表示

进一步发现,若能优化轮数维度,可以有效减少一半的计算量,我们调整状态定义为:定义 $f[state]$ 为当前状态为 $state$,「当前先手」能否获胜($1$ 代表能,$-1$ 代表不能)。

同时调整递归函数为 $int dfs(int state, int tot)$,最终答案通过判断 dfs(0, 0) 是否为 $1$ 来得知。

注意这里调整的重点在于:将记录「原始回合的先后手发起 和 原始回合的先后手获胜情况」调整为「当前回合发起 和 当前回合获胜情况」。

代码:

class Solution {    int n, t;    int[] f = new int[1 << 20];    // 1 true / -1 false    int dfs(int state, int tot) {        if (f[state] != 0) return f[state];        for (int i = 0; i < n; i++) {            if (((state >> i) & 1) == 1) continue;            if (tot + i + 1 >= t) return f[state] = 1;            if (dfs(state | (1 << i), tot + i + 1) == -1) return f[state] = 1;        }        return f[state] = -1;    }    public boolean canIWin(int _n, int _t) {        n = _n; t = _t;        if (n * (n + 1) / 2 < t) return false;        if (t == 0) return true;        return dfs(0, 0) == 1;    }}

时间复杂度:共有 $2^{n}$ 个状态,每个状态转移需要 $O(n)$ 复杂度,整体复杂度为 $O(2^{n} \times n)$

空间复杂度:$O(2^{n})$

最后

这是我们「刷穿 LeetCode」系列文章的第 No.464 篇,系列开始于 2021/01/01,截止于起始日 LeetCode 上共有 1916 道题目,部分是有锁题,我们将先把所有不带锁的题目刷完。

在这个系列文章里面,除了讲解解题思路以外,还会尽可能给出最为简洁的代码。如果涉及通解还会相应的代码模板。

为了方便各位同学能够电脑上进行调试和提交代码,我建立了相关的仓库:https://github.com/SharingSource/LogicStack-LeetCode 。

在仓库地址里,你可以看到系列文章的题解链接、系列文章的相应代码、LeetCode 原题链接和其他优选题解。

原文:https://juejin.cn/post/7100389488643276808


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:/java/15881.html