464. 我能赢吗 : 博弈论 DP 运用题

时间：2023-12-06 本站点击：0

题目描述

这是 LeetCode 上的 464. 我能赢吗，难度为中等。

Tag : 「博弈论 DP」、「记忆化搜索」、「状态压缩」

在 "100 game" 这个游戏中，两名玩家轮流选择从 $1$ 到 $10$ 的任意整数，累计整数和，先使得累计整数和达到或超过 $100$ 的玩家，即为胜者。

如果我们将游戏规则改为 “玩家不能重复使用整数” 呢？

例如，两个玩家可以轮流从公共整数池中抽取从 $1$ 到 $15$ 的整数（不放回），直到累计整数和 >= $100$。

给定两个整数 maxChoosableInteger （整数池中可选择的最大数）和 desiredTotal（累计和），若先出手的玩家是否能稳赢则返回 true ，否则返回 false 。假设两位玩家游戏时都表现最佳。

示例 1：

输入：maxChoosableInteger = 10, desiredTotal = 11输出：false解释：无论第一个玩家选择哪个整数，他都会失败。第一个玩家可以选择从 1 到 10 的整数。如果第一个玩家选择 1，那么第二个玩家只能选择从 2 到 10 的整数。第二个玩家可以通过选择整数 10（那么累积和为 11 >= desiredTotal），从而取得胜利.同样地，第一个玩家选择任意其他整数，第二个玩家都会赢。

示例 2:

输入：maxChoosableInteger = 10, desiredTotal = 0输出：true

示例 3:

输入：maxChoosableInteger = 10, desiredTotal = 1输出：true

提示:

$1 <= maxChoosableInteger <= 20$

$0 <= desiredTotal <= 300$

二维博弈论 DP（TLE）

这是一道博弈论 DP 的题，为了方便，我们使用 $n$ 来表示 $maxChoosableInteger$，使用 $t$ 来表示 $desiredTotal$。

由于 $n$ 数据范围为 $20$，且每个数只能选一次，我们可以使用一个二进制数 $state$ 来表示 $[1, n]$ 范围内的被选择的数的情况：二进制表示中 $1$ 的位置代表数已被选择，否则代表尚未选择。

首先朴素二维状态表示相对容易想到：定义 $f[statue][k]$ 为当前已被选择的数为 $state$，轮数为 $k$ 时，「原始回合的先手」能否获胜（$1$ 代表能，$-1$ 代表不能），其中 $k$ 从 $0$ 开始，通过 $k$ 的奇偶性可知是原始回合的先手还是后手。

设计递归函数来实现「记忆化搜索」，函数 int dfs(int state, int tot, int k) 表示当前状态为 $state$，$tot$ 对应累计和，$k$ 代表轮数，最终答案通过判断 dfs(0, 0, 0) 是否为 $1$ 来得知。

转移过程中，如果发现当前回合的决策，能够直接使得累积和超过 $t$，说明当前回合玩家获胜；或者如果当前决策能够导致下一回合的玩家失败的话，当前回合玩家也获胜，否则当前玩家失败。

代码：

class Solution {    int n, t;    int[][] f = new int[1 << 20][2];    // 1 true / -1 false    int dfs(int state, int tot, int k) {        if (state == ((1 << n) - 1) && tot < t) return -1;        if (f[state][k % 2] != 0) return f[state][k % 2];        int hope = k % 2 == 0 ? 1 : -1;        for (int i = 0; i < n; i++) {            if (((state >> i) & 1) == 1) continue;            if (tot + i + 1 >= t) return f[state][k % 2] = hope;            if (dfs(state | (1 << i), tot + i + 1, k + 1) == hope) return f[state][k % 2] = hope;        }        return f[state][k % 2] = -hope;    }    public boolean canIWin(int _n, int _t) {        n = _n; t = _t;        if (t == 0) return true;        return dfs(0, 0, 0) == 1;    }}

时间复杂度：共有 $2^{n} \times 2$ 个状态，每个状态转移需要 $O(n)$ 复杂度，整体复杂度为 $O(2^{n + 1} \times n)$

空间复杂度：$O(2^{n + 1})$

优化状态表示

进一步发现，若能优化轮数维度，可以有效减少一半的计算量，我们调整状态定义为：定义 $f[state]$ 为当前状态为 $state$，「当前先手」能否获胜（$1$ 代表能，$-1$ 代表不能）。

同时调整递归函数为 $int dfs(int state, int tot)$，最终答案通过判断 dfs(0, 0) 是否为 $1$ 来得知。

注意这里调整的重点在于：将记录「原始回合的先后手发起和原始回合的先后手获胜情况」调整为「当前回合发起和当前回合获胜情况」。

代码：

class Solution {    int n, t;    int[] f = new int[1 << 20];    // 1 true / -1 false    int dfs(int state, int tot) {        if (f[state] != 0) return f[state];        for (int i = 0; i < n; i++) {            if (((state >> i) & 1) == 1) continue;            if (tot + i + 1 >= t) return f[state] = 1;            if (dfs(state | (1 << i), tot + i + 1) == -1) return f[state] = 1;        }        return f[state] = -1;    }    public boolean canIWin(int _n, int _t) {        n = _n; t = _t;        if (n * (n + 1) / 2 < t) return false;        if (t == 0) return true;        return dfs(0, 0) == 1;    }}

时间复杂度：共有 $2^{n}$ 个状态，每个状态转移需要 $O(n)$ 复杂度，整体复杂度为 $O(2^{n} \times n)$

空间复杂度：$O(2^{n})$

最后

这是我们「刷穿 LeetCode」系列文章的第 No.464 篇，系列开始于 2021/01/01，截止于起始日 LeetCode 上共有 1916 道题目，部分是有锁题，我们将先把所有不带锁的题目刷完。

在这个系列文章里面，除了讲解解题思路以外，还会尽可能给出最为简洁的代码。如果涉及通解还会相应的代码模板。

为了方便各位同学能够电脑上进行调试和提交代码，我建立了相关的仓库：https://github.com/SharingSource/LogicStack-LeetCode 。

在仓库地址里，你可以看到系列文章的题解链接、系列文章的相应代码、LeetCode 原题链接和其他优选题解。

原文：https://juejin.cn/post/7100389488643276808

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如若转载，请注明出处：/java/15881.html

464. 我能赢吗 : 博弈论 DP 运用题

题目描述

二维博弈论 DP（TLE）

优化状态表示

最后

最新文章