2-3 値を覚えて再利用 “動的計画法”
探索のメモ化と動的計画法
# 01ナップサック問題 (ナイーブ解)
n: int = 4
w: list[int] = [2, 1, 3, 2]
v: list[int] = [3, 2, 4, 2]
W: int = 5
def rec(i, j) -> int:
"""
iは選択済みの商品番号、jはナップサックの残用量
"""
if i == n:
return 0
return max((v[i] + rec(i + 1, j - w[i])) * (j >= w[i]), rec(i + 1, j))
def solve() -> None:
print(rec(0, W))
ナイーブ解の計算量
探索の深さは最大、各深さにおいて 2 回分岐するため、計算量は
ナイーブ解の改善
rec(i, j)
の呼び出しにおける (i, j)
の組み合わせは高々 通りなので、呼び出し結果を保存しておくことで計算量を改善できる。
## 01ナップサック問題 (メモ化)
import functools
@functools.cache
def rec(i: int, j: int) -> int:
if i == n:
return 0
return max(v[i] + rec(i + 1, j - w[i]) * (j >= w[i]), rec(i + 1, j))
def solve() -> None:
print(rec(0, W))
## 01ナップサック問題 (メモ化ー自力で実装)
memo: list[list[int]] = [[-1] * (W + 1) for _ in range(n)]
def rec(i: int, j: int) -> int:
if not memo[i][j] != -1:
return memo[i][j]
if i == n:
return 0
memo[i][j] = max((v[i] + rec(i + 1, j - w[i])) * (j >= w[i]), rec(i + 1, j))
return memo[i][j]
def solve() -> None:
print(rec(0, W))
メモ化後の計算量
引数の組み合わせは高々 通りであり、関数内でも 2 回の再帰呼び出しが行われるのみであるから、計算量は 。
そして DP へ
dp[i][j]
は関数 rec(i, j)
の定義より、i
番目の品物以降の品物から重さの総和が j
以下となるように選んだときの価値の総和となっている。値は次のように計算できる。
この計算式を用いることで、単純な 2 重ループで問題を解く事が出来る。
# 01ナップサック問題(DP・逆方向)
n = 4
w = [2, 1, 3, 2]
v = [3, 2, 4, 2]
W = 5
dp = [[-100 for _ in range(W + 1)] for _ in range(n + 1)]
for j in range(W + 1):
dp[n][j] = 0
for i in reversed(range(n)):
for j in range(W + 1):
if j < w[i]:
dp[i][j] = dp[i + 1][j]
else:
dp[i][j] = max(dp[i + 1][j], dp[i + 1][j - w[i]] + v[i])
i \ j | 0 | 1 | 2 | 3 | 4 | 5 |
---|---|---|---|---|---|---|
0 | -100 | -100 | -100 | -100 | -100 | -100 |
1 | -100 | -100 | -100 | -100 | -100 | -100 |
2 | -100 | -100 | -100 | -100 | -100 | -100 |
3 | -100 | -100 | -100 | -100 | -100 | -100 |
4 | -100 | -100 | -100 | -100 | -100 | -100 |
漸化式は次のように定める事も出来る。
## 01ナップサック問題(DP・順方向)
n = 4
w = [2, 1, 3, 2]
v = [3, 2, 4, 2]
W = 5
dp = [[-100 for _ in range(W + 1)] for _ in range(n + 1)]
for j in range(W + 1):
dp[0][j] = 0
for i in range(n):
for j in range(W + 1):
if j < w[i]:
dp[i + 1][j] = dp[i][j]
else:
dp[i + 1][j] = max(dp[i][j], dp[i][j - w[i]] + v[i])
i \ j | 0 | 1 | 2 | 3 | 4 | 5 |
---|---|---|---|---|---|---|
0 | -100 | -100 | -100 | -100 | -100 | -100 |
1 | -100 | -100 | -100 | -100 | -100 | -100 |
2 | -100 | -100 | -100 | -100 | -100 | -100 |
3 | -100 | -100 | -100 | -100 | -100 | -100 |
4 | -100 | -100 | -100 | -100 | -100 | -100 |
実際の DP はどう考えるのか
- DP テーブルの定義
- 遷移式
- 埋める方向
最長共通部分列問題(LCS)
ポイントは、遷移における矢印の意味が文字を足すではなく、文字を消す操作に対応するということである。
文字列の入ったスタックから、任意の順番で文字を取り出していく操作だと見なすと分かりやすい。
どちらか一方のスタックから要素を取り出す操作では文字のマッチは考えない。これは DP テーブルでの右方向または下方向への遷移に対応する。
両方の要素を同時に取り出すときに、そのタイミングで文字をマッチさせる(LCSを構成する要素)と考える。これは DP テーブルでの右下方向への遷移に対応する。
【画像引用】まくろぐ / 文字列の類似度を計算する (LCS: 最長共通部分列)
# 最長共通部分問題
n: int = 4
m: int = 4
s: str = "abcd"
t: str = "becd"
# dp[i][j] := s[:i], t[:j] での LCS の長さ
dp: list[list[int]] = [[0 for _ in range(m + 1)] for _ in range(n + 1)]
film = [copy.deepcopy(dp)]
for i in range(n):
for j in range(m):
dp[i + 1][j + 1] = max(dp[i + 1][j], dp[i][j + 1], dp[i][j] + (s[i] == t[j]))
film.append(copy.deepcopy(dp))
@ipywidgets.interact(flame=ipywidgets.IntSlider(min=0, max=len(film) - 1))
def show_table_transition(flame: int):
table = pd.DataFrame(
film[flame], columns=list(enumerate(" " + s)), index=list(enumerate(" " + t))
)
with pd.option_context("display.float_format", "{:.0g}".format):
display(table)
漸化式を工夫する
個数制限なしナップサック問題
# 個数制限なしナップサック問題 (ナイーブ解)
n: int = 3
w: list[int] = [3, 4, 2]
v: list[int] = [4, 5, 3]
W: int = 7
dp: list[list[int]] = [[0 for _ in range(W + 1)] for _ in range(n + 1)]
film = [(copy.deepcopy(dp), (0, 0, 0))]
for i in range(n):
for j in range(W + 1):
for k in range(j // w[i] + 1):
dp[i + 1][j] = max(dp[i + 1][j], dp[i][j - k * w[i]] + k * v[i])
film.append((copy.deepcopy(dp), (i, j, k)))
@ipywidgets.interact(flame=ipywidgets.IntSlider(min=0, max=len(film) - 1))
def show_table_transition(flame: int):
dp, (i, j, k) = film[flame]
table = pd.DataFrame(dp)
with pd.option_context("display.float_format", "{:.0g}".format):
display(
table.style.set_properties(
subset=pd.IndexSlice[i + 1, j], **{"background-color": "#FF7000"}
).set_properties(
subset=pd.IndexSlice[i, j - k * w[i]], **{"background-color": "#FFBF00"}
)
)
print(f"価値{v[i]}、重さ{w[i]}の品物を{k}個取る")
ナイーブ解の計算量改善
の計算において、 個選ぶ場合は の計算において 個選んだ場合と同様であるため、 の遷移式における の部分の計算は既に の計算時に行っている。
つまり、次のような式変形が可能
# 個数制限なしナップサック問題 (計算量改善)
n: int = 3
w: list[int] = [3, 4, 2]
v: list[int] = [4, 5, 3]
W: int = 7
dp: list[list[int]] = [[0 for _ in range(W + 1)] for _ in range(n + 1)]
film = [(copy.deepcopy(dp), (0, 0, 0))]
for i in range(n):
for j in range(W + 1):
dp[i + 1][j] = max(dp[i][j], dp[i + 1][j - w[i]] + v[i] * (j - w[i] >= 0))
film.append((copy.deepcopy(dp), (i, j, k)))
@ipywidgets.interact(flame=ipywidgets.IntSlider(min=0, max=len(film) - 1))
def show_table_transition(flame: int) -> None:
dp, (i, j, k) = film[flame]
table = pd.DataFrame(dp)
with pd.option_context("display.float_format", "{:.0g}".format):
table = table.style.set_properties(
subset=pd.IndexSlice[i + 1, j], **{"background-color": "#FF7000"}
).set_properties(subset=pd.IndexSlice[i, j], **{"background-color": "#FFBF00"})
if j - w[i] >= 0:
table = table.set_properties(
subset=pd.IndexSlice[i + 1, j - w[i]], **{"background-color": "#FFBF00"}
)
display(table)
if j - w[i] >= 0:
print(f"{v[i]:+}")
配列の再利用
…
01 ナップサック問題その 2
価値の総和を最大化すること <=> 重さの総和を最小化すること
# コードは省略
個数制限付き部分和問題
計算時間は
# 個数制限付き部分和問題(ナイーブ解)
n: int = 3
K: int = 17
a: list[int] = [3, 5, 8]
m: list[int] = [3, 2, 2]
dp: list[list[int]] = [[False for _ in range(K + 1)] for _ in range(n + 1)]
dp[0][0] = True
film = [(copy.deepcopy(dp), (0, 0, 0))]
for i in range(n):
for j in range(K + 1):
for k in range(K + 1):
if not (0 <= k <= m[i] and k * a[i] <= j):
break
dp[i + 1][j] |= dp[i][j - k * a[i]]
film.append((copy.deepcopy(dp), (i, j, k)))
@ipywidgets.interact(flame=ipywidgets.IntSlider(min=0, max=len(film) - 1))
def show_table_transition(flame: int) -> None:
dp, (i, j, k) = film[flame]
table = pd.DataFrame(dp)
with pd.option_context("display.float_format", "{:.0g}".format):
table = table.style.set_properties(
subset=pd.IndexSlice[i + 1, j], **{"background-color": "#FF7000"}
).set_properties(
subset=pd.IndexSlice[i, j - k * a[i]], **{"background-color": "#FFBF00"}
)
display(table)
計算量の改善
- dp テーブルにもっと情報を与えたい
- 作れる場合にどれだけ が余っているかを持たせる
# 個数制限付き部分和問題
n: int = 3
K: int = 17
a: list[int] = [3, 5, 8]
m: list[int] = [3, 2, 2]
dp: list[list[int]] = [[-1 for _ in range(K + 1)] for _ in range(n + 1)]
dp[0][0] = 0
film = [(copy.deepcopy(dp), (0, 0, 0))]
for i in range(n):
for j in range(K + 1):
if dp[i][j] >= 0:
dp[i + 1][j] = m[i]
elif j < a[i] or dp[i + 1][j - a[i]] <= 0:
dp[i + 1][j] = -1
else:
dp[i + 1][j] = dp[i + 1][j - a[i]] - 1
film.append((copy.deepcopy(dp), (i, j, k)))
@ipywidgets.interact(flame=ipywidgets.IntSlider(min=0, max=len(film) - 1))
def show_table_transition(flame: int) -> None:
dp, (i, j, k) = film[flame]
table = pd.DataFrame(dp)
with pd.option_context("display.float_format", "{:.0g}".format):
table = table.style.set_properties(
subset=pd.IndexSlice[i + 1, j], **{"background-color": "#FF7000"}
)
if dp[i][j] >= 0:
table.set_properties(
subset=pd.IndexSlice[i, j], **{"background-color": "#FFBF00"}
)
if not (j < a[i] or dp[i + 1][j - a[i]] <= 0):
table.set_properties(
subset=pd.IndexSlice[i + 1, j - a[i]], **{"background-color": "#FFBF00"}
)
display(table)
最長部分増加列問題
# 最長部分増加列問題
n: int = 5
a: list[int] = [4, 2, 3, 1, 5]
dp: list[int] = [0] * n
film = [(copy.deepcopy(dp), (0, 0))]
for i in range(n):
dp[i] = 1
for j in range(i):
if a[j] < a[i]:
dp[i] = max(dp[i], dp[j] + 1)
film.append((copy.deepcopy(dp), (i, j)))
@ipywidgets.interact(flame=ipywidgets.IntSlider(min=0, max=len(film) - 1))
def show_table_transition(flame: int) -> None:
dp, (i, j) = film[flame]
table = pd.DataFrame([dp])
with pd.option_context("display.float_format", "{:.0g}".format):
table = table.style.set_properties(
subset=pd.IndexSlice[0, i], **{"background-color": "#FF7000"}
).set_properties(subset=pd.IndexSlice[0, j], **{"background-color": "#FFBF00"})
display(table)
計算問題に対する DP
分割数
を整数 を 個以下に分割するパターン数とすると、は、
- を 個以下に分割するパターン
- を 個に分割するパターン
に分類することができる。
前者については、 の定義そのものである。
後者については、まず 個の箱に 1 つずつ割り当てておいて、残った 個を 個以下に分割するパターンを考えればよいので と表現できる。
以上より、
# 分割数
import functools
MOD: int = 998244353
@functools.cache
def dp(i, j):
"""
dp[i][j] := 整数jをi個以下に分割する場合の数
"""
if i == 0:
return j == 0
if j - i >= 0:
return dp(i - 1, j) + dp(i, j - i) % MOD
else:
return dp(i - 1, j)
重複組み合わせ
# 重複組み合わせ(ナイーブ解)
n: int = 3
m: int = 3
a: list[int] = [1, 2, 3]
dp = [[0 for _ in range(m + 1)] for _ in range(n + 1)]
dp[0][0] = 1
film = [(copy.deepcopy(dp), (0, 0, 0))]
for i in range(n):
for j in range(m + 1):
for k in range(min(j, a[i]) + 1):
dp[i + 1][j] += dp[i][j - k]
film.append((copy.deepcopy(dp), (i, j, k)))
@ipywidgets.interact(flame=ipywidgets.IntSlider(min=0, max=len(film) - 1))
def show_table_transition(flame: int) -> None:
dp, (i, j, k) = film[flame]
table = pd.DataFrame(dp)
with pd.option_context("display.float_format", "{:.0g}".format):
table = table.style.set_properties(
subset=pd.IndexSlice[i + 1, j], **{"background-color": "#FF7000"}
).set_properties(
subset=pd.IndexSlice[i, j - k], **{"background-color": "#FFBF00"}
)
display(table)
# 重複組み合わせ(ナイーブ解・組み合わせの要素)
n: int = 3
m: int = 3
a: list[int] = [1, 2, 3]
dp = [[[] for _ in range(m + 1)] for _ in range(n + 1)]
dp[0][0].append("")
film = [(copy.deepcopy(dp), (0, 0, 0))]
for i in range(n):
for j in range(m + 1):
for k in range(min(j, a[i]) + 1):
for e in dp[i][j - k]:
dp[i + 1][j].append(e + str(i) * k)
film.append((copy.deepcopy(dp), (i, j, k)))
@ipywidgets.interact(flame=ipywidgets.IntSlider(min=0, max=len(film) - 1))
def show_table_transition(flame: int) -> None:
dp, (i, j, k) = film[flame]
table = pd.DataFrame(dp)
with pd.option_context("display.float_format", "{:.0g}".format):
table = table.style.set_properties(
subset=pd.IndexSlice[i + 1, j], **{"background-color": "#FF7000"}
).set_properties(
subset=pd.IndexSlice[i, j - k], **{"background-color": "#FFBF00"}
)
display(table)
# 重複組み合わせ
n: int = 4
m: int = 4
a: list[int] = [1, 2, 3, 2]
MOD: int = 998244353
dp = [[0 for _ in range(m + 1)] for _ in range(n + 1)]
for i in range(n + 1):
dp[i][0] = 1
film = [(copy.deepcopy(dp), (0, 1))]
for i in range(n):
for j in range(1, m + 1):
if j - 1 - a[i] >= 0:
dp[i + 1][j] = (dp[i + 1][j - 1] + dp[i][j] - dp[i][j - 1 - a[i]]) % MOD
else:
dp[i + 1][j] = (dp[i + 1][j - 1] + dp[i][j]) % MOD
film.append((copy.deepcopy(dp), (i, j)))
@ipywidgets.interact(flame=ipywidgets.IntSlider(min=0, max=len(film) - 1))
def show_table_transition(flame: int) -> None:
dp, (i, j) = film[flame]
table = pd.DataFrame(dp)
with pd.option_context("display.float_format", "{:.0g}".format):
table = (
table.style.set_properties(
subset=pd.IndexSlice[i + 1, j], **{"background-color": "yellow"}
)
.set_properties(
subset=pd.IndexSlice[i + 1, j - 1], **{"background-color": "red"}
)
.set_properties(subset=pd.IndexSlice[i, j], **{"background-color": "red"})
)
if j - 1 - a[i] >= 0:
table.set_properties(
subset=pd.IndexSlice[i, j - 1 - a[i]], **{"background-color": "blue"}
)
display(table)