静岡理工科大学 情報学部 菅沼ホーム 目次 索引

システムの最適化

− 5.動的計画法(DP : Dynamic Programming) −

  1. 5.1 最適性の原理
  2. 5.2 動的計画法の適用例(資源配分問題)
5.1 最適性の原理

  「決定の全系列にわたって最適化を行うためには,初期の状態と最初の決定がどんなものであっても,残りの決定は最初の決定から生じた状態に関して最適な政策を構成していなければならない」ということを,最適性の原理と呼びます.別の表現をすれば,「最適経路中の部分経路もまた最適経路になっている」ということを意味しています.

  動的計画法は,この原理を利用して最適化問題を解きます.問題が,多段決定問題,つまり,各段における決定の系列を求めるような問題に変換できれば,動的計画法によって解くことが可能です.例えば,

目的関数: f(x) = f1(x1) + ・・・ + fn(xn)
制約条件: x1 + ・・・ + xn = a,  xi ≧ 0

のような問題は,最適性の原理に従って,

φi(ai) = max [fi(xi) + φi-1(ai - xi)]   i = 2, ・・・, n   0 ≦ xi ≦ a
φ1(a1) = max [f1(x1)] = f1(a1)   0 ≦ x1 ≦ a

のような再帰方程式に変換し,動的計画法によって解くことが可能です.上の式では,1 ステップ目から解いていく表現がしてありますが,最終段から解く方法もあります.詳細については,次節で述べる例によって説明します.

5.2 動的計画法の適用例(資源配分問題) → C/C++ 及び Java によるプログラム例

[例]ある会社に 4 単位の資金があり,3 種類の投資先が候補にあるとします.資金は単位でしか配分できないものとしたとき,利益

f(x) = f1(x1) + f2(x2) + f3(x3)

を最大にする投資先をどのようにしたらよいのでしょうか.ただし,3 種類の投資先に対する利益関数は次の通りとします.

投資額: x 1 2 3 4
1 番目の投資先へ投資したときの利益: f1(x) 8 18 22 24
2 番目の投資先へ投資したときの利益: f2(x) 3 6 9 12
3 番目の投資先へ投資したときの利益: f3(x) 6 7 8 10

  まず,再帰方程式の下の式によって,1 段目における利益( 1 番目の投資先へ投資したときの利益) φ を計算します.投資額は 4 単位ですから,x1 の値として 5 つの場合がありますので,以下のようになります.

φ1(0) = max [f1(x1)] = f1(0) = 0
φ1(1) = max [f1(x1)] = f1(1) = 8
φ1(2) = max [f1(x1)] = f1(2) = 18
φ1(3) = max [f1(x1)] = f1(3) = 22
φ1(4) = max [f1(x1)] = f1(4) = 24

  次に,再帰方程式の上の式に従って,2 段目( 1 番目と 2 番目の投資先へ投資したときの利益)の計算をします.この計算は多少分かりにくいかと思いますので詳細に説明します.この場合も,1 番目の投資先の場合と同様,5 つの場合が考えられます.まず,投資合計が 0 の場合です.これは,1 番目,及び,2 番目の投資先に全く投資しない場合だけであり,下に記した φ2(0) に相当します.

  次に,投資合計が 1 になる場合を考えてみます.この場合は,1 番目の投資先に 1 単位,2 番目の投資先に 0 単位投資する場合と,1 番目の投資先に 0 単位,2 番目の投資先に 1 単位投資する場合とが考えられます.再帰方程式の上の式は,「それらの内,最大のものを選択する」ということを意味しており,具体的には,下に記した φ2(1) に相当し,1 番目の投資先に 1 単位,2 番目の投資先に 0 単位投資する方法が最大になります(利益は 8 ).同様に,投資合計が 2,3,及び,4 単位になる場合に対してその最大となる投資額の組合せを計算したのが,φ2(2),φ2(3),及び,φ2(4) です.

φ2(0) = max [f2(x2) + φ1(0 - x2)] = 0
φ2(1) = max [f2(x2) + φ1(1 - x2)]
    = max {f2(0) + φ1(1), f2(1) + φ1(0)}
    = max {0 + 8, 3 + 0} = 8
φ2(2) = max [f2(x2) + φ1(2 - x2)]
    = max {f2(0) + φ1(2), f2(1) + φ1(1), f2(2) + φ1(0)}
    = max {0 + 18, 3 + 8, 6 + 0} = 18
φ2(3) = max [f2(x2) + φ1(3 - x2)]
    = max {f2(0) + φ1(3), f2(1) + φ1(2), f2(2) + φ1(1), f2(3) + φ1(0)}
    = max {0 + 22, 3 + 18, 6 + 8, 9 + 0} = 22
φ2(4) = max [f2(x2) + φ1(4 - x2)]
    = max {f2(0) + φ1(4), f2(1) + φ1(3), f2(2) + φ1(2), f2(3) + φ1(1), f2(4) + φ1(0)}
    = max {0 + 24, 3 + 22, 6 + 18, 9 + 8, 12 + 0} = 25

  最後に,最終段の計算を行います.この計算も,基本的には,2 段目の計算と同じです.最終段では,3 つの投資先にどのような配分で投資すべきかを決定するわけですが,下に示した式からも明らかなように,1 番目の投資先に対する項目( φ1 )が陽に現れていません.前段で計算した φ2 だけとの組合せで計算を行っています.これが,最適性の原理の力です.

φ3(0) = max [f3(x3) + φ2(0 - x3)] = 0
φ3(1) = max [f3(x3) + φ2(1 - x3)]
    = max {f3(0) + φ2(1), f3(1) + φ2(0)}
    = max {0 + 8, 6 + 0} = 8
φ3(2) = max [f3(x3) + φ2(2 - x3)]
    = max {f3(0) + φ2(2), f3(1) + φ2(1), f3(2) + φ2(0)}
    = max {0 + 18, 6 + 8, 7 + 0} = 18
φ3(3) = max [f3(x3) + φ2(3 - x3)]
    = max {f3(0) + φ2(3), f3(1) + φ2(2), f3(2) + φ2(1), f3(3) + φ2(0)}
    = max {0 + 22, 6 + 18, 7 + 8, 8 + 0} = 24
φ3(4) = max [f3(x3) + φ2(4 - x3)]
    = max {f3(0) + φ2(4), f3(1) + φ2(3), f3(2) + φ2(2), f3(3) + φ2(1), f3(4) + φ2(0)}
    = max {0 + 25, 6 + 22, 7 + 18, 8 + 8, 10 + 0} = 28

  最終段の結果より,最大値は 28 であることが分かります(黄色の部分).その最大値を与えるのは,緑色の部分から,x3 = 1 ( 3 番目の投資先に 1 単位投資する),かつ,φ2(3) となります.

  次に,2 段目の φ2(3) の箇所を見ると,青色の部分から,x2 = 0 ( 2 番目の投資先には投資しない),かつ,φ1(3) で最大になっています.したがって,1 段目の φ1(3) より,x1 = 3 ( 1 番目の投資先に 3 単位投資する)となり,これが最終的な解になります.

  今までの計算過程を図示すると,右のようになります.図の左から,1 段目,2 段目,及び,3 段目に相当しています.各点は,その段における累積投資単位を表しており,下から,0,1,2,3,4 に相当します.また,点の箇所に付けられた数値は,利益(関数値)を表しています.

  例えば,2 段目の一番上の点は,1 番目,及び,2 番目の投資先に,併せて 4 単位投資すると,最大 25 単位の利益が得られることを表しています.1 番目,及び,2 番目の投資先に,併せて 4 単位投資する方法はいくつかありますが,1 段目の 上から 2 番目の点と直線で結ばれていますので,1 番目の投資先に 3 単位,2 番目の投資先に 1 単位投資したときの結果であることが分かります.これが,2 段目における φ2(4) の計算に相当しています.なお,最適解は,太線で表現してあります.

  次に,同じ問題を,最終段から計算してみます.まず,再帰方程式の下の式によって,3 段目における利益φを計算します.

φ3(0) = max [f3(x3)] = f3(0) = 0
φ3(1) = max [f3(x3)] = f3(1) = 6
φ3(2) = max [f3(x3)] = f3(2) = 7
φ3(3) = max [f3(x3)] = f3(3) = 8
φ3(4) = max [f3(x3)] = f3(4) = 10

  次に,再帰方程式の上の式に従って,2 段目の計算をします.

φ2(0) = max [f2(x2) + φ3(0 - x2)] = 0
φ2(1) = max [f2(x2) + φ3(1 - x2)]
    = max {f2(0) + φ3(1), f2(1) + φ3(0)}
    = max {0 + 6, 3 + 0} = 6
φ2(2) = max [f2(x2) + φ3(2 - x2)]
    = max {f2(0) + φ3(2), f2(1) + φ3(1), f2(2) + φ3(0)}
    = max {0 + 7, 3 + 6, 6 + 0} = 9
φ2(3) = max [f2(x2) + φ3(3 - x2)]
    = max {f2(0) + φ3(3), f2(1) + φ3(2), f2(2) + φ3(1), f2(3) + φ3(0)}
    = max {0 + 8, 3 + 7, 6 + 6, 9 + 0} = 12
φ2(4) = max [f2(x2) + φ3(4 - x2)]
    = max {f2(0) + φ3(4), f2(1) + φ3(3), f2(2) + φ3(2), f2(3) + φ3(1), f2(4) + φ3(0)}
    = max {0 + 10, 3 + 8, 6 + 7, 9 + 6, 12 + 0} = 15

  最後に,1 段目の計算を行います.

φ1(0) = max [f1(x1) + φ2(0 - x1)] = 0
φ1(1) = max [f1(x1) + φ2(1 - x1)]
    = max {f1(0) + φ2(1), f1(1) + φ2(0)}
    = max {0 + 6, 8 + 0} = 8
φ1(2) = max [f1(x1) + φ2(2 - x1)]
    = max {f1(0) + φ2(2), f1(1) + φ2(1), f1(2) + φ2(0)}
    = max {0 + 9, 8 + 6, 18 + 0} = 18
φ1(3) = max [f1(x1) + φ2(3 - x1)]
    = max {f1(0) + φ2(3), f1(1) + φ2(2), f1(2) + φ2(1), f1(3) + φ2(0)}
    = max {0 + 12, 8 + 9, 18 + 6, 22 + 0} = 24
φ1(4) = max [f1(x1) + φ2(4 - x1)]
    = max {f1(0) + φ2(4), f1(1) + φ2(3), f1(2) + φ2(2), f1(3) + φ2(1), f1(4) + φ2(0)}
    = max {0 + 15, 8 + 12, 18 + 9, 22 + 6, 24 + 0} = 28

  結局,同じ結果が得られます.

静岡理工科大学 情報学部 菅沼ホーム 目次 索引