当前位置：文档库 › 动态规划

动态规划

————————————————————————————————作者：————————————————————————————————日期：

动态规划

和分治算法一样，动态规划（ｄｙna ｍic ｐｒo ｇr ａmmi ｎｇ）是通过组合子问题的解而解决整个问题的。从第2章已经知道，分治算法是指将整个问题划分成一些独立的子问题，递归地求解各子问题，然后合并子问题的解而得到原问题的解。与此不同，动态规划使用于子问题不是独立的情况,也就是各子问题包含公共的子子问题。在这种情况下,若用分治法则会做许多不必要的工作,及重复的求解公共的子子问题。动态规划算法对每个子子问题只求解一次，将其结果保存在一张表中，从而避免每次遇到各个子问题时重新计算答案。

动态规划通常应用于最优化问题。此类问题可能有很多种可行解。每个解有一个值，而我们希望找出一个具有最优(最大或最小)值的解。称这样的解为该问题的“一个”最优解(而不是“确定”的最优解) ，因为可能存在多个取最优值的解。

动态规划算法的设计可以分为如下4个步骤：

1）描述最优解的结构。

2）递归定义最优解的值。

3）按自底向上的方式计算最优解的值。

4）由计算出的结果构造一个最优解。

第1~３步构成问题的动态规划解的基础。第４步在只要求计算最优解的值时可以略去。如果的确做了第4步,则有时要在第3步的计算中记录一些最优化问题，使构造一个最优解变得容易。

接下来的各节利用动态规划方法来求解一些最优化问题。15．1节分析包括两个汽车装配线的调度问题,在经过每个装配站后,组装中的汽车可以留在同一条装配线上,或者移动到另外一条装配线。15.2节讨论如何做一连串的矩阵乘法,使得所作的标量乘法总次数最少。在给出这些动态规划的例子之后，1５.3节讨论为使动态规划成为可行的求解技术，一个问题必须具备的两个关键特征。然后,1５.4节介绍如何找出两个序列的最长公共子序列。最后,1５.5节介绍在已知待搜索的关键字分布的情况下，如何利用动态规划构造最优的二叉查找树。

15.1装配线调度

第一个动态规划的例子是求解一个制造问题。Col ｏｎel 汽车公司在有两条装配线的工厂内生产汽车,如图１５-1所示。一个汽车底盘在进入每一条装配线后，在一些装配站中会在底盘上安装部件,然后，完成的汽车在装配线的末端离开。每一条装配线上有ｎ个装配站，编号为j =1, 2, …, ｎ。将装配线i (i 为1或2)的第j 个装配站表示为j i S ,。装配线１的第ｊ个站(j S ,1)和装配线２的第j 个站（j S ,2)执行相同的功能。然而,这些装配站是在不同的时间建造的，并且采用了不同的技术。因此，每个站上所需的时间是不同

的，即使是在两条不同装配线相同位置的装配站上也是这样。我们把在装配站j i S ,上所需的装配时间记为j i a ,。如图１５.1所示,一个汽车底盘进入其中一条装配线，然后从每一站进行到下一站。底盘进入装配线i 的进入时间为i e ，装配完的汽车离开装配线i 的离开时间为i x 。

在正常情况下,一旦一个底盘进入一条装配线后，它只会经过该条装配线。在相同的装配线中,从一个装配站到下一个装配站所花的时间可以忽略。偶尔会来一个特别急的订单，客户要求尽可能快地制造这些汽车。对这些加急的订单,底盘仍然依序经过n 个装配站，但是工厂经理可以将部分完成的汽车在任何装配站上从一条装配线移到另一条装配线上。把已经通过装配站j i S ,的一个底盘从装配线ｉ移走所花的时间为j i ,t ，其中i ＝1，2，而ｊ=1,2, …, n －1(因为在第n 个装配后，装配已经完成)。问题是要确定在装配线1内选择哪些站以及在装配线2内选择哪些站,以使汽车通过工厂的总时间最小。在图１5-2a 所示的例子中,最快的总时间是选择装配线1的装配站1，3和６,以及装配线2的装配站2，４和５。

图1５-1 一个找出通过工厂装配线的最快方式的制造问题。共有两条装配线,每条有ｎ个装配站;装配线i 的第j 个装配站表示为j i S ,，在该站的装配时间是j i a ,。一个汽车底盘进入工厂,然后进入装配线i （i 为l 或2),花费时间i e 。在通过一条线的第ｊ个装配站后，这个底盘来到任一条线的第(j +1)个装配站。如果它留在相同的装配线，则没有移动的开销;但是，如果在装配站j i S ,后，它移动到了另一条线上．则花费时间j i t ,。在离开一条线的第n 个装配站后，完成的汽车花费时间i x 离开工厂。待求解的问题是确定应该在装配线1内选择哪些站、在装配线2内选择些站,才能使汽车通过工厂的总时间量小

显然,当有很多个装配站时,用强力法(ｂｒｕt ｅｆo ｒce)来极小化通过工厂装配线的时间是不可行的。如果给定一个序列,在装配线1上使用哪些站，在装配线2上使用哪些站,则可以在)(n Θ时间内,很容易计算出一个底盘通过工厂装配线要花的时间。不幸的是，选择装配站的可能方式有2n 中:可以把装配线1内使用的装配站集合看作{1, 2, …，ｎ｝的一个子集，并注意到有2n 个这样的子集。因此，要通过穷举所有可能的方式，然后计算每种方式花费的时间来确定最快通过工厂的路线，需要)2(n Ω时间，这在n 很大时是不可行的。

图15-2 a)一个装配问题的实例，代价标为i e 、j i ,a 、j i ,t 以及i x 。深阴影的路径表示通过工厂的最快方式 b) a)中的ｆi ［j ]，f *，ｌi ［j ]以及l ＊的实例的值

步骤1：通过工厂最快路线的结构

动态规划方法的第一个步骤是描述最优解的结构的特征。对于装配线调度问题，可以如下执行。考虑底盘从起始点到装配站j ,1S 的最快可能路线。如果j =1,则底盘能走的只有一条路线,所以很容易就可以确定它的装配站j ,1S 花费了多少时间。对于j =2, ３， …, n ，则有两种选择:这个底盘可能是从装配站1-j ,1S 直接到装配站j ,1S ，在相同的装配线上，从装配站j -１到j 的时间是可以忽略的。或者，这个底盘可能来自装配站1-j ,2S ，然后再移动到装配站1-j ,1S ,移动的代价是1-j ,2t 。我们将分别考虑这两种可能性，后面可以看到,它们之间其实是有很多共性的。

首先，假设通过装配站j ,1S 的最快路线通过了装配站1-j ,1S 。关键的一点是这个底盘必定是利用了最快的路线从开始点到装配站1-j ,1S 的。这是为什呢?如果存在一条更快的路线通过1-j ,1S ，我们就可以采用这条更快的路线,从而得到通过装配站j ,1S 的更快的路线:这就形成了矛盾。

类似地，假设通过装配站j ,1S 的最快路线就是通过装配站1-j ,2S 。现在,我们注意到这个底盘必定是利用了最快的路线从开始点到装配站1-j ,2S 的。理由是相同的：如果有一条更快的通过装配站1-j ,2S 的路线，就可以采用这条更快的路线，从而得到通过装配站j ,1S 的更快的路线，这是一个矛盾。

更一般地,对于装配线调度问题，一个问题的（找出通过装配站j ,i S 的最快路线）最优解包含了子问题(找出通过1-j ,1S 和1-j ,2S 的最快路线）的一个最优解。我们称这个性质为最优子结构,这是是否可以应用动态规划方法标志之一，具体会在１5.３节中看到。

下面利用最优子结构来说明,可以利用子问题的最优解来构造原问题的一个最优解。

对于装配线调度问题，推理如下。观察一条通过装配站j ,1S 的最快路线，会发现它必定是经过装配线1或2上的装配站j -１。因此，通过装配站j ,1S 的最快路线只能是以下二者之一:

通过装配站1-j ,1S 的最快路线，然后直接通过装配站j ,1S ；

通过装配站1-j ,2S 的最快路线,从装配线2移动到装配线1,然后通过装配站j ,1S 。利用对称的推理是想,通过装配站j ,2S 的最快路线也只能是以下二者之一:

通过装配站1-j ,2S 的最快路线,然后直接通过装配站j ,2S ;

通过装配站1-j ,1S 的最快路线,从装配线1移动到装配线2,然后通过装配站j ,2S 。为了解决这个问题，即寻找通过任一条装配线上的装配站j 的最快路线，我们解决它的子问题，即寻找通过两条装配线上的装配站ｊ－1的最快路线。

所以，对于装配线调度问题,通过建立子问题的最优解，就可以建议原问题某个实例的一个最优解了。

步骤2：一个递归的解

在动态规划方法中，第二个步骤是利用子问题的最优解来递归定义一个最优解的值。对于装配线的调度问题,我们选择在两条装配线上通过装配站j 的最快路线的问题来作为子问题，j =1,2，…，n 。令ｆｉ[ｊ]表示一个底盘从起点到装配站j ,i S 的最快可能时间。

我们的最终目标是确定底盘通过工厂的所有路线的最快时间，记为f *。底盘必须一路通过装配线１或２通过装配站n ，然后到达工厂的出口。由于这些路线的较快者就是通过整个工厂的最快路线，有：

)][,][m in(*2211x n f x n f f ++= （１5-１）

要对ｆ1[1]和f 2[1]进行推理也是很容易的。不管在哪一条装配线上通过装配站1,底盘都是直接到达该装配站的。于是,

l a e f ,111]1[+= (１5-2) l a e f ,222]1[+= （1５-3）

现在来考虑如何计算f i ［j ]，其中j =２,3,…,n （i =l, 2)。先来看一看f １[j ].前面说过,

通过装配站j ,1S 的最快路线或者是通过装配站1-j ,1S ，然后直接通过装配站j ,1S 的最快路线，或者是通过装配站1-j ,2S ,从装配线2移动到装配线1．然后通过装配站j ,1S 的最快路线。在第一种情况中，有f 2[j ] = f 1[j -1]+ j ,1a ,而在后一种情况中，ｆ1[ｊ] = f 2[j -1]+ 1-j ,2t ＋j ,1a 。所以：

)]1[,]1[min(][,11,22,111j j j a t j f a j f j f ++-+-=- (１5－4) 其中j =2, 3, …, n 。对称地，有：

)]1[,]1[min(][,21,11,222j j j a t j f a j f j f ++-+-=- (15-５)

其中j =2， 3, …, n 。合并公式(1５.2)~公式(１5．５),得到递归公式:

??++-+-+=-)]1[,]1[min(][,11,22,11,111j j j j a t j f a j f a e j f (15-6）

???++-+-+=-)]1[,]1[min(][,21,11,22,222j j j j a t j f a j f a e j f (15-7) 图15-2b 示出了图15 －2a 例子中的由等式(15．6)和等式(1５.7)计算出的ｆi ［j ]值,以及f *的值。

f i [ｊ]的值就是子问题最优解的值。为了有助于跟踪最优解的构造过程,我们定义l ｉ[j ]为装配线的编号（1或2），其中的装配站j -l 被通过装配站j ,i S 的最快路线所使用。这里，i =ｌ,２且j =２，3,…,ｎ。（我们避免定义ｌi [1],因为在任一条装配线上都没有一个装配站在站l 前面）。此外，还定义l *为这样的装配线,其内的装配站ｎ被通过整个工厂的最快路线所使用。l i ［j ]的值可以帮助找到一个最快的路线。利用图15-2b 中所示的l *的值和l i [j ]，可以如下找到如图15－2a 所示通过工厂的一条最快路线。从ｌ*=l 开始,使用装配站1,6S 。现在看到l 1[6］值为2,所以使用装配站2,5S 。接着，可以看到ｌ2[５］＝2(使用装配站2,4S ),l 2[４] ＝１(装配站1,3S ).l 1[3]＝2(装配站2,2S ）,以及ｌ２［2]=1（装配站1,1S )。

步骤3：计算最快时间

此时，写出一个递归算法来计算通过工厂的最快路线是一件简单的事情,它基于公式(１5.1)以及递归式(15.６)和式(１5.７）。这种递归算法有一个问题：它的执行时间是关于n 的指数形式。要知道为什么,令r ｉ (j )为递归算法中引用f ｉ[j ]的次数。由公式（15.１),有

1)()(21==n r n r (1５.8)

由递归式(15.6)和式(15.７）得到

)1()1()()(2121+++==j r j r j r j r (15.９）

其中j =1, ２， …， n -l 。练习1５. 1-2会要求读者证明r ｉ[j ]=2n -ｊ。这样，单是f 1[1]就被引用了２n －1次！如练习15.1-3要求读者证明的那样,引用所有f ｉ［ｊ］值的总次数为)2(n Θ。

如果在递归的方式中以不同的顺序来计算f i [ｊ]的值,能做得更好。注意对于2≥j ，ｆi [ｊ]的每一个值仅依赖于f 1[j -１]和ｆ2[j －1]的值。通过以递增装配站编号j 的顺序来计算ｆi [j ]的值，即在图15－2b 中从左到右，可以在)(n Θ时间内计算出通过工厂的最快路线，以及其所花的时间。FAS ＴＥＳT-WAY 程序以值j ,i a ，j ,i t ，i e 和i x ,以及在每条装配线中装配站的数目ｎ作为输入。

ＦＡST ＥST-ＷＡY(a , ｔ, e , ｘ, n )

１ f 1［1］ ← e 1 + a 1,1

2 ｆ2［1] ←ｅ2 + a2,1

３ｆor j←２ｔo n

4do iｆｆ1[ｊ- 1]+ a1,j≤ f2[j - 1] + t２,j－1＋a１,j

5 ｔhen f1［j］←ｆ1［ｊ- 1] + ａ１，j

6l1[ｊ］← 1

7 ｅlsｅf1[j］←f2[j -1] + t2,j－1+a1,ｊ

8l1[j] ← 2

9 iｆf2[j - １] ＋a2,j≤ f１[j - 1］＋t１,ｊ-1 + a2,j

10 then f2[j］← f2[ｊ－１] + a2,j

１1 ｌ2[j] ← 2

１２elｓｅf2［ｊ］∞f1［j- 1] +t１,ｊ-1 + a2，j

13 ｌ２[j]←１

14 if f１［ｎ]+ｘ1≤ ｆ2[n] ＋x２

１5ｔheｎf* = ｆ1[n] +x1

16 l＊= 1

17 eｌsｅf* = f2［ｎ] + x2

18 l* =２

FＡSTESＴ-WAY的工作方式如下。第1～2行利用公式(1５.2）和公式(15.3）来计算f1[1]和f2[1]。然后第3~13行的ｆor循环计算fｉ[ｊ］和l i［ｊ],i=l, 2，且j=2, 3，…, ｎ。第4~8行利用公式(1５-4）来计算f1［j]和l1[ｊ],而第9～13行利用公式（15.5)来计算f2［j]和ｌ2[j]。最后,第1４~１８行利用公式(15.1)来计算ｆ＊和l*。因为第1~2行与第1４~１8行花费常数时间,而且第3~13行的for循环的n-ｌ次迭代中的每一个也花费常数时间,所以整个过程花费)

时间。

观察ｆi[ｊ]和l i［j］值的计算过程的一种方式是在表格中填入记录。在图15. 2b中，我们在表格内从左到右填入f i[j]和l i［j]的数值(在每一列中从上到下)。要填入一个记录f i[j],需要ｆ１[j－1]和f2[ｊ-1］的值，由于已经计算并保存了它们，只需简单地查表来确定它们的值。

步骤4：构造通过工厂的最快路线

计算出f i[ｊ]，f*，lｉ[j],l*的值之后,需要构造在通过工厂的最快路线中使用的装配站的序列。我们在上面已经讨论了如何在图１5-2的例子中做到这一点。

下面的过程以站号的递减顺序，输出所使用的各个装配站。练习15. 1-１要求读者修改这个过程，使它按站号的递增顺序输出各个装配站。

PＲINT-ＳTATＩONS(l,l＊, n)

1 i←l*

２print"liｎe "i", staｔion " n

3 forｊ←nｄowntｏ2

4 dｏi← ｌｉ[j]

5 pr ｉn ｔ "ｌine ＂ i ＂, st ａti ｏn " j - 1

在图1５—2的例子中，PRI ＮT －STATIONS 将产生以下的输出：

line １, ｓｔat ｉon 6

l ｉn ｅ２, st ａt ｉon ５

li ｎe 2, s ｔat ｉon 4

li ｎe 1, station 3

ｌｉne 2, s ｔａt ｉo ｎ 2

l ｉne 1, statio ｎ 1

练习

1５． 1-1说明应如何修改程序ＰRIN Ｔ-ＳTA ＴIONS,让它以站号的递增顺序输出各装配站。(提示:利用递归。)

1５．１-2利用公式(15. 8）、(15. 9)及替换法来证明：在递归算法中引用f i [j ］的次数r i （j )等于2n -j 。

１5. 1-３利用练习1５． 1－2的结果，证明所有引用f ｉ[j ]的总次数(即∑∑==211)(i n

j i j r )

等于２n ＋1-2。 15．１-4包含f i [j ]和l ｉ［j ]值的表格共含有４n -２个表项。说明如何把空间需求缩减到共2n +2个表项，仍然能够计算出f *,并且仍然能够输出通过工厂的最快路线上的所有装配站。

15. 1－5 Can ｔy 教授猜测存在着某些i e ,j ,i a 以及j ,i t 的值,使得ＦA ＳTE ＳT-W ＡY 程序在某个装配站j 上,产生出满足l 1[ｊ]=２且l 2［j ]=l 的l i [ｊ]值。假设所有的移动代价j ,i t 是非负值,说明Canty 教授的猜测是不正确的。

１５.２矩阵链乘法

我们用来说明动态规划的下一个例子是解决矩阵链相乘问题的一个算法。给定由n 个要相乘的矩阵构成的序列(链)。要计算乘积

A 1 Ａ2…A ｎ (15． 10）

为计算式(15. １0),可将两个矩阵相乘的标准算法作为一个子程序,根据括号给出的计算顺序做全部的矩阵乘法。一组矩阵的乘积是加全部括号的(ｆully ｐarenthesize ｄ),如果它是单个的矩阵,或是两个加全部括号的矩阵的乘积外加括号而成。矩阵的乘法满足结合率,故无论怎样加括号都会产生相同的结果。例如,如果矩阵链为＜A 1，Ａ2．A 3，A 4>,乘积A 1A 2A 3A 4可用五种不同方式加全部括号:

(Ａ1 (Ａ２ (A ３ A 4)）) ，

(A 1 ((A 2 A ３) A 4)） ,

((A 1 A 2) （A 3 Ａ4)) ,

((A 1 （A 2 A ３)) A 4) ，

((（A 1 A 2) Ａ3) A 4）．

矩阵链加括号的顺序对求积运算的代价有很大的影响。先来看看两个矩阵相乘的代价。标准的算法由下面的伪代码给出。属性rｏｗs和cｏluｍｎs表示矩阵的行数和列数。

MAＴRIX-MULTＩPLY（Ａ, B)

１iｆcｏlumns[A] ≠ rｏｗs［Ｂ］