Bài giảng Phân tích và thiết kế giải thuật - Chương 5: Qui hoạch động và giải thuật tham lam
Quy hoạch động (dynamic programming) giải các bài toán bằng cách kết hợp các lời giải của các bài toán con của bài toán đang xét.
Phương pháp này khả dụng khi các bài toán con không độc lập đối với nhau, tức là khi các bài toán con có dùng chung những bài toán “cháu” (subsubproblem).
Qui hoạch động giải các bài toán “cháu” dùng chung này một lần và lưu lời giải của chúng trong một bảng và sau đó khỏi phải tính lại khi gặp lại bài toán cháu đó.
Qui hoạch động được áp dụng cho những bài toán tối ưu hóa (optimization problem).
để đạt được một giá trị tối đa với những món hàng mà y lấy đi.”. Bài toán này được gọi là bài toán cái túi dạng 0-1 vì mỗi món hàng thì hoặc là lấy đi hoặc là bỏ lại, kẻ trộm không thể lấy đi chỉ một phần của món hàng. Giải thuật tham lam so sánh với quy hoạch động * Bài toán cái túi dạng phân số (Fractional knapsack problem) Trong bài toán cái túi dạng phân số, tình tiết cũng như vậy, nhưng kẻ trộm có thể lấy đi một phần của một món hàng. Cả hai bài toán đều có tính chất tiểu cấu trúc tối ưu. Đối với bài toán cái túi dạng 0-1, xét một tổ hợp nặng M ký mà đem lại giá trị cực đại. Nếu ta lấy món hàng thứ j ra khỏi túi, những món hàng còn lại cũng là tổ hợp đem lại giá trị lớn nhất ứng với trọng lượng tối đa M - wj mà kẻ trộm có thể lấy đi từ n-1 loại mặt hàng trừ mặt hàng thứ j. Đối với bài toán cái túi dạng phân số, xét trường hợp khi ta lấy ra khỏi túi wj -w ký của mặt hàng thứ j, những món hàng còn lại cũng là tổ hợp đem lại giá trị lớn nhất ứng với trọng lượng M – (wj –w) mà kẻ trộm có thể lấy đi từ n-1 loại mặt hàng trừ mặt hàng thứ j. * Bài toán cái túi dạng phân số (tt.) Ta dùng giải thuật tham lam cho bài toán cái túi dạng phân số và qui hoạch động cho bài toán cái túi dạng 1-0. Để giải bài toán cái túi dạng phân số, trước tiên ta tính hệ số giá trị tiền trên một đơn vị trọng lượng (vi/wi ) của từng mặt hàng. Kẻ trộm bắt đầu bằng cách lấy càng nhiều càng tốt mặt hàng có hệ số vi/wi lớn nhất. Khi loại mặt hàng này đã cạn mà kẻ trộm còn có thể mang thêm được nữa thì y sẽ lấy càng nhiều càng tốt mặt hàng có hệ số vi/wi lớn nhì và cứ như thể cho đến khi y không còn có thể mang thêm nữa. * Hình 5.6 * procedure GREEDY_KNAPSACK(V, W, M, X, n); /* V, W are the arrays contain the values and weights of n objects ordered so that Vi/Wi Vi+1/Wi+1. M is the knapsack capacity and X is solution vector */ Bỏ qua thời gian sắp thứ tự các món hàng, giải thuật này có độ phức tạp O(n). var rc: real; i: integer; begin for i:= 1 to n do X[i]:= 0; rc := M ; // rc = remaining knapsack capacity // for i := 1 to n do begin if W[i] > rc then exit; X[i] := 1; rc := rc – W[i] end; if i n then X[i] := rc/W[i] end * Mã Huffman Chủ đề này liên quan đến vấn đề nén file (file compression). Các mã Huffman là kỹ thuật được dùng phổ biến và rất hữu hiệu cho việc nén dữ liệu, tiết kiệm từ 20% đến 90% là điển hình. Bước đầu tiên của việc xây dựng mã Huffman là đếm tần số xuất hiện (frequency) của mỗi ký tự trong tập tin được mã hóa. Giả sử ta có một tập tin 100000 ký tự mà ta muốn lưu trữ ở dạng nén. * a b c d e f Tần số 45 13 12 16 9 5 Mã có chiều dài cố định 000 001 010 011 100 101 Mã có chiều dài thay đổi 0 101 100 111 1101 1100 Xét bài toán thiết kế một mã nhị phân cho ký tự (binary character code) theo đó mỗi ký tự được diễn tả bằng một tràng bit nhị phân. Nếu ta dùng một mã có chiều dài cố định (3 bit) để diễn tả 6 ký tự: a = 000, b = 001, . . . , f = 101 Thì cần tất cả 300000 bit để mã hóa toàn tập tin. * Mã có chiều dài thay đổi Một mã có chiều dài thay đổi (variable-length code) có thể làm việc tốt hơn một mã có chiều dài cố định, nó cho những ký tự hay xuất hiện những mã ngắn và những ký tự ít hay xuất hiện những mã dài hơn. a = 0, b = 101, . . . f = 1100 Mã này đòi hỏi: (45. 1 + 13 .3 + 12.3 + 16.3 + 9.4 + 5.4).1000 = 224000 bits để biểu diễn tập tin, tiết kiệm được 25 %. Và đấy cũng chính là mã tối ưu cho tập tin này. * Mã phi-tiền tố (Prefix-code) Ở đây ta chỉ xét những cách mã hóa mà không có mã của ký tự nào là tiền tố (prefix) của mã của một ký tự khác. Những cách mã hóa như vậy được gọi là mã phi tiền tố (prefix-free-code) hay mã tiền tố (prefix-code). Có thể chứng minh được rằng sự nén tin tối ưu được thực hiện bởi một cách mã hóa ký tự và đó là mã phi tiền tố. Mã phi tiền tố được ưa chuộng vì nó làm đơn giản sự mã hóa và giải mã. - Sự mã hóa là đơn giản; ta chỉ cần ghép kề các mã của các ký tự lại với nhau thì sẽ biểu diễn được mọi ký tự trong tập tin. - Sự giải mã cần một sự biểu diễn thuận tiện cho mã phi tiền tố sao cho phần đầu của mã được nhặt ra một cách dễ dàng. * Mã phi tiền tố và cây nhị phân Biểu diễn cho một mã phi tiền tố là một cây nhị phân với mỗi nút lá tương ứng với các ký tự được cho. Chúng ta phân giải một mã nhị phân cho một ký tự như là một lối đi từ nút rễ đến nút lá của ký tự ấy, mà 0 ứng với “rẽ sang con bên trái” và 1 nghĩa là “rẽ sang con bên phải”. Mã tối ưu của một tập tin thường được biểu diễn bằng một cây nhị phân đầy đủ (full binary tree). Một cây nhị phân đầy đủ là một cây nhị phân mà mỗi nút không phải lá có đủ hai con. Nếu C là tập ký tự mà từ đó các ký tự lấy ra, thì cây nhị phân cho mã phi tiền tố tối ưu có đúng |C| nút lá, mỗi nút lá cho một ký tự, và đúng |C|-1 nút nội. * * Mã phi tiền tố và cây nhị phân (tt.) Cho một cây T tương ứng với một mã phi tiền tố, chúng ta có thể tính tổng số bit cần để mã hóa một tập tin. Với mỗi ký tự c trong tập ký tự C, dùng f(c) để ký hiệu tần số xuất hiện của c trong tập tin và dT(c) là chiều dài của mã cho ký tự c. Thì số bit đòi hỏi để mã hóa tập tin là B(T) = f(c)dT(c) cC Mà chúng ta coi là chi phí của cây nhị phân T. * Huffman đã đề xuất một giải thuật tham lam để cấu tạo một mã phi tiền tố tối ưu được gọi là mã Huffman (Huffman code). Giải thuật tạo một cây nhị phân T tương ứng với mã tối ưu theo kiểu từ dưới lên. Giải thuật bắt đầu với một tập gồm |C| nút lá và thực hiện một chuỗi gồm |C| tác vụ trộn để tạo ra cây cuối cùng. Một hàng đợi có độ ưu tiên Q, lấy trị khóa theo tần số f, được dùng để nhận diện hai đối tượng có tần số nhỏ nhất để trộn lại với nhau. Kết quả của việc trộn hai đối tượng là một đối tượng mới mà tần số là tổng tần số của hai đối tượng mà đã được trộn. Cấu tạo mã Huffman * Hình 5.8 Các bước của giải thuật tạo mã Huffman * Giải thuật Huffman procedure HUFFMAN(C) ; begin n := |C| ; Q := C ; for i := 1 to n -1 do begin z: = ALLOCATE-NODE( ); left[z]: = EXTRACT-MIN(Q); right[z]: = EXTRACT-MIN(Q); f[z] := f[left[z]] + f[right[z]]; INSERT(Q, z); end end Giả sử Q được hiện thực bởi một heap. Cho một tập C gồm n ký tự, việc khởi tạo Q được thực thi với thời gian O(n). Vòng lặp for được thực thi chính xác gồm n-1 lần, và vì mỗi tác vụ làm việc trên heap đòi hỏi O(lgn), vòng lặp này đóng góp chi phí O(nlgn) vào thời gian tính toán. Như vậy, độ phức tạp của giải thuật HUFFMAN trên tập n ký tự sẽ là O(nlgn). * Thí dụ 4: Bài toán tô màu đồ thị Cho một đồ thị vô hướng, tìm số màu tối thiểu để tô các đỉnh của đồ thị sao cho không có hai đỉnh nào có cạnh nối lại được tô cùng màu. Đây là một bài toán tối ưu hóa. Một chiến lược để giải quyết bài toán này là dùng giải thuật “tham lam”. Ý tưởng: Đầu tiên ta cố tô cho được nhiều đỉnh với màu đầu tiên, và rồi dùng một màu mới tô các đỉnh chưa tô sao cho tô được càng nhiều đỉnh càng tốt. Và quá trình này được lặp lại với những màu khác cho đến khi mọi đỉnh đều được tô màu. Chú ý: Giải thuật tham lam không đem lại lời giải tối ưu cho bài toán. * Để tô màu các đỉnh trong đồ thị với một màu mới, ta thực hiện các bước sau: Chọn một đỉnh chưa tô nào đó và tô nó với màu mới. Duyệt qua danh sách các đỉnh còn chưa tô. Với mỗi đỉnh chưa tô, xét xem nó có cạnh nối đến bất cứ đỉnh nào đã được tô với màu mới không. Nếu không có một cạnh như thế, ta tô đỉnh đó với màu mới. Thí dụ: Trong hình vẽ, ta tô đỉnh 1 với màu đỏ, rồi thì ta có thể tô các đỉnh 3 và 4 với cùng màu đỏ. 1 5 3 2 4 * Thủ tục SAME_COLOR Thủ tục SAME_COLOR xác đinh một tập các đỉnh (biến newclr), mà tất cả những đỉnh đó có thể tô với cùng màu mới. Thủ tục này được gọi nhiều lần cho đến khi mọi đỉnh đều đã được tô màu. procedure SAME_COLOR(G, newclr); /* SAME_COLOR assigns to newclr a set of vertices of G that may be given the same color */ begin newclr := ; for each uncolored vertex of G do if v is not adjacent to any vertex in newclr then mark v colored and add v to newclr. end; * procedure G_COLORING(G); procedure SAME_COLOR(G, newclr); /* SAME_COLOR assigns to newclr a set of vertices of G that may be given the same color ; a: adjacency matrix for graph G */ begin newclr := ; for each uncolored vertex v of G do begin found := false; for each vertex w X newclr do if a[v,w] = 1 /*there is an edge between v and w in G */ then found := true; if not found then mark v colored and add v to newclr end end; * for each vertex in G do mark uncolored; while there is any vertex marked uncolored do begin SAME_COLOR(G, newclr); print newclr end. Bậc của một đỉnh: số cạnh nối đến đỉnh đó. Định lý: Nếu (G) là số màu tối thiểu để tô đồ thị G và G là bậc lớn nhất trong đồ thị G thì (G) ≤ G +1 Độ phức tạp của giải thuật tô màu đồ thị Tác vụ căn bản: kiểm tra hai đỉnh có cạnh nối hay không. Độ phức tạp của thủ tục SAME_COLOR: O(n). Nếu m là số màu được dùng để tô đồ thị thì thủ tục SAME_COLOR được gọi tất cả m lần. Do đó, độ phức tạp của toàn giải thuật: m* O(n). Vì m thường là một số nhỏ, ta có thể nói Giải thuật có độ phức tạp tuyến tính. * Ứng dụng: Xếp lịch thi học kỳ Mỗi môn thi được biểu diễn bằng một đỉnh trong đồ thị. Xếp lịch thi là gán ca thi vào các môn thi. Các ca thi chính là các màu dùng để tô cho các đỉnh. Một cạnh nối giữa hai đỉnh nếu có tồn tại ít nhất một sinh viên lấy cả hai môn và phải thi cả hai môn, do đó không thể xếp hai môn thi biểu thị bằng hai đỉnh đó vào cùng một ca thi. Ứng dụng: Gán tần số trong lãnh vực vô tuyến, điện thoại di động (Frequency assignment problem) * Một Heuristic cho bài toán Tô Màu đồ thị Màu có bậc lớn nhất được tô trước. (Welsh and Powell) Bậc của một đỉnh: số cạnh nối đến đỉnh đó. Lý do: Những đỉnh có càng nhiều cạnh nối tới thì càng khó tô nếu ta đợi cho đến khi những đỉnh láng giềng của nó đã được tô. Giải thuật Arrange the vertices by decreasing order of degrees. Color a vertex with maximal degree with color 1. Choose an uncolored vertex with a maximum degree. If there is another vertex with the same maximum vertex, choose either of them. Color the chosen vertex with the least possible (lowest numbered) color. If all vertices are colored, stop. Otherwise, return to 3.
File đính kèm:
- Bài giảng Phân tích và thiết kế giải thuật - Chương 5 Qui hoạch động và giải thuật tham lam.PPT