Sáng tạo trong thuật toán và lập trình với ngôn ngữ Pascal và C# - Tập 1 - Chương 5: Phương pháp tham lam
Người ta cần ghi N bài hát, được mã số từ 1 đến N, vào một băng nhạc có thời
lượng tính theo phút đủ chứa toàn bộ các bài đã cho. Với mỗi bài hát ta biết
thời lượng phát của bài đó. Băng sẽ được lắp vào một máy phát nhạc đặt trong
một siêu thị. Khách hàng muốn nghe bài hát nào chỉ việc nhấn phím ứng với
bài đó. Để tìm và phát bài thứ i trên băng, máy xuất phát từ đầu cuộn băng,
quay băng để bỏ qua i – 1 bài ghi trước bài đó. Thời gian quay băng bỏ qua
mỗi bài và thời gian phát bài đó được tính là như nhau. Tính trung bình, các
bài hát trong một ngày được khách hàng lựa chọn với số lần (tần suất) như
nhau. Hãy tìm cách ghi các bài trên băng sao cho tổng thời gian quay băng
trong mỗi ngày là ít nhất
là 6 + 2 = 8 và tệp có 8 phần tử. Kết quả thu được tệp . Tổng số thao tác ghi trong cả hai bước trên sẽ là: 6 + 8 = 14. Tổng quát, với ba tệp a, b và c được trộn theo quy trình: (a b) c ta dễ dàng tính được tổng số thao tác ghi tệp cho quy trình trên là (| a | + | b |) + (| a | + | b |) + c = 2(| a | + | b |) + c. Bảng dưới đây tính toán cho ba phương án để phát hiện ra phương án tối ưu. Sáng tạo trong Thuật toán và Lập trình Tập I 156 Phương án Quy trình thực hiện Tổng số thao tác ghi tệp 1 ( ) 2(5 + 1) + 2 = 2.6 + 2 = 14 2 ( ) 2(5 + 2) + 1 = 2.7 + 1 = 15 3 ( ) 2(1 + 2) + 5 = 2.3 + 5= 11 (phương án tối ưu) Khảo sát các quy trình trộn ba tệp s[1..3] = (5, 1, 2) Thuật toán tham lam khi đó sẽ như sau: Thuật toán Huffman Lặp (đến khi chỉ còn một tệp duy nhất) Lấy hai tệp u và v có số phần tử nhỏ nhất. Trộn u v h. Ta có | h | = | u | + | |v |. Loại bỏ u và v khỏi danh sách các tệp cần xử lí. Kết nạp h vào danh sách các tệp cần xử lí xong lặp Với n tệp ban đầu, dễ thấy rằng mỗi lần lặp ta loại bỏ được hai tệp (u và v có số phần tử min) và thêm một tệp (h) tức là mỗi lần lặp ta loại bỏ được một tệp, do đó số lần lặp sẽ là n – 1. Thuật toán trên mang tên nhà toán học Mĩ Huffman là người đầu tiên đề xuất. Ta minh hoạ thuật toán trên với dữ liệu vào như sau: s[1..5] = (10, 5, 4, 4, 3). Ý nghĩa: Trộn 5 tệp sắp tăng với số phần tử lần lượt là 10, 5, 4, 4 và 3 để thu được một tệp sắp tăng duy nhất. Lần lặp Danh sách các tệp cần xử lí Hai tệp có số phần tử min Trộn Số thao tác ghi tệp 1 (:10,:5,:4,:4,:3) :3 , :4 7 2 (:10,:5,:4,:7) :5 , :4 9 3 (:10,:7, : 9) :7 , :9 16 4 (:10,: 16) :10 , :16 26 Kết quả (: 26) 58 Minh hoạ thuật toán Huffman với dữ liệu vào (:10,:5,:4,:4,:3) Vì n = 5 nên số lần lặp sẽ là n – 1 = 4. Sau 4 lần lặp ta thu được tệp mã số 9 với 26 phần tử. Để tính tổng số thao tác ghi ta chỉ cần lấy tổng số phần tử của các tệp tham gia trong mỗi lần trộn hai tệp. Tổng đó là: tt = (3 + 4) + (5 + 4) + (7 + 9) + (10 + 16) = 7 + 9 + 16 + 26 = 58. Sáng tạo trong Thuật toán và Lập trình Tập I 157 Ta chọn phương án cài đặt sau đây cho thuật toán Huffman. Phương án này tỏ ra tiện lợi trong nhiều ứng dụng. Lợi thế của nó là không xoá đi các đối tượng (tệp) đã xử lí mà chỉ đánh dấu chúng để khi cần có thể khôi phục lại và giải trình kết quả. Cụ thể là ta sẽ xây dựng một cây nhị phân gồm 2n – 1 đỉnh và gọi là cây Huffman như sau. Các đỉnh được mã số từ 1..2n – 1. Mỗi đỉnh nhận một giá trị nguyên dương gọi là trọng số của đỉnh đó. Trên hình vẽ, đỉnh được thể hiện trong hình tròn, cạnh đó là giá trị của trọng số. Trong bài toán trộn tệp này mã số của đỉnh chính là mã số của tệp, trọng số của đỉnh chính là số phần tử có trong tệp tương ứng. Thuật toán tạo cây Huffman Khởi tạo: n đỉnh rời nhau 1..n có trọng số s(1),..., s(n). h:= n; Lặp n – 1 lần Lấy hai đỉnh u và v có s(u) và s(v) min. Đánh dấu u và v là đã xử lí. h:= h + 1 Tạo đỉnh mới h trỏ đến u và v và s(h) = s(u) + s(v). xong lặp Để tổ chức dữ liệu cho cây Huffman chúng ta dùng ba mảng nguyên s, t và p kích thước 2n – 1 phần tử. Với mỗi đỉnh i, s[h] cho biết trọng số của đỉnh h, t[h] trỏ đến con trái của đỉnh h, p[h] trỏ đến con phải của đỉnh h. Hai con trái t[h] và phải p[h] chính là hai đỉnh đạt trọng số min trong mỗi lần lặp, h chính là đỉnh mới được tạo lập từ hai đỉnh có trọng số min. Ngoài ra ta dùng một mảng nguyên d để đánh dấu các đỉnh đã xử lí, d[i] = 0 cho biết đỉnh i chưa được xử lí, d[i] = 1 cho biết đỉnh i đã xử lí. Các đỉnh mới được tạo lập và thêm vào cây lần lượt nhận mã số là n + 1, n + 2,…, 2n – 1, do đó đỉnh cuối cùng sẽ có mã số là h = 2n – 1. Thủ tục tạo cây Huffman h khi đó sẽ như sau: 3 4 4 7 5 9 16 10 Cây Huffman h xây dựng từ 5 nút ban đầu s[1..5] = (10,5,4,4,3) h = d = 7 + 9 + 16 + 26 = 58 26 Sáng tạo trong Thuật toán và Lập trình Tập I 158 {----------------------------- Tao cay Huffman h = 2n-1 tu cac trong so s[1..n] -----------------------------} procedure Huffman; var i,u,v: integer; begin fillchar(d,sizeof(d),0); fillchar(t,sizeof(t),0); fillchar(p,sizeof(p),0); h := n; tt := 0; {tong trong so} for i := 1 to n-1 do begin min2(u,v); {u,v dat trong so min } h := h+1; {ma so cua dinh moi} s[h] := s[u]+s[v]; {trong so cua dinh moi } tt := tt+s[h]; {tong trog so } t[h] := u; {tro toi con trai } p[h] := v; {tro toi con phai } end; end; Thủ tục min2(u,v) tìm trong số các đỉnh chưa xử lí hai đỉnh u và v đạt trọng số min. Thủ tục này gọi hai lần hàm min1, mỗi lần tìm một đỉnh đạt trọng số min trong số các đỉnh chưa xử lí và đánh dấu luôn đỉnh tìm được (là đã xử lí). {-------------------------------- Tim trong so cac dinh chua xu li hai dinh u va v dat trong so min. ----------------------------------} procedure min2(var u,v: integer); begin u := min1; v := min1; end; {-------------------------------- Tim trong so cac dinh chua xu li mot dinh dat trong so min va danh dau dinh tim duoc. ----------------------------------} function min1: integer; var i, imin, vmin: integer; begin vmin := MaxInt; Sáng tạo trong Thuật toán và Lập trình Tập I 159 for i := 1 to h do if d[i]=0 then {dinh i chua xu li } if s[i] < vmin then begin vmin := s[i]; imin := i; end; d[imin] := 1; min1 := imin; end; Sau khi tạo xong cây Huffman, để ghi kết quả, ta chỉ cần duyệt các đỉnh được tạo mới, tức là các đỉnh có mã số từ n + 1 đến h = 2n – 1 để lấy hai con trái và phải của mỗi đỉnh. {--------------------------------- Duyet cac dinh tu n+1 den 2n-1, ghi thong tin vao tep. ----------------------------------} procedure Ghi; var i: integer; begin assign(g,gn); rewrite(g); writeln(g,n-1); for i := n+1 to h do writeln(g,t[i],BL,p[i],BL,i); writeln(g,tt); close(g); end; (* Pascal *) (*----------------------------------- Tron nhieu tep ------------------------------------*) uses crt; const fn = 'MF.INP'; gn = 'MF.OUT'; MN = 200; BL = #32; {Dau cach} NL = #13#10; {xuong dong} type MI1 = array[0..MN] of integer; MB1 = array[0..MN] of byte; var s,t,p: MI1; {s[i] - so phan tu trong tep i} {t[i] - tro trai} {p[i] - tro phai i} Sáng tạo trong Thuật toán và Lập trình Tập I 160 d: MB1; {danh dau tep da xu li} n: integer; {so luong tep ban dau} h: integer; {cay Huffman} f,g: text; tt: longint; procedure Doc; var i: integer; begin assign(f,fn); reset(f); read(f,n); for i := 1 to n do read(f,s[i]); close(f); end; {-------------------------------- Tim trong so cac dinh chua xu li mot dinh dat trong so min va danh dau dinh tim duoc. ----------------------------------} function min1: integer; tự viết {-------------------------------- Tim trong so cac dinh chua xu li hai dinh u va v dat trong so min, U < v. ----------------------------------} procedure min2(var u,v: integer); tự viết {----------------------------- Tao cay Huffman h = 2n-1 tu cac trong so s[1..n] -----------------------------} procedure Huffman; tự viết {------------------------------ Duyet cac dinh tu n+1 den 2n-1, ghi thong tin vao tep. -------------------------------} procedure Ghi; tự viết BEGIN Doc; Huffman; Ghi; END. // C# using System; using System.IO; namespace SangTao1 { /*---------------------------- * Cay Huffman * Tron n file sap tang * --------------------------*/ Sáng tạo trong Thuật toán và Lập trình Tập I 161 class HuffmanTree { static string fn = "MF.inp"; // file ket qua static string gn = "MF.out"; // file ket qua static int[] t; // tro trai static int[] p; // tro phai static int[] v; // trong so dinh static int[] d; // danh dau dinh da xu ly static int n = 0; // so phan tu static int n2; // n2 = 2*n static int h = 0; // Goc cua cay Huffman static int tt = 0; // tong trong so static void Main() { Doc(); Huffman();Ghi(); Test(); Console.WriteLine("\n Fini"); Console.ReadLine(); } // Main static void Ghi() { StreamWriter f = File.CreateText(gn); for (int i = n + 1; i <= h; ++i) f.WriteLine(t[i] + " " + p[i] + " " + i); f.WriteLine(tt); f.Close(); } static void Huffman() { h = n; // goc cay Huffman tt = 0; // tong trong so int m1 = 0, m2 = 0; int x; for (int i = 1; i < n; ++i) { m1 = MinV(); m2 = MinV(); if (m1 > m2) {x = m1; m1 = m2; m2 = x;} // m1 < m2 ++h; // them dinh moi v[h] = v[m1] + v[m2]; t[h] = m1; // tro trai p[h] = m2; // tro phai tt += v[h]; } } // Tim dinh chua xu ly co trong so min static int MinV() { int imin = 0; for (int i = 1; i <= h; ++i) if (d[i] == 0) // dinh i chua x li if (v[i] < v[imin]) imin = i; Sáng tạo trong Thuật toán và Lập trình Tập I 162 d[imin] = 1; // danh dau dinh i return imin; } static void Doc() { char[] cc = new char[] {'\n',' ','\t','\0','\r'}; int [] a = Array.ConvertAll((File.ReadAllText(fn)).Split(cc, StringSplitOptions.RemoveEmptyEntries), new Converter(int.Parse)); n = a[0]; n2 = 2*n; v = new int[n2]; t = new int[n2]; p = new int[n2]; d = new int[n2]; v[0] = int.MaxValue; // linh canh // Khoi tri cac nut cua cay for (int i = 0; i < n2; ++i) t[i] = p[i] = d[i] = 0; for (int i = 1; i <= n; ++i) v[i] = a[i]; } static void Print(int[] a, int n) tự viết static void Test() tự viết } // Huffmantree } // SangTao1 Chú ý Thuật ngữ tham lam không có nghĩa là lấy nhiều nhất mà chỉ là xác định một chiến lược xử lí dữ liệu sao cho có hiệu quả nhất.
File đính kèm:
- Sáng tạo trong thuật toán và lập trình với ngôn ngữ Pascal và C# - Tập 1 - Chương 5_Phương pháp tham lam.pdf