Giáo trình Cấu trúc dữ liệu và giải thuật - Chương 7: Tìm kiếm

Chúng ta có một số quy ước như sau. Các phần tử trong danh sách đang được

tìm kiếm thoả các tiêu chuẩn tối thiểu sau:

• Mỗi mẫu tin có một khoá đi kèm.

• Các khóa có thể được so sánh với nhau bằng các toán tử so sánh.

• Một mẩu tin có thể được chuyển đổi tự động thành một khóa. Do đó có thể

so sánh các mẫu tin với nhau hoặc so sánh mẫu tin với khoá thông qua việc

việc chuyển đổi mẫu tin về khóa liên quan đến nó.

Chúng ta sẽ cài đặt các chương trình tìm kiếm làm việc với các đối tượng

thuộc lớp Record thoả các điều kiện trên. Ngoài ra còn có một lớp Key (có thể

trùng với Record) và một tác vụ để chuyển đổi một Record thành một Key. Tác

vụ đó có thể được cài đặt theo một trong hai cách sau:

• Một phương thức của lớp Record có khai báo là operator Key() const;

• Một constructor của lớp Key có khai báo là Key(const Record&);

12 trang | Chuyên mục: Cấu Trúc Dữ Liệu & Giải Thuật | Chia sẻ: tuando | Lượt xem: 863 | Lượt tải: 0

Tóm tắt nội dung Giáo trình Cấu trúc dữ liệu và giải thuật - Chương 7: Tìm kiếm, để xem tài liệu hoàn chỉnh bạn click vào nút "TẢI VỀ" ở trên

ớc, giải 
thuật giảm kích thước của phần này đi khoảng một nửa. Để tiện theo dõi tiến 
trình của giải thuật, chúng ta cần xác nhận một điều rằng, trước mỗi lần lặp có 
một điều kiện luôn đúng: khoá đích, nếu có trong danh sách, phải luôn nằm trong 
khoảng từ bottom đến top, có kể cả hai vị trí này. Điều kiện này lúc đầu được bảo 
đảm bằng cách đặt bottom bằng 0 và top là the_list.size()–1. 
Trước tiên , giải thuật tìm vị trí phần tử ở giữa bottom và top theo công thức 
 (bottom + top) 
mid = 
 2 
Kế đó giải thuật so sánh khoá đích với khoá của phần tử tại vị trí mid và thay 
đổi top hoặc bottom dựa theo kết quả của phép so sánh này. 
Chúng ta lưu ý rằng giải thuật nên kết thúc khi top ≤ bottom; tức là khi 
phần danh sách cần tìm còn không quá một phần tử (giả sử rằng giải thuật đã 
không chấm dứt sớm hơn trước đó trong trường hợp khoá đích đã được tìm thấy). 
Cuối cùng, để chắc chắn rằng giải thuật dừng, số phần tử cần tìm của danh 
sách (top – bottom + 1) phải giảm sau mỗi lần lặp của giải thuật. 
7.3.3. Phiên bản thứ nhất 
Cách cài đặt đơn giản nhất của giải thuật là cứ tiếp tục chia đôi danh sách, 
bất kể khoá đích có được tìm thấy hay chưa, cho tới khi danh sách còn lại có 
chiều dài là 1. 
Hàm sau đây được viết đệ qui. 
Error_code recursive_binary_1(const Ordered_list &the_list, const Key 
&target, int bottom, int top, int &position) 
/* 
pre: Các chỉ số bottom và top chỉ ra dãy các phần tử trong danh sách phục vụ cho việc tìm 
kiếm target. 
post: Nếu phần tử có khóa trùng với target được tìm thấy thì trả về success, position chỉ 
vị trí tìm thấy. Ngược lại phương thức trả về not_present, position không có nghĩa. 
uses: recursive_binary_1 và các phương thức của lớp List và Record. 
Chương 7 – Tìm kiếm 
Giáo trình Cấu trúc dữ liệu và Giải thuật 144
*/ 
{ 
 Record data; 
 if (bottom < top) { // List có nhiều hơn 1 phần tử. 
 int mid = (bottom + top) / 2; 
 the_list.retrieve(mid, data); 
 if (data < target) // Cần loại bỏ một nửa số phần tử bên phải. 
 return recursive_binary_1(the_list, target, mid + 1, top, position); 
 else // Cần loại bỏ một nửa số phần tử bên trái. 
 return recursive_binary_1(the_list, target, bottom, mid, position); 
 } 
 else if (top < bottom) 
 return not_present; // List rỗng. 
 else { // List có chính xác 1 phần tử. 
 position = bottom; 
 the_list.retrieve(bottom, data); 
 if (data == target) return success; 
 else return not_present; 
 } 
} 
Sự phân chia của danh sách trong quá trình tìm kiếm có thể được minh hoạ 
như sau: 
Lưu ý rằng trong sơ đồ này phần đầu tiên chỉ chứa các phần tử nhỏ hơn khoá 
đích còn phần cuối có thể chứa các phần tử lớn hơn hoặc bằng khoá đích. Bằng 
cách này, khi phần giữa của danh sách chỉ còn một phần tử mà lại là phần tử 
chứa khóa đích thì phần tử này luôn là phần tử đầu tiên nếu có nhiều phần tử có 
khoá trùng với nó trong danh sách. 
Nếu danh sách là rỗng thì hàm trên thất bại, ngược lại nó tính giá trị của 
mid. Vì mid được tính là trung bình của top và bottom nên nó nằm giữa top và 
bottom, và do đó nó là chỉ số hợp lệ của một phần tử của danh sách. 
Biểu thức chia nguyên luôn làm tròn xuống, nên chúng ta có 
bottom ≤ mid < top 
Sau khi quá trình đệ qui kết thúc, giải thuật phải kiểm tra xem khoá đích đã 
được tìm thấy hay chưa vì quá trình đệ qui không thực hiện phép kiểm tra này. 
Để chuyển hàm trên về dạng hàm tìm kiếm chuẩn mà chúng ta định ra ở trên 
chúng ta định nghĩa hàm sau: 
Chương 7 – Tìm kiếm 
Giáo trình Cấu trúc dữ liệu và Giải thuật 145
Error_code run_recursive_binary_1(const Ordered_list &the_list, 
 const Key &target, int &position) 
{ 
 return recursive_binary_1(the_list, target, 0, the_list.size() - 1, 
position); 
} 
Vì phép đệ qui được sử dụng trong hàm trên là đệ qui đuôi (tail recursion) nên 
có thể chuyển thành vòng lặp một cách dễ dàng. Đồng thời chúng ta có thể làm 
cho các thông số của hàm trở nên thống nhất với các hàm tìm kiếm khác. 
ErrorCode binary_search_1 (const Ordered_list &the_list, 
 const Key &target, int &position) 
/* 
post: Nếu phần tử có khóa trùng với target được tìm thấy thì trả về success, position chỉ vị trí 
tìm thấy. Ngược lại phương thức trả về not_present, position không có nghĩa. 
uses: Các phương thức của lớp List và Record. 
*/ 
{ 
 Record data; 
 int bottom = 0, top = the_list.size() - 1; 
 while (bottom < top) { 
 int mid = (bottom + top) / 2; 
 the_list.retrieve(mid, data); 
 if (data < target) 
 bottom = mid + 1; 
 else 
 top = mid; 
 } 
 if (top < bottom) return not_present; 
 else { 
 position = bottom; 
 the_list.retrieve(bottom, data); 
 if (data == target) return success; 
 else return not_present; 
 } 
} 
7.3.4. Nhận biết sớm phần tử có chứa khóa đích 
Tuy binary_search_1 là một dạng đơn giản của giải thuật tìm kiếm nhị 
phân, nhưng nó thực hiện thừa một số lần so sánh vì nó không nhận ra trường 
hợp phần tử khoá được tìm thấy sớm hơn. Vì thế chúng ta có thể cải tiến giải 
thuật như sau. 
Error_code recursive_binary_2(const Ordered_list &the_list, const Key 
&target,int bottom, int top, int &position) 
/* 
pre: Các chỉ số bottom và top chỉ ra dãy các phần tử trong danh sách phục vụ cho việc tìm 
kiếm target. 
Chương 7 – Tìm kiếm 
Giáo trình Cấu trúc dữ liệu và Giải thuật 146
post: Nếu phần tử có khóa trùng với target được tìm thấy thì trả về success, position chỉ 
vị trí tìm thấy. Ngược lại phương thức trả về not_present, position không có nghĩa. 
uses: recursive_binary_2 và các phương thức của lớp List và Record. 
*/ 
{ 
 Record data; 
 if (bottom <= top) { 
 int mid = (bottom + top) / 2; 
 the_list.retrieve(mid, data); 
 if (data == target) { 
 position = mid; 
 return success; 
 } 
 else if (data < target) 
 return recursive_binary_2(the_list, target, mid + 1, top, position); 
 else 
 return recursive_binary_2(the_list, target, bottom, mid - 1, 
position); 
 } 
 else return not_present; 
} 
Error_code run_recursive_binary_2(const Ordered_list &the_list, 
 const Key &target, int &position) 
{ 
 return recursive_binary_2(the_list, target, 0, the_list.size() - 1, 
position); 
} 
Chúng ta có thể chuyển hàm này thành dạng không đệ qui như sau. 
Error_code binary_search_2(const Ordered_list &the_list, 
 const Key &target, int &position) 
/* 
post: Nếu phần tử có khóa trùng với target được tìm thấy thì trả về success, position chỉ 
vị trí tìm thấy. Ngược lại phương thức trả về not_present, position không có nghĩa. 
uses: Các phương thức của lớp List và Record. 
*/ 
{ 
 Record data; 
 int bottom = 0, top = the_list.size() - 1; 
 while (bottom <= top) { 
 position = (bottom + top) / 2; 
 the_list.retrieve(position, data); 
 if (data == target) return success; 
 if (data < target) bottom = position + 1; 
 else top = position - 1; 
 } 
 return not_present; 
} 
Các hoạt động này có thể được minh họạ như sau: 
Chương 7 – Tìm kiếm 
Giáo trình Cấu trúc dữ liệu và Giải thuật 147
Sơ đồ này là đối xứng theo nghĩa phần thứ nhất chỉ chứa các phần tử nhỏ hơn 
khoá, phần thứ ba chỉ chứa các phần tử lớn hơn khoá. Khi đó, nếu như khoá xuất 
hiện ở nhiều vị trí trong danh sách thì giải thuật có thể trả về bất kỳ vị trí nào 
trong số đó. Đây cũng là nhược điểm của cách cải tiến để nhận ra sớm phần tử 
cần tìm này, vì trong một số ứng dụng, vị trí tương đối giữa phần tử được tìm 
thấy so với các phần tử có khóa trùng với nó rất quan trọng. 
7.4. Cây so sánh 
Cây so sánh (comparison tree) của một giải thuật tìm kiếm, còn gọi là cây 
quyết định (decision tree) hay cây tìm kiếm (search tree), là một cây có được bằng 
cách lần theo vết các hành vi của giải thuật. Mỗi nút của cây biểu diễn một phép 
so sánh. Tên của nút là chỉ số của phần tử có khóa đang được so sánh với khóa 
đích. Các nhánh xuất phát từ mỗi nút là các kết quả có thể có của phép so sánh 
tại nút đó và được đặt tên tương ứng. Khi giải thuật kết thúc chúng ta có một nút 
lá. Nếu giải thuật thất bại thì nút lá này được đặt tên là F, ngược lại tên của nút 
là chỉ số của phần tử có khoá trùng với khoá đích. 
Cây so sánh cho giải thuật tìm kiếm tuần tự rất đơn giản: 
Hình 7.2- Cây so sánh cho tìm kiếm tuần tự 
Số lần so sánh mà một giải thuật tìm kiếm thực hiện khi tiến hành một phép 
tìm kiếm cụ thể là số nút trung gian mà giải thuật đi qua kể từ gốc (nút trên cùng 
của cây) để đi đến nút lá cần thiết. 
Chương 7 – Tìm kiếm 
Giáo trình Cấu trúc dữ liệu và Giải thuật 148
Hình dạng của cây so sánh cho tìm kiếm nhị phân: 
Giải thuật tìm kiếm tuần tự cần nhiều phép so sánh hơn giải thuật tìm kiếm 
nhị phân. Chúng ta dễ dàng nhận thấy điều này qua hình dạng các cây so sánh 
của chúng. Giải thuật tìm kiếm tuần tự có cây so sánh hẹp và cao trong khi cây 
so sánh của giải thuật tìm kiếm nhị phân rộng và thấp hơn nhiều. Hình dạng cây 
này giúp ta hiểu được tại sao số lần so sánh trong phép tìm kiếm nhị phân là ít 
hơn so với tìm kiếm tuần tự. 
Hình 7.3- Cây so sánh cho tìm kiếm nhị phân.

File đính kèm:

giao_trinh_cau_truc_du_lieu_va_giai_thuat_chuong_7_tim_kiem.pdf