Luận án tóm tắt Luyện mạng nơron bằng thuật toán vượt khe có sự kết hợp với giải thuật di truyền

Xét trường hợp đối tượng phi tuyến có độ phức tạp cao, nếu sử dụng

phương pháp giải tích thông thường để nhận dạng sẽ rất khó khăn,

thậm chí không thực hiện được do sự hiểu biết nghèo nàn về đối

tượng. Vì vậy các nhà khoa học đã đưa ra ý tưởng là sử dụng công cụ

tính toán mềm như hệ mờ, mạng nơron, đại số gia tử để xấp xỉ -chính là nhận dạng đối tượng. Mạng nơron là một trong những công

cụ hữu hiệu để nhận dạng mô hình đối tượng, bằng phương pháp này

ta không biết được mô hình toán thực sự của đối tượng nhưng hoàn

toàn có thể sử dụng kết quả xấp xỉ để thay thế đối tượng.

pdf28 trang | Chuyên mục: MATLAB | Chia sẻ: dkS00TYs | Lượt xem: 2182 | Lượt tải: 2download
Tóm tắt nội dung Luận án tóm tắt Luyện mạng nơron bằng thuật toán vượt khe có sự kết hợp với giải thuật di truyền, để xem tài liệu hoàn chỉnh bạn click vào nút "TẢI VỀ" ở trên
GA BP 
0.1 16 14 
0.001 4 13 
Nhận xét 1: Nhờ cơ chế tìm kiếm trải rộng, ngẫu nghiên và mang 
tính chọn lọc tự nhiên nên: GA thường tìm ra được vùng chứa cực trị 
toàn cục, nhưng khó đạt được cực trị toàn cục. Một mặt ta muốn GA 
duy trì sự đa dạng quần thể để tránh hội tụ sớm đến cực trị cục bộ; 
mặt khác, khi “đã khoanh vùng được cực trị toàn cục”, ta muốn GA 
thu hẹp vùng tìm kiếm để “chỉ ra được cực trị toàn cục”. Mục tiêu 
thứ nhất thường dễ đạt được bằng cách chọn hàm thích nghi và 
phương pháp tái tạo quần thể phù hợp. Để đạt được mục tiêu thứ hai 
đòi hỏi chúng ta phải chia quá trình tiến hóa thành hai giai đoạn, 
trong giai đoạn hai ta phải chỉnh lại: các toán tử lai, đột biến, tái tạo; 
phương pháp chọn lọc; đánh giá độ thích nghi; cũng như chỉnh sửa 
lại các tham số của quá trình tiến hóa để có thể đến cực trị toàn cục. 
Việc thực thi một mô hình như thế sẽ rất phức tạp. Do đó, cần phải 
kết hợp GA với các phương pháp tối ưu cục bộ khác. 
Nhận xét 2: Các phương pháp học trong ANN thực hiện việc “tìm 
kiếm cục bộ” trong không gian trọng số (dựa trên thông tin về đạo 
hàm của lỗi) nên có hai nhược điểm. Thứ nhất bộ trọng số thu được 
23 
thường không là tối ưu toàn cục. Thứ hai quá trình học có thể không 
hội tụ hoặc hội tụ rất chậm. Do đó, cần phải kết hợp các phương 
pháp học “mang tính cục bộ” của ANN với các thuật giải “mang 
tính toàn cục” như thuật giải di truyền. 
Từ nhận xét 1 và 2, ta thấy rằng có thể kết hợp GA và ANN nhằm 
nâng cao hiệu quả của ANN. GA sẽ khoanh vùng chứa cực tiểu toàn 
cục của hàm lỗi, sau đó ANN xuất phát từ bộ trọng số này để tiến 
đến cực tiểu toàn cục. 
Trong phần này sẽ trình bày về giải thuật di truyền (GA) kết hợp với 
thuật toán “vượt khe” để chế ngự quỹ đạo và rút ngắn thời gian của 
quá trình tìm kiếm tối ưu với mặt sai số phức tạp dạng lòng khe. 
3.2.2. Thuật toán 
Có nhiều cách để kết hợp giải thuật di truyền vào mạng nơron nhưng 
cách đơn giản và khá hiệu quả là ta thực hiện lai ghép hai giải thuật 
nối tiếp nhau. 
Với một cấu trúc mạng cho trước, ta xuất phát bằng giải thuật di 
truyền, đi tìm tập các trọng số tốt nhất đối với mạng. Một quần thể N 
chuỗi được khởi tạo ngẫu nhiên. Mỗi chuỗi là một bản mã hoá của 
một tập trọng số của mạng. Sau G thế hệ tiến hoá, 5% các cá thể tốt 
nhất trong G thế hệ sẽ được lưu giữ lại. Các cá thể này sau đó sẽ 
được giải mã và được đưa vào mạng nơron xây nên các mô hình để 
học. Sau quá trình học, tập trọng số nào cho kết quả dự báo tốt nhất 
sẽ được giữ lại làm thông số của mạng nơron cho việc dự báo đó. 
Thuật toán kết hợp giải thuật vượt khe và giải thuật di truyền cho 
mạng MLP được đề xuất trong hình 3.1. 
Nó bao gồm hai giai đoạn luyện mạng. Giai đoạn đầu tiên sử dụng 
thuật toán di truyền với bước truyền thẳng nhằm đẩy nhanh toàn bộ 
quá trình luyện mạng. Thuật toán di truyền thực hiện tìm kiếm toàn 
cục và tìm kiếm tối ưu gần điểm ban đầu (trọng lượng vec-tơ) cho 
24 
giai đoạn thứ hai. Trong đó, mỗi nhiễm sắc thể được sử dụng để mã 
hóa các trọng số của mạng nơron. Hàm thích nghi (hàm mục tiêu) 
cho các thuật toán di truyền được xác định là tổng bình phương lỗi 
(TSSE) của mạng nơron tương ứng. Do đó, bài toán sẽ trở thành tối 
ưu hóa không giới hạn nhằm tìm một tập hợp các biến quyết định 
giảm thiểu hàm mục tiêu. Trong giai đoạn thứ 2 sẽ sử dụng kỹ thuật 
lan truyền ngược với các bước học được thay đổi theo thuật toán 
vượt khe đã được đề xuất ở hình 2.4. 
Hình 3.1: Sơ đồ thuật toán kết hợp giải thuật vượt khe và di truyền 
cho luyện mạng MP 
3.3. Áp dụng mô hình kết hợp giải thuật di truyền và thuật 
toán vƣợt khe trong quá trình luyện mạng nơron vào bài 
toán nhận dạng 
25 
Trở lại ví dụ về nhận dạng chữ viết tay 0,1,2,… 9. 
Cài đặt thuật toán được thực hiện trên Matlab. 
Các kết quả thực nghiệm khi luyện mạng MLP kết hợp giải 
thuật vƣợt khe và di truyền. 
Mạng MLP được luyện với bộ các ký tự mẫu chữ với kích thước 7 x 
5. Các giá trị ban đầu như số đầu vào (35), số lượng lớp ẩn (1), số 
nơron lớp ẩn (5), các kỹ thuật luyện mạng khác nhau, mã hóa đầu 
vào và đầu ra nhằm khởi tạo các trọng số đã được đề cập ở trên. 
Các tham số luyện mạng: 
Kích thước quần thể = 20 Xác suất lai tạo = 0.46 
Mã hóa bằng số thực 
Độ dài nhiễm sắc thể = 225 Độ chính xác mong muốn = 90% 
Số thế hệ: 20 Lỗi hệ thống mong muốn=0.06 
Kết quả luyện mạng như sau: 
Số thế hệ 1 5 10 15 20 
Tổng thích nghi 9.5563 8.1638 6.1383 5.724 5.697 
Số chu kỳ 
luyện 
5 10 15 20 33 
Tỷ lệ lỗi 93.33% 60.33% 40.67% 37.33% 0% 
TSSE 0.4956 0.3274 0.1387 0.0864 0.0589
 Như vậy, sau 20 thế hệ đã đạt đến 
yêu cầu của bài toán. Giá trị thích 
nghi trung bình đạt được là 5.679. 
Kết quả của giai đoạn 1 được sử 
dụng để khởi tạo trọng số cho giai 
đoạn 2. Với sự thay đổi bước học 
theo giải thuật vượt khe, sau 33 
Hình 3.2: Hoạt động của mạng MLP cải tiến 
26 
chu kỳ luyện mạng lỗi hệ thống đã đạt đến mục đích 0.0589 và độ 
chính xác của quá trình nhận dạng là 100%. Hoạt động của mạng 
MLP có kết hợp giải thuật vượt khe và di truyền cho nhận dạng chữ 
được thể hiện trên hình 3.2 
3.4. Kết luận chƣơng 3 
Trong chương này, tác giả đề xuất việc sử dụng giải thuật di truyền 
kết hợp với thuật toán “vượt khe” để cải tiến quá trình luyện mạng 
nơron có mặt lỗi đặc biệt và minh họa thông qua ứng dụng nhận 
dạng chữ. Có thể đánh giá được rằng phương pháp này đã tăng khả 
năng và tốc độ hội tụ của mạng nơron có mặt lỗi dạng “lòng khe”. 
KẾT LUẬN CHUNG VÀ ĐỀ XUẤT HƢỚNG NGHIÊN CỨU 
* So sánh luyện mạng nơron có mặt lỗi đặc biệt với các phƣơng 
pháp khác nhau 
Qua việc nghiên cứu và thực nghiệm trên máy tính cho ta thấy: với 
những cấu trúc mạng nơ ron mà mặt lỗi có dạng lòng khe, vẫn sử 
dụng kỹ thuật lan truyền ngược nhưng việc áp dụng giải thuật di 
truyền kết hợp với thuật toán “vượt khe” để luyện mạng sẽ cho ta độ 
chính xác và tốc độ hội tụ nhanh hơn nhiều so với phương pháp 
gradient. 
Kết quả nghiên cứu này được giải thích như sau: 
- Kết quả luyện mạng nơron phụ thuộc rất lớn vào giá trị ban đầu của 
vec-tơ trọng số. Việc sử dụng giải thuật di truyền thực hiện quá trình 
tìm kiếm toàn cục cho phép có được vec-tơ trọng số ban đầu tốt cho 
giai đoạn sau của quá trình luyện mạng. 
- Khi mặt lỗi đặc biệt có dạng lòng khe, nếu luyện mạng bằng thuật 
toán gradien liên hợp hay thuật toán Levenberg – Marquardt sẽ chậm 
hội tụ và gặp phải vấn đề cực trị địa phương. Thuật toán “vượt khe” 
nhằm tìm kiếm các bước học tối ưu trong giai đoạn 2 của quá trình 
27 
luyện mạng nên đã khắc phục các nhược điểm này và do đó làm tăng 
tốc độ hội tụ cũng như độ chính xác của quá trình luyện mạng. 
Việc sử dụng giải thuật di truyền kết hợp với thuật toán “vượt khe” 
có thể ứng dụng để luyện một số cấu trúc mạng nơ ron mà có mặt lỗi 
đặc biệt khác. Vì vậy, kết quả nghiên cứu này có thể ứng dụng cho 
nhiều bài toán khác trong lĩnh vực viễn thông, điều khiển, và công 
nghệ thông tin. 
* Những đóng góp chính của luận án 
- Đề xuất một dạng thuật toán vượt khe để giải bài toán tối ưu với 
hàm mục tiêu có dạng đặc biệt, dạng lòng khe. 
- Phân tích, đánh giá độ hội tụ của quá trình luyện mạng nơron phụ 
thuộc vào bộ trọng số khởi tạo ban đầu và bước học. 
- Đề xuất mô hình kết hợp giải thuật di truyền và thuật toán vượt khe 
trong quá trình luyện mạng nơron có mặt lỗi đặc biệt. Trong đó giải 
thuật di truyền có vai trò thực hiện quá trình tìm kiếm toàn cục để có 
được vec-tơ trọng số ban đầu tốt cho giai đoạn sau của quá trình 
luyện mạng. Còn thuật toán vượt khe là để tìm bước học tối ưu, làm 
tăng tốc độ hội tụ cũng như độ chính xác của quá trình luyện mạng. 
- Để kiểm chứng kết quả nghiên cứu, một ví dụ về nhận dạng chữ 
viết tay đã được đưa ra để luyện mạng với những phương pháp khác 
nhau. 
* Đề xuất hƣớng nghiên cứu 
- Bổ sung vào Toolbox Matlab một lựa chọn tính bước học mới: 
bước học vượt khe. 
- Ứng dụng thuật toán này cho một số bài toán trong lĩnh vực điều 
khiển, tự động hóa và kỹ thuật điện tử. 
- Phát triển mô hình kết hợp cho các bài toán tối ưu có hàm mục tiêu 
phức tạp khác. 
28 
CÁC CÔNG TRÌNH ĐÃ CÔNG BỐ 
1. “Reseach and Development of an adaptive control system for extremal 
systems”; Cong Nguyen Huu, Dung Nguyen Tien, Nga Nguyen Thi Thanh, The 
2009 international forum on strategic technologies (IFOST 2009), October 21-23, 
2009, Ho Chi Minh city, Vietnam; page 235-238. 
2. “Nghiên cứu ứng dụng mạng hồi quy thời gian liên tục trong nhận dạng và 
điều khiển hệ thống xử lý nước thải”; Nguyễn Hữu Công, Nguyễn Thị Thanh 
Nga, Phạm Văn Hưng; Tạp chí khoa học công nghệ Đại học Thái Nguyên số 12 
tập 74 năm 2010; trang 4-8. 
3. Research on the application of genetic algorithm combined with the “cleft-
overstep” algorithm for improving learning process of MLP neural network with 
special error surface.; Cong Nguyen Huu, Nga Nguyen Thi Thanh, Huy Nguyen 
Phương; The 7th International Conference on Natural Computation (ICNC'11) and 
the 8th International Conference on Fuzzy Systems and Knowledge Discovery 
(FSKD'11), 26-28 July, Shanghai, China, 2011; page 222-227. 
4. Đề tài nghiên cứu khoa học cấp bộ “Nghiên cứu thuật toán tìm nghiệm tối ưu 
toàn cục trong quá trình luyện mạng nơron - ứng dụng để nhận dạng, điều 
khiển đối tượng động học phi tuyến”. Chủ nhiệm đề tài: Nguyễn Thị Thanh Nga, 
Nghiệm thu chính thức năm 2011. 
5. “Research to improve a learning algorithm of neural networks”; Cong Nguyen 
Huu, Nga Nguyen Thi Thanh,Ngoc Van Dong; Tạp chí Khoa học Công nghệ - Đại 
học Thái Nguyên, tháng 5 năm 2012; page 53-58. 
6. “The Influence of Initial Weights During Neural Network Training”; Cong 
Nguyen Huu, Nga Nguyen Thi Thanh, Huy Vu Ngoc, Anh Bui Tuan; Tạp chí 
Khoa học Công nghệ các Trường Đại học Kỹ thuật, No.95 (2013); page 18-25. 
Trong tổng số 06 công trình tác giả đã công bố, tiêu biểu có: bài 
báo số 03 được nằm trong danh sách ISI, và đề tài NCKH cấp bộ số 
04 mà tác giả làm chủ nhiệm đề tài. 

File đính kèm:

  • pdfLuận án tóm tắt Luyện mạng nơron bằng thuật toán vượt khe có sự kết hợp với giải thuật di truyền.pdf