Luận án tóm tắt Luyện mạng nơron bằng thuật toán vượt khe có sự kết hợp với giải thuật di truyền

Xét trường hợp đối tượng phi tuyến có độ phức tạp cao, nếu sử dụng

phương pháp giải tích thông thường để nhận dạng sẽ rất khó khăn,

thậm chí không thực hiện được do sự hiểu biết nghèo nàn về đối

tượng. Vì vậy các nhà khoa học đã đưa ra ý tưởng là sử dụng công cụ

tính toán mềm như hệ mờ, mạng nơron, đại số gia tử để xấp xỉ -chính là nhận dạng đối tượng. Mạng nơron là một trong những công

cụ hữu hiệu để nhận dạng mô hình đối tượng, bằng phương pháp này

ta không biết được mô hình toán thực sự của đối tượng nhưng hoàn

toàn có thể sử dụng kết quả xấp xỉ để thay thế đối tượng.

28 trang | Chuyên mục: MATLAB | Chia sẻ: dkS00TYs | Lượt xem: 2514 | Lượt tải: 2

Tóm tắt nội dung Luận án tóm tắt Luyện mạng nơron bằng thuật toán vượt khe có sự kết hợp với giải thuật di truyền, để xem tài liệu hoàn chỉnh bạn click vào nút "TẢI VỀ" ở trên

GA BP
0.1 16 14
0.001 4 13
Nhận xét 1: Nhờ cơ chế tìm kiếm trải rộng, ngẫu nghiên và mang
tính chọn lọc tự nhiên nên: GA thường tìm ra được vùng chứa cực trị
toàn cục, nhưng khó đạt được cực trị toàn cục. Một mặt ta muốn GA
duy trì sự đa dạng quần thể để tránh hội tụ sớm đến cực trị cục bộ;
mặt khác, khi “đã khoanh vùng được cực trị toàn cục”, ta muốn GA
thu hẹp vùng tìm kiếm để “chỉ ra được cực trị toàn cục”. Mục tiêu
thứ nhất thường dễ đạt được bằng cách chọn hàm thích nghi và
phương pháp tái tạo quần thể phù hợp. Để đạt được mục tiêu thứ hai
đòi hỏi chúng ta phải chia quá trình tiến hóa thành hai giai đoạn,
trong giai đoạn hai ta phải chỉnh lại: các toán tử lai, đột biến, tái tạo;
phương pháp chọn lọc; đánh giá độ thích nghi; cũng như chỉnh sửa
lại các tham số của quá trình tiến hóa để có thể đến cực trị toàn cục.
Việc thực thi một mô hình như thế sẽ rất phức tạp. Do đó, cần phải
kết hợp GA với các phương pháp tối ưu cục bộ khác.
Nhận xét 2: Các phương pháp học trong ANN thực hiện việc “tìm
kiếm cục bộ” trong không gian trọng số (dựa trên thông tin về đạo
hàm của lỗi) nên có hai nhược điểm. Thứ nhất bộ trọng số thu được
23
thường không là tối ưu toàn cục. Thứ hai quá trình học có thể không
hội tụ hoặc hội tụ rất chậm. Do đó, cần phải kết hợp các phương
pháp học “mang tính cục bộ” của ANN với các thuật giải “mang
tính toàn cục” như thuật giải di truyền.
Từ nhận xét 1 và 2, ta thấy rằng có thể kết hợp GA và ANN nhằm
nâng cao hiệu quả của ANN. GA sẽ khoanh vùng chứa cực tiểu toàn
cục của hàm lỗi, sau đó ANN xuất phát từ bộ trọng số này để tiến
đến cực tiểu toàn cục.
Trong phần này sẽ trình bày về giải thuật di truyền (GA) kết hợp với
thuật toán “vượt khe” để chế ngự quỹ đạo và rút ngắn thời gian của
quá trình tìm kiếm tối ưu với mặt sai số phức tạp dạng lòng khe.
3.2.2. Thuật toán
Có nhiều cách để kết hợp giải thuật di truyền vào mạng nơron nhưng
cách đơn giản và khá hiệu quả là ta thực hiện lai ghép hai giải thuật
nối tiếp nhau.
Với một cấu trúc mạng cho trước, ta xuất phát bằng giải thuật di
truyền, đi tìm tập các trọng số tốt nhất đối với mạng. Một quần thể N
chuỗi được khởi tạo ngẫu nhiên. Mỗi chuỗi là một bản mã hoá của
một tập trọng số của mạng. Sau G thế hệ tiến hoá, 5% các cá thể tốt
nhất trong G thế hệ sẽ được lưu giữ lại. Các cá thể này sau đó sẽ
được giải mã và được đưa vào mạng nơron xây nên các mô hình để
học. Sau quá trình học, tập trọng số nào cho kết quả dự báo tốt nhất
sẽ được giữ lại làm thông số của mạng nơron cho việc dự báo đó.
Thuật toán kết hợp giải thuật vượt khe và giải thuật di truyền cho
mạng MLP được đề xuất trong hình 3.1.
Nó bao gồm hai giai đoạn luyện mạng. Giai đoạn đầu tiên sử dụng
thuật toán di truyền với bước truyền thẳng nhằm đẩy nhanh toàn bộ
quá trình luyện mạng. Thuật toán di truyền thực hiện tìm kiếm toàn
cục và tìm kiếm tối ưu gần điểm ban đầu (trọng lượng vec-tơ) cho
24
giai đoạn thứ hai. Trong đó, mỗi nhiễm sắc thể được sử dụng để mã
hóa các trọng số của mạng nơron. Hàm thích nghi (hàm mục tiêu)
cho các thuật toán di truyền được xác định là tổng bình phương lỗi
(TSSE) của mạng nơron tương ứng. Do đó, bài toán sẽ trở thành tối
ưu hóa không giới hạn nhằm tìm một tập hợp các biến quyết định
giảm thiểu hàm mục tiêu. Trong giai đoạn thứ 2 sẽ sử dụng kỹ thuật
lan truyền ngược với các bước học được thay đổi theo thuật toán
vượt khe đã được đề xuất ở hình 2.4.
Hình 3.1: Sơ đồ thuật toán kết hợp giải thuật vượt khe và di truyền
cho luyện mạng MP
3.3. Áp dụng mô hình kết hợp giải thuật di truyền và thuật
toán vƣợt khe trong quá trình luyện mạng nơron vào bài
toán nhận dạng
25
Trở lại ví dụ về nhận dạng chữ viết tay 0,1,2,… 9.
Cài đặt thuật toán được thực hiện trên Matlab.
Các kết quả thực nghiệm khi luyện mạng MLP kết hợp giải
thuật vƣợt khe và di truyền.
Mạng MLP được luyện với bộ các ký tự mẫu chữ với kích thước 7 x
5. Các giá trị ban đầu như số đầu vào (35), số lượng lớp ẩn (1), số
nơron lớp ẩn (5), các kỹ thuật luyện mạng khác nhau, mã hóa đầu
vào và đầu ra nhằm khởi tạo các trọng số đã được đề cập ở trên.
Các tham số luyện mạng:
Kích thước quần thể = 20 Xác suất lai tạo = 0.46
Mã hóa bằng số thực
Độ dài nhiễm sắc thể = 225 Độ chính xác mong muốn = 90%
Số thế hệ: 20 Lỗi hệ thống mong muốn=0.06
Kết quả luyện mạng như sau:
Số thế hệ 1 5 10 15 20
Tổng thích nghi 9.5563 8.1638 6.1383 5.724 5.697
Số chu kỳ
luyện
5 10 15 20 33
Tỷ lệ lỗi 93.33% 60.33% 40.67% 37.33% 0%
TSSE 0.4956 0.3274 0.1387 0.0864 0.0589
Như vậy, sau 20 thế hệ đã đạt đến
yêu cầu của bài toán. Giá trị thích
nghi trung bình đạt được là 5.679.
Kết quả của giai đoạn 1 được sử
dụng để khởi tạo trọng số cho giai
đoạn 2. Với sự thay đổi bước học
theo giải thuật vượt khe, sau 33
Hình 3.2: Hoạt động của mạng MLP cải tiến
26
chu kỳ luyện mạng lỗi hệ thống đã đạt đến mục đích 0.0589 và độ
chính xác của quá trình nhận dạng là 100%. Hoạt động của mạng
MLP có kết hợp giải thuật vượt khe và di truyền cho nhận dạng chữ
được thể hiện trên hình 3.2
3.4. Kết luận chƣơng 3
Trong chương này, tác giả đề xuất việc sử dụng giải thuật di truyền
kết hợp với thuật toán “vượt khe” để cải tiến quá trình luyện mạng
nơron có mặt lỗi đặc biệt và minh họa thông qua ứng dụng nhận
dạng chữ. Có thể đánh giá được rằng phương pháp này đã tăng khả
năng và tốc độ hội tụ của mạng nơron có mặt lỗi dạng “lòng khe”.
KẾT LUẬN CHUNG VÀ ĐỀ XUẤT HƢỚNG NGHIÊN CỨU
* So sánh luyện mạng nơron có mặt lỗi đặc biệt với các phƣơng
pháp khác nhau
Qua việc nghiên cứu và thực nghiệm trên máy tính cho ta thấy: với
những cấu trúc mạng nơ ron mà mặt lỗi có dạng lòng khe, vẫn sử
dụng kỹ thuật lan truyền ngược nhưng việc áp dụng giải thuật di
truyền kết hợp với thuật toán “vượt khe” để luyện mạng sẽ cho ta độ
chính xác và tốc độ hội tụ nhanh hơn nhiều so với phương pháp
gradient.
Kết quả nghiên cứu này được giải thích như sau:
- Kết quả luyện mạng nơron phụ thuộc rất lớn vào giá trị ban đầu của
vec-tơ trọng số. Việc sử dụng giải thuật di truyền thực hiện quá trình
tìm kiếm toàn cục cho phép có được vec-tơ trọng số ban đầu tốt cho
giai đoạn sau của quá trình luyện mạng.
- Khi mặt lỗi đặc biệt có dạng lòng khe, nếu luyện mạng bằng thuật
toán gradien liên hợp hay thuật toán Levenberg – Marquardt sẽ chậm
hội tụ và gặp phải vấn đề cực trị địa phương. Thuật toán “vượt khe”
nhằm tìm kiếm các bước học tối ưu trong giai đoạn 2 của quá trình
27
luyện mạng nên đã khắc phục các nhược điểm này và do đó làm tăng
tốc độ hội tụ cũng như độ chính xác của quá trình luyện mạng.
Việc sử dụng giải thuật di truyền kết hợp với thuật toán “vượt khe”
có thể ứng dụng để luyện một số cấu trúc mạng nơ ron mà có mặt lỗi
đặc biệt khác. Vì vậy, kết quả nghiên cứu này có thể ứng dụng cho
nhiều bài toán khác trong lĩnh vực viễn thông, điều khiển, và công
nghệ thông tin.
* Những đóng góp chính của luận án
- Đề xuất một dạng thuật toán vượt khe để giải bài toán tối ưu với
hàm mục tiêu có dạng đặc biệt, dạng lòng khe.
- Phân tích, đánh giá độ hội tụ của quá trình luyện mạng nơron phụ
thuộc vào bộ trọng số khởi tạo ban đầu và bước học.
- Đề xuất mô hình kết hợp giải thuật di truyền và thuật toán vượt khe
trong quá trình luyện mạng nơron có mặt lỗi đặc biệt. Trong đó giải
thuật di truyền có vai trò thực hiện quá trình tìm kiếm toàn cục để có
được vec-tơ trọng số ban đầu tốt cho giai đoạn sau của quá trình
luyện mạng. Còn thuật toán vượt khe là để tìm bước học tối ưu, làm
tăng tốc độ hội tụ cũng như độ chính xác của quá trình luyện mạng.
- Để kiểm chứng kết quả nghiên cứu, một ví dụ về nhận dạng chữ
viết tay đã được đưa ra để luyện mạng với những phương pháp khác
nhau.
* Đề xuất hƣớng nghiên cứu
- Bổ sung vào Toolbox Matlab một lựa chọn tính bước học mới:
bước học vượt khe.
- Ứng dụng thuật toán này cho một số bài toán trong lĩnh vực điều
khiển, tự động hóa và kỹ thuật điện tử.
- Phát triển mô hình kết hợp cho các bài toán tối ưu có hàm mục tiêu
phức tạp khác.
28
CÁC CÔNG TRÌNH ĐÃ CÔNG BỐ
1. “Reseach and Development of an adaptive control system for extremal
systems”; Cong Nguyen Huu, Dung Nguyen Tien, Nga Nguyen Thi Thanh, The
2009 international forum on strategic technologies (IFOST 2009), October 21-23,
2009, Ho Chi Minh city, Vietnam; page 235-238.
2. “Nghiên cứu ứng dụng mạng hồi quy thời gian liên tục trong nhận dạng và
điều khiển hệ thống xử lý nước thải”; Nguyễn Hữu Công, Nguyễn Thị Thanh
Nga, Phạm Văn Hưng; Tạp chí khoa học công nghệ Đại học Thái Nguyên số 12
tập 74 năm 2010; trang 4-8.
3. Research on the application of genetic algorithm combined with the “cleft-
overstep” algorithm for improving learning process of MLP neural network with
special error surface.; Cong Nguyen Huu, Nga Nguyen Thi Thanh, Huy Nguyen
Phương; The 7th International Conference on Natural Computation (ICNC'11) and
the 8th International Conference on Fuzzy Systems and Knowledge Discovery
(FSKD'11), 26-28 July, Shanghai, China, 2011; page 222-227.
4. Đề tài nghiên cứu khoa học cấp bộ “Nghiên cứu thuật toán tìm nghiệm tối ưu
toàn cục trong quá trình luyện mạng nơron - ứng dụng để nhận dạng, điều
khiển đối tượng động học phi tuyến”. Chủ nhiệm đề tài: Nguyễn Thị Thanh Nga,
Nghiệm thu chính thức năm 2011.
5. “Research to improve a learning algorithm of neural networks”; Cong Nguyen
Huu, Nga Nguyen Thi Thanh,Ngoc Van Dong; Tạp chí Khoa học Công nghệ - Đại
học Thái Nguyên, tháng 5 năm 2012; page 53-58.
6. “The Influence of Initial Weights During Neural Network Training”; Cong
Nguyen Huu, Nga Nguyen Thi Thanh, Huy Vu Ngoc, Anh Bui Tuan; Tạp chí
Khoa học Công nghệ các Trường Đại học Kỹ thuật, No.95 (2013); page 18-25.
Trong tổng số 06 công trình tác giả đã công bố, tiêu biểu có: bài
báo số 03 được nằm trong danh sách ISI, và đề tài NCKH cấp bộ số
04 mà tác giả làm chủ nhiệm đề tài.

File đính kèm:

Luận án tóm tắt Luyện mạng nơron bằng thuật toán vượt khe có sự kết hợp với giải thuật di truyền.pdf