Nhận dạng chữ viết tay dùng rút trích thông tin theo chiều và mạng Nơron
Nhận dạng chữviết tay là một đềtài rất quan trọng, nó có những ứng dụng khác nhau
trong tình báo, kỹthuật robot,. Bài báo cáo này trình bày kỹthuật nhận dạng ký tựviết tay dùng
phương pháp nhận dạng dựa trên thông tin tĩnh. Phương pháp gồm hai bước: làm mỏng nét ký tự đểgiữ
lại bộkhung của chúng và những thông tin đặc trưng được rút trích dựa trên bộkhung này bằng
phương pháp rút trích thông tin theo chiều. Mặt khác, chúng ta xây dựng mạng nơ-ron nhân tạo nhằm
tạo ra cơsởdữliệu tri thức cho quá trình nhận dạng. Trong thí nghiệm của mình, độchính xác của giải
thuật đạt trên 84% được ghi nhận dựa trên các mẫu thu được trong thực tế. Với kỹthuật này, chúng ta
có thểthay thếhoặc kết hợp với các phương pháp nhận dạng trực tuyến thường được dùng trên các
thiết bịdi động và mởrộng việc nhận dạng lên các bềmặt khác nhưgiấy viết, bảng, biển sốxe, cũng
nhưkhảnăng đọc chữcho robot.
tìm và các pixel được thay thế bằng các giá trị chiều thích hợp. Cuối cùng, các đặc điểm của ký tự được huấn luyện và phân loại bởi mạng nơ-ron. Giải thuật gồm hai bước chính: lấy giá trị về chiều và các đặc điểm về chiều đã được thay đổi. 3.2.1.Lấy Giá Trị Chiều [3] đề xuất một phương pháp lấy giá trị chiều (Obtaining Direct Values). Dữ liệu đưa vào bước này là ảnh nhị phân đã được làm mỏng. Các giá trị về chiều được quy định như sau: value = 2 cho chiều dọc, value = 4 cho chiều ngang, value = 3 cho đường chéo phải, value = 5 cho đường chéo trái và value = 1 cho điểm bắt đầu như hình 3.2. Hình 3.2. Giá trị chiều cho MDF Đầu tiên, chúng ta đi tìm điểm bắt đầu. Điểm bắt đầu được định nghĩa là pixel đầu tiên màu đen (mang giá trị 1) được tìm thấy tại vị trí dưới nhất và trái nhất của ảnh kí tự. Điểm này sẽ được gán giá trị value = 8. TAÏP CHÍ PHAÙT TRIEÅN KH&CN, TAÄP 14, SOÁ K2 - 2011 Trang 67 Tiếp theo, ta phân biệt từng phần đoạn thẳng riêng biệt. Giải thuật thu thập từng pixel một và dựa vào chiều trước đó của nó, nó chuyển đổi giá trị của các pixel này đồng thời kiểm tra điều kiện có đoạn thẳng mới. Nếu một trong những điều kiện sau được gặp, ta xem là một đoạn thẳng mới đã được tìm thấy. Các điều kiện được diễn tả như sau: - Tìm được điểm góc: điểm ngay tại đó có sự thay đổi tức thời về chiều. Có tám trường hợp điểm góc như hình 3.3: Hình 3.3. Các trường hợp điểm góc - Đổi chiều 3 lần. - Có sự đổi chiều, chiều của pixel trước liên tục giống nhau và chiều dài của chiều trước đó của chuỗi liên tục này lớn hơn 3. Sau khi đã cập nhật các giá trị chiều cho từng pixel, các giá trị này sẽ được chuẩn hóa (chuẩn hóa các giá trị chiều). Có ba bước để chuẩn hóa các giá trị về chiều trong một đoạn thẳng: (i) Tìm những giá trị chiều nào thường xuất hiện nhất trong đoạn thẳng cần chuẩn hóa bằng cách dùng phương pháp đếm thông thường để xác định giá trị chiều nào xuất hiện nhiều nhất trong đoạn thẳng. (ii) Thay thế tất cả các giá trị chiều của các pixel trong một đoạn thẳng bằng giá trị chiều được xuất hiện nhiều nhất trong đoạn thẳng đó. (iii) Thay thế giá trị của điểm bắt đầu (value = 8) bằng giá trị chiều có tần suất xuất hiện nhiều nhất trong đoạn thẳng. Hình 3.4 biểu diễn việc tính giá trị chiều và chuẩn hóa cho kí tự a. Trong hình này, chúng ta thấy rằng các giá trị chiều ứng với các đường nét tương ứng đã được chuẩn hóa. Hình 3.4. Tính giá trị chiều cho kí tự a 3.2.2.Lấy Giá Trị MDF Kỹ thuật lấy giá trị MDF (Obtaining Modified Direction Feature) được xây dựng dựa trên kỹ thuật Direction Feature (DF) và Transition Feature (TF). Trong kỹ thuật này, chúng ta tính giá trị của véc-tơ đặc điểm dựa trên giá trị chiều [LT, DT] và sự chuyển từ giá trị pixel = 0 sang giá trị pixel = 1, trong đó (i) LT (Location Transition): giá trị đánh dấu những vị trí mà có sự chuyển từ pixel = 0 sang pixel = 1. Giá trị LT được tính bằng cách quét từng hàng từ trái sang phải và ngược lại, quét các cột từ trên xuống dưới và ngược lại. LT = (vị trí chuyển từ 0 sang 1) / (độ dài của mỗi chiều) (ii) DT (Direction Transition): tính toán dựa trên các giá trị về chiều đã được phân tích. Trong đó, số phần tử trong véc-tơ DT được xác Science & Technology Development, Vol 14, No.K2- 2011 Trang 68 định trước, ở đây chọn là 3, và mỗi phần tử là giá trị chiều tại mỗi điểm có sự chuyển pixel từ 0 sang khác 0 (nonzero). (iii) Chuẩn hóa véc-tơ: tính giá trị trung bình của ba véc-tơ LT hoặc DT liên tiếp nhau. Hình 3.5 biểu diễn cách tính LT và DT điển hình như sau: Hình 3.5. Cách tính LT và DT điển hình 3.3.Sử Dụng Mạng Nơ-Ron Đề Huấn Luyện Và Nhận Dạng Mạng nơ-ron cung cấp một hướng tiếp cận mạnh cho các giá trị thực xấp xỉ, giá trị rời rạc hay các véc-tơ giá trị. Trong nhiều dạng của vấn đề, mạng nơ-ron nhân tạo là một trong những phương pháp máy học hiểu quả hiện nay. Trong phần nghiên cứu của mình, kỹ thuật mạng nơ-ron truyền ngược (back-propagation), một trong những phương pháp hiểu quả trong trong nhiều bài toán, thích hợp bài toán nhận dạng chữ viết tay của chúng ta. Trong giải thuật đề cập trên, mạng nơ-ron giúp xây dựng một tập cơ sở dữ liệu từ việc huấn luyện các tập mẫu có sẵn. Cơ sở dữ liệu này được dùng trong nhận dạng ký tự từ các đặc điểm phân tích được. 4. KẾT QUẢ THÍ NGHIỆM Trong khuôn khổ của bài nghiên cứu, chúng ta sử dụng tập không gian mẫu cho quá trình học máy bởi mạng nơ-ron có kích thước 500 mẫu, được lấy mẫu từ 500 người khác nhau. Mỗi mẫu là 26 file tương ứng với 26 ký tự Latin. Một số ký tự mẫu được thu thập như sau: Ký tự a Ký tự h Ký tự i Ký tự j Ký tự o Ký tự q Ký tự s Ký tự t Ký tự w Ký tự z Hình 4.1. Một số ký tự mẫu Giao điện chương trình được thể hiện trong hình bên dưới (hình 4.2) Hình 4.2. Giao điện chương trình Chúng ta sẽ thi hành phương pháp nhận dạng chữ viết được trình bày ở phần 3 trên nhiều người dùng khác nhau. Trong bài báo cáo này, chúng ta chỉ nêu ra một vài kết quả minh họa. Sau đây là bảng kết quả khi tiến hành thử nghiệm trên 5 user khác nhau: TAÏP CHÍ PHAÙT TRIEÅN KH&CN, TAÄP 14, SOÁ K2 - 2011 Trang 69 Bảng 4.1.Một số kết quả độ chính xác của chương trình Số trường hợp User 1 User 2 User 3 User 4 User 5 Đúng 21 25 22 23 23 Sai 5 1 4 3 3 Các trường hợp sai Độ chính xác (%) 80,7 96,1 84.6 88.5 88.5 Quá trình kiểm tra tiến hành kiểm nghiệm trên nhiều người dùng khác nhau. Mỗi người dùng sẽ sử dụng phần mềm viết 26 kí tự và chương trình chạy kết quả nhận dạng, độ chính xác trung bình thu được là 84% và thời gian nhận dạng trung bình là 0.84ms. 5. KẾT LUẬN Trong bài báo cáo này, chúng ta phát triển một kỹ thuật nhận dạng ký tự viết tay dùng phương pháp nhận dạng dựa trên thông tin tĩnh. Phương pháp gồm hai bước: làm mỏng nét ký tự để giữ lại bộ khung của chúng và những thông tin đặc trưng được rút trích dựa trên bộ khung này bằng phương pháp rút trích thông tin theo chiều. Mặt khác, chúng ta xây dựng mạng nơ-ron nhân tạo nhằm tạo ra cơ sở dữ liệu tri thức cho quá trình nhận dạng. Không giống như những phương pháp khác, phương pháp chúng ta đề xuất sử dụng bộ khung, kết quả của quá trình làm mỏng, thay cho đường biên. Ưu điểm của sự cải tiến này không những làm giảm thời gian thi hành của giải thuật mà còn đưa ra các đặc điểm chính xác hơn. Mặt khác, thay vì các véc-tơ đặc điểm được đưa vào giai đoạn huấn luyện, các véc-tơ này sẽ được đưa vào giai đoạn nhận dạng. Bên cạnh những ưu điểm trên, giải thuật làm mỏng không phù hợp chữ viết chữ quá nhỏ, các nét viết có thể dính từ nét này qua nét khác. Do đó, giải thuật có thể làm mất thông tin của ảnh. Khi chuẩn hóa các giá trị về chiều, một số trường hợp chuẩn hóa không trả về các giá trị mong muốn, làm sai lệch thông tin thực về nét vẽ. Chương trình phải huấn luyện trên hàng ngàn mẫu ký tự khác nhau. Do số mẫu được huấn luyện quá ít, không thể đánh giá xác thực được độ chính xác của chương trình một cách tuyệt đối. Hướng phát triển sắp tới của nhóm nghiên cứu là tăng cường và bổ sung thêm một số các đặc điểm khác cần phải rút trích để tăng độ tin cậy và lưu những thông tin chính xác hơn về đặc trưng của ký tự. Mặt khác, nhóm áp dụng một số phương pháp cải tiến trong mạng nơ-ron để tăng độ tin cậy cho mạng. Science & Technology Development, Vol 14, No.K2- 2011 Trang 70 MODIFIED DIRECTION FEATURE AND NEURAL NETWORK BASED TECHNIQUE FOR HANDWRITING CHARACTER RECOGNITION Huynh Huu Loc, Luu Quoc Hai, Dinh Duc Anh Vu University of Technology, VNU-HCM ABSTRACT: Handwriting character recognition is an important research topic which has various applications in surveillance, radar, robot technology... In this paper, we propose the implementation of the handwriting character recognition using off-line handwriting recognition. The approach consists of two steps: to make thin handwriting by keeping the skeleton of character and reject redundant points caused by humam’s stroke width and to modify direction method which provide high accuracy and simply structure analysis method to extract character’s features from its skeleton. In addition, we build neural network in order to help machine learn character specific features and create knowledge databases to help them have ability to classify character with other characters. The recognition accuracy of above 84% is reported on characters from real samples. Using this off-line system and other parts in handwriting text recognition, we can replace or cooperate with online recognition techniques which are ususally applied on mobile devices and extend our handwriting recognition technique on any surfaces such as papers, boards, and vehicle lisences as well as provide the reading ability for humanoid robot. TÀI LIỆU THAM KHẢO [1]. Nafiz Arica and Fatos T. Yarman- Vural, An Overview of Character Recognition Focused on Off-Line Handwriting, in IEEE Transactions on Systems, Man, And Cybernetics—Part C: Applications And Reviews, Vol. 31, No. 2, May 2001. [2]. M.Blumenstein, X.Y. Liu, B. Verma, A modified direction feature for cursive character recognition, International Joint Conference on Neural Networks (IJCNN ’04), Budapest, Hungary, 2004, pp. 2983– 2987. [3]. M.Blumenstein, B.K.Verma, H.Basli, A novel feature extraction technique for the recognition of segmented handwritten characters, Seventh International Conference on Document Analysis and Recognition, 2003, pp. 137–141. [4]. T.Y.Zhang and C.Y.Suen, A Fast Parallel Algorithm for Thinning Digital Patterns, in Image Processing and Computer Vision. Volume 27 , March 1984, pp 236 - 239 [5]. R.M.Bozinovic and S. N. Srihari, Off- line cursive script word recognition, IEEE Trans. Pattern Anal. Machine Intell, Vol 11, 1989
File đính kèm:
- Nhận dạng chữ viết tay dùng rút trích thông tin theo chiều và mạng Nơron.pdf