Nhận dạng chữ viết tay dùng rút trích thông tin theo chiều và mạng Nơron

Nhận dạng chữviết tay là một đềtài rất quan trọng, nó có những ứng dụng khác nhau

trong tình báo, kỹthuật robot,. Bài báo cáo này trình bày kỹthuật nhận dạng ký tựviết tay dùng

phương pháp nhận dạng dựa trên thông tin tĩnh. Phương pháp gồm hai bước: làm mỏng nét ký tự đểgiữ

lại bộkhung của chúng và những thông tin đặc trưng được rút trích dựa trên bộkhung này bằng

phương pháp rút trích thông tin theo chiều. Mặt khác, chúng ta xây dựng mạng nơ-ron nhân tạo nhằm

tạo ra cơsởdữliệu tri thức cho quá trình nhận dạng. Trong thí nghiệm của mình, độchính xác của giải

thuật đạt trên 84% được ghi nhận dựa trên các mẫu thu được trong thực tế. Với kỹthuật này, chúng ta

có thểthay thếhoặc kết hợp với các phương pháp nhận dạng trực tuyến thường được dùng trên các

thiết bịdi động và mởrộng việc nhận dạng lên các bềmặt khác nhưgiấy viết, bảng, biển sốxe, cũng

nhưkhảnăng đọc chữcho robot.

pdf9 trang | Chuyên mục: MATLAB | Chia sẻ: dkS00TYs | Lượt xem: 2053 | Lượt tải: 2download
Tóm tắt nội dung Nhận dạng chữ viết tay dùng rút trích thông tin theo chiều và mạng Nơron, để xem tài liệu hoàn chỉnh bạn click vào nút "TẢI VỀ" ở trên
 tìm và các pixel được thay thế bằng 
các giá trị chiều thích hợp. Cuối cùng, các đặc 
điểm của ký tự được huấn luyện và phân loại 
bởi mạng nơ-ron. Giải thuật gồm hai bước 
chính: lấy giá trị về chiều và các đặc điểm về 
chiều đã được thay đổi. 
3.2.1.Lấy Giá Trị Chiều 
[3] đề xuất một phương pháp lấy giá trị 
chiều (Obtaining Direct Values). Dữ liệu đưa 
vào bước này là ảnh nhị phân đã được làm 
mỏng. Các giá trị về chiều được quy định như 
sau: value = 2 cho chiều dọc, value = 4 cho 
chiều ngang, value = 3 cho đường chéo phải, 
value = 5 cho đường chéo trái và value = 1 cho 
điểm bắt đầu như hình 3.2. 
Hình 3.2. Giá trị chiều cho MDF 
Đầu tiên, chúng ta đi tìm điểm bắt đầu. 
Điểm bắt đầu được định nghĩa là pixel đầu tiên 
màu đen (mang giá trị 1) được tìm thấy tại vị trí 
dưới nhất và trái nhất của ảnh kí tự. Điểm này 
sẽ được gán giá trị value = 8. 
TAÏP CHÍ PHAÙT TRIEÅN KH&CN, TAÄP 14, SOÁ K2 - 2011 
Trang 67 
Tiếp theo, ta phân biệt từng phần đoạn 
thẳng riêng biệt. Giải thuật thu thập từng pixel 
một và dựa vào chiều trước đó của nó, nó 
chuyển đổi giá trị của các pixel này đồng thời 
kiểm tra điều kiện có đoạn thẳng mới. Nếu một 
trong những điều kiện sau được gặp, ta xem là 
một đoạn thẳng mới đã được tìm thấy. Các điều 
kiện được diễn tả như sau: 
- Tìm được điểm góc: điểm ngay tại đó có 
sự thay đổi tức thời về chiều. Có tám trường 
hợp điểm góc như hình 3.3: 
Hình 3.3. Các trường hợp điểm góc 
- Đổi chiều 3 lần. 
- Có sự đổi chiều, chiều của pixel trước 
liên tục giống nhau và chiều dài của chiều 
trước đó của chuỗi liên tục này lớn hơn 3. 
Sau khi đã cập nhật các giá trị chiều cho 
từng pixel, các giá trị này sẽ được chuẩn hóa 
(chuẩn hóa các giá trị chiều). Có ba bước để 
chuẩn hóa các giá trị về chiều trong một đoạn 
thẳng: 
(i) Tìm những giá trị chiều nào thường 
xuất hiện nhất trong đoạn thẳng cần chuẩn hóa 
bằng cách dùng phương pháp đếm thông 
thường để xác định giá trị chiều nào xuất hiện 
nhiều nhất trong đoạn thẳng. 
(ii) Thay thế tất cả các giá trị chiều của các 
pixel trong một đoạn thẳng bằng giá trị chiều 
được xuất hiện nhiều nhất trong đoạn thẳng đó. 
(iii) Thay thế giá trị của điểm bắt đầu 
(value = 8) bằng giá trị chiều có tần suất xuất 
hiện nhiều nhất trong đoạn thẳng. 
Hình 3.4 biểu diễn việc tính giá trị chiều 
và chuẩn hóa cho kí tự a. Trong hình này, 
chúng ta thấy rằng các giá trị chiều ứng với các 
đường nét tương ứng đã được chuẩn hóa. 
Hình 3.4. Tính giá trị chiều cho kí tự a 
3.2.2.Lấy Giá Trị MDF 
Kỹ thuật lấy giá trị MDF (Obtaining 
Modified Direction Feature) được xây dựng 
dựa trên kỹ thuật Direction Feature (DF) và 
Transition Feature (TF). Trong kỹ thuật này, 
chúng ta tính giá trị của véc-tơ đặc điểm dựa 
trên giá trị chiều [LT, DT] và sự chuyển từ giá 
trị pixel = 0 sang giá trị pixel = 1, trong đó 
(i) LT (Location Transition): giá trị đánh 
dấu những vị trí mà có sự chuyển từ pixel = 0 
sang pixel = 1. Giá trị LT được tính bằng cách 
quét từng hàng từ trái sang phải và ngược lại, 
quét các cột từ trên xuống dưới và ngược lại. 
LT = (vị trí chuyển từ 0 sang 1) / (độ dài 
của mỗi chiều) 
 (ii) DT (Direction Transition): tính toán 
dựa trên các giá trị về chiều đã được phân tích. 
Trong đó, số phần tử trong véc-tơ DT được xác 
Science & Technology Development, Vol 14, No.K2- 2011 
Trang 68 
định trước, ở đây chọn là 3, và mỗi phần tử là 
giá trị chiều tại mỗi điểm có sự chuyển pixel từ 
0 sang khác 0 (nonzero). 
(iii) Chuẩn hóa véc-tơ: tính giá trị trung 
bình của ba véc-tơ LT hoặc DT liên tiếp nhau. 
Hình 3.5 biểu diễn cách tính LT và DT điển 
hình như sau: 
Hình 3.5. Cách tính LT và DT điển hình 
3.3.Sử Dụng Mạng Nơ-Ron Đề Huấn 
Luyện Và Nhận Dạng 
Mạng nơ-ron cung cấp một hướng tiếp cận 
mạnh cho các giá trị thực xấp xỉ, giá trị rời rạc 
hay các véc-tơ giá trị. Trong nhiều dạng của 
vấn đề, mạng nơ-ron nhân tạo là một trong 
những phương pháp máy học hiểu quả hiện 
nay. Trong phần nghiên cứu của mình, kỹ thuật 
mạng nơ-ron truyền ngược (back-propagation), 
một trong những phương pháp hiểu quả trong 
trong nhiều bài toán, thích hợp bài toán nhận 
dạng chữ viết tay của chúng ta. 
Trong giải thuật đề cập trên, mạng nơ-ron 
giúp xây dựng một tập cơ sở dữ liệu từ việc 
huấn luyện các tập mẫu có sẵn. Cơ sở dữ liệu 
này được dùng trong nhận dạng ký tự từ các 
đặc điểm phân tích được. 
4. KẾT QUẢ THÍ NGHIỆM 
Trong khuôn khổ của bài nghiên cứu, 
chúng ta sử dụng tập không gian mẫu cho quá 
trình học máy bởi mạng nơ-ron có kích thước 
500 mẫu, được lấy mẫu từ 500 người khác 
nhau. Mỗi mẫu là 26 file tương ứng với 26 ký 
tự Latin. Một số ký tự mẫu được thu thập như 
sau: 
Ký tự a Ký tự h Ký tự i Ký tự j Ký tự o 
Ký tự q Ký tự s Ký tự t Ký tự w Ký tự z 
Hình 4.1. Một số ký tự mẫu 
Giao điện chương trình được thể hiện 
trong hình bên dưới (hình 4.2) 
Hình 4.2. Giao điện chương trình 
Chúng ta sẽ thi hành phương pháp nhận 
dạng chữ viết được trình bày ở phần 3 trên 
nhiều người dùng khác nhau. Trong bài báo cáo 
này, chúng ta chỉ nêu ra một vài kết quả minh 
họa. Sau đây là bảng kết quả khi tiến hành thử 
nghiệm trên 5 user khác nhau: 
TAÏP CHÍ PHAÙT TRIEÅN KH&CN, TAÄP 14, SOÁ K2 - 2011 
Trang 69 
Bảng 4.1.Một số kết quả độ chính xác của 
chương trình 
Số trường 
hợp 
User 1 User
2 
User 
3 
User 
4 
User 
5 
Đúng 21 25 22 23 23 
Sai 5 1 4 3 3 
Các 
trường 
hợp sai 
Độ chính 
xác (%) 
80,7 96,1 84.6 88.5 88.5 
Quá trình kiểm tra tiến hành kiểm nghiệm 
trên nhiều người dùng khác nhau. Mỗi người 
dùng sẽ sử dụng phần mềm viết 26 kí tự và 
chương trình chạy kết quả nhận dạng, độ chính 
xác trung bình thu được là 84% và thời gian 
nhận dạng trung bình là 0.84ms. 
5. KẾT LUẬN 
Trong bài báo cáo này, chúng ta phát triển 
một kỹ thuật nhận dạng ký tự viết tay dùng 
phương pháp nhận dạng dựa trên thông tin tĩnh. 
Phương pháp gồm hai bước: làm mỏng nét ký 
tự để giữ lại bộ khung của chúng và những 
thông tin đặc trưng được rút trích dựa trên bộ 
khung này bằng phương pháp rút trích thông 
tin theo chiều. Mặt khác, chúng ta xây dựng 
mạng nơ-ron nhân tạo nhằm tạo ra cơ sở dữ 
liệu tri thức cho quá trình nhận dạng. Không 
giống như những phương pháp khác, phương 
pháp chúng ta đề xuất sử dụng bộ khung, kết 
quả của quá trình làm mỏng, thay cho đường 
biên. Ưu điểm của sự cải tiến này không những 
làm giảm thời gian thi hành của giải thuật mà 
còn đưa ra các đặc điểm chính xác hơn. Mặt 
khác, thay vì các véc-tơ đặc điểm được đưa vào 
giai đoạn huấn luyện, các véc-tơ này sẽ được 
đưa vào giai đoạn nhận dạng. 
Bên cạnh những ưu điểm trên, giải thuật 
làm mỏng không phù hợp chữ viết chữ quá 
nhỏ, các nét viết có thể dính từ nét này qua nét 
khác. Do đó, giải thuật có thể làm mất thông tin 
của ảnh. Khi chuẩn hóa các giá trị về chiều, 
một số trường hợp chuẩn hóa không trả về các 
giá trị mong muốn, làm sai lệch thông tin thực 
về nét vẽ. Chương trình phải huấn luyện trên 
hàng ngàn mẫu ký tự khác nhau. Do số mẫu 
được huấn luyện quá ít, không thể đánh giá xác 
thực được độ chính xác của chương trình một 
cách tuyệt đối. Hướng phát triển sắp tới của 
nhóm nghiên cứu là tăng cường và bổ sung 
thêm một số các đặc điểm khác cần phải rút 
trích để tăng độ tin cậy và lưu những thông tin 
chính xác hơn về đặc trưng của ký tự. Mặt 
khác, nhóm áp dụng một số phương pháp cải 
tiến trong mạng nơ-ron để tăng độ tin cậy cho 
mạng. 
Science & Technology Development, Vol 14, No.K2- 2011 
Trang 70 
MODIFIED DIRECTION FEATURE AND NEURAL NETWORK BASED 
TECHNIQUE FOR HANDWRITING CHARACTER RECOGNITION 
Huynh Huu Loc, Luu Quoc Hai, Dinh Duc Anh Vu 
University of Technology, VNU-HCM 
ABSTRACT: Handwriting character recognition is an important research topic which has 
various applications in surveillance, radar, robot technology... In this paper, we propose the 
implementation of the handwriting character recognition using off-line handwriting recognition. The 
approach consists of two steps: to make thin handwriting by keeping the skeleton of character and reject 
redundant points caused by humam’s stroke width and to modify direction method which provide high 
accuracy and simply structure analysis method to extract character’s features from its skeleton. In 
addition, we build neural network in order to help machine learn character specific features and create 
knowledge databases to help them have ability to classify character with other characters. The 
recognition accuracy of above 84% is reported on characters from real samples. Using this off-line 
system and other parts in handwriting text recognition, we can replace or cooperate with online 
recognition techniques which are ususally applied on mobile devices and extend our handwriting 
recognition technique on any surfaces such as papers, boards, and vehicle lisences as well as provide 
the reading ability for humanoid robot. 
TÀI LIỆU THAM KHẢO 
[1]. Nafiz Arica and Fatos T. Yarman-
Vural, An Overview of Character 
Recognition Focused on Off-Line 
Handwriting, in IEEE Transactions on 
Systems, Man, And Cybernetics—Part C: 
Applications And Reviews, Vol. 31, No. 2, 
May 2001. 
[2]. M.Blumenstein, X.Y. Liu, B. Verma, 
A modified direction feature for cursive 
character recognition, International Joint 
Conference on Neural Networks (IJCNN 
’04), Budapest, Hungary, 2004, pp. 2983–
2987. 
[3]. M.Blumenstein, B.K.Verma, H.Basli, 
A novel feature extraction technique for 
the recognition of segmented handwritten 
characters, Seventh International 
Conference on Document Analysis and 
Recognition, 2003, pp. 137–141. 
[4]. T.Y.Zhang and C.Y.Suen, A Fast 
Parallel Algorithm for Thinning Digital 
Patterns, in Image Processing and 
Computer Vision. Volume 27 , March 
1984, pp 236 - 239 
[5]. R.M.Bozinovic and S. N. Srihari, Off-
line cursive script word recognition, IEEE 
Trans. Pattern Anal. Machine Intell, Vol 
11, 1989 

File đính kèm:

  • pdfNhận dạng chữ viết tay dùng rút trích thông tin theo chiều và mạng Nơron.pdf