Nhận dạng chữ viết tay dùng rút trích thông tin theo chiều và mạng Nơron

Nhận dạng chữviết tay là một đềtài rất quan trọng, nó có những ứng dụng khác nhau

trong tình báo, kỹthuật robot,. Bài báo cáo này trình bày kỹthuật nhận dạng ký tựviết tay dùng

phương pháp nhận dạng dựa trên thông tin tĩnh. Phương pháp gồm hai bước: làm mỏng nét ký tự đểgiữ

lại bộkhung của chúng và những thông tin đặc trưng được rút trích dựa trên bộkhung này bằng

phương pháp rút trích thông tin theo chiều. Mặt khác, chúng ta xây dựng mạng nơ-ron nhân tạo nhằm

tạo ra cơsởdữliệu tri thức cho quá trình nhận dạng. Trong thí nghiệm của mình, độchính xác của giải

thuật đạt trên 84% được ghi nhận dựa trên các mẫu thu được trong thực tế. Với kỹthuật này, chúng ta

có thểthay thếhoặc kết hợp với các phương pháp nhận dạng trực tuyến thường được dùng trên các

thiết bịdi động và mởrộng việc nhận dạng lên các bềmặt khác nhưgiấy viết, bảng, biển sốxe, cũng

nhưkhảnăng đọc chữcho robot.

9 trang | Chuyên mục: MATLAB | Chia sẻ: dkS00TYs | Lượt xem: 2624 | Lượt tải: 2Free

Tóm tắt nội dung Nhận dạng chữ viết tay dùng rút trích thông tin theo chiều và mạng Nơron, để xem tài liệu hoàn chỉnh bạn click vào nút "TẢI VỀ" ở trên

tìm và các pixel được thay thế bằng
các giá trị chiều thích hợp. Cuối cùng, các đặc
điểm của ký tự được huấn luyện và phân loại
bởi mạng nơ-ron. Giải thuật gồm hai bước
chính: lấy giá trị về chiều và các đặc điểm về
chiều đã được thay đổi.
3.2.1.Lấy Giá Trị Chiều
[3] đề xuất một phương pháp lấy giá trị
chiều (Obtaining Direct Values). Dữ liệu đưa
vào bước này là ảnh nhị phân đã được làm
mỏng. Các giá trị về chiều được quy định như
sau: value = 2 cho chiều dọc, value = 4 cho
chiều ngang, value = 3 cho đường chéo phải,
value = 5 cho đường chéo trái và value = 1 cho
điểm bắt đầu như hình 3.2.
Hình 3.2. Giá trị chiều cho MDF
Đầu tiên, chúng ta đi tìm điểm bắt đầu.
Điểm bắt đầu được định nghĩa là pixel đầu tiên
màu đen (mang giá trị 1) được tìm thấy tại vị trí
dưới nhất và trái nhất của ảnh kí tự. Điểm này
sẽ được gán giá trị value = 8.
TAÏP CHÍ PHAÙT TRIEÅN KH&CN, TAÄP 14, SOÁ K2 - 2011
Trang 67
Tiếp theo, ta phân biệt từng phần đoạn
thẳng riêng biệt. Giải thuật thu thập từng pixel
một và dựa vào chiều trước đó của nó, nó
chuyển đổi giá trị của các pixel này đồng thời
kiểm tra điều kiện có đoạn thẳng mới. Nếu một
trong những điều kiện sau được gặp, ta xem là
một đoạn thẳng mới đã được tìm thấy. Các điều
kiện được diễn tả như sau:
- Tìm được điểm góc: điểm ngay tại đó có
sự thay đổi tức thời về chiều. Có tám trường
hợp điểm góc như hình 3.3:
Hình 3.3. Các trường hợp điểm góc
- Đổi chiều 3 lần.
- Có sự đổi chiều, chiều của pixel trước
liên tục giống nhau và chiều dài của chiều
trước đó của chuỗi liên tục này lớn hơn 3.
Sau khi đã cập nhật các giá trị chiều cho
từng pixel, các giá trị này sẽ được chuẩn hóa
(chuẩn hóa các giá trị chiều). Có ba bước để
chuẩn hóa các giá trị về chiều trong một đoạn
thẳng:
(i) Tìm những giá trị chiều nào thường
xuất hiện nhất trong đoạn thẳng cần chuẩn hóa
bằng cách dùng phương pháp đếm thông
thường để xác định giá trị chiều nào xuất hiện
nhiều nhất trong đoạn thẳng.
(ii) Thay thế tất cả các giá trị chiều của các
pixel trong một đoạn thẳng bằng giá trị chiều
được xuất hiện nhiều nhất trong đoạn thẳng đó.
(iii) Thay thế giá trị của điểm bắt đầu
(value = 8) bằng giá trị chiều có tần suất xuất
hiện nhiều nhất trong đoạn thẳng.
Hình 3.4 biểu diễn việc tính giá trị chiều
và chuẩn hóa cho kí tự a. Trong hình này,
chúng ta thấy rằng các giá trị chiều ứng với các
đường nét tương ứng đã được chuẩn hóa.
Hình 3.4. Tính giá trị chiều cho kí tự a
3.2.2.Lấy Giá Trị MDF
Kỹ thuật lấy giá trị MDF (Obtaining
Modified Direction Feature) được xây dựng
dựa trên kỹ thuật Direction Feature (DF) và
Transition Feature (TF). Trong kỹ thuật này,
chúng ta tính giá trị của véc-tơ đặc điểm dựa
trên giá trị chiều [LT, DT] và sự chuyển từ giá
trị pixel = 0 sang giá trị pixel = 1, trong đó
(i) LT (Location Transition): giá trị đánh
dấu những vị trí mà có sự chuyển từ pixel = 0
sang pixel = 1. Giá trị LT được tính bằng cách
quét từng hàng từ trái sang phải và ngược lại,
quét các cột từ trên xuống dưới và ngược lại.
LT = (vị trí chuyển từ 0 sang 1) / (độ dài
của mỗi chiều)
(ii) DT (Direction Transition): tính toán
dựa trên các giá trị về chiều đã được phân tích.
Trong đó, số phần tử trong véc-tơ DT được xác
Science & Technology Development, Vol 14, No.K2- 2011
Trang 68
định trước, ở đây chọn là 3, và mỗi phần tử là
giá trị chiều tại mỗi điểm có sự chuyển pixel từ
0 sang khác 0 (nonzero).
(iii) Chuẩn hóa véc-tơ: tính giá trị trung
bình của ba véc-tơ LT hoặc DT liên tiếp nhau.
Hình 3.5 biểu diễn cách tính LT và DT điển
hình như sau:
Hình 3.5. Cách tính LT và DT điển hình
3.3.Sử Dụng Mạng Nơ-Ron Đề Huấn
Luyện Và Nhận Dạng
Mạng nơ-ron cung cấp một hướng tiếp cận
mạnh cho các giá trị thực xấp xỉ, giá trị rời rạc
hay các véc-tơ giá trị. Trong nhiều dạng của
vấn đề, mạng nơ-ron nhân tạo là một trong
những phương pháp máy học hiểu quả hiện
nay. Trong phần nghiên cứu của mình, kỹ thuật
mạng nơ-ron truyền ngược (back-propagation),
một trong những phương pháp hiểu quả trong
trong nhiều bài toán, thích hợp bài toán nhận
dạng chữ viết tay của chúng ta.
Trong giải thuật đề cập trên, mạng nơ-ron
giúp xây dựng một tập cơ sở dữ liệu từ việc
huấn luyện các tập mẫu có sẵn. Cơ sở dữ liệu
này được dùng trong nhận dạng ký tự từ các
đặc điểm phân tích được.
4. KẾT QUẢ THÍ NGHIỆM
Trong khuôn khổ của bài nghiên cứu,
chúng ta sử dụng tập không gian mẫu cho quá
trình học máy bởi mạng nơ-ron có kích thước
500 mẫu, được lấy mẫu từ 500 người khác
nhau. Mỗi mẫu là 26 file tương ứng với 26 ký
tự Latin. Một số ký tự mẫu được thu thập như
sau:
Ký tự a Ký tự h Ký tự i Ký tự j Ký tự o
Ký tự q Ký tự s Ký tự t Ký tự w Ký tự z
Hình 4.1. Một số ký tự mẫu
Giao điện chương trình được thể hiện
trong hình bên dưới (hình 4.2)
Hình 4.2. Giao điện chương trình
Chúng ta sẽ thi hành phương pháp nhận
dạng chữ viết được trình bày ở phần 3 trên
nhiều người dùng khác nhau. Trong bài báo cáo
này, chúng ta chỉ nêu ra một vài kết quả minh
họa. Sau đây là bảng kết quả khi tiến hành thử
nghiệm trên 5 user khác nhau:
TAÏP CHÍ PHAÙT TRIEÅN KH&CN, TAÄP 14, SOÁ K2 - 2011
Trang 69
Bảng 4.1.Một số kết quả độ chính xác của
chương trình
Số trường
hợp
User 1 User
2
User
3
User
4
User
5
Đúng 21 25 22 23 23
Sai 5 1 4 3 3
Các
trường
hợp sai
Độ chính
xác (%)
80,7 96,1 84.6 88.5 88.5
Quá trình kiểm tra tiến hành kiểm nghiệm
trên nhiều người dùng khác nhau. Mỗi người
dùng sẽ sử dụng phần mềm viết 26 kí tự và
chương trình chạy kết quả nhận dạng, độ chính
xác trung bình thu được là 84% và thời gian
nhận dạng trung bình là 0.84ms.
5. KẾT LUẬN
Trong bài báo cáo này, chúng ta phát triển
một kỹ thuật nhận dạng ký tự viết tay dùng
phương pháp nhận dạng dựa trên thông tin tĩnh.
Phương pháp gồm hai bước: làm mỏng nét ký
tự để giữ lại bộ khung của chúng và những
thông tin đặc trưng được rút trích dựa trên bộ
khung này bằng phương pháp rút trích thông
tin theo chiều. Mặt khác, chúng ta xây dựng
mạng nơ-ron nhân tạo nhằm tạo ra cơ sở dữ
liệu tri thức cho quá trình nhận dạng. Không
giống như những phương pháp khác, phương
pháp chúng ta đề xuất sử dụng bộ khung, kết
quả của quá trình làm mỏng, thay cho đường
biên. Ưu điểm của sự cải tiến này không những
làm giảm thời gian thi hành của giải thuật mà
còn đưa ra các đặc điểm chính xác hơn. Mặt
khác, thay vì các véc-tơ đặc điểm được đưa vào
giai đoạn huấn luyện, các véc-tơ này sẽ được
đưa vào giai đoạn nhận dạng.
Bên cạnh những ưu điểm trên, giải thuật
làm mỏng không phù hợp chữ viết chữ quá
nhỏ, các nét viết có thể dính từ nét này qua nét
khác. Do đó, giải thuật có thể làm mất thông tin
của ảnh. Khi chuẩn hóa các giá trị về chiều,
một số trường hợp chuẩn hóa không trả về các
giá trị mong muốn, làm sai lệch thông tin thực
về nét vẽ. Chương trình phải huấn luyện trên
hàng ngàn mẫu ký tự khác nhau. Do số mẫu
được huấn luyện quá ít, không thể đánh giá xác
thực được độ chính xác của chương trình một
cách tuyệt đối. Hướng phát triển sắp tới của
nhóm nghiên cứu là tăng cường và bổ sung
thêm một số các đặc điểm khác cần phải rút
trích để tăng độ tin cậy và lưu những thông tin
chính xác hơn về đặc trưng của ký tự. Mặt
khác, nhóm áp dụng một số phương pháp cải
tiến trong mạng nơ-ron để tăng độ tin cậy cho
mạng.
Science & Technology Development, Vol 14, No.K2- 2011
Trang 70
MODIFIED DIRECTION FEATURE AND NEURAL NETWORK BASED
TECHNIQUE FOR HANDWRITING CHARACTER RECOGNITION
Huynh Huu Loc, Luu Quoc Hai, Dinh Duc Anh Vu
University of Technology, VNU-HCM
ABSTRACT: Handwriting character recognition is an important research topic which has
various applications in surveillance, radar, robot technology... In this paper, we propose the
implementation of the handwriting character recognition using off-line handwriting recognition. The
approach consists of two steps: to make thin handwriting by keeping the skeleton of character and reject
redundant points caused by humam’s stroke width and to modify direction method which provide high
accuracy and simply structure analysis method to extract character’s features from its skeleton. In
addition, we build neural network in order to help machine learn character specific features and create
knowledge databases to help them have ability to classify character with other characters. The
recognition accuracy of above 84% is reported on characters from real samples. Using this off-line
system and other parts in handwriting text recognition, we can replace or cooperate with online
recognition techniques which are ususally applied on mobile devices and extend our handwriting
recognition technique on any surfaces such as papers, boards, and vehicle lisences as well as provide
the reading ability for humanoid robot.
TÀI LIỆU THAM KHẢO
[1]. Nafiz Arica and Fatos T. Yarman-
Vural, An Overview of Character
Recognition Focused on Off-Line
Handwriting, in IEEE Transactions on
Systems, Man, And Cybernetics—Part C:
Applications And Reviews, Vol. 31, No. 2,
May 2001.
[2]. M.Blumenstein, X.Y. Liu, B. Verma,
A modified direction feature for cursive
character recognition, International Joint
Conference on Neural Networks (IJCNN
’04), Budapest, Hungary, 2004, pp. 2983–
2987.
[3]. M.Blumenstein, B.K.Verma, H.Basli,
A novel feature extraction technique for
the recognition of segmented handwritten
characters, Seventh International
Conference on Document Analysis and
Recognition, 2003, pp. 137–141.
[4]. T.Y.Zhang and C.Y.Suen, A Fast
Parallel Algorithm for Thinning Digital
Patterns, in Image Processing and
Computer Vision. Volume 27 , March
1984, pp 236 - 239
[5]. R.M.Bozinovic and S. N. Srihari, Off-
line cursive script word recognition, IEEE
Trans. Pattern Anal. Machine Intell, Vol
11, 1989

File đính kèm:

Nhận dạng chữ viết tay dùng rút trích thông tin theo chiều và mạng Nơron.pdf