Nhận dạng chữ viết tay dùng rút trích thông tin theo chiều và mạng nơron

Nhận dạng chữ viết tay là một đề tài rất quan trọng, nó có những ứng dụng khác nhau trong tình báo, kỹ thuật robot,. Bài báo cáo này trình bày kỹ thuật nhận dạng ký tự viết tay dùng phương pháp nhận dạng dựa trên thông tin tĩnh. Phương pháp gồm hai bước: làm mỏng nét ký tự để giữ lại bộ khung của chúng và những thông tin đặc trưng được rút trích dựa trên bộ khung này bằng phương pháp rút trích thông tin theo chiều. Mặt khác, chúng ta xây dựng mạng nơ-ron nhân tạo nhằm tạo ra cơ sở dữ liệu tri thức cho quá trình nhận dạng. Trong thí nghiệm của mình, độ chính xác của giải thuật đạt trên 84% được ghi nhận dựa trên các mẫu thu được trong thực tế. Với kỹ thuật này, chúng ta có thể thay thế hoặc kết hợp với các phương pháp nhận dạng trực tuyến thường được dùng trên các thiết bị di động và mở rộng việc nhận dạng lên các bề mặt khác như giấy viết, bảng, biển số xe, cũng như khả năng đọc chữ cho robot.

Nhận dạng chữ viết tay dùng rút trích thông tin theo chiều và mạng nơron trang 1

Trang 1

Nhận dạng chữ viết tay dùng rút trích thông tin theo chiều và mạng nơron trang 2

Trang 2

Nhận dạng chữ viết tay dùng rút trích thông tin theo chiều và mạng nơron trang 3

Trang 3

Nhận dạng chữ viết tay dùng rút trích thông tin theo chiều và mạng nơron trang 4

Trang 4

Nhận dạng chữ viết tay dùng rút trích thông tin theo chiều và mạng nơron trang 5

Trang 5

Nhận dạng chữ viết tay dùng rút trích thông tin theo chiều và mạng nơron trang 6

Trang 6

Nhận dạng chữ viết tay dùng rút trích thông tin theo chiều và mạng nơron trang 7

Trang 7

Nhận dạng chữ viết tay dùng rút trích thông tin theo chiều và mạng nơron trang 8

Trang 8

Nhận dạng chữ viết tay dùng rút trích thông tin theo chiều và mạng nơron trang 9

Trang 9

pdf 9 trang Trúc Khang 08/01/2024 2460
Bạn đang xem tài liệu "Nhận dạng chữ viết tay dùng rút trích thông tin theo chiều và mạng nơron", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Nhận dạng chữ viết tay dùng rút trích thông tin theo chiều và mạng nơron

Nhận dạng chữ viết tay dùng rút trích thông tin theo chiều và mạng nơron
Science & Technology Development, Vol 14, No.K2- 2011 
Trang 62 
NHẬN DẠNG CHỮ VIẾT TAY DÙNG RÚT TRÍCH THÔNG TIN 
THEO CHIỀU VÀ MẠNG NƠRON 
Huỳnh Hữu Lộc, Lưu Quốc Hải, Đinh Đức Anh Vũ 
Trường Đại học Bách Khoa, ĐHQG-HCM 
(Bài nhận ngày 07 tháng 12 năm 2010, hoàn chỉnh sửa chữa ngày 20 tháng 04 năm 2011) 
TÓM TẮT: Nhận dạng chữ viết tay là một đề tài rất quan trọng, nó có những ứng dụng khác nhau 
trong tình báo, kỹ thuật robot,.... Bài báo cáo này trình bày kỹ thuật nhận dạng ký tự viết tay dùng 
phương pháp nhận dạng dựa trên thông tin tĩnh. Phương pháp gồm hai bước: làm mỏng nét ký tự để giữ 
lại bộ khung của chúng và những thông tin đặc trưng được rút trích dựa trên bộ khung này bằng 
phương pháp rút trích thông tin theo chiều. Mặt khác, chúng ta xây dựng mạng nơ-ron nhân tạo nhằm 
tạo ra cơ sở dữ liệu tri thức cho quá trình nhận dạng. Trong thí nghiệm của mình, độ chính xác của giải 
thuật đạt trên 84% được ghi nhận dựa trên các mẫu thu được trong thực tế. Với kỹ thuật này, chúng ta 
có thể thay thế hoặc kết hợp với các phương pháp nhận dạng trực tuyến thường được dùng trên các 
thiết bị di động và mở rộng việc nhận dạng lên các bề mặt khác như giấy viết, bảng, biển số xe, cũng 
như khả năng đọc chữ cho robot. 
Từ khóa: nhận dạng chữ viết tay, mạng nơron 
1. GIỚI THIỆU 
Nhận dạng chữ viết tay là một đề tài rất 
quan trọng, nó có những ứng dụng khác nhau 
trong tình báo, kỹ thuật robot,.... Các nghiên 
cứu về nhận dạng chữ viết tay đã được phát 
triển từ hơn nửa thập kỷ qua và đạt được nhiều 
thành quả thiết thực. 
Ở mức khái niệm, kỹ thuật nhận dạng chữ 
viết tay được chia thành hai phương pháp chính 
[1, 2]: nhận dạng chữ viết gián tiếp dựa trên 
thông tin tĩnh (off-line handwriting 
recognition)- chương trình sẽ thông dịch các kí 
tự, các chữ hay các đoạn văn được viết trên các 
mẫu giấy hoặc các các bề mặt khác mà chúng 
ta có thể thu thập thông tin về chúng thông qua 
hình ảnh thu được từ các bề mặt bằng cách 
chụp lại hình ảnh và nhận dạng chữ viết trực 
tiếp dựa trên thông tin động (online 
handwriting recognition)- nhận dạng ký tự hoặc 
chữ viết dựa trên thông tin thu được trong thời 
gian thực ngay lúc người dùng thực hiện hành 
động viết, những thông tin đó là tốc độ viết, áp 
lực khi viết và hướng viết. 
Hướng tiếp cận của đề tài là nhận dạng 
dựa trên thông tin tĩnh. Mặc dù phương pháp 
nhận dạng trực tiếp đang được áp dụng rộng rãi 
trên các thiết bị di động, nhưng nhận dạng tĩnh 
lại có những ưu điểm khác. Phương pháp này 
không dừng lại ở việc ứng dụng và hoàn thiện 
trên các thiết bị di động, mà còn có khả năng 
mở rộng sang các ứng dụng khác như đọc các 
văn bản viết trên giấy cũng như ứng dụng vào 
khả năng đọc và hiểu chữ của robot. 
TAÏP CHÍ PHAÙT TRIEÅN KH&CN, TAÄP 14, SOÁ K2 - 2011 
Trang 63 
Đầu tiên chúng ta dùng giải thuật làm 
mỏng nét ký tự để giữ lại bộ khung ký tự, loại 
bỏ các thông tin dư thừa về hình dạng của kí tự. 
Sau đó, những thông tin đặc trưng được rút 
trích dựa trên bộ khung này bằng phương pháp 
rút trích thông tin theo chiều và kết hợp những 
véctơ đặc điểm cục bộ với các thông tin về cấu 
trúc toàn cục sẽ nhận dạng chữ viết. Tiếp theo, 
chiều của các phần đoạn thẳng tạo nên các ký 
tự được dò tìm, các pixel được thay thế bằng 
các giá trị chiều thích hợp. Cuối cùng, các đặc 
điểm của kí tự được huấn luyện và phân loại 
bởi mạng nơ-ron. Các phần còn lại trong bài 
báo cáo được tổ chức như sau: phần hai, chúng 
ta khái quát một số bước thông thường của một 
hệ thống nhận dạng chữ viết tay. Thuật giải sẽ 
được thể hiện trong phần ba. Phần bốn trình 
bày những thí nghiệm và kết quả thu được. 
Những thảo luận và đánh giá hiệu quả của giải 
thuật sẽ được trình bày ở phần năm. 
2. NHỮNG NÉT ĐẶC TRƯNG CỦA HỆ 
THỐNG NHẬN DẠNG CHỮ VIẾT TAY 
Nhận dạng chữ viết tay thường bao gồm 
năm giai đoạn: tiền xử lý (preprocessing), phân 
mảnh (segmentation), biểu diễn 
(representation), huấn luyện và nhận dạng 
(training and recognition), hậu xử lý 
(postprocessing) [1, 3, 5]. 
(i) Tiền xử lý: giảm nhiễu cho các lỗi trong 
quá trình quét ảnh, hoạt động viết của con 
người, chuẩn hóa dữ liệu và nén dữ liệu. 
(ii) Phân mảnh: chia nhỏ văn bản thành 
những thành phần nhỏ hơn, phân mảnh các từ 
trong câu hay các kí tự trong từ. 
(iii) Biểu diễn, rút trích đặc điểm: giai 
đoạn đóng vai trò quan trọng nhất trong nhận 
dạng chữ viết tay. Để tránh những phức tạp của 
chữ viết tay cũng như tăng cường độ chính xác, 
ta cần phải biểu diễn thông tin chữ viết dưới 
những dạng đặc biệt hơn và cô đọng hơn, rút 
trích các đặc điểm riêng nhằm phân biệt các ký 
tự khác nhau. 
(iv) Huấn luyện và nhận dạng: phương 
pháp điển hình so trùng mẫu, dùng thống kê, 
mạng nơ-ron trí tuệ nhân tạo hay dùng phương 
pháp kết hợp các phương pháp trên. 
(v) Hậu xử lý: sử dụng các thông tin về 
ngữ cảnh để giúp tăng cường độ chính xác, 
dùng từ điển dữ liệu. 
Hình 2.1. Hệ thống nhận dạng 
Hình 2.2.Làm mỏng hình ảnh ... dựa trên thông tin về 
hình dạng của ký tự như sự chuyển vị trí và sự 
chuyển chiều. Kết quả quá trình này là các véc-
tơ đặc điểm chứa thông tin về ký tự. Các thông 
tin này giúp máy lấy được các đặc điểm của 
từng ký tự, phân loại chúng và tạo ra các thông 
tin cần thiết để nhận dạng các ký tự có chung ý 
nghĩa. Do chữ viết mỗi người mỗi khác nên ta 
không thể thu thập tất cả các nét chữ của từng 
người để máy học có thể nhận diện mà chỉ có 
thể dựa trên một số mẫu nào đó để nhận ra các 
nét chữ của những người viết khác nhau. Mạng 
nơ-ron nhân tạo (Artificial neural networks) có 
thể giải quyết vấn đề này. 
(iv) Xây dựng mạng nơ-ron đồng nghĩa với 
việc thiết lập các thông số thích hợp trong 
mạng để giúp mạng có thể phân biệt được các 
ký tự có trong và ngoài mẫu. Các thông số của 
mạng nơ-ron sẽ được lưu lại và giúp cho quá 
trình nhận dạng. Sau một loạt các giai đoạn 
trên, chúng ta sẽ thu được những thông số cần 
thiết của mạng nơ-ron, và nó giúp hệ thống 
phân biệt được các kí tự viết tay. Và quá trình 
nhận dạng được trình bày phần sau sử dụng 
những kết quả từ quá trình máy học giúp hệ 
thống phân biệt các ký tự. 
3. GIẢI THUẬT NHẬN DẠNG CHỮ VIẾT 
TAY 
Trong khuôn khổ đề tài nghiên cứu này, 
thay vì sử dụng ảnh trong tập hợp mẫu cho 
trước, chúng ta sử dụng ảnh thu được từ người 
dùng chương trình vẽ. Ảnh này qua các bước 
tiền xử lý cũng như rút trích đặc điểm trong 
quá trình huấn luyện. Mặt khác, thay vì các 
véc-tơ đặc điểm được đưa vào giai đoạn huấn 
luyện, các véc-tơ này sẽ được đưa vào giai 
đoạn nhận dạng. Giai đoạn này sử dụng các 
thông số của mạng nơ-ron, các véc-tơ đặc điểm 
sẽ được đưa qua mạng nơ-ron và trả về véc-tơ 
xuất. Véc-tơ xuất chỉ ra bit ký tự vừa vẽ có ý 
nghĩa gì. 
TAÏP CHÍ PHAÙT TRIEÅN KH&CN, TAÄP 14, SOÁ K2 - 2011 
Trang 65 
Trong phương pháp này, chúng ta chia cấu 
trúc của giải thuật thành hai quá trình với các 
giai đoạn theo trình tự sau: 
- Quá trình huấn luyện: ảnh mẫu, ảnh nhị 
phân, cắt xét và thu nhỏ, làm mỏng ảnh, rút 
trích đặc điểm, xây dựng mạng nơ-ron. 
- Quá trình nhận dạng: ảnh kí tự, ảnh nhị 
phân, cắt xét và thu nhỏ, làm mỏng ảnh, rút 
trích đặc điểm, nhận dạng. 
3.1.Giải Thuật Làm Mỏng Nét Vẽ Của Ký 
Tự 
Như đã trình bày ở phần 2, giải thuật làm 
mỏng nằm trong giai đoạn tiền xử lý với mục 
đích loại bỏ các thông tin dư thừa về hình dạng 
của ký tự. Các nét vẽ được làm mỏng thường đi 
kèm với sự méo mó và biến dạng. Sự méo mó 
càng ít càng tốt. Chúng ta dùng giải T.Y. 
Zhang [4] làm giảm sự méo mó và tăng tốc độ 
tính toán. Giải thuật này chú ý tới các pixel lân 
cận của một pixel bất kỳ. Bảng 3.1 mô tả các 
pixel lân cận của pixel P1(i, j). 
Bảng 3.1.Các pixel lân cận của một pixel 
P9 (i-1, j-1) P2 (i-1, j) P3 (i-1, j+1) 
P8 (i, j-1) P1 (i, j) P4 (i, j+1) 
P7 (i+1, j-1) P6 (i+1, j) P5 (i+1, j+1) 
Mục tiêu của giải thuật là loại bỏ các điểm 
bao quanh hình và giữ lại các điểm nằm trong 
bộ khung. Để giữ gìn liên kết giữa các điểm 
trong bộ khung, chúng ta chia vòng lặp lớn 
thành hai vòng lặp nhỏ (vòng lặp qua từng 
điểm một). 
Vòng lặp thứ nhất sẽ xóa các điểm bao 
quanh thỏa các điều kiện sau: 
(a) 2 ≤ B(P1) ≤ 6 
với B(P1): số các điểm lân cận khác 0 của 
điểm P1. 
B(P1) = P2 + P3 + P4 + P5 + P6 + P7 + P8 + 
P9 
(b) A(P1) = 1 
với A(P1): số mẫu (Pi, Pj) = (0, 1) theo thứ 
tự được sắp xếp như sau P2, P3, P4, , P9. 
Chẳn hạn, chuỗi P2, , P9 = 00100100 thì 
ta có A(P1) = 2. 
(c) P2 * P4 * P6 = 0 
(d) P4 * P6 * P8 = 0 
Trong vòng lặp thứ hai, chúng ta xóa các 
điểm thỏa hai điều kiện a) và b) của vòng lặp 
thứ nhất và thỏa thêm hai điều kiện nữa: 
(c’) P2 * P4 * P8 = 0 
(d’) P2 * P6 * P8 = 0 
Trong hai điều kiện (c) và (d) của vòng lặp 
thứ nhất, chỉ xóa các đường biên ở phía Đông 
Nam hay các góc ở phía Tây Bắc, có thể quan 
sát qua hình 3.1: 
Science & Technology Development, Vol 14, No.K2- 2011 
Trang 66 
Bắc 
 P2 
P3 P1 P4 
Tây 
 P6 
Đông 
Nam 
Hình 3.1. Biểu diễn các pixel lân cận 
Tương tự, các điểm bị xóa ở vòng lặp thứ 
hai, điều kiện (c’) và (d’) là các điểm đường 
biên ở phía Tây Bắc hoặc các góc ở phía Đông 
Nam. 
Điều kiện (a) sẽ giữ lại các điểm là điểm 
kết thúc đường khung. Điều kiện (b) giúp ta 
tránh khỏi xóa các điểm nằm giữa các điểm kết 
thúc. 
3.2.Phương Pháp Rút Trích Đặc Điểm 
Kỹ thuật rút trích đặc điểm (modified 
direction feature- MDF) dựa trên đặc điểm về 
cấu trúc của chữ viết tay [4]. Kỹ thuật này kết 
hợp những véc-tơ đặc điểm cục bộ với các 
thông tin về cấu trúc toàn cục và cung cấp đặc 
điểm tích hợp cho mạng nơ-ron huấn luyện và 
kiểm tra. Hướng tiếp cận này xử lý dựa vào 
đường biên của ký tự. Trong phương pháp, 
chúng ta đề xuất sử dụng bộ khung, kết quả của 
quá trình làm mỏng, thay cho đường biên. Ưu 
điểm của cải tiến này không những làm giảm 
thời gian thi hành của giải thuật mà còn đưa ra 
các đặc điểm chính xác hơn. Tiếp theo, chiều 
của các phần đoạn thẳng tạo nên các ký tự 
được dò tìm và các pixel được thay thế bằng 
các giá trị chiều thích hợp. Cuối cùng, các đặc 
điểm của ký tự được huấn luyện và phân loại 
bởi mạng nơ-ron. Giải thuật gồm hai bước 
chính: lấy giá trị về chiều và các đặc điểm về 
chiều đã được thay đổi. 
3.2.1.Lấy Giá Trị Chiều 
[3] đề xuất một phương pháp lấy giá trị 
chiều (Obtaining Direct Values). Dữ liệu đưa 
vào bước này là ảnh nhị phân đã được làm 
mỏng. Các giá trị về chiều được quy định như 
sau: value = 2 cho chiều dọc, value = 4 cho 
chiều ngang, value = 3 cho đường chéo phải, 
value = 5 cho đường chéo trái và value = 1 cho 
điểm bắt đầu như hình 3.2. 
Hình 3.2. Giá trị chiều cho MDF 
Đầu tiên, chúng ta đi tìm điểm bắt đầu. 
Điểm bắt đầu được định nghĩa là pixel đầu tiên 
màu đen (mang giá trị 1) được tìm thấy tại vị trí 
dưới nhất và trái nhất của ảnh kí tự. Điểm này 
sẽ được gán giá trị value = 8. 
TAÏP CHÍ PHAÙT TRIEÅN KH&CN, TAÄP 14, SOÁ K2 - 2011 
Trang 67 
Tiếp theo, ta phân biệt từng phần đoạn 
thẳng riêng biệt. Giải thuật thu thập từng pixel 
một và dựa vào chiều trước đó của nó, nó 
chuyển đổi giá trị của các pixel này đồng thời 
kiểm tra điều kiện có đoạn thẳng mới. Nếu một 
trong những điều kiện sau được gặp, ta xem là 
một đoạn thẳng mới đã được tìm thấy. Các điều 
kiện được diễn tả như sau: 
- Tìm được điểm góc: điểm ngay tại đó có 
sự thay đổi tức thời về chiều. Có tám trường 
hợp điểm góc như hình 3.3: 
Hình 3.3. Các trường hợp điểm góc 
- Đổi chiều 3 lần. 
- Có sự đổi chiều, chiều của pixel trước 
liên tục giống nhau và chiều dài của chiều 
trước đó của chuỗi liên tục này lớn hơn 3. 
Sau khi đã cập nhật các giá trị chiều cho 
từng pixel, các giá trị này sẽ được chuẩn hóa 
(chuẩn hóa các giá trị chiều). Có ba bước để 
chuẩn hóa các giá trị về chiều trong một đoạn 
thẳng: 
(i) Tìm những giá trị chiều nào thường 
xuất hiện nhất trong đoạn thẳng cần chuẩn hóa 
bằng cách dùng phương pháp đếm thông 
thường để xác định giá trị chiều nào xuất hiện 
nhiều nhất trong đoạn thẳng. 
(ii) Thay thế tất cả các giá trị chiều của các 
pixel trong một đoạn thẳng bằng giá trị chiều 
được xuất hiện nhiều nhất trong đoạn thẳng đó. 
(iii) Thay thế giá trị của điểm bắt đầu 
(value = 8) bằng giá trị chiều có tần suất xuất 
hiện nhiều nhất trong đoạn thẳng. 
Hình 3.4 biểu diễn việc tính giá trị chiều 
và chuẩn hóa cho kí tự a. Trong hình này, 
chúng ta thấy rằng các giá trị chiều ứng với các 
đường nét tương ứng đã được chuẩn hóa. 
Hình 3.4. Tính giá trị chiều cho kí tự a 
3.2.2.Lấy Giá Trị MDF 
Kỹ thuật lấy giá trị MDF (Obtaining 
Modified Direction Feature) được xây dựng 
dựa trên kỹ thuật Direction Feature (DF) và 
Transition Feature (TF). Trong kỹ thuật này, 
chúng ta tính giá trị của véc-tơ đặc điểm dựa 
trên giá trị chiều [LT, DT] và sự chuyển từ giá 
trị pixel = 0 sang giá trị pixel = 1, trong đó 
(i) LT (Location Transition): giá trị đánh 
dấu những vị trí mà có sự chuyển từ pixel = 0 
sang pixel = 1. Giá trị LT được tính bằng cách 
quét từng hàng từ trái sang phải và ngược lại, 
quét các cột từ trên xuống dưới và ngược lại. 
LT = (vị trí chuyển từ 0 sang 1) / (độ dài 
của mỗi chiều) 
 (ii) DT (Direction Transition): tính toán 
dựa trên các giá trị về chiều đã được phân tích. 
Trong đó, số phần tử trong véc-tơ DT được xác 
Science & Technology Development, Vol 14, No.K2- 2011 
Trang 68 
định trước, ở đây chọn là 3, và mỗi phần tử là 
giá trị chiều tại mỗi điểm có sự chuyển pixel từ 
0 sang khác 0 (nonzero). 
(iii) Chuẩn hóa véc-tơ: tính giá trị trung 
bình của ba véc-tơ LT hoặc DT liên tiếp nhau. 
Hình 3.5 biểu diễn cách tính LT và DT điển 
hình như sau: 
Hình 3.5. Cách tính LT và DT điển hình 
3.3.Sử Dụng Mạng Nơ-Ron Đề Huấn 
Luyện Và Nhận Dạng 
Mạng nơ-ron cung cấp một hướng tiếp cận 
mạnh cho các giá trị thực xấp xỉ, giá trị rời rạc 
hay các véc-tơ giá trị. Trong nhiều dạng của 
vấn đề, mạng nơ-ron nhân tạo là một trong 
những phương pháp máy học hiểu quả hiện 
nay. Trong phần nghiên cứu của mình, kỹ thuật 
mạng nơ-ron truyền ngược (back-propagation), 
một trong những phương pháp hiểu quả trong 
trong nhiều bài toán, thích hợp bài toán nhận 
dạng chữ viết tay của chúng ta. 
Trong giải thuật đề cập trên, mạng nơ-ron 
giúp xây dựng một tập cơ sở dữ liệu từ việc 
huấn luyện các tập mẫu có sẵn. Cơ sở dữ liệu 
này được dùng trong nhận dạng ký tự từ các 
đặc điểm phân tích được. 
4. KẾT QUẢ THÍ NGHIỆM 
Trong khuôn khổ của bài nghiên cứu, 
chúng ta sử dụng tập không gian mẫu cho quá 
trình học máy bởi mạng nơ-ron có kích thước 
500 mẫu, được lấy mẫu từ 500 người khác 
nhau. Mỗi mẫu là 26 file tương ứng với 26 ký 
tự Latin. Một số ký tự mẫu được thu thập như 
sau: 
Ký tự a Ký tự h Ký tự i Ký tự j Ký tự o 
Ký tự q Ký tự s Ký tự t Ký tự w Ký tự z 
Hình 4.1. Một số ký tự mẫu 
Giao điện chương trình được thể hiện 
trong hình bên dưới (hình 4.2) 
Hình 4.2. Giao điện chương trình 
Chúng ta sẽ thi hành phương pháp nhận 
dạng chữ viết được trình bày ở phần 3 trên 
nhiều người dùng khác nhau. Trong bài báo cáo 
này, chúng ta chỉ nêu ra một vài kết quả minh 
họa. Sau đây là bảng kết quả khi tiến hành thử 
nghiệm trên 5 user khác nhau: 
TAÏP CHÍ PHAÙT TRIEÅN KH&CN, TAÄP 14, SOÁ K2 - 2011 
Trang 69 
Bảng 4.1.Một số kết quả độ chính xác của 
chương trình 
Số trường 
hợp 
User 1 User
2 
User 
3 
User 
4 
User 
5 
Đúng 21 25 22 23 23 
Sai 5 1 4 3 3 
Các 
trường 
hợp sai 
Độ chính 
xác (%) 
80,7 96,1 84.6 88.5 88.5 
Quá trình kiểm tra tiến hành kiểm nghiệm 
trên nhiều người dùng khác nhau. Mỗi người 
dùng sẽ sử dụng phần mềm viết 26 kí tự và 
chương trình chạy kết quả nhận dạng, độ chính 
xác trung bình thu được là 84% và thời gian 
nhận dạng trung bình là 0.84ms. 
5. KẾT LUẬN 
Trong bài báo cáo này, chúng ta phát triển 
một kỹ thuật nhận dạng ký tự viết tay dùng 
phương pháp nhận dạng dựa trên thông tin tĩnh. 
Phương pháp gồm hai bước: làm mỏng nét ký 
tự để giữ lại bộ khung của chúng và những 
thông tin đặc trưng được rút trích dựa trên bộ 
khung này bằng phương pháp rút trích thông 
tin theo chiều. Mặt khác, chúng ta xây dựng 
mạng nơ-ron nhân tạo nhằm tạo ra cơ sở dữ 
liệu tri thức cho quá trình nhận dạng. Không 
giống như những phương pháp khác, phương 
pháp chúng ta đề xuất sử dụng bộ khung, kết 
quả của quá trình làm mỏng, thay cho đường 
biên. Ưu điểm của sự cải tiến này không những 
làm giảm thời gian thi hành của giải thuật mà 
còn đưa ra các đặc điểm chính xác hơn. Mặt 
khác, thay vì các véc-tơ đặc điểm được đưa vào 
giai đoạn huấn luyện, các véc-tơ này sẽ được 
đưa vào giai đoạn nhận dạng. 
Bên cạnh những ưu điểm trên, giải thuật 
làm mỏng không phù hợp chữ viết chữ quá 
nhỏ, các nét viết có thể dính từ nét này qua nét 
khác. Do đó, giải thuật có thể làm mất thông tin 
của ảnh. Khi chuẩn hóa các giá trị về chiều, 
một số trường hợp chuẩn hóa không trả về các 
giá trị mong muốn, làm sai lệch thông tin thực 
về nét vẽ. Chương trình phải huấn luyện trên 
hàng ngàn mẫu ký tự khác nhau. Do số mẫu 
được huấn luyện quá ít, không thể đánh giá xác 
thực được độ chính xác của chương trình một 
cách tuyệt đối. Hướng phát triển sắp tới của 
nhóm nghiên cứu là tăng cường và bổ sung 
thêm một số các đặc điểm khác cần phải rút 
trích để tăng độ tin cậy và lưu những thông tin 
chính xác hơn về đặc trưng của ký tự. Mặt 
khác, nhóm áp dụng một số phương pháp cải 
tiến trong mạng nơ-ron để tăng độ tin cậy cho 
mạng. 
Science & Technology Development, Vol 14, No.K2- 2011 
Trang 70 
MODIFIED DIRECTION FEATURE AND NEURAL NETWORK BASED 
TECHNIQUE FOR HANDWRITING CHARACTER RECOGNITION 
Huynh Huu Loc, Luu Quoc Hai, Dinh Duc Anh Vu 
University of Technology, VNU-HCM 
ABSTRACT: Handwriting character recognition is an important research topic which has 
various applications in surveillance, radar, robot technology... In this paper, we propose the 
implementation of the handwriting character recognition using off-line handwriting recognition. The 
approach consists of two steps: to make thin handwriting by keeping the skeleton of character and reject 
redundant points caused by humam’s stroke width and to modify direction method which provide high 
accuracy and simply structure analysis method to extract character’s features from its skeleton. In 
addition, we build neural network in order to help machine learn character specific features and create 
knowledge databases to help them have ability to classify character with other characters. The 
recognition accuracy of above 84% is reported on characters from real samples. Using this off-line 
system and other parts in handwriting text recognition, we can replace or cooperate with online 
recognition techniques which are ususally applied on mobile devices and extend our handwriting 
recognition technique on any surfaces such as papers, boards, and vehicle lisences as well as provide 
the reading ability for humanoid robot. 
TÀI LIỆU THAM KHẢO 
[1]. Nafiz Arica and Fatos T. Yarman-
Vural, An Overview of Character 
Recognition Focused on Off-Line 
Handwriting, in IEEE Transactions on 
Systems, Man, And Cybernetics—Part C: 
Applications And Reviews, Vol. 31, No. 2, 
May 2001. 
[2]. M.Blumenstein, X.Y. Liu, B. Verma, 
A modified direction feature for cursive 
character recognition, International Joint 
Conference on Neural Networks (IJCNN 
’04), Budapest, Hungary, 2004, pp. 2983–
2987. 
[3]. M.Blumenstein, B.K.Verma, H.Basli, 
A novel feature extraction technique for 
the recognition of segmented handwritten 
characters, Seventh International 
Conference on Document Analysis and 
Recognition, 2003, pp. 137–141. 
[4]. T.Y.Zhang and C.Y.Suen, A Fast 
Parallel Algorithm for Thinning Digital 
Patterns, in Image Processing and 
Computer Vision. Volume 27 , March 
1984, pp 236 - 239 
[5]. R.M.Bozinovic and S. N. Srihari, Off-
line cursive script word recognition, IEEE 
Trans. Pattern Anal. Machine Intell, Vol 
11, 1989 

File đính kèm:

  • pdfnhan_dang_chu_viet_tay_dung_rut_trich_thong_tin_theo_chieu_v.pdf