Tổng quan các phương pháp nhận dạng khuôn mặt dựa trên đặc trưng cạnh

Tóm tắt - Nhận dạng khuôn mặt là một trong những vấn đề quan trọng

trong hướng nghiên cứu về nhận dạng của ngành thị giác máy tính.

Do tính giống nhau của khuôn mặt nên việc trích ra các đặc trưng của

khuôn mặt dùng cho nhận dạng là rất khó. Trong các đặc trưng của

khuôn mặt dùng để nhận dạng thì đặc trưng về cạnh là một đặc trưng

chỉ mới được nghiên cứu và phát triển trong những năm gần đây. Bài

báo này sẽ giới thiệu tổng quát về một hướng nghiên cứu nhận dạng

khuôn mặt dựa trên bản đồ cạnh (edge map) của khuôn mặt. Việc tính

toán sự trùng khớp sẽ dựa trên khoảng cách Hausdorff. Các mô phỏng

sẽ so sánh sự chính xác của việc nhận dạng khuôn mặt dựa vào bản

đồ cạnh, với phương pháp rất phổ biến của nhận dạng khuôn mặt là

Eigenface. Các kết quả cũng chỉ ra rằng việc nhận dạng khuôn mặt

dựa vào bản đồ cạnh cho kết quả nhận dạng chính xác cao hơn

phương pháp Eigenface trong hầu hết các so sánh.

Download

Trang 1

Trang 2

Trang 3

Trang 4

Trang 5

Trang 6

6 trang baonam 9320

Download

Bạn đang xem tài liệu "Tổng quan các phương pháp nhận dạng khuôn mặt dựa trên đặc trưng cạnh", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Tổng quan các phương pháp nhận dạng khuôn mặt dựa trên đặc trưng cạnh

ISSN 1859-1531 - TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ ĐẠI HỌC ĐÀ NẴNG, SỐ 05(114).2017-Quyển 2 21
TỔNG QUAN CÁC PHƯƠNG PHÁP NHẬN DẠNG KHUÔN MẶT
DỰA TRÊN ĐẶC TRƯNG CẠNH
OVERVIEW OF FACE RECOGNITION BASED ON EDGE FEATURES
Đặng Nguyên Châu, Đỗ Hồng Tuấn
Trường Đại học Bách khoa Tp. Hồ Chí Minh; chaudn@hcmut.edu.vn, do-hong@hcmut.edu.vn
Tóm tắt - Nhận dạng khuôn mặt là một trong những vấn đề quan trọng
trong hướng nghiên cứu về nhận dạng của ngành thị giác máy tính.
Do tính giống nhau của khuôn mặt nên việc trích ra các đặc trưng của
khuôn mặt dùng cho nhận dạng là rất khó. Trong các đặc trưng của
khuôn mặt dùng để nhận dạng thì đặc trưng về cạnh là một đặc trưng
chỉ mới được nghiên cứu và phát triển trong những năm gần đây. Bài
báo này sẽ giới thiệu tổng quát về một hướng nghiên cứu nhận dạng
khuôn mặt dựa trên bản đồ cạnh (edge map) của khuôn mặt. Việc tính
toán sự trùng khớp sẽ dựa trên khoảng cách Hausdorff. Các mô phỏng
sẽ so sánh sự chính xác của việc nhận dạng khuôn mặt dựa vào bản
đồ cạnh, với phương pháp rất phổ biến của nhận dạng khuôn mặt là
Eigenface. Các kết quả cũng chỉ ra rằng việc nhận dạng khuôn mặt
dựa vào bản đồ cạnh cho kết quả nhận dạng chính xác cao hơn
phương pháp Eigenface trong hầu hết các so sánh.
Abstract - Face recognition is an important issue in research of
pattern recognition in computer vision. Due to the similarity of
human faces, face feature extraction for recognition presents a
significant challenge for researchers. Edge map, one of human
face’s feature, however, has not been used for face recognition
until recent years. This paper presents a brief review of face
recognition based on edge map. Matching of human faces is
carried out using Hausdorff distance. Experiment results of face
recognition based on edge map will be compared with the
Eigenface method, which is a common method in face recognition.
It is very encouraging that in most comparison experiments, face
recognition based on edge map gives higher accuracy than that
based on Eigenface.
Từ khóa - nhận dạng khuôn mặt; bản đồ cạnh; khoảng cách
Hausdorff; đặc trưng khuôn mặt; Eigenface.
Key words - face recognition; edge map; Hausdorff distance; face
feature; Eigenface.
1. Giới thiệu
Tự động nhận dạng khuôn mặt là một hướng nghiên
cứu thú vị đã thu hút được rất đông các nhà nghiên cứu
trong khoảng hơn 20 năm qua. Từ khi bắt đầu ra đời đến
nay, hướng nghiên cứu về nhận dạng khuôn mặt đã thu hút
được rất nhiều nhà nghiên cứu trên toàn thế giới. Chính vì
là một hướng nghiên cứu thu hút nên đã có rất nhiều
phương pháp khác nhau về nhận dạng khuôn mặt đã được
đề xuất. Các nghiên cứu về nhận dạng khuôn mặt có thể
được chia thành các nhóm chính sau: Eigenface, mạng thần
kinh nhân tạo, mô hình Markov ẩn, nhận dạng dựa vào các
đặc trưng hình học (geometrical feature matching) và nhận
dạng mẫu (template matching). Trong khi các hướng
nghiên cứu về mạng thần kinh nhân tạo và template
matching cho tỷ lệ nhận dạng chính xác cao, nhưng yêu cầu
phải có nhiều ảnh làm cơ sở dữ liệu cho cùng một đối
tượng, thì sẽ không thích hợp với các ứng dụng mà chỉ có
một ảnh cho một đối tượng để nhận dạng. Trong khi đó,
các nghiên cứu dựa vào mô hình Markov ẩn và đặc trưng
hình học thì tỷ lệ chính xác lại phụ thuộc rất nhiều vào trực
giác chọn các thông số huấn luyện cũng như thời gian nhận
dạng khá lớn. Eigenface tuy là một hướng nghiên cứu đã
lâu nhưng lại đơn giản, cho kết quả nhận dạng chính xác
tương đối và dễ dàng áp dụng cho các ứng dụng đòi hỏi chỉ
có một ảnh làm cơ sở dữ liệu cho một đối tượng.
Trong vấn đề nhận dạng, cạnh cũng là một đặc trưng rất
hay được sử dụng. Tuy nhiên trong nhận dạng khuôn mặt,
đặc trưng cạnh của khuôn mặt vẫn không được sử dụng khi
nghiên cứu. Takács [1] là người đầu tiên sử dụng đặc trưng
cạnh của khuôn mặt trong việc nhận dạng khuôn mặt. Tuy
nhiên các nghiên cứu của Takács và sau này chỉ dựa vào
các điểm trên cạnh của khuôn mặt nên không cho thông tin
chính xác cao về khuôn mặt. Y. Gao và K. H. Leung [2] đã
đưa ra một phương pháp nhận dạng khuôn mặt dựa trên các
đường trong bản đồ cạnh của khuôn mặt (Line Edge Map
– LEM). Phương pháp này cho tỷ lệ nhận dạng chính xác
rất cao, và cũng cho thấy sự bền vững của việc nhận dạng
khuôn mặt trong các điều kiện khác nhau về ánh sáng, cũng
như việc thay đổi cảm xúc trên khuôn mặt. Bài báo này sẽ
trình bày về hướng nghiên cứu nhận dạng khuôn mặt dựa
trên bản đồ cạnh, từ việc sử dụng các điểm trong bản đồ
cạnh của Takács cho đến việc sử dụng các đường trong bản
đồ cạnh của Y. Gao. Chúng tôi sẽ sử dụng phương pháp
Eigenface như là một phương pháp so sánh với các phương
pháp được trình bày trong bài báo này.
Phần còn lại của bài báo sẽ được trình bày như sau:
Phần 2 giới thiệu về các phương pháp khác nhau sử dụng
bản đồ cạnh để nhận dạng khuôn mặt. Phần 3 mô phỏng và
so sánh kết quả của các thuật toán được nêu trong ... giữa hai
đường thẳng, chúng ta sẽ xoay đường thẳng có độ dài ngắn
hơn để song song với đường thẳng dài hơn. Khi hai đường
thẳng song song như Hình 2, khoảng cách song song và
vuông góc sẽ được tính như sau:
1 2l lss i j ss ssd c ,n min l ,l (8)
l lvg i j vgd c ,n l (9)
Hình 2. Khoảng cách giữa hai đường thẳng song song
Khoảng cách song song sẽ được tính là khoảng cách
nhỏ nhất giữa điểm ngoài cùng bên trái và ngoài cùng bên
phải của hai đường thẳng. Khoảng cách song song sẽ bằng
0 khi hai đường thẳng thuộc một trong ba trường hợp được
mô tả trong Hình 3.
Hình 3. Các trường hợp 𝑑𝑠𝑠 = 0
Như vậy khoảng cách LHD gốc (Primary LHD –
pLHD) giữa hai bản đồ cạnh LEM được định nghĩa như
sau:
l l l l l lpLHDH C ,N max h C ,N ,h N ,C (10)
với:

1
l
l li
ji ll
lil l
i
l l l l
i jc n N
c Cc
c C
h C ,N l . mind c ,n
l
(11)
và 𝑙
𝑐𝑖
𝑙 là chiều dài của đoạn thẳng 𝑐𝑖
𝑙. Trong phương trình
(11), ta thấy rằng khoảng cách của mỗi đường thẳng sẽ
được nhân với một trọng số là chiều dài của chính nó.
Tuy nhiên, với khoảng cách pLHD được tính như
phương trình (11) thì có một điểm yếu. Giả sử chúng ta có
𝑁𝑙 là LEM của khuôn mặt cần nhận dạng, 𝑛𝑗
𝑙 là một đường
trong LEM đó; 𝐶𝑔
𝑙 và 𝐶𝑘
𝑙 lần lượt là LEM của khuôn mặt
nhận dạng đúng của 𝑁𝑙 và khuôn mặt khác với 𝑁𝑙 trong cơ
sở dữ liệu. Nếu vì một lý do nào đó mà đường tương ứng
với 𝑛𝑗
𝑙 trong 𝐶𝑔
𝑙 là 𝑐𝑔𝑗
𝑙 bị mất đi, khi đó, đường 𝑛𝑗
𝑙 trong 𝑁𝑙
sẽ có khoảng cách gần nhất tới một đường khác trong 𝐶𝑔
𝑙 ,
giả sử là đường 𝑐𝑔𝑖
𝑙 . Khi đó khoảng cách 𝑑(𝑐𝑔𝑖
𝑙 , 𝑛𝑗
𝑙) có thể
sẽ lớn hơn rất nhiều so với 𝑑(𝑐𝑘𝑗
𝑙 , 𝑛𝑗
𝑙), với 𝑐𝑘𝑗
𝑙 là đường
trong 𝐶𝑘
𝑙 có khoảng cách ngắn nhất tới 𝑛𝑗
𝑙. Điều này dẫn tới
việc 𝑁𝑙 sẽ có khoảng cách tới 𝐶𝑘
𝑙 gần hơn so với 𝐶𝑔
𝑙 và dẫn
tới nhận dạng sai.
Để khắc phục điều này, Gao đưa thêm vào một thông
số nữa vào khoảng cách Hausdorff, đó là tỉ số tin cậy. Nếu
một đường thẳng 𝑐𝑖
𝑙 trong LEM 𝐶𝑙 có khoảng cách gần nhất
tới đường thẳng 𝑛𝑗
𝑙 trong LEM 𝑁𝑙, và hai đường nào có
khoảng cách góc nhỏ hơn một lượng 𝐾𝑔, và khoảng cách
giữa hai trung điểm của hai đường thẳng nhỏ hơn một
lượng 𝐾𝑣𝑡, thì khi đó đường 𝑛𝑗
𝑙 được xem là tin cậy với
đường 𝑐𝑖
𝑙. Khi đó, tỉ số tin cậy của một bức ảnh được định
nghĩa là tỉ số giữa tổng số đường tin cậy 𝐷𝑡𝑐 và tổng số
đường trong LEM 𝐷𝑡𝑜𝑡𝑎𝑙 của bức ảnh.
tc
total
D
R
D
(12)
Như vậy, tổng số đường nằm ngoài vùng tin cậy của hai
bức ảnh sẽ là:
1
2
C N
n
R R
D (13)
Vậy khoảng cách Hausdorff giữa hai bức ảnh sẽ là:
𝑙𝑣𝑔
𝑙𝑠𝑠1 𝑙𝑠𝑠2
24 Đặng Nguyên Châu, Đỗ Hồng Tuấn
22l l l l
LHD pLHD n n
H C ,N H C ,N W D (14)
với 𝑊𝑛 là một trọng số cho tổng số các đường nằm ngoài
vùng tin cậy.
Chúng tôi sử dụng phương pháp mô phỏng annealing
[14], là một phương pháp dựa trên kỹ thuật tối ưu ngẫu
nhiên, trên việc nhận dạng các khuôn mặt trong cơ sở dữ
liệu Bern và tìm ra được các chỉ số như sau: 𝑊 = 30, 𝐾𝑔 =
20, 𝐾𝑣𝑡 = 5 và 𝑊𝑛 = 6. Chúng tôi sử dụng các giá trị này
cho các mô phỏng còn lại.
Mihir et al. [15] đã đề xuất phương pháp trích xuất các
vùng là mặt, mũi, miệng từ bản đồ cạnh để nhận dạng. Mục
đích của việc này là làm giảm bớt số đường cạnh dư thừa
trong bản đồ cạnh, mà theo tác giả là không cần thiết trong
việc tính toán vào trong khoảng cách Hausdorff. Để có thể
trích xuất các vùng này, tác giả đã tạo ra bản đồ cạnh nhân
tạo để thể hiện các vùng mắt, mũi, miệng của một khuôn mặt
người, và sử dụng sự tương quan của mô hình này với các
bản đồ cạnh để trích xuất ra các vùng trên bản đồ cạnh. Như
vậy, khoảng cách giữa 2 bức ảnh sẽ là tổng khoảng cách
LHD như [2] cho từng vùng và được cộng lại theo hệ số
mắt:mũi:miệng là 2:1:1. Các kết quả tại [15] cho thấy
phương pháp này cho kết quả nhận dạng chính xác cao hơn
phương pháp LHD của Gao [2] khoảng 5%.
3. Kết quả thí nghiệm
Trong bài báo này, chúng tôi sẽ mô phỏng và tính toán
độ chính xác của các phương pháp nhận dạng với các điều
kiện khác nhau của một bức ảnh khuôn mặt: i) điều kiện lý
tưởng; ii) điều kiện ánh sáng khác nhau và iii) điều kiện các
góc chụp khác nhau của khuôn mặt. Để so sánh giữa các
phương pháp nhận diện khác nhau, chúng tôi sẽ sử dụng
phương pháp Eigenface như là phương pháp chuẩn để so
sánh tỷ lệ chính xác, với các phương pháp nhận diện khuôn
mặt dựa trên bản đồ cạnh là MHD và LHD.Trong bài báo
này, chúng tôi không chọn phương pháp của Mihir [15] để
mô phỏng và so sánh, vì lý do các thông số của thuật toán
không được công bố; ngoài ra việc huấn luyện cũng không
được đề cập nên việc nghiên cứu này sử dụng chung một cơ
sở dữ liệu cho cả quá trình huấn luyện, và nhận dạng cũng là
một vấn đề chưa sáng tỏ. Vì thế, trong bài báo này chúng tôi
chỉ giới hạn ở việc giới thiệu ý tưởng của thuật toán chứ
không đi sâu vào việc mô phỏng và phân tích.
Trong các mô phỏng, chúng tôi sẽ sử dụng hai cơ sở dữ
liệu chuẩn về khuôn mặt, thường được dùng trong các
nghiên cứu về nhận diện khuôn mặt là cơ sở dữ liệu Bern [3]
và AR [4]. Trong cơ sở dữ liệu của Bern có ảnh của 30 người
khác nhau với các điều kiện ánh sáng lý tưởng như Hình 4.
Mỗi người sẽ có 10 bức ảnh xám với các góc chụp khác nhau
của khuôn mặt (2 ảnh chụp chính diện, 2 đầu xoay sang trái,
2 ảnh đầu xoay sang phải, 2 ảnh ngước nhìn lên và 2 ảnh
ngước nhìn xuống). Trong cơ sở dữ liệu của AR Database,
có tất cả ảnh của 100 người, gồm 50 nam và 50 nữ. Mỗi
người sẽ có tất cả 26 ảnh khác nhau, trong đó có 13 ảnh gồm
ảnh chụp trong điều kiện lý tưởng, các ảnh với các điều kiện
ánh sáng khác nhau (gồm chiếu sáng bên phải, bên trái và
chiếu sáng từ 2 bên), với các thay đổi khác nhau khi mang
các vật dụng như kính, khăn choàng; 13 ảnh còn lại cũng
giống như 13 ảnh đầu tiên nhưng được chụp sau đó 2 tuần,
để tạo ra sự thay đổi trên khuôn mặt như Hình 5. Tất cả các
bức ảnh sẽ được tiền xử lý để tạo thành các bức ảnh xám
160x160 pixel, và sau đó tạo ra các bản đồ cạnh để phục vụ
cho việc mô phỏng phương pháp MHD và LHD.
3.1. Nhận dạng khuôn mặt dưới các điều kiện lý tưởng
Các bức ảnh chụp chính diện dưới các điều kiện ánh sáng
lý tưởng của cơ sở dữ liệu Bern và AR được dùng để mô
phỏng các thuật toán nhận dạng. Đối với Bern, ta có 30 ảnh
dùng làm cơ sở dữ liệu và 30 ảnh khác để nhận dạng. Đối
với AR database, chúng ta có 100 ảnh để làm cơ sở dữ liệu
và 100 ảnh để nhận dạng. Tỷ lệ nhận dạng chính xác của các
thuật toán với 2 cơ sở dữ liệu được liệt kê trong Bảng 1.
Hình 4. Cặp ảnh chính diện của một người
trong cơ sở dữ liệu Bern
Hình 5. Cặp ảnh chính diện của một người trong cơ sở dữ liệu
AR chụp cách nhau 2 tuần
Bảng 1. Kết quả nhận dạng với điều kiện lý tưởng
Thuật toán Bern AR
Eigenface – 20 eigenvectors 100% 53%
MHD 100% 69%
LHD 100% 93%
Đối với cơ sở dữ liệu Bern, tất cả các thuật toán đều đạt
nhận dạng chính xác đến 100%, là do rất ít sự khác nhau
giữa các bức ảnh dùng làm cơ sở dữ liệu và dùng để nhận
dạng. Tuy nhiên, đối với cơ sở dữ liệu AR, lại có sự khác
nhau rất lớn giữa cặp ảnh vì các tấm ảnh được chụp cách
nhau 2 tuần. Đối với cơ sở dữ liệu AR, các thuật toán có tỷ
lệ chính xác khác nhau rất lớn. Bảng 2 so sánh độ chính
xác của các thuật toán đối với cơ sở dữ liệu AR.
Bảng 2. Tỷ lệ chính xác trên cơ sỡ dữ liệu AR
Thuật toán Tỷ lệ chính xác
LHD 93%
MHD 69%
Eigenface – 20 eigenvectors 53%
Eigenface – 60 eigenvectors 60%
Eigenface – 100 eigenvectors 63%
ISSN 1859-1531 - TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ ĐẠI HỌC ĐÀ NẴNG, SỐ 05(114).2017-Quyển 2 25
Tỷ lệ chính xác của phương pháp Eigenface phụ thuộc
rất nhiều vào số vector riêng được chọn. Càng tăng số
lượng vector riêng, sẽ càng làm tăng tỷ lệ chính xác. Tuy
nhiên, vì số lượng ảnh trong tập cơ sở dữ liệu là 100, nên
số lượng vector riêng lớn nhất là 100. Vậy, tỷ lệ chính xác
lớn nhất của Eigenface đối với cơ sở dữ liệu AR là 63%,
thấp hơn nhiều so với phương pháp MHD và LHD.
3.2. Nhận dạng khuôn mặt với các điều kiện khác nhau
của ánh sáng
Trong mô phỏng này, chúng tôi sử dụng 100 ảnh chính
diện của 100 người trong cơ sở dữ liệu AR để làm cơ sở dữ
liệu. Với mỗi người sẽ có 2 tấm ảnh với đèn chiếu từ bên
trái, 2 tấm với đèn chiếu từ bên phải và 2 tấm với đèn chiếu
từ cả 2 bên, vậy ta sẽ có 300 ảnh để nhận dạng. Tỷ lệ nhận
dạng chính xác của các thuật toán được liệt kê trong Bảng 3.
Trong tất cả các kết quả của các điều kiện ánh sáng khác
nhau tác động đến khuôn mặt, phương pháp LHD đều cho
kết quả cao hơn hẳn so với Eigenface, cho dù ta chọn số
vector riêng cực đại – đạt tỷ lệ chính xác cao nhất. Trong
phương pháp Eigenface, ba thành phần cơ bản đầu tiên,
tương ứng là ba vector riêng có trị riêng lớn nhất, là các
thành phần nhạy cảm với sự thay đổi của điều kiện ánh sáng
của bức ảnh. Nếu ta bỏ đi ba thành phần đó, tỷ lệ chính xác
sẽ tăng lên nhưng vẫn không bằng với phương pháp MHD,
và nhất là phương pháp LHD. Kết quả mô phỏng này chứng
tỏ phương pháp LHD rất bền vững với các điều kiện ánh
sáng khác nhau, phù hợp với thực tế ứng dụng của việc
nhận dạng khuôn mặt.
Bảng 3. Kết quả nhận dạng với các điều kiện
chiếu sáng khác nhau
Điều kiện
chiếu sáng
Eigenface MHD LHD
Trái 100 eigenvectors 5%
74% 93%
100 eigenvector w/o 1st 3 48%
Phải 100 eigenvectors 6%
66% 87%
100 eigenvector w/o 1st 3 40%
Trái + Phải 100 eigenvectors 2%
50% 71%
100 eigenvector w/o 1st 3 43%
3.3. Nhận dạng khuôn mặt với các góc chụp khác nhau
của khuôn mặt
Trong mô phỏng này, chúng tôi dùng 30 ảnh chính diện
của 30 người trong cơ sở dữ liệu Bern để làm cơ sở dữ liệu.
Mỗi người sẽ có 8 ảnh khác nhau về góc chụp khuôn mặt,
vậy chúng ta có 240 ảnh cần nhận diện. Kết quả của việc
ảnh hưởng của góc chụp đến tỷ lệ chính xác được nêu trong
Bảng 4. Trong mô phỏng này, chúng tôi sử dụng 30 vector
riêng cho phương pháp Eigenface, là số lượng vector riêng
lớn nhất có thể chọn.
Bảng 4. Tỷ lệ nhận dạng chính xác với các góc chụp khác nhau
của khuôn mặt
Góc chụp Eigenface – 30 eigenvectors MHD LHD
Nhìn trái 70% 56,6% 46,67%
Nhìn phải 70% 50% 53,33%
Nhìn lên 50% 60% 70%
Nhìn xuống 43,33% 53,3% 63,33%
Trung bình 58,33% 55% 58,33%
Trong mô phỏng này, chúng ta thấy rằng góc chụp của
khuôn mặt ảnh hưởng lớn đến kết quả chính xác của nhận
dạng. Phương pháp Eigenface cho kết quả cao hơn so với
LHD khoảng 1% là không quá nhiều.
3.4. Nhận dạng khuôn mặt với các cảm xúc khác nhau
của khuôn mặt
Trong mô phỏng này, chúng tôi sử dụng 100 ảnh chính
diện của 100 người trong cơ sở dữ liệu AR để làm cơ sở dữ
liệu. Với mỗi người, sẽ có 3 tấm ảnh về cảm xúc là cười,
giận dữ và hốt hoảng. Vậy ta sẽ có 100 tấm ảnh cho mỗi
cảm xúc để nhận dạng. Tỷ lệ nhận dạng chính xác của các
thuật toán được liệt kê trong Bảng 5.
Bảng 5. Tỷ lệ nhận dạng chính xác với
các cảm xúc khác nhau của khuôn mặt
Cảm xúc Eigenface MHD LHD
Cười 100 eigenvectors 91%
42% 81%
100 eigenvector w/o 1st 3 74%
Giận dữ 100 eigenvectors 88%
85% 90%
100 eigenvector w/o 1st 3 71%
Hốt hoảng 100 eigenvectors 38%
16% 32%
100 eigenvector w/o 1st 3 20%
Trong mô phỏng này, chúng ta thấy phương pháp LHD
cho kết quả chính xác cao hơn so với MHD nhưng thấp hơn
so với Eigenface. Tuy nhiên trong điều kiện ứng dụng thực
tế với ánh sáng không lý tưởng, ta cần bỏ đi 3 vector riêng
tương ứng 3 trị riêng lớn nhất cho phương pháp Eigenface.
Để nâng cao tỷ lệ nhận dạng chính xác thì phương pháp
LHD cho kết quả tốt hơn Eigenface.
4. Kết luận
Trong bài báo này, chúng tôi đã trình bày khái quát về
một hướng nghiên cứu mới trong nhận diện khuôn mặt, là
kết hợp giữa khoảng cách Hausdorff và bản đồ cạnh của
khuôn mặt, và phương pháp tốt nhất là LHD. Đây là
phương pháp còn khá mới trong việc nhận diện khuôn mặt.
Các kết quả mô phỏng cho thấy phương pháp MHD và
LHD cho kết quả vượt trội so với phương pháp Eigenface,
vốn rất hay được dùng trong các ứng dụng về nhận dạng
khuôn mặt. Phương pháp LHD còn cho thấy sự bền vững
với các điều kiện khác nhau của bức ảnh khuôn mặt như
điều kiện ánh sáng thay đổi, góc chụp thay đổi và cảm xúc
khuôn mặt thay đổi. Với các ưu điểm đó, phương pháp
nhận diện khuôn mặt dựa trên đặc trưng cạnh, nhất là
phương pháp LHD, là phương pháp rất tốt để ứng dụng cho
việc nhận dạng khuôn mặt.
TÀI LIỆU THAM KHẢO
[1] B. Takács, “Comparing face images using the modified Hausdorff
distance”, Pattern Recognition, Vol. 31, 1998, pp. 1873-1881.
[2] Y. Gao and M. K. Leung, “Face recognition using line edge map”,
26 Đặng Nguyên Châu, Đỗ Hồng Tuấn
IEEE Trans. on Pattern and Analysis and Machine Intelligence, Vol.
24, No. 6, Jun 2002, pp. 764-779.
[3] Bern University Database,
database/FullFaces.tgz
[4] A.M. Martinez and R. Benavente, The AR Face Database, CVC
Technical Report, No. 24, June 1998.
[5] L. A. Iverson and S. W. Zucker, “Logical/linear operators for image
curves”, IEEE Transactions on Pattern Analysis and Machine
Intelligence, Vol. 17, 1995, pp. 982–996.
[6] I. E. Sobel, Cameral model and machine perception, PhD thesis,
Stanford University, USA, 1970.
[7] J. Canny, “A computational approach to edge detection”, IEEE
Transactions on Pattern Analysis and Machine Intelligence, Vol. 8,
1986, pp. 679–698.
[8] Heath, M.D., Sarkar, S., Sanocki, T., and Bowyer, K.W.,
“Comparison of edge detectors: A methodology and initial study”,
Comput. Vis. Image Underst., Vol. 69, 1998, pp. 38–54.
[9] Nevatia, R., and Babu, K.R., “Linear feature extraction and description”,
Comput. Graph. Image Process., Vol. 13, 1980, pp. 257–269.
[10] Leung, M.K.H., and Yang, Y.H., “Dynamic two-strip algorithm in
curve fitting”, Pattern Recognition, Vol. 23, 1990, pp. 69–79.
[11] Huttenlocher, D.P., Klanderman, G.A., and Rucklidge, W.J.,
“Comparing images using the Hausdorff distance”, IEEE
Transactions on Pattern Analysis and Machine Intelligence, Vol. 15,
1993, pp. 850–863.
[12] Dubuisson, M.P., and Jain, A.K., “A modified Hausdorff distance
for object matching”, Proc. 12th Int. Conf. on Pattern recognition,
Jerusalem, Israel, 1994, pp. 566–568.
[13] Y. Gao, “Efficiently comparing face images using a modified
Hausdorff distance”, IEE Proc. Vision, Image and Signal
Processing, Vol. 150, No. 6, Dec 2003, pp. 346-350.
[14] V. Granville, M. Krivanek, J. Rasson, “Simulated annealing:
A proof of convergence”, IEEE Transactions on Pattern
Analysis and Machine Intelligence, Vol. 16, No. 6, 1994, pp.
652–656.
[15] J. Mihir, M. Suman and J. Naresh, “Eye detection and face
recognition using line edge map”, Proc.National Conference on
Computer Vision, Pattern Recognition, Image Processing and
Graphics, Gandhinagar, India, 2008.
(BBT nhận bài: 14/02/2017, hoàn tất thủ tục phản biện: 10/05/2017)

File đính kèm:

tong_quan_cac_phuong_phap_nhan_dang_khuon_mat_dua_tren_dac_t.pdf