Siêu phân giải dùng trí tuệ nhân tạo nâng cao chất lượng ảnh võng mạc mắt người

Hình ảnh võng mạc là một lĩnh vực quan trọng trong y tế phục vụ mục tiêu điều trị các bệnh lý.

Quan sát những thay đổi của các đường mạch máu ở võng mạc giúp các bác sỹ chẩn đoán nhiều

bệnh, thu thập, phân tích các triệu chứng và phát triển các phương pháp điều trị liên quan. Do vậy,

nâng cao chất lượng hình ảnh võng mạc là bước tiền xử lý quan trọng. Nhằm cải thiện chất lượng

hình ảnh võng mạc một số kỹ thuật đã được đề xuất như biến đổi wavelet rời rạc (DWT) [1,2,3],

siêu phân giải rất sâu (VDSR) [4], mạng nơron tích chập siêu phân giải (SRCNN) [5]. Tuy nhiên,

vẫn chưa thể đem lại hiệu quả cao do vẫn tồn tại nhiễu cao, cho kết quả hình ảnh không tốt, chưa

tối ưu về độ phức tạp tính toán, mức tiêu thụ bộ nhớ và tốc độ xử lý. Trong khuôn khổ bài báo này,

tác giả đề xuất phương pháp siêu phân giải dùng trí tuệ nhân tạo nâng cao chất lượng ảnh võng

mạc mắt người, nhằm tái tạo trực tiếp hình ảnh có độ phân giải cao từ hình ảnh có độ phân giải

thấp ban đầu. Bằng các phân tích và kết quả tính toán các tham số chất lượng ảnh xử lý qua thực

nghiệm, bài báo chứng minh rằng phương pháp được đề xuất là vượt trội so với các phương pháp đã

thực hiện, đặc biệt là về thời gian thực thi.

Siêu phân giải dùng trí tuệ nhân tạo nâng cao chất lượng ảnh võng mạc mắt người trang 1

Trang 1

Siêu phân giải dùng trí tuệ nhân tạo nâng cao chất lượng ảnh võng mạc mắt người trang 2

Trang 2

Siêu phân giải dùng trí tuệ nhân tạo nâng cao chất lượng ảnh võng mạc mắt người trang 3

Trang 3

Siêu phân giải dùng trí tuệ nhân tạo nâng cao chất lượng ảnh võng mạc mắt người trang 4

Trang 4

Siêu phân giải dùng trí tuệ nhân tạo nâng cao chất lượng ảnh võng mạc mắt người trang 5

Trang 5

Siêu phân giải dùng trí tuệ nhân tạo nâng cao chất lượng ảnh võng mạc mắt người trang 6

Trang 6

Siêu phân giải dùng trí tuệ nhân tạo nâng cao chất lượng ảnh võng mạc mắt người trang 7

Trang 7

Siêu phân giải dùng trí tuệ nhân tạo nâng cao chất lượng ảnh võng mạc mắt người trang 8

Trang 8

Siêu phân giải dùng trí tuệ nhân tạo nâng cao chất lượng ảnh võng mạc mắt người trang 9

Trang 9

Siêu phân giải dùng trí tuệ nhân tạo nâng cao chất lượng ảnh võng mạc mắt người trang 10

Trang 10

Tải về để xem bản đầy đủ

pdf 13 trang baonam 7900
Bạn đang xem 10 trang mẫu của tài liệu "Siêu phân giải dùng trí tuệ nhân tạo nâng cao chất lượng ảnh võng mạc mắt người", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Siêu phân giải dùng trí tuệ nhân tạo nâng cao chất lượng ảnh võng mạc mắt người

Siêu phân giải dùng trí tuệ nhân tạo nâng cao chất lượng ảnh võng mạc mắt người
TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ NĂNG LƯỢNG - TRƯỜNG ĐẠI HỌC ĐIỆN LỰC 
(ISSN: 1859 - 4557) 
50 Số 24 
SIÊU PHÂN GIẢI DÙNG TRÍ TUỆ NHÂN TẠO 
NÂNG CAO CHẤT LƯỢNG ẢNH VÕNG MẠC MẮT NGƯỜI 
SUPER RESOLUTION USING ARTIFICIAL INTELLIGENCE 
FOR RETINA IMAGE ENHANCEMENT 
Doãn Thanh Bình 
Trường Đại học Điện lực 
Ngày nhận bài: 28/07/2020, Ngày chấp nhận đăng: 28/12/2020, Phản biện: TS. Hoàng Thị Phương Thảo 
Tóm tắt: 
Hình ảnh võng mạc là một lĩnh vực quan trọng trong y tế phục vụ mục tiêu điều trị các bệnh lý. 
Quan sát những thay đổi của các đường mạch máu ở võng mạc giúp các bác sỹ chẩn đoán nhiều 
bệnh, thu thập, phân tích các triệu chứng và phát triển các phương pháp điều trị liên quan. Do vậy, 
nâng cao chất lượng hình ảnh võng mạc là bước tiền xử lý quan trọng. Nhằm cải thiện chất lượng 
hình ảnh võng mạc một số kỹ thuật đã được đề xuất như biến đổi wavelet rời rạc (DWT) [1,2,3], 
siêu phân giải rất sâu (VDSR) [4], mạng nơron tích chập siêu phân giải (SRCNN) [5]... Tuy nhiên, 
vẫn chưa thể đem lại hiệu quả cao do vẫn tồn tại nhiễu cao, cho kết quả hình ảnh không tốt, chưa 
tối ưu về độ phức tạp tính toán, mức tiêu thụ bộ nhớ và tốc độ xử lý. Trong khuôn khổ bài báo này, 
tác giả đề xuất phương pháp siêu phân giải dùng trí tuệ nhân tạo nâng cao chất lượng ảnh võng 
mạc mắt người, nhằm tái tạo trực tiếp hình ảnh có độ phân giải cao từ hình ảnh có độ phân giải 
thấp ban đầu. Bằng các phân tích và kết quả tính toán các tham số chất lượng ảnh xử lý qua thực 
nghiệm, bài báo chứng minh rằng phương pháp được đề xuất là vượt trội so với các phương pháp đã 
thực hiện, đặc biệt là về thời gian thực thi. 
Từ khóa: 
nâng cao chất lượng ảnh Retina, mạng nơron tích chập sâu (CNN), siêu phân giải đơn ảnh. 
Abstract: 
The retina image is an important area for medical treatment of the disease. By observing the 
changes in the blood vessels in the retina lines, doctors can diagnose diseases, to collect and analyze 
the symptoms and the development of related treatments. Consequently, improving retinal image 
quality is an important preprocessing step. In order to improve retinal image quality, several 
techniques have been proposed such as wavelet transform [1,2,3], very-deep-super-resolution 
(VDSR) [4], super-resolution-convolutional neural network (SRCNN) [5]... but still can not provide 
high efficiency by persistent high noise, poor image results, not optimal for computational complexity 
and memory consumption. Therefore, in this paper, we propose a particular method of retinal 
images quality enhancement via super resolution using artificial intelligence to directly reconstruct 
the high resolution image from the original low resolution image. By the analysis and calculated 
results in picture quality parameters through experimental treatment, we will demonstrate that the 
proposed method is superior to the state-of-the-art methods, especially in terms of time 
performance. 
TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ NĂNG LƯỢNG - TRƯỜNG ĐẠI HỌC ĐIỆN LỰC 
(ISSN: 1859 - 4557) 
Số 24 51 
Keywords: 
retinal image enhancement, convolutional neural network, single image super resolution.
1. GIỚI THIỆU 
1.1. Ảnh võng mạc mắt người 
Võng mạc là một cấu trúc nhiều lớp với 
nhiều lớp tế bào thần kinh kết nối với 
nhau bằng các khớp thần kinh. Các tế bào 
thần kinh chỉ nhạy cảm với ánh sáng trực 
tiếp là các tế bào tiếp nhận ánh sáng. Đối 
với tầm nhìn, đây là hai loại: các que và 
hình nón. Thanh chức năng chủ yếu trong 
ánh sáng mờ và cung cấp tầm nhìn màu 
đen và trắng, trong khi tế bào hình nón hỗ 
trợ nhận thức về màu sắc. Loại thứ ba của 
tiếp nhận ánh sáng là sử dụng tế bào hạch 
quang có khả năng cảm biến với cường độ 
của ánh sáng. 
Đánh giá hình ảnh võng mạc là điều cần 
thiết để chăm sóc mắt hiện đại. Với sự ra 
đời của các thiết bị xử lý hình ảnh, ghi âm 
kỹ thuật số và xử lý hình ảnh võng mạc 
được bắt đầu nghiên cứu phát triển. 
Bài báo này đề cập đến ảnh võng mạc dựa 
trên trí tuệ nhân tạo để nâng cao, cải thiện 
chất lượng ảnh, tái tạo trực tiếp hình ảnh 
có độ phân giải cao từ hình ảnh có độ 
phân giải thấp nhằm phục vụ cho các 
bước chẩn đoán lâm sàng về các bệnh lý 
liên quan đến nhãn khoa. 
Bố cục của bài báo như sau: giới thiệu về 
ảnh võng mạc, cơ sở lý thuyết về siêu 
phân giải đơn giản, các phương pháp siêu 
phân giải dùng trí tuệ nhân tạo dựa trên 
mạng nơron tích chập, đưa ra mô hình cho 
phương pháp đề xuất. Phần cuối đưa ra 
kết quả thực nghiệm, và các tham số tính 
toán so sánh chất lượng xử lý giữa các 
phương pháp hiện tại và phương pháp 
đề xuất. 
1.2. Siêu phân giải đơn ảnh 
Siêu phân giải là quá trình tạo hình ảnh có 
độ phân giải cao từ hình ảnh có độ phân 
giải thấp. Bài báo này xem xét siêu phân 
giải đơn ảnh (SISR), trong đó mục tiêu là 
khôi phục một hình ảnh có độ phân giải 
cao từ một hình ảnh có độ phân giải thấp. 
SISR là một thách thức vì nội dung hình 
ảnh tần số cao thường không thể được 
phục hồi từ hình ảnh độ  ... ) 
Bằng thực nghiệm, ta nhận thấy rằng mô 
hình với hàm Loss MSE có thể cải thiện 
hiệu suất của mạng đã đào tạo với hàm 
Loss MAE. Do đó, việc đầu tiên của 
phương pháp là đào tạo mạng với hàm 
Loss MAE và sau đó tinh chỉnh theo hàm 
Loss MSE. 
3.2. Đơn vị tăng cường 
Hình 3. Kiến trúc của đơn vị tăng cường 
trong mô hình đề xuất 
Đơn vị tăng cường có thể được chia thành 
hai môđun, một là ba tích chập trên và hai 
là ba tích chập dưới. Môđun trên có ba 
tích chập 3×3, mỗi tích chập được theo 
sau bởi hàm kích hoạt tinh chỉnh các đơn 
vị tuyến tính hở (LReLU), được bỏ qua ở 
đây. Hãy biểu thị các kích thước ma trận 
lớp đầu vào của lớp thứ i là Di (i = 1,, 
6). Theo đó, mối quan hệ của các lớp chập 
có thể được biểu thị bằng: 
𝐷3 − 𝐷1 = 𝐷1 − 𝐷2 = 𝑑 (6) 
trong đó d biểu thị độ chênh lệch giữa lớp 
thứ nhất và lớp thứ hai hoặc giữa lớp thứ 
nhất và lớp thứ ba. Tương tự, kích thước 
của các kênh trong môđun dưới cũng có 
mối quan hệ này và có thể được mô tả 
như sau: 
𝐷6 − 𝐷4 = 𝐷4 − 𝐷5 = 𝑑 (7) 
trong đó D4 = D3. Môđun trên bao gồm ba 
lớp chập xếp tầng với các LReLU và đầu 
ra của lớp chập thứ ba được phân chia 
thành hai phân đoạn. Giả sử đầu vào của 
môđun này là Bk-1, chúng ta có: 
𝑃𝑙
𝑘 = 𝐶𝑎(𝐵𝑘−1) (8) 
Trong đó Bk-1 biểu thị đầu ra của khối 
trước đó và trong khi đó là đầu vào của 
khối hiện tại, Ca biểu thị hoạt động tích 
chập nối tiếp và 𝑃𝑙
𝑘 là đầu ra của môđun 
trên trong đơn vị tăng cường thứ k. Các 
ma trận lớp đầu vào với các kích thước 
𝐷3
𝑠
và đầu vào của lớp chập đầu tiên được 
liên kết với nhau trong khuôn khổ kênh, 
𝑅𝑘 = 𝐶(𝑆 (𝑃𝑙
𝑘 ,
1
𝑠
) , 𝐵𝑘−1) (9) 
Trong đó C, S đại diện cho hoạt động 
ghép nối và hoạt động phân chia. Cụ thể, 
chúng tôi biết kích thước của 𝑃𝑙
𝑘 là D3. 
TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ NĂNG LƯỢNG - TRƯỜNG ĐẠI HỌC ĐIỆN LỰC 
(ISSN: 1859 - 4557) 
Số 24 55 
Do đó, 𝑆 (𝑃𝑙
𝑘,
1
𝑠
) biểu thị rằng các đặc 
trưng kích thước 
𝐷3
𝑠
 được tìm nạp từ 𝑃𝑙
𝑘. 
Ngoài ra 𝑆 (𝑃𝑙
𝑘,
1
𝑠
) ghép nối các đặc trưng 
với Bk-1 trong khuôn khổ kênh. Mục đích 
là để kết hợp thông tin trước đó với một 
số thông tin hiện tại. Nó có thể được coi 
là thông tin đường dẫn cục bộ được giữ 
lại một phần. Sử dụng phần còn lại của 
thông tin đường dẫn ngắn cục bộ làm đầu 
vào cho môđun dưới, chủ yếu trích xuất 
thêm các ma trận lớp đầu vào đường dài, 
𝑃2
𝑘 = 𝐶𝑏(𝑆 (𝑃𝑙
𝑘 , 1 −
1
𝑠
)) (10) 
Trong đó, 𝑃2
𝑘, 𝐶𝑏 tương ứng là các hoạt 
động tích chập đầu ra và xếp nối của 
môđun dưới. Cuối cùng, như trong hình 3, 
thông tin đầu vào, thông tin đường dẫn 
cục bộ riêng và thông tin đường dài cục 
bộ được tổng hợp. Do đó, đơn vị tăng 
cường có thể được trình bày như sau: 
𝑃𝑘 = 𝑃2
𝑘 + 𝑅𝑘 = 𝐶𝑏 (𝑆 (
𝐶𝑎(𝐵𝑘−1),
1 −
1
𝑠
)) +
𝐶 (𝑆 (𝐶𝑎(𝐵𝑘−1),
1
𝑠
) , 𝐵𝑘−1) (11) 
Trong đó Pk là đầu ra của đơn vị tăng 
cường. Tại thời điểm này, các đặc trưng 
đường dài cục bộ 𝑃2
𝑘 và sự kết hợp của 
các đặc trưng đường ngắn cục bộ cùng 
các đặc trưng chưa qua xử lý Rk được sử 
dụng mà không có ngoại lệ bởi đơn vị 
nén. 
3.3. Đơn vị nén 
Cơ chế nén được hình thành bằng cách 
tận dụng lớp chập 1×1. Cụ thể, các đầu ra 
của đơn vị tăng cường được chuyển tới 
lớp chập 1×1, có vai trò hoạt động như 
giảm kích thước hoặc chắt lọc thông tin 
liên quan cho mạng sau này. Do đó, đơn 
vị nén có thể được xây dựng như sau: 
𝐵𝑘 = 𝑓𝐹
𝑘(𝑃𝑘) = 𝛼𝐹
𝑘(𝑊𝐹
𝑘(𝑃𝑘)) (12) 
Trong đó 𝑓𝐹
𝑘 biểu thị cho hàm lớp tích 
chập 1×1 ( 𝛼𝐹
𝑘 biểu thị cho hàm kích hoạt 
và 𝑊𝐹
𝑘 là các thông số trọng số). 
4. THỰC NGHIỆM VÀ ĐÁNH GIÁ KẾT 
QUẢ 
Hình ảnh võng mạc mắt người sử dụng 
cho thực nghiệm được lấy từ cơ sở dữ liệu 
DRIVE [19] công khai (nguồn ảnh võng 
mạc kỹ thuật số). Hình ảnh có kích thước 
565×584 pixel, 8 bit cho mỗi kênh màu 
sắc, định dạng nén .*TIFF. Hình ảnh ban 
đầu được bắt từ một nonmydriatic 3 thiết 
bị tích điện kép Canon CR5(CCD) camera 
tại 45° trường nhìn (FOV). Theo [4, 11, 
13, 14], tác giả sử dụng 91 hình ảnh từ 
Yang cùng cộng sự [13] và 200 hình ảnh 
từ Bộ Dữ liệu Phân đoạn Berkeley (BSD) 
[18] làm dữ liệu đào tạo. Ảnh thực 
nghiệm được giảm tỷ lệ bằng phép nội 
suy hai chiều để tạo các cặp hình ảnh độ 
phân giải thấp/độ phân giải cao cho cả tập 
dữ liệu đào tạo và thử nghiệm. 
Mạng nơron trí tuệ nhân tạo phát hiện dư 
ảnh từ độ chói của hình ảnh màu. Kênh độ 
chói của hình ảnh - Y thể hiện độ sáng 
của từng pixel thông qua sự kết hợp tuyến 
tính của các giá trị pixel đỏ, lục và lam. 
Ngược lại, hai kênh sắc độ của một hình 
ảnh, Cb và Cr, là các kết hợp tuyến tính 
khác nhau của các giá trị pixel đỏ, lục và 
lam thể hiện thông tin sai lệch màu. Mạng 
nơron trí tuệ nhân tạo được đào tạo chỉ sử 
TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ NĂNG LƯỢNG - TRƯỜNG ĐẠI HỌC ĐIỆN LỰC 
(ISSN: 1859 - 4557) 
56 Số 24 
dụng kênh độ chói vì nhận thức của mắt 
con người nhạy cảm hơn với những thay 
đổi về độ sáng so với thay đổi về màu sắc. 
4.1. Histogram của ảnh võng mạc và 
các kênh màu 
Biểu đồ này hiển thị số lượng pixel trong 
một hình ảnh ở từng giá trị cường độ khác 
nhau được tìm thấy trong hình ảnh đó, từ 
biểu đồ này, có thể tìm hiểu mức độ phơi 
sáng hình ảnh tốt hơn nhiều so với việc 
nhìn vào hình ảnh này trên màn hình máy 
tính lớn. Nếu phơi sáng là không tối ưu, 
ngay lập tức thấy cách cải thiện nó từ biểu 
đồ hình ảnh. Mục đích để lựa chọn ảnh 
phù hợp cho thực nghiệm. Kênh độ chói 
Y chính là biểu đồ Red channel được thể 
hiện trên hình 4. 
Hình 4. Ảnh võng mạc và các kênh màu 
4.2. Chi tiết thực nghiệm 
Phần này sẽ đề cập các bước tiến hành 
thực nghiệm siêu phân giải dùng trí tuệ 
nhân tạo nâng cao chất lượng ảnh võng 
mạc mắt người. 
Để thực hiện siêu phân giải hình ảnh đơn 
(SISR) bằng mạng đề xuất, các bước thực 
hiện như sau: 
B1: Tạo một hình ảnh độ phân giải thấp 
mẫu từ một hình ảnh tham chiếu độ phân 
giải cao. 
B2: Thực hiện SISR trên hình ảnh có độ 
phân giải thấp bằng cách sử dụng phép 
nội suy bicubic, một giải pháp xử lý hình 
ảnh truyền thống không dựa vào việc 
học sâu. 
B3: Thực hiện SISR trên hình ảnh độ 
phân giải thấp bằng cách sử dụng mạng 
nơron đề xuất. 
B4: Trực quan so sánh các hình ảnh độ 
phân giải cao được xây dựng lại bằng 
cách sử dụng phép nội suy bicubic, DWT 
[1,2,3], SRCNN [5], VDSR [4], và IDN. 
B5: Đánh giá chất lượng của hình ảnh 
siêu phân giải bằng cách định lượng độ 
tương tự của hình ảnh với hình ảnh tham 
chiếu có độ phân giải cao qua các tham số 
tính toán chất lượng ảnh RMSE, PSNR, 
Entropi, SC, NIQE, SSIM. Cuối cùng, 
thực hiện đánh giá hiệu suất về thời gian 
thực thi giữa các phương pháp. 
4.3. Phân tích và đánh giá kết quả thực 
nghiệm 
Phần này sẽ so sánh trực quan và định 
lượng các kết quả thực nghiệm đã tiến 
hành với các phương giới thiệu và phương 
pháp đề xuất. 
TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ NĂNG LƯỢNG - TRƯỜNG ĐẠI HỌC ĐIỆN LỰC 
(ISSN: 1859 - 4557) 
Số 24 57 
Hình 5. Dư ảnh và sự phân bố dữ liệu 
của ảnh võng mạc 
Các tham số tính toán chất lượng ảnh: 
Tính toán Entropi: 
log( )k k
k
H p p  (13) 
trong đó K là số lượng các mức xám và pk 
là xác suất được kết hợp với mức xám k. 
Tính toán RMSE: 
 
2
( , ) ( , )R i j F i j
RMSE
MN
 
 (14) 
Trong đó i và j biểu thị vị trí không gian 
của pixel trong khi M và N là kích thước 
của ảnh. 
Tính toán PSNR: 
2
10
2 1
10l g
n
PSNR o
MSE
 (15) 
 
2
1 1
( , ) ( , )M N
i j
I i j F i j
MSE
M N 

I(i,j): ảnh gốc, F(i,j): ảnh hợp nhất (fused 
image); 
M×N: kích thước ảnh I. 
Tính toán SC: 
 
2
1 1
2
'
1 1
( , )
( , )
M N
i j
M N
i j
f i j
SC
f i j


 (16) 
f(i,j): ảnh gốc; f’(i,j): ảnh hợp nhất (fused 
image); 
M×N : kích thước ảnh f. 
Tính toán NIQE [16]: 
NIQE đo khoảng cách giữa các tính năng 
dựa trên NSS được tính toán từ hình ảnh 
A đến các tính năng thu được từ cơ sở dữ 
liệu hình ảnh được sử dụng để huấn luyện 
mô hình. Các tính năng được mô hình hóa 
như các bản phân phối Gaussian đa chiều. 
Tính toán SSIM [17]: 
𝑆𝑆𝐼𝑀(𝑥, 𝑦) = [𝑙(𝑥, 𝑦)]𝛼 ∙ [𝑐(𝑥, 𝑦)]𝛽 ∙
[𝑠(𝑥, 𝑦)]𝛾 (17) 
trong đó, 
𝑙(𝑥, 𝑦) =
2𝜇𝑥𝜇𝑦 + 𝐶1
𝜇𝑥2 + 𝜇𝑦2 + 𝐶1
𝑐(𝑥, 𝑦) =
2𝜎𝑥𝜎𝑦 + 𝐶2
𝜎𝑥2 + 𝜎𝑦2 + 𝐶2
𝑠(𝑥, 𝑦) =
𝜎𝑥𝑦 + 𝐶3
𝜎𝑥𝜎𝑦 + 𝐶3
trong đó μx,y, σx, σy và σxy là trung bình 
cục bộ, độ lệch chuẩn và hiệp phương sai 
cho hình ảnh x, y . Nếu α = β = γ = 1, và 
C3 = C2 /2 (lựa chọn mặc định của C3) sự 
đơn giản hóa chỉ số để: 
𝑆𝑆𝐼𝑀(𝑥, 𝑦) =
(2𝜇𝑥𝜇𝑦+𝐶1)(2𝜎𝑥𝜎𝑦+𝐶2)
(𝜇𝑥
2+𝜇𝑦
2+𝐶1)(𝜎𝑥
2+𝜎𝑦
2+𝐶2)
 (18) 
So sánh trực quan ảnh được xử lý và biểu 
đồ mật độ phổ năng lượng: 
TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ NĂNG LƯỢNG - TRƯỜNG ĐẠI HỌC ĐIỆN LỰC 
(ISSN: 1859 - 4557) 
58 Số 24 
Hình 6. So sánh trực quan ảnh võng mạc 
Hình 7. Mật độ phổ năng lượng 
Từ hình 6, chúng ta có thể thấy rằng kết 
quả trực quan theo phương pháp đề xuất 
thể hiện chất lượng hình ảnh tốt nhất. Ảnh 
khôi phục với phương pháp đề xuất cho 
độ nhạy sáng tốt hơn và khả năng quan sát 
rõ ràng hơn các chi tiết ảnh. 
Theo kết quả mô phỏng trong hình 7, đối 
với mật độ phổ năng lượng, ảnh chất 
lượng thấp sẽ cho một mật độ năng lượng 
quang phổ phẳng. Do đó, từ các kết quả 
PSD trên, dễ dàng thấy rằng phương pháp 
đề xuất cho chất lượng xử lý tốt nhất bởi 
vì PSD càng lớn cho thấy kết quả tăng 
cường ảnh càng tốt. 
So sánh định lượng qua các tham số tính 
toán chất lượng ảnh. 
TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ NĂNG LƯỢNG - TRƯỜNG ĐẠI HỌC ĐIỆN LỰC 
(ISSN: 1859 - 4557) 
Số 24 59 
Bảng 1. Kết quả định lượng chất lượng ảnh võng mạc 
Phương pháp Bicubic DWT SRCNN VDSR IDN 
RMSE 3.074901084 49.7709469 2.082487134 0.019029733 0.006824656 
PSNR 38.37418062 14.19128554 41.75915707 82.54214967 83.31838486 
Entropi 5.341462778 4.435734623 5.299262245 6.519411707 7.272545443 
SC 0.998209422 0.249589283 1.000384552 0.994228197 0.199988018 
NIQE 5.004336182 5.313397536 5.069672023 5.229128662 4.163979766 
SSIM 0.944457499 0.745228683 0.957719795 0.981807407 0.998874777 
Time - 0.1597907 22.0877573 0.0333412 0.0218909 
Chúng ta thấy, kết quả tính toán định 
lượng chất lượng ảnh võng mạc được xử 
lý với màu xanh chỉ ra mức hiệu suất tốt 
nhất và màu đỏ chỉ ra mức hiệu suất tốt 
thứ hai. 
5. KẾT LUẬN 
Trong bài báo này, tác giả đề xuất một 
phương pháp mới dùng trí tuệ nhân tạo 
dựa trên mạng nơron, sử dụng các khối 
chắt lọc để trích xuất dần nguồn đặc trưng 
phong phú và hiệu quả nhằm mục đích tái 
tạo hình ảnh độ phân giải cao. Phương 
pháp đề xuất thu được kết quả có hiệu 
suất rất tốt về RMSE, PSNR, Entropi, SC, 
NIQE, SSIM và cho thời gian thực thi rất 
nhanh so với các phương pháp được giới 
thiệu. Mạng nhỏ gọn này sẽ được áp dụng 
rộng rãi hơn trong thực tế. Trong tương 
lai, phương pháp siêu phân giải hình ảnh 
này sẽ được nghiên cứu để hỗ trợ vấn đề 
về phục hồi hình ảnh khác như giảm 
nhiễu và giảm thiểu hiện tượng sai khác 
giữa ảnh gốc và ảnh sau xử lý (hiện tượng 
compression artifact). 
TÀI LIỆU THAM KHẢO 
[1] Daubechies, Ten lectures on wavelets, CBMS-NSF conference series in applied mathematics. 
SIAM Ed, 1992. 
[2] Mallat, S. “A theory for multiresolution signal decomposition: the wavelet representation,” IEEE 
Pattern Anal. and Machine Intell., vol. 11, no. 7, pp. 674–693, 1989. 
[3] Meyer. Y, Ondelettes et opérateurs, Tome 1, Hermann Ed, 1990 (English translation: Wavelets 
and operators, Cambridge Univ. Press. 1993). 
[4] J. Kim, J.K. Lee, and K.M. Lee. Accurate image super-resolution using very deep convolutional 
networks. In CVPR, pp. 1646–1654, 2016. 
[5] C. Dong, C.C. Loy, and X. Tang. Accelerating the super-resolution convolutional neural network. 
In ECCV, pp. 391–407, 2016. 
[6] J. Kim, J.K. Lee, and K.M. Lee. Deeply-recursive convolutional network for image super-
resolution. In CVPR, pp. 1637–1645, 2016. 
TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ NĂNG LƯỢNG - TRƯỜNG ĐẠI HỌC ĐIỆN LỰC 
(ISSN: 1859 - 4557) 
60 Số 24 
[7] C. Dong, C.C. Loy, K. He, and X. Tang. Learning a deep convolutional network for image super-
resolution. In ECCV, pp. 184–199, 2014. 
[8] C. Dong, C.C. Loy, K. He, and X. Tang. Image super-resolution using deep convolutional 
networks. IEEE Transactions on Pattern Analysis and Machine Intelligence, 38(2):295–307, 2016. 
[9] W. Shi, J. Caballero, F. Husz´ ar, J. Totz, A. P. Aitken, R. Bishop, D. Rueckert, and Z. Wang. Real-
time single image and video super-resolution using an efficient sub-pixel convolutional neural 
network. In CVPR, pp. 1874–1883, 2016. 
[10] X.-J. Mao, C. Shen, and Y.-B. Yang. Image restoration using very deep convolutional encoder-
decoder networks with symmetric skip connections. In NIPS, 2016. 
[11] Y. Tai, J. Yang, and X. Liu. Image super-resolution via deep recursive residual network. In CVPR, 
pp. 3147–3155, 2017. 
[12] M.S.M. Sajjadi, B. Scholkopf, and M. Hirsch. Enhancenet: Single image super-resolution through 
automated texture synthesis. In ICCV, pp. 4491–4500, 2017. 
[13] W.-S. Lai, J.-B. Huang, N. Ahuja, and M.-H. Yang. Deep laplacian pyramid networks for fast and 
accurate super-resolution. In CVPR, pp. 624–632, 2017. 
[14] Y. Tai, J. Yang, X. Liu, and C. Xu. Memnet: A persistent memory network for image restoration. 
In ICCV, pp. 3147–3155, 2017. 
[15] J. Yang, J. Wright, T.S. Huang, and Y. Ma. Image super-resolution via sparse representation. 
IEEE Transactions on Image Processing, 19(11):2861–2873, 2010. 
[16] Mittal, A., R. Soundararajan, and A.C. Bovik. "Making a Completely Blind Image Quality Analyzer." 
IEEE Signal Processing Letters. Vol. 22, Number 3, pp. 209–212, Mar. 2013. 
[17] Zhou, W., A. C. Bovik, H. R. Sheikh, and E. P. Simoncelli. "Image Qualifty Assessment: From Error 
Visibility to Structural Similarity." IEEE Transactions on Image Processing. Vol. 13, Issue 4, pp. 
600–612, Apr. 2004. 
[18] D. Martin, C. Fowlkes, D. Tal, and J. Malik. A database of human segmented natural images and 
its application to evaluating segmentation algorithms and measuring ecological statistics. In 
CVPR, pp. 416–423, 2001. 
[19] DRIVE database. Article (CrossRef Link). 
Giới thiệu tác giả: 
Tác giả Doãn Thanh Bình tốt nghiệp đại học ngành kỹ thuật điện tử năm 2008, 
nhận bằng Thạc sĩ năm 2010, nhận bằng Tiến sĩ ngành kỹ thuật điện tử năm 
2018 tại Trường Đại học Bách khoa Hà Nội. Tác giả hiện đang công tác tại Phòng 
Khảo thí và Kiểm định chất lượng, Trường Đại học Điện lực. 
Lĩnh vực nghiên cứu: lý thuyết nghịch đảo suy rộng (generalized inverses), GSVD 
nhằm mô hình hóa, đánh giá các hệ thống MIMO; nghiên cứu các hệ thống thông 
tin trải phổ đa sóng mang (multi-carrier) áp dụng cho các hệ thống thông tin thế 
hệ tiếp theo. 
TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ NĂNG LƯỢNG - TRƯỜNG ĐẠI HỌC ĐIỆN LỰC 
(ISSN: 1859 - 4557) 
61 Số 24 
TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ NĂNG LƯỢNG - TRƯỜNG ĐẠI HỌC ĐIỆN LỰC 
(ISSN: 1859 - 4557) 
62 Số 24 

File đính kèm:

  • pdfsieu_phan_giai_dung_tri_tue_nhan_tao_nang_cao_chat_luong_anh.pdf