Siêu phân giải dùng trí tuệ nhân tạo nâng cao chất lượng ảnh võng mạc mắt người
Hình ảnh võng mạc là một lĩnh vực quan trọng trong y tế phục vụ mục tiêu điều trị các bệnh lý.
Quan sát những thay đổi của các đường mạch máu ở võng mạc giúp các bác sỹ chẩn đoán nhiều
bệnh, thu thập, phân tích các triệu chứng và phát triển các phương pháp điều trị liên quan. Do vậy,
nâng cao chất lượng hình ảnh võng mạc là bước tiền xử lý quan trọng. Nhằm cải thiện chất lượng
hình ảnh võng mạc một số kỹ thuật đã được đề xuất như biến đổi wavelet rời rạc (DWT) [1,2,3],
siêu phân giải rất sâu (VDSR) [4], mạng nơron tích chập siêu phân giải (SRCNN) [5]. Tuy nhiên,
vẫn chưa thể đem lại hiệu quả cao do vẫn tồn tại nhiễu cao, cho kết quả hình ảnh không tốt, chưa
tối ưu về độ phức tạp tính toán, mức tiêu thụ bộ nhớ và tốc độ xử lý. Trong khuôn khổ bài báo này,
tác giả đề xuất phương pháp siêu phân giải dùng trí tuệ nhân tạo nâng cao chất lượng ảnh võng
mạc mắt người, nhằm tái tạo trực tiếp hình ảnh có độ phân giải cao từ hình ảnh có độ phân giải
thấp ban đầu. Bằng các phân tích và kết quả tính toán các tham số chất lượng ảnh xử lý qua thực
nghiệm, bài báo chứng minh rằng phương pháp được đề xuất là vượt trội so với các phương pháp đã
thực hiện, đặc biệt là về thời gian thực thi.
Trang 1
Trang 2
Trang 3
Trang 4
Trang 5
Trang 6
Trang 7
Trang 8
Trang 9
Trang 10
Tải về để xem bản đầy đủ
Tóm tắt nội dung tài liệu: Siêu phân giải dùng trí tuệ nhân tạo nâng cao chất lượng ảnh võng mạc mắt người
TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ NĂNG LƯỢNG - TRƯỜNG ĐẠI HỌC ĐIỆN LỰC (ISSN: 1859 - 4557) 50 Số 24 SIÊU PHÂN GIẢI DÙNG TRÍ TUỆ NHÂN TẠO NÂNG CAO CHẤT LƯỢNG ẢNH VÕNG MẠC MẮT NGƯỜI SUPER RESOLUTION USING ARTIFICIAL INTELLIGENCE FOR RETINA IMAGE ENHANCEMENT Doãn Thanh Bình Trường Đại học Điện lực Ngày nhận bài: 28/07/2020, Ngày chấp nhận đăng: 28/12/2020, Phản biện: TS. Hoàng Thị Phương Thảo Tóm tắt: Hình ảnh võng mạc là một lĩnh vực quan trọng trong y tế phục vụ mục tiêu điều trị các bệnh lý. Quan sát những thay đổi của các đường mạch máu ở võng mạc giúp các bác sỹ chẩn đoán nhiều bệnh, thu thập, phân tích các triệu chứng và phát triển các phương pháp điều trị liên quan. Do vậy, nâng cao chất lượng hình ảnh võng mạc là bước tiền xử lý quan trọng. Nhằm cải thiện chất lượng hình ảnh võng mạc một số kỹ thuật đã được đề xuất như biến đổi wavelet rời rạc (DWT) [1,2,3], siêu phân giải rất sâu (VDSR) [4], mạng nơron tích chập siêu phân giải (SRCNN) [5]... Tuy nhiên, vẫn chưa thể đem lại hiệu quả cao do vẫn tồn tại nhiễu cao, cho kết quả hình ảnh không tốt, chưa tối ưu về độ phức tạp tính toán, mức tiêu thụ bộ nhớ và tốc độ xử lý. Trong khuôn khổ bài báo này, tác giả đề xuất phương pháp siêu phân giải dùng trí tuệ nhân tạo nâng cao chất lượng ảnh võng mạc mắt người, nhằm tái tạo trực tiếp hình ảnh có độ phân giải cao từ hình ảnh có độ phân giải thấp ban đầu. Bằng các phân tích và kết quả tính toán các tham số chất lượng ảnh xử lý qua thực nghiệm, bài báo chứng minh rằng phương pháp được đề xuất là vượt trội so với các phương pháp đã thực hiện, đặc biệt là về thời gian thực thi. Từ khóa: nâng cao chất lượng ảnh Retina, mạng nơron tích chập sâu (CNN), siêu phân giải đơn ảnh. Abstract: The retina image is an important area for medical treatment of the disease. By observing the changes in the blood vessels in the retina lines, doctors can diagnose diseases, to collect and analyze the symptoms and the development of related treatments. Consequently, improving retinal image quality is an important preprocessing step. In order to improve retinal image quality, several techniques have been proposed such as wavelet transform [1,2,3], very-deep-super-resolution (VDSR) [4], super-resolution-convolutional neural network (SRCNN) [5]... but still can not provide high efficiency by persistent high noise, poor image results, not optimal for computational complexity and memory consumption. Therefore, in this paper, we propose a particular method of retinal images quality enhancement via super resolution using artificial intelligence to directly reconstruct the high resolution image from the original low resolution image. By the analysis and calculated results in picture quality parameters through experimental treatment, we will demonstrate that the proposed method is superior to the state-of-the-art methods, especially in terms of time performance. TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ NĂNG LƯỢNG - TRƯỜNG ĐẠI HỌC ĐIỆN LỰC (ISSN: 1859 - 4557) Số 24 51 Keywords: retinal image enhancement, convolutional neural network, single image super resolution. 1. GIỚI THIỆU 1.1. Ảnh võng mạc mắt người Võng mạc là một cấu trúc nhiều lớp với nhiều lớp tế bào thần kinh kết nối với nhau bằng các khớp thần kinh. Các tế bào thần kinh chỉ nhạy cảm với ánh sáng trực tiếp là các tế bào tiếp nhận ánh sáng. Đối với tầm nhìn, đây là hai loại: các que và hình nón. Thanh chức năng chủ yếu trong ánh sáng mờ và cung cấp tầm nhìn màu đen và trắng, trong khi tế bào hình nón hỗ trợ nhận thức về màu sắc. Loại thứ ba của tiếp nhận ánh sáng là sử dụng tế bào hạch quang có khả năng cảm biến với cường độ của ánh sáng. Đánh giá hình ảnh võng mạc là điều cần thiết để chăm sóc mắt hiện đại. Với sự ra đời của các thiết bị xử lý hình ảnh, ghi âm kỹ thuật số và xử lý hình ảnh võng mạc được bắt đầu nghiên cứu phát triển. Bài báo này đề cập đến ảnh võng mạc dựa trên trí tuệ nhân tạo để nâng cao, cải thiện chất lượng ảnh, tái tạo trực tiếp hình ảnh có độ phân giải cao từ hình ảnh có độ phân giải thấp nhằm phục vụ cho các bước chẩn đoán lâm sàng về các bệnh lý liên quan đến nhãn khoa. Bố cục của bài báo như sau: giới thiệu về ảnh võng mạc, cơ sở lý thuyết về siêu phân giải đơn giản, các phương pháp siêu phân giải dùng trí tuệ nhân tạo dựa trên mạng nơron tích chập, đưa ra mô hình cho phương pháp đề xuất. Phần cuối đưa ra kết quả thực nghiệm, và các tham số tính toán so sánh chất lượng xử lý giữa các phương pháp hiện tại và phương pháp đề xuất. 1.2. Siêu phân giải đơn ảnh Siêu phân giải là quá trình tạo hình ảnh có độ phân giải cao từ hình ảnh có độ phân giải thấp. Bài báo này xem xét siêu phân giải đơn ảnh (SISR), trong đó mục tiêu là khôi phục một hình ảnh có độ phân giải cao từ một hình ảnh có độ phân giải thấp. SISR là một thách thức vì nội dung hình ảnh tần số cao thường không thể được phục hồi từ hình ảnh độ ... ) Bằng thực nghiệm, ta nhận thấy rằng mô hình với hàm Loss MSE có thể cải thiện hiệu suất của mạng đã đào tạo với hàm Loss MAE. Do đó, việc đầu tiên của phương pháp là đào tạo mạng với hàm Loss MAE và sau đó tinh chỉnh theo hàm Loss MSE. 3.2. Đơn vị tăng cường Hình 3. Kiến trúc của đơn vị tăng cường trong mô hình đề xuất Đơn vị tăng cường có thể được chia thành hai môđun, một là ba tích chập trên và hai là ba tích chập dưới. Môđun trên có ba tích chập 3×3, mỗi tích chập được theo sau bởi hàm kích hoạt tinh chỉnh các đơn vị tuyến tính hở (LReLU), được bỏ qua ở đây. Hãy biểu thị các kích thước ma trận lớp đầu vào của lớp thứ i là Di (i = 1,, 6). Theo đó, mối quan hệ của các lớp chập có thể được biểu thị bằng: 𝐷3 − 𝐷1 = 𝐷1 − 𝐷2 = 𝑑 (6) trong đó d biểu thị độ chênh lệch giữa lớp thứ nhất và lớp thứ hai hoặc giữa lớp thứ nhất và lớp thứ ba. Tương tự, kích thước của các kênh trong môđun dưới cũng có mối quan hệ này và có thể được mô tả như sau: 𝐷6 − 𝐷4 = 𝐷4 − 𝐷5 = 𝑑 (7) trong đó D4 = D3. Môđun trên bao gồm ba lớp chập xếp tầng với các LReLU và đầu ra của lớp chập thứ ba được phân chia thành hai phân đoạn. Giả sử đầu vào của môđun này là Bk-1, chúng ta có: 𝑃𝑙 𝑘 = 𝐶𝑎(𝐵𝑘−1) (8) Trong đó Bk-1 biểu thị đầu ra của khối trước đó và trong khi đó là đầu vào của khối hiện tại, Ca biểu thị hoạt động tích chập nối tiếp và 𝑃𝑙 𝑘 là đầu ra của môđun trên trong đơn vị tăng cường thứ k. Các ma trận lớp đầu vào với các kích thước 𝐷3 𝑠 và đầu vào của lớp chập đầu tiên được liên kết với nhau trong khuôn khổ kênh, 𝑅𝑘 = 𝐶(𝑆 (𝑃𝑙 𝑘 , 1 𝑠 ) , 𝐵𝑘−1) (9) Trong đó C, S đại diện cho hoạt động ghép nối và hoạt động phân chia. Cụ thể, chúng tôi biết kích thước của 𝑃𝑙 𝑘 là D3. TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ NĂNG LƯỢNG - TRƯỜNG ĐẠI HỌC ĐIỆN LỰC (ISSN: 1859 - 4557) Số 24 55 Do đó, 𝑆 (𝑃𝑙 𝑘, 1 𝑠 ) biểu thị rằng các đặc trưng kích thước 𝐷3 𝑠 được tìm nạp từ 𝑃𝑙 𝑘. Ngoài ra 𝑆 (𝑃𝑙 𝑘, 1 𝑠 ) ghép nối các đặc trưng với Bk-1 trong khuôn khổ kênh. Mục đích là để kết hợp thông tin trước đó với một số thông tin hiện tại. Nó có thể được coi là thông tin đường dẫn cục bộ được giữ lại một phần. Sử dụng phần còn lại của thông tin đường dẫn ngắn cục bộ làm đầu vào cho môđun dưới, chủ yếu trích xuất thêm các ma trận lớp đầu vào đường dài, 𝑃2 𝑘 = 𝐶𝑏(𝑆 (𝑃𝑙 𝑘 , 1 − 1 𝑠 )) (10) Trong đó, 𝑃2 𝑘, 𝐶𝑏 tương ứng là các hoạt động tích chập đầu ra và xếp nối của môđun dưới. Cuối cùng, như trong hình 3, thông tin đầu vào, thông tin đường dẫn cục bộ riêng và thông tin đường dài cục bộ được tổng hợp. Do đó, đơn vị tăng cường có thể được trình bày như sau: 𝑃𝑘 = 𝑃2 𝑘 + 𝑅𝑘 = 𝐶𝑏 (𝑆 ( 𝐶𝑎(𝐵𝑘−1), 1 − 1 𝑠 )) + 𝐶 (𝑆 (𝐶𝑎(𝐵𝑘−1), 1 𝑠 ) , 𝐵𝑘−1) (11) Trong đó Pk là đầu ra của đơn vị tăng cường. Tại thời điểm này, các đặc trưng đường dài cục bộ 𝑃2 𝑘 và sự kết hợp của các đặc trưng đường ngắn cục bộ cùng các đặc trưng chưa qua xử lý Rk được sử dụng mà không có ngoại lệ bởi đơn vị nén. 3.3. Đơn vị nén Cơ chế nén được hình thành bằng cách tận dụng lớp chập 1×1. Cụ thể, các đầu ra của đơn vị tăng cường được chuyển tới lớp chập 1×1, có vai trò hoạt động như giảm kích thước hoặc chắt lọc thông tin liên quan cho mạng sau này. Do đó, đơn vị nén có thể được xây dựng như sau: 𝐵𝑘 = 𝑓𝐹 𝑘(𝑃𝑘) = 𝛼𝐹 𝑘(𝑊𝐹 𝑘(𝑃𝑘)) (12) Trong đó 𝑓𝐹 𝑘 biểu thị cho hàm lớp tích chập 1×1 ( 𝛼𝐹 𝑘 biểu thị cho hàm kích hoạt và 𝑊𝐹 𝑘 là các thông số trọng số). 4. THỰC NGHIỆM VÀ ĐÁNH GIÁ KẾT QUẢ Hình ảnh võng mạc mắt người sử dụng cho thực nghiệm được lấy từ cơ sở dữ liệu DRIVE [19] công khai (nguồn ảnh võng mạc kỹ thuật số). Hình ảnh có kích thước 565×584 pixel, 8 bit cho mỗi kênh màu sắc, định dạng nén .*TIFF. Hình ảnh ban đầu được bắt từ một nonmydriatic 3 thiết bị tích điện kép Canon CR5(CCD) camera tại 45° trường nhìn (FOV). Theo [4, 11, 13, 14], tác giả sử dụng 91 hình ảnh từ Yang cùng cộng sự [13] và 200 hình ảnh từ Bộ Dữ liệu Phân đoạn Berkeley (BSD) [18] làm dữ liệu đào tạo. Ảnh thực nghiệm được giảm tỷ lệ bằng phép nội suy hai chiều để tạo các cặp hình ảnh độ phân giải thấp/độ phân giải cao cho cả tập dữ liệu đào tạo và thử nghiệm. Mạng nơron trí tuệ nhân tạo phát hiện dư ảnh từ độ chói của hình ảnh màu. Kênh độ chói của hình ảnh - Y thể hiện độ sáng của từng pixel thông qua sự kết hợp tuyến tính của các giá trị pixel đỏ, lục và lam. Ngược lại, hai kênh sắc độ của một hình ảnh, Cb và Cr, là các kết hợp tuyến tính khác nhau của các giá trị pixel đỏ, lục và lam thể hiện thông tin sai lệch màu. Mạng nơron trí tuệ nhân tạo được đào tạo chỉ sử TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ NĂNG LƯỢNG - TRƯỜNG ĐẠI HỌC ĐIỆN LỰC (ISSN: 1859 - 4557) 56 Số 24 dụng kênh độ chói vì nhận thức của mắt con người nhạy cảm hơn với những thay đổi về độ sáng so với thay đổi về màu sắc. 4.1. Histogram của ảnh võng mạc và các kênh màu Biểu đồ này hiển thị số lượng pixel trong một hình ảnh ở từng giá trị cường độ khác nhau được tìm thấy trong hình ảnh đó, từ biểu đồ này, có thể tìm hiểu mức độ phơi sáng hình ảnh tốt hơn nhiều so với việc nhìn vào hình ảnh này trên màn hình máy tính lớn. Nếu phơi sáng là không tối ưu, ngay lập tức thấy cách cải thiện nó từ biểu đồ hình ảnh. Mục đích để lựa chọn ảnh phù hợp cho thực nghiệm. Kênh độ chói Y chính là biểu đồ Red channel được thể hiện trên hình 4. Hình 4. Ảnh võng mạc và các kênh màu 4.2. Chi tiết thực nghiệm Phần này sẽ đề cập các bước tiến hành thực nghiệm siêu phân giải dùng trí tuệ nhân tạo nâng cao chất lượng ảnh võng mạc mắt người. Để thực hiện siêu phân giải hình ảnh đơn (SISR) bằng mạng đề xuất, các bước thực hiện như sau: B1: Tạo một hình ảnh độ phân giải thấp mẫu từ một hình ảnh tham chiếu độ phân giải cao. B2: Thực hiện SISR trên hình ảnh có độ phân giải thấp bằng cách sử dụng phép nội suy bicubic, một giải pháp xử lý hình ảnh truyền thống không dựa vào việc học sâu. B3: Thực hiện SISR trên hình ảnh độ phân giải thấp bằng cách sử dụng mạng nơron đề xuất. B4: Trực quan so sánh các hình ảnh độ phân giải cao được xây dựng lại bằng cách sử dụng phép nội suy bicubic, DWT [1,2,3], SRCNN [5], VDSR [4], và IDN. B5: Đánh giá chất lượng của hình ảnh siêu phân giải bằng cách định lượng độ tương tự của hình ảnh với hình ảnh tham chiếu có độ phân giải cao qua các tham số tính toán chất lượng ảnh RMSE, PSNR, Entropi, SC, NIQE, SSIM. Cuối cùng, thực hiện đánh giá hiệu suất về thời gian thực thi giữa các phương pháp. 4.3. Phân tích và đánh giá kết quả thực nghiệm Phần này sẽ so sánh trực quan và định lượng các kết quả thực nghiệm đã tiến hành với các phương giới thiệu và phương pháp đề xuất. TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ NĂNG LƯỢNG - TRƯỜNG ĐẠI HỌC ĐIỆN LỰC (ISSN: 1859 - 4557) Số 24 57 Hình 5. Dư ảnh và sự phân bố dữ liệu của ảnh võng mạc Các tham số tính toán chất lượng ảnh: Tính toán Entropi: log( )k k k H p p (13) trong đó K là số lượng các mức xám và pk là xác suất được kết hợp với mức xám k. Tính toán RMSE: 2 ( , ) ( , )R i j F i j RMSE MN (14) Trong đó i và j biểu thị vị trí không gian của pixel trong khi M và N là kích thước của ảnh. Tính toán PSNR: 2 10 2 1 10l g n PSNR o MSE (15) 2 1 1 ( , ) ( , )M N i j I i j F i j MSE M N I(i,j): ảnh gốc, F(i,j): ảnh hợp nhất (fused image); M×N: kích thước ảnh I. Tính toán SC: 2 1 1 2 ' 1 1 ( , ) ( , ) M N i j M N i j f i j SC f i j (16) f(i,j): ảnh gốc; f’(i,j): ảnh hợp nhất (fused image); M×N : kích thước ảnh f. Tính toán NIQE [16]: NIQE đo khoảng cách giữa các tính năng dựa trên NSS được tính toán từ hình ảnh A đến các tính năng thu được từ cơ sở dữ liệu hình ảnh được sử dụng để huấn luyện mô hình. Các tính năng được mô hình hóa như các bản phân phối Gaussian đa chiều. Tính toán SSIM [17]: 𝑆𝑆𝐼𝑀(𝑥, 𝑦) = [𝑙(𝑥, 𝑦)]𝛼 ∙ [𝑐(𝑥, 𝑦)]𝛽 ∙ [𝑠(𝑥, 𝑦)]𝛾 (17) trong đó, 𝑙(𝑥, 𝑦) = 2𝜇𝑥𝜇𝑦 + 𝐶1 𝜇𝑥2 + 𝜇𝑦2 + 𝐶1 𝑐(𝑥, 𝑦) = 2𝜎𝑥𝜎𝑦 + 𝐶2 𝜎𝑥2 + 𝜎𝑦2 + 𝐶2 𝑠(𝑥, 𝑦) = 𝜎𝑥𝑦 + 𝐶3 𝜎𝑥𝜎𝑦 + 𝐶3 trong đó μx,y, σx, σy và σxy là trung bình cục bộ, độ lệch chuẩn và hiệp phương sai cho hình ảnh x, y . Nếu α = β = γ = 1, và C3 = C2 /2 (lựa chọn mặc định của C3) sự đơn giản hóa chỉ số để: 𝑆𝑆𝐼𝑀(𝑥, 𝑦) = (2𝜇𝑥𝜇𝑦+𝐶1)(2𝜎𝑥𝜎𝑦+𝐶2) (𝜇𝑥 2+𝜇𝑦 2+𝐶1)(𝜎𝑥 2+𝜎𝑦 2+𝐶2) (18) So sánh trực quan ảnh được xử lý và biểu đồ mật độ phổ năng lượng: TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ NĂNG LƯỢNG - TRƯỜNG ĐẠI HỌC ĐIỆN LỰC (ISSN: 1859 - 4557) 58 Số 24 Hình 6. So sánh trực quan ảnh võng mạc Hình 7. Mật độ phổ năng lượng Từ hình 6, chúng ta có thể thấy rằng kết quả trực quan theo phương pháp đề xuất thể hiện chất lượng hình ảnh tốt nhất. Ảnh khôi phục với phương pháp đề xuất cho độ nhạy sáng tốt hơn và khả năng quan sát rõ ràng hơn các chi tiết ảnh. Theo kết quả mô phỏng trong hình 7, đối với mật độ phổ năng lượng, ảnh chất lượng thấp sẽ cho một mật độ năng lượng quang phổ phẳng. Do đó, từ các kết quả PSD trên, dễ dàng thấy rằng phương pháp đề xuất cho chất lượng xử lý tốt nhất bởi vì PSD càng lớn cho thấy kết quả tăng cường ảnh càng tốt. So sánh định lượng qua các tham số tính toán chất lượng ảnh. TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ NĂNG LƯỢNG - TRƯỜNG ĐẠI HỌC ĐIỆN LỰC (ISSN: 1859 - 4557) Số 24 59 Bảng 1. Kết quả định lượng chất lượng ảnh võng mạc Phương pháp Bicubic DWT SRCNN VDSR IDN RMSE 3.074901084 49.7709469 2.082487134 0.019029733 0.006824656 PSNR 38.37418062 14.19128554 41.75915707 82.54214967 83.31838486 Entropi 5.341462778 4.435734623 5.299262245 6.519411707 7.272545443 SC 0.998209422 0.249589283 1.000384552 0.994228197 0.199988018 NIQE 5.004336182 5.313397536 5.069672023 5.229128662 4.163979766 SSIM 0.944457499 0.745228683 0.957719795 0.981807407 0.998874777 Time - 0.1597907 22.0877573 0.0333412 0.0218909 Chúng ta thấy, kết quả tính toán định lượng chất lượng ảnh võng mạc được xử lý với màu xanh chỉ ra mức hiệu suất tốt nhất và màu đỏ chỉ ra mức hiệu suất tốt thứ hai. 5. KẾT LUẬN Trong bài báo này, tác giả đề xuất một phương pháp mới dùng trí tuệ nhân tạo dựa trên mạng nơron, sử dụng các khối chắt lọc để trích xuất dần nguồn đặc trưng phong phú và hiệu quả nhằm mục đích tái tạo hình ảnh độ phân giải cao. Phương pháp đề xuất thu được kết quả có hiệu suất rất tốt về RMSE, PSNR, Entropi, SC, NIQE, SSIM và cho thời gian thực thi rất nhanh so với các phương pháp được giới thiệu. Mạng nhỏ gọn này sẽ được áp dụng rộng rãi hơn trong thực tế. Trong tương lai, phương pháp siêu phân giải hình ảnh này sẽ được nghiên cứu để hỗ trợ vấn đề về phục hồi hình ảnh khác như giảm nhiễu và giảm thiểu hiện tượng sai khác giữa ảnh gốc và ảnh sau xử lý (hiện tượng compression artifact). TÀI LIỆU THAM KHẢO [1] Daubechies, Ten lectures on wavelets, CBMS-NSF conference series in applied mathematics. SIAM Ed, 1992. [2] Mallat, S. “A theory for multiresolution signal decomposition: the wavelet representation,” IEEE Pattern Anal. and Machine Intell., vol. 11, no. 7, pp. 674–693, 1989. [3] Meyer. Y, Ondelettes et opérateurs, Tome 1, Hermann Ed, 1990 (English translation: Wavelets and operators, Cambridge Univ. Press. 1993). [4] J. Kim, J.K. Lee, and K.M. Lee. Accurate image super-resolution using very deep convolutional networks. In CVPR, pp. 1646–1654, 2016. [5] C. Dong, C.C. Loy, and X. Tang. Accelerating the super-resolution convolutional neural network. In ECCV, pp. 391–407, 2016. [6] J. Kim, J.K. Lee, and K.M. Lee. Deeply-recursive convolutional network for image super- resolution. In CVPR, pp. 1637–1645, 2016. TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ NĂNG LƯỢNG - TRƯỜNG ĐẠI HỌC ĐIỆN LỰC (ISSN: 1859 - 4557) 60 Số 24 [7] C. Dong, C.C. Loy, K. He, and X. Tang. Learning a deep convolutional network for image super- resolution. In ECCV, pp. 184–199, 2014. [8] C. Dong, C.C. Loy, K. He, and X. Tang. Image super-resolution using deep convolutional networks. IEEE Transactions on Pattern Analysis and Machine Intelligence, 38(2):295–307, 2016. [9] W. Shi, J. Caballero, F. Husz´ ar, J. Totz, A. P. Aitken, R. Bishop, D. Rueckert, and Z. Wang. Real- time single image and video super-resolution using an efficient sub-pixel convolutional neural network. In CVPR, pp. 1874–1883, 2016. [10] X.-J. Mao, C. Shen, and Y.-B. Yang. Image restoration using very deep convolutional encoder- decoder networks with symmetric skip connections. In NIPS, 2016. [11] Y. Tai, J. Yang, and X. Liu. Image super-resolution via deep recursive residual network. In CVPR, pp. 3147–3155, 2017. [12] M.S.M. Sajjadi, B. Scholkopf, and M. Hirsch. Enhancenet: Single image super-resolution through automated texture synthesis. In ICCV, pp. 4491–4500, 2017. [13] W.-S. Lai, J.-B. Huang, N. Ahuja, and M.-H. Yang. Deep laplacian pyramid networks for fast and accurate super-resolution. In CVPR, pp. 624–632, 2017. [14] Y. Tai, J. Yang, X. Liu, and C. Xu. Memnet: A persistent memory network for image restoration. In ICCV, pp. 3147–3155, 2017. [15] J. Yang, J. Wright, T.S. Huang, and Y. Ma. Image super-resolution via sparse representation. IEEE Transactions on Image Processing, 19(11):2861–2873, 2010. [16] Mittal, A., R. Soundararajan, and A.C. Bovik. "Making a Completely Blind Image Quality Analyzer." IEEE Signal Processing Letters. Vol. 22, Number 3, pp. 209–212, Mar. 2013. [17] Zhou, W., A. C. Bovik, H. R. Sheikh, and E. P. Simoncelli. "Image Qualifty Assessment: From Error Visibility to Structural Similarity." IEEE Transactions on Image Processing. Vol. 13, Issue 4, pp. 600–612, Apr. 2004. [18] D. Martin, C. Fowlkes, D. Tal, and J. Malik. A database of human segmented natural images and its application to evaluating segmentation algorithms and measuring ecological statistics. In CVPR, pp. 416–423, 2001. [19] DRIVE database. Article (CrossRef Link). Giới thiệu tác giả: Tác giả Doãn Thanh Bình tốt nghiệp đại học ngành kỹ thuật điện tử năm 2008, nhận bằng Thạc sĩ năm 2010, nhận bằng Tiến sĩ ngành kỹ thuật điện tử năm 2018 tại Trường Đại học Bách khoa Hà Nội. Tác giả hiện đang công tác tại Phòng Khảo thí và Kiểm định chất lượng, Trường Đại học Điện lực. Lĩnh vực nghiên cứu: lý thuyết nghịch đảo suy rộng (generalized inverses), GSVD nhằm mô hình hóa, đánh giá các hệ thống MIMO; nghiên cứu các hệ thống thông tin trải phổ đa sóng mang (multi-carrier) áp dụng cho các hệ thống thông tin thế hệ tiếp theo. TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ NĂNG LƯỢNG - TRƯỜNG ĐẠI HỌC ĐIỆN LỰC (ISSN: 1859 - 4557) 61 Số 24 TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ NĂNG LƯỢNG - TRƯỜNG ĐẠI HỌC ĐIỆN LỰC (ISSN: 1859 - 4557) 62 Số 24
File đính kèm:
- sieu_phan_giai_dung_tri_tue_nhan_tao_nang_cao_chat_luong_anh.pdf