Phân đoạn ảnh và NCuts
Trong nhiều thập kỉ qua, nhiều công trình nghiên cứu khoa học đóng góp không ngừng trong
lĩnh vực thị giác máy tính nói chung cũng như nghiên cứu phân đoạn ảnh nói riêng. Trong đó, phân
đoạn ảnh là quá trình tiền xử lí quan trọng trong hầu hết các ứng dụng xử lí ảnh. Chúng tôi tóm tắt
và đánh giá các kĩ thuật phân đoạn ảnh và phân chia các kĩ thuật này thành các nhóm gồm: kĩ thuật
dựa trên phát hiện cạnh/biên, kĩ thuật phân ngưỡng, phương trình vi phân, phương pháp gom nhóm,
kĩ thuật dựa trên phân hoạch đồ thị. Tiếp theo, chúng tôi trình bày ưu điểm và khuyết điểm của thuật
toán Ncuts, là thuật toán kinh điển khá phổ biến trong phân đoạn ảnh dựa trên đồ thị. Thuật toán
Ncuts (Shi, & Malik, 2000) được đưa ra năm 2000 nhưng đã được áp dụng thành công và cho kết
quả tối ưu cho nhiều ứng dụng xử lí ảnh cũng như các ứng dụng khoa học kĩ thuật.
Trang 1
Trang 2
Trang 3
Trang 4
Trang 5
Trang 6
Trang 7
Trang 8
Trang 9
Trang 10
Tải về để xem bản đầy đủ
Tóm tắt nội dung tài liệu: Phân đoạn ảnh và NCuts
TẠP CHÍ KHOA HỌC HO CHI MINH CITY UNIVERSITY OF EDUCATION TRƯỜNG ĐẠI HỌC SƯ PHẠM TP HỒ CHÍ MINH JOURNAL OF SCIENCE Tập 18, Số 6 (2021): 1100-1112 Vol. 18, No. 6 (2021): 1100-1112 ISSN: 2734-9918 Website: Bài báo tổng quan* PHÂN ĐOẠN ẢNH VÀ NCUTS Trần Như Ý1, Nguyễn Viết Hưng2*, Nguyễn Quốc Huy3, Phạm Thế Bảo3 1Khoa Công nghệ thông tin, Trường Đại học Công nghiệp Thực phẩm Thành phố Hồ Chí Minh, Việt Nam 2Khoa Công nghệ thông tin, Trường Đại học Sư phạm Thành phố Hồ Chí Minh, Việt Nam 3Khoa Công nghệ thông tin, Trường Đại học Sài Gòn, Việt Nam *Tác giả liên hệ: Nguyễn Viết Hưng – Email: hungnv@hcmue.edu.vn Ngày nhận bài: 17-4-2021; ngày nhận bài sửa: 13-5-2021;ngày duyệt đăng: 10-6-2021 TÓM TẮT Trong nhiều thập kỉ qua, nhiều công trình nghiên cứu khoa học đóng góp không ngừng trong lĩnh vực thị giác máy tính nói chung cũng như nghiên cứu phân đoạn ảnh nói riêng. Trong đó, phân đoạn ảnh là quá trình tiền xử lí quan trọng trong hầu hết các ứng dụng xử lí ảnh. Chúng tôi tóm tắt và đánh giá các kĩ thuật phân đoạn ảnh và phân chia các kĩ thuật này thành các nhóm gồm: kĩ thuật dựa trên phát hiện cạnh/biên, kĩ thuật phân ngưỡng, phương trình vi phân, phương pháp gom nhóm, kĩ thuật dựa trên phân hoạch đồ thị. Tiếp theo, chúng tôi trình bày ưu điểm và khuyết điểm của thuật toán Ncuts, là thuật toán kinh điển khá phổ biến trong phân đoạn ảnh dựa trên đồ thị. Thuật toán Ncuts (Shi, & Malik, 2000) được đưa ra năm 2000 nhưng đã được áp dụng thành công và cho kết quả tối ưu cho nhiều ứng dụng xử lí ảnh cũng như các ứng dụng khoa học kĩ thuật. Từ khóa: eigenvalue; graph-cut; Ncuts 1. Bài toán phân đoạn ảnh Ảnh số ngày càng trở nên phổ biến và phong phú hơn, đặc biệt là có liên quan đến nhiều ứng dụng khoa học kĩ thuật. Ảnh số được xem là một trong những phương tiện quan trọng nhất trong việc truyền tải thông tin trong lĩnh vực thị giác máy tính. Việc hiểu các thông tin từ ảnh giúp thực hiện được nhiều nhiệm vụ trong các ứng dụng khoa học kĩ thuật như xác định các tế bào ung thư trong y khoa, xác định vị trí sân bay từ dữ liệu điều khiển cảm biến. Và mục tiêu cần thiết phải xác định các phân vùng hay các đối tượng trong ảnh để xử lí hay rút trích thông tin ở mức cao là rất quan trọng trong các quá trình xử lí ảnh và thị giác máy tính (Wang, Jensen, & Im, 2010; Wang, Kong, Lu, Qi, & Zhang, 2008; Guo, Ng, Goubran, Petersen, Piechnik, Neubauer, & Wright, 2020). Phân đoạn ảnh là quá trình phân chia ảnh thành các vùng không giao nhau hay các đối tượng như tập các điểm ảnh, hoặc vùng gồm các điểm ảnh có tính chất tương đồng nhau theo một tiêu chuẩn đồng nhất nào đó, ví dụ như màu sắc, cường độ, kết cấu, mức xám để từ Cite this article as: Tran Nhu Y, Nguyen Viet Hung, Nguyen Quoc Huy, & Pham The Bao (2021). Image Segmentation and Ncuts. Ho Chi Minh City University of Education Journal of Science, 18(6), 1100-1112. 1100 Tạp chí Khoa học Trường ĐHSP TPHCM Trần Như Ý và tgk đó xác định vị trí đối tượng và biên trong ảnh (Dass, Priyanka, & Devi, 2012). Đây là một trong những nhiệm vụ quan trọng nhất trong phân tích ảnh số tự động vì các kết quả của phân đoạn ảnh sẽ có ảnh hưởng cốt yếu đến tất cả các quá trình tiếp theo trong nhiều ứng dụng của xử lí ảnh và thị giác máy tính, như biểu diễn và mô tả đối tượng trong ảnh, xử lí nhận dạng đối tượng, phân loại ảnh, nén ảnh dựa trên đối tượng hay truy vấn ảnh dựa trên nội dung Trong lĩnh vực thị giác máy tính và xử lí ảnh, phân đoạn ảnh là một trong những công đoạn quan trọng và được quan tâm nghiên cứu rất nhiều do tính cần thiết trong nhiều ứng dụng. Quá trình phân đoạn ảnh số còn có nhiều đóng góp quan trọng trong nhiều lĩnh vực (Hoang, & Nguyen, 2018; Almotiri, Elleithy, & Elleithy, 2018; Jain, Prabhakar, Member, & Hong, 1999; Chandra, & Bajpai, 2019; Wang, Jensen, & Im, 2010; Wang, Kong, Lu, Qi, & Zhang, 2008; Dimauro, & Simone, 2020; Guo, Ng, Goubran, Petersen, Piechnik, Neubauer, & Wright, 2020) như y tế, viễn thám, dự báo thời tiết, các bài toán nhận dạng, các bài toán giao thông... 2. Các hướng tiếp cận Việc nghiên cứu phân đoạn ảnh đã có nhiều thành tựu và nhiều kĩ thuật phân đoạn ảnh được đưa ra. Tuy nhiên, không có một phương pháp nào là tốt nhất cho các loại ảnh khác nhau, cũng như không phải tất cả các phương pháp là tốt nhất cho một loại ảnh đặc trưng nào. Vì vậy, việc lựa chọn kĩ thuật phân đoạn ảnh nào đó còn dựa trên tính chất của ảnh và vấn đề cần giải quyết. Có nhiều cách để phân loại các kĩ thuật này, theo (Dass, Priyanka, & Devi, 2012; Misal, & Singh, 2013; Cheng, Jiang, Sun, & Wang, 2001) các kĩ thuật có thể phân loại. a. Hướng tiếp cận phát hiện cạnh/biên Kĩ thuật này dựa trên việc phát hiện các cạnh hay các điểm ảnh giữa các vùng khác nhau về mức độ biến đổi cường độ nhằm thành các biên giữa các vùng hay đối tượng (Zaitoun, & Aqel, 2015). Hai phương pháp phân đoạn dựa trên cạnh cơ bản là: lược đồ xám của ảnh và ... ượng kết nối đến tất cả các đỉnh trong đồ thị, công thức (1). 푡( , ) 푡( , ) (1) 푡( , ) = + 푠푠표 ( , ) 푠푠표 ( , ) Với 푠푠표 ( , ) = ∑ ∈ ,푣∈ 푤( , 푣) là tổng trọng lượng của các kết nối từ đỉnh trong A đến tất cả các đỉnh trong đồ thị. Đặt là vector có | | chiều, đại diện cho các phân vùng của đồ thị trong hai tập A và B. Ta có 푖 = 1 nếu đỉnh 푖 thuộc A và 푖 = −1 nếu đỉnh 푖 thuộc B. 푡( ) được định nghĩa như 푡( , ). Đặt (푖) = ∑푗(푖, 푗) là tổng các liên kết từ đỉnh 푖 tới tất cả các đỉnh còn lại. ∑ Nếu = 푖 ( ) và = 푖>0 푖, công thức (2) (Shi, & Malik, 2000), 푖 ∑ 푖<0 푖 1105 Tạp chí Khoa học Trường ĐHSP TPHCM Tập 18, Số 6 (2021): 1100-1112 ( − 푊) (2) min 푡( ) = min Với 푖 ∈ {1, − } và 1 = 0. Gọi là biến được tính theo công thức (3). 1 + 1 − (3) = − 2 2 Từ công thức (3), có thể thấy rằng 푖 = 1 nếu đỉnh 푖 thuộc A và 푖 = − nếu đỉnh 푖 thuộc B. Công thức (2) có thể được tối thiểu hóa bằng cách giải bài toán tìm trị riêng bằng phương trình (4). ( − 푊) = 휆 (4) Phương trình (4) có thể được viết lại thành (5). 1 1 1 − − (5) 2( − 푊) 2 = 휆 , với = 2 . Một số tính chất: 1 1 − − - 2( − 푊) 2 là ma trận các trục đường chéo đối xứng với các giá trị không âm, nghĩa là ma trận này có dạng bán xác định dương, vì vậy, ma trận chỉ có các trị riêng dương. 1 - 21 một vector riêng của phương trình (5) với trị riêng là 0. 1 1 − − - Vì ma trận 2( − 푊) 2 đối xứng, nên các vector riêng của nó trực giao với nhau. 1 − Cụ thể vector riêng của phương trình (5) ở trị riêng nhỏ thứ hai phải trực giao với 21 và 1 thỏa điều kiện 1 1 = 0 với 1 = 2 1. Theo định lí về Rayleigh quotient (Golub, & Loan, 2013), nếu A là một ma trận đối xứng thực, với điều kiện trực giao với 푗 − 1 vector riêng nhỏ nhất 1, , −1. Thương số được tối thiểu hóa bằng vector tương ứng với trị riêng nhỏ nhất 휆 . 푗 푗 Kết quả thu được công thức (6) và (7). 1 1 − − (6) 2( − 푊) 2 = . min 1 0=0 Do đó ( −푊) 1 (7) 1 = . min và 0 = 21 1=0 Tập các phần tử có thể được chia thành hai tập con, một tập chứa các phần tử mang giá trị dương trong vector riêng và tập còn lại chứa các phần tử có giá trị âm trong vector riêng. Cách chia này được lặp lại cho đến khi đặt được số nhóm cần phân đoạn. Nhóm tác giả J. Shi (Shi, & Malik, 2000). cho rằng, vector riêng của trị riêng nhỏ nhất thứ hai trong phương trình (5) xấp xỉ một lời giải tối ưu của bài toán tối thiểu hóa Ncuts, được mô tả thông qua công thức (8). 2 (8) ∑푖 ∑푗( (푖) − (푗)) 푤푖푗 inf 2 1=0 ∑푖 (푖) (푖) Cuối cùng, để phân vùng đồ thị, ta có thể đặt một ngưỡng trên vector riêng này để chia 1106 Tạp chí Khoa học Trường ĐHSP TPHCM Trần Như Ý và tgk đôi đồ thị và đệ qui theo kiểu two-way-cut (Shi, & Malik, 2000) để đạt kết quả. b. Thực nghiệm Chúng tôi thực nghiệm trên máy tính sử dụng hệ điều hành Windows 10 Pro bản 64bit, RAM 8 GB, Chip Intel Core (TM) 5i-3210M CPU @ 2.5GHz. Ngôn ngữ lập trình Matlab phiên bản R2016a. Kết quả thực nghiệm các phương pháp Prewitt, Roberts, Sobel, Laplacian of Gaussian, Ncuts nhằm phát hiện cạnh/biên đối tượng qua dữ liệu Hình 1, 2, 3, 4 được sử dụng nguồn tại (Zaitoun, & Aqel, 2015; Ganesan, & Sajiv, 2017). (a) (b) (c) (d) (e) (f) Hình 1. Kết quả phân đoạn cạnh ảnh võng mạc: (a) ảnh gốc, (b) Prewitt, (c) Roberts, (d) LoG, (e) Sobel, (f) NCuts (a) (b) (c) (d) (e) (f) Hình 2. Kết quả phân đoạn cạnh ảnh cameraman: (a) ảnh gốc, (b) Prewitt, (c) Roberts, (d) LoG, (e) Sobel, (f) NCuts 1107 Tạp chí Khoa học Trường ĐHSP TPHCM Tập 18, Số 6 (2021): 1100-1112 (a) (b) (c) (d) (e) (f) Hình 3. Kết quả phân đoạn cạnh ảnh củ quả: (a) ảnh gốc, (b) Prewitt, (c) Roberts, (d) LoG, (e) Sobel, (f) Ncuts (a) (b) (c) (d) (e) (f) Hình 4. Kết quả phân đoạn cạnh ảnh cổng đại học Bharathiar: (a) ảnh gốc, (b) Prewitt, (c) Roberts, (d) LoG, (e) Sobel, (f) NCuts Nhận xét: nhóm Hình 1, 2 dấu hiệu sai khác các đối tượng nhiều trong ảnh phương pháp Prewitt, Roberts, Sobel, Laplacian of Gaussian, Ncuts cho kết quả độ chính xác tốt. Nhóm Hình 3, 4 độ tương phản giữa các đối tượng sai khác không nhiều trong ảnh thì phương pháp Ncuts cho kết quả tốt nhất. c. Ứng dụng Phương pháp Ncuts (Dimauro, & Simone, 2020; Guo, Ng, Goubran, Petersen, Piechnik, Neubauer, & Wright, 2020) được sử dụng để tự động phân đoạn kết mạc mí mắt 1108 Tạp chí Khoa học Trường ĐHSP TPHCM Trần Như Ý và tgk cho phép chẩn đoán bệnh thiếu máu. Hay trong việc chăm sóc bệnh nhân lâm sàn liên quan đến tim mạch bằng ảnh MRI tim. Để tăng cường phân đoạn đa lớp MRI tim bằng cách kết hợp các điểm mạnh của CNN và phương pháp Ncuts phân đoạn cấu trúc tim. Ứng dụng (Wang, Lin, & Chen, 2019) phương pháp Ncuts để tự động phân đoạn hình ảnh sỏi. Với độ chính xác của phân đoạn cạnh so với phương pháp đo thủ công và phương pháp xử lí ảnh khác. Ứng dụng này có vai trò quan trọng trong nghiên cứu định lượng về sự phân bố cỡ hạt, có ý nghĩa lớn đối với địa chất, thủy văn và sinh thái học. 4. Kết luận Với ảnh có độ tương phản giữa các đối tượng sai khác không nhiều, thuật toán Ncuts cho kết quả tốt hơn so với các phương pháp gồm Prewitt, Roberts, LoG và Sobel. Tuy nhiên, thuật toán Ncuts cũng tồn tại những khuyết điểm: - Tập ảnh lớn thuật toán thực thi với tốc độ chậm, mất nhiều thời gian và chiếm nhiều bộ nhớ trong tính toán. - Vấn đề tìm số phân vùng cần phân vùng có thể chủ yếu còn dựa vào cảm tính trực quan, chưa có cơ sở lí thuyết để áp dụng chung. Chúng tôi nhận thấy quá trình phân đoạn ảnh bằng thuật toán Ncuts có hiệu suất thời gian còn thấp; Vì vậy, việc song song hóa thuật toán Ncuts trong quá trình tính toán ma trận sẽ cho phép tăng hiệu suất bài toán. Ngoài ra, chúng ta có thể sử dụng 1 số phương pháp gom cụm tìm số phân vùng cần phân vùng, thuật toán Ncuts có cơ sở để phân vùng ảnh tốt hơn. ❖ Tuyên bố về quyền lợi: Các tác giả xác nhận hoàn toàn không có xung đột về quyền lợi. TÀI LIỆU THAM KHẢO Almotiri, J., Elleithy, K., & Elleithy, A. (2018). Retinal Vessels Segmentation Techniques and Algorithms: A Survey. Applied Science, MDPI, 8(2). Bai, X., Zhang, Y., Liu, H., & Chen, Z. (2019). Similarity Measure-Based Possibilistic FCM with Label Information for Brain MRI Segmentation. IEEE Transactions on Cybernetics, 49, 2618-2630. Bejar, H. H. C., Guimaraes, S. J., & Miranda, P. A. V. (2020). Efficient hierarchical graph partitioning for image segmentation by optimum oriented cuts. Pattern Recognition Letters, 131, 185-192. Bezdek, J. C. (2013). Pattern Recognition with Fuzzy Objective Function Algorithms. Springer Science & Business Media. Chandra, S. K., & Bajpai, M. K. (2019). Mesh free alternate directional implicit method based three dimensional super-diffusive model for benign brain tumor segmentation. Computers & Mathematics with Applications, 77(12), 3212-3223. Cheng, H. D., Jiang, X. H., Sun, Y., & Wang, J. L. (2001). Color image segmentation: advances and prospects, Pattern Recognition, 34, 2259-2281. 1109 Tạp chí Khoa học Trường ĐHSP TPHCM Tập 18, Số 6 (2021): 1100-1112 Chen, Y., Zhang, H., Zheng, Y., Jeon, B., & Wu, Q. M. J. (2016). An improved anisotropic hierarchical fuzzy c-means method based on multivariate student t-distribution for brain MRI segmentation. Pattern Recognition, 60, 778-792. Dass, R., Priyanka, & Devi, S. (2012). Image Segmentation Techniques. International Journal on Electronics & Communication Technology, 3(1). Dhankhar, P., & Sahu, N. (2013). A Review and Research of Edge Detection Techniques for Image Segmentation. International Journal of Computer Science and Mobile Computing, 2(7), 86-92. Ding, Y., & Fu, X. (2016). Kernel-based fuzzy c-means clustering algorithm based on genetic algorithm. Neurocomputing, 188, 233-238. Dimauro, G., & Simone, L. (2020). Novel Biased Normalized Cuts Approach for the Automatic Segmentation of the Conjunctiva. MDPI Multidisciplinary Digital Publishing Institute, 9(6). Ganesan, P., & Sajiv, G. (2017). A comprehensive study of edge detection for image processing applications. International Conference on Innovations in Information, Embedded and Communication Systems (ICIIECS 2017), 2018, 1-6. Golub, G. H. & Loan, C. F. V., (2013). Matrix Computations. John Hopkins University Press. Guo, F., Ng, M., Goubran, M., Petersen, S. E., Piechnik, S. K., Neubauer, S., & Wright, G. (2020). Improving cardiac MRI convolutional neural network segmentation on small training datasets and dataset shift: A continuous kernel cut approach. Medical Image Analysis, 61. Hawas, A. R., Guo, Y., Du, C., Polat, K., & Ashour, A. S. (2020). OCE-NGC: A neutrosophic graph cut algorithm using optimized clustering estimation algorithm for dermoscopic skin lesion segmentation. Applied Soft Computing, 86. Hoang, N. D., & Nguyen, Q. L. (2018). Metaheuristic Optimized Edge Detection for Recognition of Concrete Wall Cracks: A Comparative Study on the Performances of Roberts, Prewitt, Canny, and Sobel Algorithms. Advances in Civil Engineering, 2018. Huang, H., Meng, F., Zhou, S., Jiang, F., & Manogaran, G. (2019). Brain Image Segmentation Based on FCM Clustering Algorithm and Rough Set. IEEE Access, 7, 12386-12396. Huttenlocher, D. P., & Felzenszwalb, P. F. (2004). Efficient graph based image segmetnation. International Journal of Computer Vision, 59(2), 167-181. Jain, A. K., Prabhakar, S., Member, S., & Hong, L. (1999). A Multichannel Approach to Fingerprint Classification. IEEE Transactions on Pattern Analysis and Machine Intelligence, 21(4), 348-359. Kamil, M. Y., & Salih, A. M. (2019). Mammography Images Segmentation via Fuzzy C-mean and K-mean. International Journal of Intelligent Engineering and Systems, 12(1). Khairuzzaman, A. K. M., & Chaudhury, S. (2017). Multilevel thresholding using grey wolf optimizer for image segmentation. Expert Systems with Applications, 86, 64-76. Kirti, & Bhatnagar, A. (2017). Image Segmentation Using Canny Edge Detection Technique. International Journal of Techno-Management Research, 4(4). Kouhi, A., Seyedarabi, H., & Aghagolzadeh, A. (2020). Robust FCM clustering algorithm with combined spatial constraint and membership matrix local information for brain MRI segmentation. Expert Systems with Applications, 146. Luo, S., Tai, X. Ch., Huo, L., Wang, Y., & Glowinski, R. (2019). Convex Shape Prior for Multi-object Segmentation Using a Single Level Set Function. Proceedings of the IEEE/CVF International Conference on Computer Vision (ICCV), 613-621. 1110 Tạp chí Khoa học Trường ĐHSP TPHCM Trần Như Ý và tgk Manic, K. S., Priya, R. K., & Rajinikanth, V. (2016). Image Multithresholding based on Kapur/Tsallis Entropy and Firefly Algorithm. Indian Journal of Science and Technology, 9(12). Misal, A., & Singh, M. (2013). A survey paper on various visual image segmentation techniques. International Journal of Computer Science and Management Research, 2. Ruthotto, L., & Haber, E. (2020). Deep Neural Networks Motivated by Partial Differential Equations. Journal of Mathematical Imaging and Vision, 62, 352-364. Senthilkumaran, N. & Rajesh, R. (2009). Edge Detection Techniques for Image Segmentation A Survey of Soft Computing Approaches. International Journal of Recent Trends in Engineering, 1(2). Sezgin, M., & Sankur, B. (2004). Survey over image thresholding techniques and quantitative performance evaluation. Journal of Electronic Imaging, 13(1), 146-165. Shi, J., & Malik, J. (2000). Normalized cuts and Image Segmentation. Pattern Analysis and Machine Intelligence. IEEE Trans., 22, 888-905. Wang, Z., Jensen, J. R., & Im, J. (2010). An automatic region-based image segmentation algorithm for remote sensing applications. Environmental Modelling & Software, 25, 1149-1165. Wang, J., Kong, J., Lu, Y., Qi, M., & Zhang, B. (2008). A modified FCM algorithm for MRI brain image segmentation using both local and non-local spatial constraints. Computerized Medical Imaging and Graphics, 8, 685-698. Wang, S., & Siskind, J. M. (2001). Image Segmentation with Minimum Mean Cut. IEEE International Conference on Computer Vision (ICCV 2001), 1, 517-524. Wang, C., Oda, M., Hayashi, Y., Yoshino, Y., Yamamoto, T., Frangi, A. F., & Mori, K. (2020). Tensor- cut: A tensor-based graph-cut blood vessel segmentation method and its application to renal artery segmentation. Medical Image Analysis, 60. Wang, S., & Siskind, J. M. (2003). Image Segmentation with Ratio Cut. Pattern Analysis and Machine Intelligence, IEEE Trans., 25(6), 675-690. Wang, C., Lin, X., & Chen, C. (2019). Gravel Image Auto-Segmentation Based on an Improved Normalized Cuts Algorithm. Journal of Applied Mathematics and Physics, 7(3). Weickert, J. (2001). Efficient image segmentation using partial differential equations and morphology. Pattern Recognition, 34(9), 1813-1824. Yang, X., Shen, X., Long, J., & Chen, H. (2012). An Improved Median-based Otsu Image Thresholding Algorithm. AASRI Procedia, 3, 468-473. Zaitoun, N. M., & Aqel, M. J. (2015). Survey on Image Segmentation Techniques. International Conference on Communication. Management and Information Technology (ICCMIT 2015), 797-806. Zhang, L., Zhang, D., & Peng, B. (2013). A survey of graph theoretical approaches to image segmentation. Pattern Recognition, 46(3), 1020-1038. Zhu, H., Zhang, J., Xu, G., & Deng, L. (2021). Tensor Field Graph-Cut for Image Segmentation: A Non-Convex Perspective. IEEE Transactions on Circuits and Systems for Video Technology, 31(3), 1103-1113. 1111 Tạp chí Khoa học Trường ĐHSP TPHCM Tập 18, Số 6 (2021): 1100-1112 IMAGE SEGMENTATION AND NCUTS Tran Nhu Y1, Nguyen Viet Hung2*, Nguyen Quoc Huy3, Pham The Bao3 1Faculty of Information Technology, Ho Chi Minh city, University of Food Industry, Vietnam 2Faculty of Information Technology, Ho Chi Minh city, University of Education, Vietnam 3Faculty of Information Technology, Saigon University, Vietnam *Corresponding author: Nguyen Viet Hung – Email: hungnv@hcmue.edu.vn Received: April 17, 2021; Revised: May 13, 2021; Accepted: June 10, 2021 ABSTRACT In the past decades, many studies have been conducted in computer vision and image segmentation. Image segmentation is the process of image preprocessing in most image processing applications. We summarize and evaluate image segmentation techniques and categorize them, including edge detection, thresholding, partial differential equation, clustering, and graph-based. Next, we present the pros and cons of the Ncuts algorithm, which is typical of graph-based image segmentation. The Ncuts algorithm was introduced in 2000 and showed optimal results for image processing and other applications. Keywords: eigenvalue; graph-cut; Ncuts 1112
File đính kèm:
- phan_doan_anh_va_ncuts.pdf