Ứng dụng cây quyết định để xây dựng mô hình phối hợp nâng cao chất lượng nhận dạng tín hiệu điện tim

Tóm tắt

Nội dung chính của bài báo này là đề xuất giải pháp nâng cao chất lượng (độ chính xác) nhận dạng

tín hiệu điện tim ECG (ElectroCardioGraphy), dựa trên việc sử dụng cây quyết định nhị phân (Binary

Decision Tree) để phối hợp nhiều mô hình nhận dạng đơn là các mạng nơron kinh điển MLP (Multi

Layer Perceptron), mạng nơron logic mờ TSK (Takaga-Sugeno-Kang), máy học vectơ hỗ trợ SVM

(Support Vectơ Machines) và rừng ngẫu nhiên RF (Random Forest). Sử dụng các hàm cơ sở Hermite

(Hermite Basis Functions) để khai triển phức bộ QRS và hai đặc tính về thời gian là khoảng cách

giữa hai đỉnh R liên tiếp (R-R), giá trị trung bình của 10 khoảng cách R-R cuối cùng. Các thuật toán

đã được triển khai thử nghiệm trên các bộ mẫu số liệu kinh điển của quốc tế cơ sở dữ liệu MIT-BIH

(Massachusetts Institute of Technology, Boston’s Beth Israel Hospital) và cơ sở dữ liệu MGH từ trang

web

Từ khóa: Mạng nơron; MLP; TSK; SVM; hệ thống tích hợp; cây quyết định; chức năng cơ sở Hermite;

tín hiệu điện tâm đồ (ECG); IC FPAA; IC ARM.

Ứng dụng cây quyết định để xây dựng mô hình phối hợp nâng cao chất lượng nhận dạng tín hiệu điện tim trang 1

Trang 1

Ứng dụng cây quyết định để xây dựng mô hình phối hợp nâng cao chất lượng nhận dạng tín hiệu điện tim trang 2

Trang 2

Ứng dụng cây quyết định để xây dựng mô hình phối hợp nâng cao chất lượng nhận dạng tín hiệu điện tim trang 3

Trang 3

Ứng dụng cây quyết định để xây dựng mô hình phối hợp nâng cao chất lượng nhận dạng tín hiệu điện tim trang 4

Trang 4

Ứng dụng cây quyết định để xây dựng mô hình phối hợp nâng cao chất lượng nhận dạng tín hiệu điện tim trang 5

Trang 5

Ứng dụng cây quyết định để xây dựng mô hình phối hợp nâng cao chất lượng nhận dạng tín hiệu điện tim trang 6

Trang 6

Ứng dụng cây quyết định để xây dựng mô hình phối hợp nâng cao chất lượng nhận dạng tín hiệu điện tim trang 7

Trang 7

Ứng dụng cây quyết định để xây dựng mô hình phối hợp nâng cao chất lượng nhận dạng tín hiệu điện tim trang 8

Trang 8

pdf 8 trang baonam 10040
Bạn đang xem tài liệu "Ứng dụng cây quyết định để xây dựng mô hình phối hợp nâng cao chất lượng nhận dạng tín hiệu điện tim", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Ứng dụng cây quyết định để xây dựng mô hình phối hợp nâng cao chất lượng nhận dạng tín hiệu điện tim

Ứng dụng cây quyết định để xây dựng mô hình phối hợp nâng cao chất lượng nhận dạng tín hiệu điện tim
27
LIÊN NGÀNH ĐIỆN - ĐIỆN TỬ - TỰ ĐỘNG HÓA
Tạp chí Nghiên cứu khoa học, Trường Đại học Sao Đỏ, ISSN 1859-4190 Số 4 (67).2019
Ứng dụng cây quyết định để xây dựng mô hình phối hợp 
nâng cao chất lượng nhận dạng tín hiệu điện tim
Decision tree application to build a coordinated model to improve the 
quality of ECG signal recognition 
Đỗ Vĕn Đỉnh, Phạm Vĕn Kiên
Email: dodinh75@gmail.com 
Trường Đại học Sao Đỏ
Ngày nhận bài: 9/10/2019
Ngày nhận bài sửa sau phản biện: 23/12/2019
Ngày chấp nhận đĕng: 31/12/2019 
Tóm tắt
Nội dung chính của bài báo này là đề xuất giải pháp nâng cao chất lượng (độ chính xác) nhận dạng 
tín hiệu điện tim ECG (ElectroCardioGraphy), dựa trên việc sử dụng cây quyết định nhị phân (Binary 
Decision Tree) để phối hợp nhiều mô hình nhận dạng đơn là các mạng nơron kinh điển MLP (Multi 
Layer Perceptron), mạng nơron logic mờ TSK (Takaga-Sugeno-Kang), máy học vectơ hỗ trợ SVM 
(Support Vectơ Machines) và rừng ngẫu nhiên RF (Random Forest). Sử dụng các hàm cơ sở Hermite 
(Hermite Basis Functions) để khai triển phức bộ QRS và hai đặc tính về thời gian là khoảng cách 
giữa hai đỉnh R liên tiếp (R-R), giá trị trung bình của 10 khoảng cách R-R cuối cùng. Các thuật toán 
đã được triển khai thử nghiệm trên các bộ mẫu số liệu kinh điển của quốc tế cơ sở dữ liệu MIT-BIH 
(Massachusetts Institute of Technology, Boston’s Beth Israel Hospital) và cơ sở dữ liệu MGH từ trang 
web 
Từ khóa: Mạng nơron; MLP; TSK; SVM; hệ thống tích hợp; cây quyết định; chức nĕng cơ sở Hermite; 
tín hiệu điện tâm đồ (ECG); IC FPAA; IC ARM.
Abstract
The paper presents a solution to improve the accuracy of arrhythmia recognition based on the integration 
of multiple classifiers using the binary decision tree. The solution uses as the single classifiers the classical 
MLP (Multi Layer Perceptron), neuro-fuzzy TSK network (Takaga-Sugeno-Kang), SVM (Support Vectơ 
Machines) and RF (Random Forest). The Hermite basis functions were used to generate the feature 
vectơs together with 2 time-based features: the last R-R period and the average of last 10 R-R periods. 
The proposed solution was tested with ECG signals taken from 2 databases MIT-BIH (Massachusetts 
Institute of Technology, Boston’s Beth Israel Hospital) and MGH available at 
Keywords: Neural network; MLP; TSK; SVM; Integrated System; Decision Tree; Hermite Basis 
Functions; Electrocardiogram (ECG) Signals; IC FPAA; IC ARM.
Người phản biện: 1. PGS.TS. Trần Vệ Quốc
 2. PGS.TS. Bạch Long Giang
CÁC CHỮ VIẾT TẮT
ARM Advanced RISC Machine
DT Decision Tree
ECG ElectroCardioGram 
FN False Negative
FP False Positive
FPAA Field Programable Analog Arrays
IC Intergrated Circuit 
MIT-BIH MIT-BIH Arrhythmia Database
MGH/MF MGH/MF Waveform Database
MLP Multi Layer Perceptron Network
PC Personal Computer 
QRS QRS Complex
RF Random Forest
SD Secure Digital 
SVD Singular Value Decomposition
SVM Support Vectơ Machines
28
NGHIÊN CỨU KHOA HỌC
Tạp chí Nghiên cứu khoa học,Trường Đại học Sao Đỏ, ISSN 1859-4190 Số 4 (67).2019
1. ĐẶT VẤN ĐẾ
Tín hiệu điện tim ECG có độ biến đổi rất mạnh cả 
về hình dáng, biên độ ở các trường hợp bệnh lý. 
Tín hiệu cũng dễ bị ảnh hưởng bởi nhiễu từ bên 
ngoài, tình trạng sức khỏe hay tâm lý của bệnh 
nhân. Nên nhận dạng ECG là một trong những bài 
toán khó. Thực tế hiện nay có nhu cầu về thiết bị 
đo điện tim thông minh có chức nĕng nhận dạng 
tự động các trường hợp bệnh lý, yêu cầu giải pháp 
nhận dạng cần có độ chính xác cao và phân biệt 
được nhiều loại bệnh để có thể áp dụng cho nhiều 
đối tượng bệnh nhân,
Xuất phát từ những nhu cầu thực tế trên, mục tiêu 
đặt ra của bài báo này là đề xuất một giải pháp để 
nâng cao chất lượng nhận dạng tín hiệu điện tim 
(giảm số mẫu nhận dạng sai).
Hiện nay, đã có rất nhiều các giải pháp khác nhau 
để nâng cao chất lượng nhận dạng tín hiệu điện 
tim ECG được các tác giả trong nước và quốc tế 
nghiên cứu và công bố, như từ khâu thu thập, tiền 
xử lý, trích chọn đặc tính hay khối nhận dạng (phi 
tuyến). Đa số các giải pháp đều ở dạng “mô hình 
đơn”, một số ít các giải pháp ở dạng “mô hình phối 
hợp”. Như trong nghiên cứu [1], tác giả kết hợp 
hai mô hình đơn là SVM và PSO (Particles Swarm 
Optimization) kết quả thử nghiệm trên bộ cơ sở dữ 
liệu L MIT-BIH có độ chính xác tĕng khoảng 4% so 
với khi sử dụng SVM đơn lẻ, hay như trong công 
trình [4] tác giả kết hợp mạng logic mờ Fuzzy KNN 
(Fuzzy K Nearest Neighbors) và mạng MLP cho 
kết quả có độ chính xác được cải thiện từ 97,3% 
lên 98%.
Xu thế đang phát triển hiện nay là sử dụng các 
mô hình phối hợp để nhận dạng, nhất là các bài 
toán đòi hỏi độ nhận dạng có chính xác cao như 
nhận dạng tín hiệu điện tim ECG, mô hình sử dụng 
nhiều mô hình nhận dạng đơn để đưa ra các kết 
luận (có thể khác biệt) sau đó thêm một khâu xử 
lý nữa để tổng hợp lại các kết quả từ các mô hình 
nhận dạng đơn để đưa ra kết luận cuối cùng, một 
số ưu điểm của giải pháp “mô hình phối hợp”:
- Mỗi “mô hình đơn”  ... ng.
4. TRÍCH CHỌN ĐẶC TÍNH VÀ CƠ SỞ DỮ LIỆU 
TÍN HIỆU ĐIỆN TIM ECG
4.1. Trích chọn đặc tính tín hiệu điện tim 
Bài báo sử dụng các hàm cơ sở Hermite (Hermite 
Basis Functions) để khai triển các phức bộ QRS 
nhằm lấy các hệ số khai triển làm vectơ đặc trưng 
của tín hiệu. Ngoài ra ta còn sử dụng thêm hai 
đặc tính về thời gian: khoảng cách giữa hai đỉnh 
R liên tiếp, giá trị trung bình của 10 khoảng cách 
R-R cuối cùng. 
Hàm Hermite có công thức như sau:
Với ( )nH x là đa thức Hermite được định nghĩa ở 
dạng đệ quy:
Cho n ≥ 1 với 
Quan sát trên hình 6 ta có thể bậc của hàm 
Hermite càng cao thì tốc độ biến thiên của hàm 
càng lớn, hay nói cách khác hàm sẽ chứa nhiều 
thành phần bậc càng cao. Đồng thời dáng điệu 
của các hàm cũng khá tương đồng với hình dạng 
các thành phần cơ bản trong tín hiệu ECG. Đây 
chính là cơ sở của việc sử dụng hàm Hermite để 
phân tích tín hiệu điện tim ECG.
Hình 6. Đồ thị của hàm Hermite bậc n: 
a) n=0; b) n=1; c) n=3; d) n=10
Để biểu diễn tín hiệu điện tim s(t) theo N hàm 
Hermite đầu tiên như trong công thức (3), ta sử 
dụng phân tích theo các giá trị kỳ dị SVD (Singular 
Value Decomposition) để tìm nghiệm tối ưu của hệ 
phương trình bậc nhất có số phương trình nhiều 
hơn số ẩn, chi tiết có thể tìm hiểu trong [7, 8].
Hình 7. Xấp xỉ tín hiệu ECG bằng N hàm Hermite 
đầu tiên: a) N=5; b) N=10; c) N=12; d) N=16
Từ hình 7 ta có thể nhận thấy tín hiệu ECG và nhất 
là đoạn phức bộ QRS đã được xấp xỉ rất tốt khi 
sử dụng 16 hàm Hermite cơ sở đầu tiên, sai số tại 
các đỉnh Q, R và S nhỏ, trong hình 8 ta thấy ngay 
cả với các trường hợp bệnh lý, tín hiệu biến thiên 
 s(t)≈ c
i
i=0
N−1∑ ⋅ψi(t) (3)
𝜓𝜓!(𝑥𝑥) = (√𝜋𝜋 ⋅ 2! ⋅ 𝑛𝑛!)"#$𝑒𝑒"%!$ 𝐻𝐻!(𝑥𝑥) (1)
(2)𝐻𝐻!"#(𝑥𝑥) = 2𝑥𝑥 ⋅ 𝐻𝐻!(𝑥𝑥) − 2𝑛𝑛 ⋅ 𝐻𝐻!$#(𝑥𝑥) 
 0 1( ) 1; ( ) 2 .H x H x x∫ =
(a) (b)
(d)(c)
31
LIÊN NGÀNH ĐIỆN - ĐIỆN TỬ - TỰ ĐỘNG HÓA
Tạp chí Nghiên cứu khoa học, Trường Đại học Sao Đỏ, ISSN 1859-4190 Số 4 (67).2019
mạnh thì việc khai triển tới 16 hàm Hermite cơ sở 
đầu tiên vẫn khá tốt.
Hình 8. Hình ảnh xấp xỉ tín hiệu ECG bằng 16 hàm 
Hermite đầu tiên đối với một số loại nhịp tim khác
Tập hợp 16 các giá trị này được sử dụng để tạo 
thành vectơ đặc tính của tín hiệu điện tim. Ngoài 
ra sử dụng thêm hai đặc tính về thời gian: khoảng 
cách giữa hai đỉnh R liên tiếp R-R, giá trị trung 
bình của 10 khoảng cách R-R cuối cùng. Như vậy, 
vectơ đặc tính có 18 giá trị.
4.2. Cơ sở dữ liệu của tín hiệu điện tim ECG
a) Cơ sở dữ liệu MIT-BIH 
Bộ cơ sở dữ liệu tín hiệu điện tim ECG đầu tiên sử 
dụng trong bài báo là bộ cơ sở dữ liệu về chứng 
loạn nhịp tim nổi tiếng MIT BIH [2], lựa chọn lấy 
các bản ghi của 19 bệnh nhân (mã số trong cơ sở 
dữ liệu là 100, 105, 106, 109, 111, 114, 116, 118, 
119, 124, 200, 202, 207, 208, 209, 212, 214, 221 
và 222), phân loại 6 kiểu rối loạn nhịp tim được 
xem xét là: block nhánh trái (L), block nhánh phải 
(R), ngoại tâm thu nhĩ (A), ngoại tâm thu thất (V), 
rung thất (I) và tâm thất lỗi nhịp (E) và 1 kiểu nhịp 
bình thường (N). Số lượng chi tiết mẫu lấy từ bản 
ghi của 19 bệnh nhân được thống kê chi tiết trong 
bảng 1 và bảng 2 dưới đây:
Bảng 1. Bảng phân chia số lượng mẫu học và 
mẫu kiểm tra của 7 loại rối loạn nhịp tim từ CSDL 
MIT-BIH
Loại 
nhịp
Tổng số 
mẫu
Số mẫu 
học
Số mẫu 
kiểm tra
N 2000 1065 935
L 1200 639 561
R 1000 515 485
A 902 504 398
V 964 549 451
I 472 271 201
E 105 68 37
Tổng 6643 3611 3068
Bảng 2. Bảng phân chia số lượng mẫu học và mẫu 
kiểm tra của 2 loại nhịp
Loại nhịp Tổng số mẫu
Số mẫu 
học
Số mẫu 
kiểm tra
Normal 2000 1065 935
Abnormal 4643 2546 2133
Tổng 6643 3611 3068
b) Cơ sở dữ liệu MGH
Bộ cơ sở dữ liệu thứ hai là MGH [11], bộ CSDL 
này gồm có 250 bản ghi của tín hiệu ECG, thu 
thập từ 250 bệnh nhân tim mạch tại các phòng 
chĕm sóc đặc biệt, phòng mổ, phòng thí nghiệm 
thông tim,... tại Bệnh viện Đa khoa Massachusetts. 
Bài báo lựa chọn sử dụng các mẫu tín hiệu ECG 
của 20 bản ghi có mã số là: 029, 030, 058, 105, 
106, 107, 108, 110, 111, 114, 117, 119, 121, 123, 
124, 125, 128, 131, 137, 142, lấy ra tổng 4500 
mẫu với 3 loại nhịp: bình thường (N - Normal 
sinus rhythm), nhịp ngoại tâm thu thất (V - 
Premature ventricular contraction) và loạn nhịp 
trên thất (S - Supraventricular premature beat). Số 
lượng chi tiết số mẫu sử dụng được thống kê chi 
tiết trong bảng 3 và bảng 4 dưới đây.
Bảng 3. Bảng phân chia số lượng mẫu học và mẫu 
kiểm tra của 3 loại nhịp
Loại 
nhịp
Tổng số 
mẫu
Số mẫu 
học
Số mẫu 
kiểm tra
N 3000 1997 1003
S 750 502 248
V 750 501 249
Tổng 4500 3000 1500
Bảng 4. Bảng phân chia số lượng mẫu học và mẫu 
kiểm tra của 2 loại nhịp
Loại nhịp Tổng số mẫu
Số mẫu 
học
Số mẫu 
kiểm tra
Normal 3000 1997 1003
Abnormal 1500 1003 497
Tổng 4500 3000 1500
5. KẾT QUẢ TÍNH TOÁN
5.1. Kết quả thử nghiệm trên bộ cơ sở dữ liệu 
MIT-BIH
a) Nhận dạng 7 loại nhịp tim
Với bốn mô hình nhận dạng đơn MLP, SVM, TSK, 
RF trong bài báo, các thông số của các mô hình 
này được huấn luyện độc lập trên cùng một bộ dữ 
liệu học, có kết quả như sau:
- Đầu tiên, với cấu trúc của mô hình MLP có 1 
lớp ẩn, với 20 nơron, trong đó có 7 nơron đầu ra 
(tương ứng với 7 loại rối loạn nhịp tim). 
32
NGHIÊN CỨU KHOA HỌC
Tạp chí Nghiên cứu khoa học,Trường Đại học Sao Đỏ, ISSN 1859-4190 Số 4 (67).2019
- Còn đối với các thông số của mô hình SVM: với 
7 lớp và theo phương pháp 1 chọi 1 để tìm ra lớp 
chiến thắng trong mô hình SVM. Cho bộ mẫu có 7 
lớp nên nhóm tác giả phải xây dựng 21 mạng SVM 
đơn lẻ cho từng cặp tổ hợp 2 loại tín hiệu một lúc. 
- Cấu trúc của mạng TSK có 21 luật suy luận và 7 
kết quả đầu ra. 
- Cuối cùng mô hình RF có 100 cây quyết định, 
mỗi cây có tối đa 9 tầng, tổng hợp kết quả theo 
phương pháp bỏ phiếu theo đám đông.
Tất cả kết quả đầu ra từ các mô hình nhận dạng 
đơn trên sẽ được đẩy vào đầu vào cho Cây quyết 
định DT, và sẽ có thêm một quá trình học nữa để 
xây dựng các thông số cho Cây quyết định DT, kết 
quả cuối cùng của quá trình nhận dạng tín hiệu 
điện tim ECG là đầu ra của Cây quyết định DT. 
Đối với 4 mô hình nhận dạng đơn trên ta sẽ thử 
nghiệm các trường hợp tổng hợp kết quả từ 3 mô 
hình (có 4 khả nĕng phối hợp là MLP-TSK-SVM; 
MLP-TSK-RF; MLP-RF-SVM và RF-TSK-SVM) và 
có 1 mô hình phối hợp cả 4 mô hình đơn MLP-
SVM-TSK-R. Sử dụng chung một bộ dữ liệu mẫu 
để kiểm tra mô hình nhận dạng. Kết quả kiểm tra 
này sẽ được sử dụng để so sánh với kết quả của 
các nghiên cứu trước. Trong bảng 5 và hình 9 thể 
hiện kết quả sai số kiểm tra của 4 mô hình nhận 
dạng cơ sở MLP, TSK, SVM, RF và 4 mô hình 
phối hợp. Tất cả các mạng mô hình phân loại đầu 
tiên sẽ được huấn luyện trên cùng một bộ dữ liệu 
học và sau đó được kiểm tra trên một bộ dữ liệu 
kiểm tra khác.
Bảng 5. Kết quả nhận dạng 7 loại nhịp (CSDL 
MIT-BIH) bằng các mô hình đơn và các mô hình 
kết hợp
Hệ thống phân loại Sai số Sai số (%)
MLP 110 3,59
TSK 100 3,26
SVM 60 1,96
RF 70 2,28
MLP-TSK-SVM 38 1,24
MLP-TSK-RF 43 1,40
MLP-RF-SVM 40 1,30
RF-TSK-SVM 39 1,27
MLP-TSK-SVM-RF 37 1,21
Từ bảng 5 ta có thể thấy kết quả của các mô hình 
phối hợp sử dụng cây quyết định DT đã được cải 
thiện hơn so với kết quả của các mô hình nhận 
dạng đơn. Chất lượng của mô hình phối hợp phụ 
thuộc vào chất lượng của từng mô hình nhận dạng 
đơn và số lượng mô hình đơn, thông thường số 
lượng mô hình nhận dạng đơn càng lớn thì cho ra 
kết quả tổng hợp càng tin cậy hơn.
Hình 9. Đồ thị cột thể hiện số mẫu nhận dạng sai 
của các mô hình nhận dạng - bộ cơ sở dữ liệu 
MIT-BIH - phân loại 7 loại nhịp tim
b) Nhận dạng hai loại nhịp tim bình thường và 
bất thường
Thực hiện tương tự như đối với khi các mô hình 
nhận dạng 7 loại nhịp tim ở mục (a), ta xây 4 mô 
hình nhận dạng đơn MLP, SVM, TSK, RF và có kết 
quả như sau:
- Đầu tiên, với cấu trúc của mô hình MLP có 1 
lớp ẩn, với 20 nơron, trong đó có 2 nơron đầu ra 
(tương ứng với hai loại nhịp tim bình thường và 
bất thường).
- Còn đối với các thông số của mô hình SVM chỉ 
cần xây dựng với 1 lớp và theo phương pháp 1 
chọi 1 để phân loại hai loại nhịp tim bình thường 
và bất thường.
- Cấu trúc của mạng TSK có 18 luật suy luận và 2 
kết quả đầu ra. 
- Cuối cùng mô hình RF có 100 cây quyết định, 
mỗi cây có 9 tầng, tổng hợp kết quả theo phương 
pháp bỏ phiếu theo đám đông.
Bảng 6. Kết quả nhận dạng hai loại nhịp (CSDL MIT-
BIH) bằng các mô hình đơn và các mô hình kết hợp
Hệ thống phân loại Sai số Sai số (%)
MLP 39 1,27
TSK 41 1,34
SVM 26 0,85
RF 37 1,21
Tích hợp MLP-TSK-SVM 21 0,68
Tích hợp MLP-TSK-RF 22 0,72
Tích hợp MLP-RF-SVM 23 0,75
Tích hợp RF-TSK-SVM 16 0,52
Tích hợp MLP-TSK-SVM-RF 15 0,49
Từ bảng 6 ta có thể thấy đối với trường hợp phân 
loại hai loại nhịp tim bình thường và bất thường, ta 
cũng thu được kết quả của các mô hình phối hợp 
sử dụng cây quyết định DT cao hơn đáng kể so 
với kết quả của các mô hình nhận dạng đơn.
Số mẫu nhận dạng sai
33
LIÊN NGÀNH ĐIỆN - ĐIỆN TỬ - TỰ ĐỘNG HÓA
Tạp chí Nghiên cứu khoa học, Trường Đại học Sao Đỏ, ISSN 1859-4190 Số 4 (67).2019
Hình 10. Đồ thị cột thể hiện số mẫu nhận dạng sai 
của các mô hình nhận dạng - bộ CSDL MIT-BIH - 
phân loại hai loại nhịp tim bình thường và bất thường
5.2. Kết quả thử nghiệm trên bộ CSDL MGH
Để đánh giá thêm độ chính xác và tin cậy của mô 
hình nhận dạng phối hợp bằng Cây quyết định DT, 
bài báo thử nghiệm thêm với bộ CSDL MGH, và 
thu được các kết quả như trong bảng 7 và bảng 8.
Bảng 7. Kết quả nhận dạng ba loại nhịp (CSDL 
MGH/MF) bằng các mô hình đơn và các mô hình 
kết hợp 
Hệ thống phân loại Sai số Sai số (%)
MLP 66 4,40
TSK 73 4,87
SVM 32 2,13
RF 96 6,40
Tích hợp MLP-TSK-SVM 25 1,67
Tích hợp MLP-TSK-RF 30 2,00
Tích hợp MLP-RF-SVM 25 1,67
Tích hợp RF-TSK-SVM 25 1,67
Tích hợp MLP-TSK-SVM-RF 21 1,40
Hình 11. Đồ thị cột thế hiện số mẫu nhận dạng sai của 
các mô hình nhận dạng - bộ CSDL MGH - phân loại 
ba loại nhịp tim
Bảng 8. Kết quả nhận dạng hai loại nhịp (CSDL 
MGH/MF)
Hệ thống phân loại Sai số Sai số (%)
MLP 37 2,47
TSK 62 4,13
SVM 20 1,33
RF 78 5,20
Số mẫu nhận dạng sai
Số mẫu nhận dạng sai
Tích hợp MLP-TSK-SVM 17 1,13
Tích hợp MLP-TSK-RF 20 1,33
Tích hợp MLP-RF-SVM 19 1,27
Tích hợp RF-TSK-SVM 18 1,20
Tích hợp MLP-TSK-SVM-RF 15 1,00
Hình 12. Đồ thị cột thể hiện số mẫu nhận dạng sai 
của các mô hình nhận dạng - bộ CSDL MGH - phân 
loại hai loại nhịp tim bình thường và bất thường
5.3. Đánh giá kết quả
Từ các kết quả thử nghiệm trên, ta có một số đánh 
giá như sau: 
- Qua các kết quả thử nghiệm trên bộ cơ sở dữ liệu 
MIT-BIH và MGH/MF (là được các nhóm nghiên 
cứu quốc tế thường dùng để tham chiếu), bài báo 
đã minh chứng được giải pháp kết hợp song song 
nhiều mô hình nhận dạng cơ sở bằng Cây quyết 
định DT đã tiếp tục nâng cao chất lượng kết quả 
nhận dạng tín hiệu điện tim ECG. Sai số kiểm tra 
(số mẫu nhận dạng sai) của các mô hình kết hợp 
đều thấp hơn so với các mô hình nhận dạng cơ sở. 
- Riêng có một trường hợp bằng nhau - trong 
bảng 8, sai số của mô hình SVM và mô hình kết 
hợp MLP-TSK-RF có số mẫu nhận dạng sai là 20.
6. KẾT LUẬN 
Bài báo đã đề xuất được giải pháp nâng cao chất 
lượng nhận dạng tín hiệu điện tim ECG dựa trên 
việc sử dụng cây quyết định DT để phối hợp nhiều 
mô hình nhận dạng đơn. Các thuật toán đã phần 
nào được triển khai thử nghiệm trên các bộ mẫu 
số liệu kinh điển của quốc tế là MIT-BIH và MGH/
MF đã được các nhóm nghiên cứu quốc tế thường 
dùng để tham chiếu.
TÀI LIỆU THAM KHẢO
[1] Bazi F. and Melgani Y. (2008), Classification of 
electrocardiogram signals with support vectơ 
machines and particle swarm optimization, 
IEEE Transactions on Information Technology 
in Biomedicine, vol. 12(5), pp. 667- 677.
Số mẫu nhận dạng sai
34
NGHIÊN CỨU KHOA HỌC
Tạp chí Nghiên cứu khoa học,Trường Đại học Sao Đỏ, ISSN 1859-4190 Số 4 (67).2019
[2] G. và R. Mark Moody, (2001), The impact of 
the MIT-BIH Arrhythmia Database, IEEE Eng. 
in Medicine and Biology 20(3): 45-50.
[3] L. Breiman (2001), Random forests. Machine 
Learning, Vol. 45, pp.5-32.
[4] O. Castillo, E. Ramírez, J. Soria (2010), Hybrid 
System for Cardiac Arrhythmia Classification 
with Fuzzy K-Nearest Neighbors and Multi-
Layer Perceptrons combined by a Fuzzy 
Inference System, 2010 International Joint 
Conference on Neural Networks (IJCNN), pp. 
1-6.
[5] S.Osowski, L.Tran Hoai, T. Markiewicz (2006), 
Ensemble of neural networks for improved 
recognition and classification of arrhythmia. 
Metrology for a Sustainable Development 
September, Rio de Janeiro, Brazil, pp. 17-22.
[6] S.Osowski, T. Markiewicz, L. Tran Hoai (2008), 
Recognition and classification system of 
arrhythmia using ensemble of neural networks, 
Article in Measurement, Vol. 41, pp. 610-617.
[7] Trần Hoài Linh, Phạm Vĕn Nam, Vương Hoàng 
Nam (2014), Multiple neural network integration 
using a binary decision tree to improve the 
ECG signal recognition accuracy, International 
Journal of Applied Mathematics and Computer 
Science. Volume 24, Issue 3, pp. 647-655.
[8] Trần Hoài Linh, Phạm Vĕn Nam, Nguyễn 
Đức Thảo (2015), A hardware implementation 
of intelligent ECG classifier, COMPEL: The 
International Journal for Computation and 
Mathematics in Electrical and Electronic 
Engineering, vol. 34, Iss: 3, pp. 905-919.
[9] Trần Hoài Linh (2014), Mạng nơron và ứng 
dụng trong xử lý tín hiệu. Nhà xuất bản Bách 
Khoa Hà Nội.
[10] S.Osowski, T. Markiewicz, L. Tran Hoai (2008), 
Recognition and classification system of 
arrhythmia using ensemble of neural networks, 
Article in Measurement, Vol. 41, pp. 610-617.
[11]  
THÔNG TIN TÁC GIẢ
 Đỗ Vĕn Đỉnh
- Tóm tắt quá trình đào tạo, nghiên cứu (thời điểm tốt nghiệp và chương trình đào tạo, 
nghiên cứu):
+ Nĕm 1998: Tốt nghiệp Đại học chuyên ngành Tự động hóa, Trường Đại học Bách khoa 
Hà Nội
+ Nĕm 2005: Tốt nghiệp Thạc sĩ chuyên ngành Tự động hóa, Trường Đại học Bách khoa 
Hà Nội
+ Nĕm 2018: Tốt nghiệp Tiến sĩ chuyên ngành Điều khiển và Tự động hóa, Trường Đại 
học Bách khoa Hà Nội
- Công việc hiện tại: Giảng viên, cán bộ phòng Khoa học công nghệ và hợp tác quốc tế, 
Trường Đại học Sao Đỏ
 - Các nghiên cứu chính là ứng dụng trí tuệ nhân tạo trong các giải pháp đo lường, điều 
khiển và tự động hóa, các thiết bị đo thông minh
- Email: dodinh75@gmail.com
- Điện thoại: 0982586160
 Phạm Vĕn Kiên
- Tóm tắt quá trình đào tạo, nghiên cứu (thời điểm tốt nghiệp và chương trình đào tạo, 
nghiên cứu):
+ Nĕm 2002: Tốt nghiệp Đại học chuyên ngành Sư phạm kỹ thuật Tin học, Trường Đại 
học Bách khoa Hà Nội
+ Nĕm 2007: Tốt nghiệp Thạc sĩ chuyên ngành Giáo dục nghề nghiệp, Trường Đại học 
Bách khoa Hà Nội liên kết với trường TU Dresden (Đức)
- Công việc hiện tại: Giảng viên, Phó Trưởng Khoa, Trưởng Bộ môn Công nghệ thông tin, 
Khoa Điện tử - Tin học, Trường Đại học Sao Đỏ
- Các nghiên cứu chính: Giải pháp phần mềm, kỹ thuật nhận dạng, trí tuệ nhân tạo
- Điện thoại: 0986362233

File đính kèm:

  • pdfung_dung_cay_quyet_dinh_de_xay_dung_mo_hinh_phoi_hop_nang_ca.pdf