Tóm tắt:
Các bệnh lý tim mạch như rối loạn nhịp tim, đột quỵ tim thường được phát hiện trễ và là nguyên nhân gây tử vong hàng đầu. Tích hợp trí tuệ nhân tạo trong các thiết bị y tế đóng vai trò quan trọng trong việc phát hiện và chẩn đoán sớm bệnh. Trong nghiên cứu này, nhóm tác giả sử dụng mô hình các dấu hiệu bất thường Reservoir Computing nhằm tái lập tín hiệu điện tâm đồ và qua đó nhằm phát hiện của tim. Trong các mô hình tái lập dữ liệu chuỗi thời gian, mô hình Reservoir Computing có ưu điểm hơn các mạng nơ-ron truyền thống ở khả năng sử dụng dữ liệu ít nhưng vẫn cho độ chính xác cao. Nhóm tác giả huấn luyện mô hình trên tập dữ liệu MIT-BIH Arrhythmia Database. Kết quả huấn luyện cho thấy tiềm năng dự đoán tín hiệu điện tim trong khoảng thời gian ngắn.
Từ khóa: trí tuệ nhân tạo, mô hình Reservoir Computing, điện tâm đồ MIT-BIH Arrhythmia Database.
Điện tâm đồ (Electrocardiogram - ECG) là một công cụ hữu ích trong phân tích sức khỏe tim mạch [1, 13, 15]. Ứng dụng trí tuệ nhân tạo trong việc phát hiện và phân loại những dấu hiệu bất thường liên quan đến các bệnh về tim như: rối loạn tim, ngất đột ngột hoặc đột quỵ nhận được nhiều sự quan tâm của các nhà khoa học [3, 5-8, 11, 14]. Trong nghiên cứu [6], nhóm tác giả sử dụng kết hợp 2 thuật toán Trí tuệ nhân tạo là Support Vector Machine (SVM) và K-Nearest Neighbor (KNN) nhằm phân loại những tín hiệu bình thường và bất thường của điện tim. Bài báo đã đưa ra giải thuật giúp loại bỏ những tín hiệu nhiễu trong ECG và trích xuất những giá trị đặc trưng của tín hiệu phi tuyến đặc thù của điện tim. Mô hình của nhóm có khả năng phân loại với độ chính xác đến 99%. Trong khi đó, Hannun và đồng nghiệp đưa ra một mô hình trí tuệ nhân tạo khác dựa trên kỹ thuật học sâu (Deep Learning) [6, 7]. Mô hình này sử dụng tập dữ liệu lớn gồm 91,323 tín hiệu ECG của 53,549 bệnh nhân. Những nghiên cứu trên còn hạn chế do tín hiệu điện tim của bệnh nhân thường thay đổi trong những khoảng thời gian khác nhau. Do vậy, dựa vào những dấu hiệu bất thường của tim chỉ thông qua việc phân tích hình ảnh, cụ thể là hình ảnh ECG có thể dẫn đến việc sai sót trong phát hiện bệnh. Những năm gần đây, nhằm tăng mức độ chính xác trong việc chẩn đoán bệnh, các nhà khoa học ứng dụng trí tuệ nhân tạo nhằm tái lập mô hình ECG của bệnh nhân dựa vào dữ liệu được thu thập qua những khoảng thời gian khác nhau [3, 13-15]. Mạng nơ-ron hồi quy (Recurrent Neural Network) được nhiều nhà khoa học quan tâm và phát triển trong việc phân tích các tín hiệu phi tuyến như tín hiệu điện tâm đồ [9, 16]. Trong đó, mô hình Reservoir Computing - một dạng đặc thù của mạng nơ-ron hồi quy thường được sử dụng trong việc tái lập tín hiệu chuỗi thời gian. Mô hình này có ưu điểm có thể tái lập được mô hình chuỗi thời gian với mức độ chính xác cao nhưng sử dụng lượng dữ liệu không quá
lớn. Tuy nhiên, việc ứng dụng mô hình toán học này trong tái lập tín hiệu điện tâm đồ theo thời gian thực chưa nhận được nhiều quan tâm. Việc tái lập tín hiệu điện tâm đồ theo thời gian thực có nhiều ý nghĩa trong việc phát triển những thiết bị y khoa có thể kiểm soát tình trạng tim mạch thực tế của bệnh nhân.
Hình 1: Mô hình Reservoir Computing trong 2 quá trình gán nhãn và huấn luyện
Reservoir Computing (RC) là một mô hình đặc thù trong mạng nơ-ron hồi quy. Mô hình này thường được dùng trong việc tái lập quỹ đạo nghiệm các mô hình phi tuyến tính [5, 9, 10, 12, 14, 16-18]. Hình 1 mô tả cấu trúc tổng quát của mô hình. RC là mô hình học có giám sát, tức dữ liệu cần được gán nhãn trước khi được đưa vào huấn luyện mô hình [2]. Trong đó, tập dữ liệu ban đầu thường sẽ được chia làm 2 phần: Tập huấn luyện và Tập kiểm tra. Tuy nhiên, ưu điểm của mô hình RC là có thể vừa huấn luyện mô hình và vừa tạo tập dữ liệu. Tập dữ liệu mới có thể được xem là tập dữ liệu đã được "gán nhãn" như các mô hình học có giám sát truyền thống. Mô hình này gồm 2 quy trình riêng biệt như quan sát trong Hình 1a và Hình 1b.
Cấu trúc chi tiết của mô hình RC được mô tả như trong Hình 2. RC gồm 5 thành phần chính gồm: đầu vào x(t), khối Input-to-Reservoir, khối Reservoir, khối Reservoir -to-Output và đầu ra yˆ(t). Đầu vào x(t) được cho vào mạng thông qua khối Input-to-Reservoir. Trong khối này Winx(t) được kết hợp vào trạng thái Reservoir r(t) để tạo nên đầu ra Reservoir là r(t + ∆t) như bên dưới:
r(t + ∆t) = tanh[Ar(t) + Winx(t)] (1)
Trong đó, A và Win lần lượt là ma trận kề và ma trận trọng số đầu vào. Những giá trị này được chọn ngẫu nhiên từ ban đầu.
Hình 2: Cấu trúc tổng quát mô hình Reservoir Computing
Trạng thái Reservoir r(t + ∆t) được kết hợp với ma trận tham số được định nghĩa bởi P thông qua khối Reservoir-to-Output. Hơn nữa, Wout kết nối vector r(t + ∆t) với đầu ra yˆ(t) qua công thức:
yˆ(t) = Wout (r(t + ∆t), P) (2)
Tại đầu ra, mô hình nhận giá trị dự đoán yˆ(t), giá trị này càng gần giá trị thực y(t) sẽ thể hiện mô hình được thiết kế và huấn luyện tốt. Trong nghiên cứu này, nhóm tác giả sử dụng một lượng giới hạn dữ liệu là 10.000 giá trị của biến hệ thống làm Tập huấn luyện. Có 20.000 dữ liệu còn lại cho Tập kiểm tra nhằm kiểm chứng mức độ hiệu quả của mô hình.
Trong nghiên cứu này nhóm tác giả sử dụng tập dữ liệu MIT-BIH Arrhythmia Database nhằm phân tích và tái lập tín hiệu ECG [4]. Tập dữ liệu này gồm 47 tín hiệu ECG của người trưởng thành bao gồm cả bệnh nhân và người bình thường ở các độ tuổi khác nhau. Mỗi dữ liệu ghi nhận tín hiệu điện tim liên tục trong 48 giờ. Dữ liệu được lấy mẫu rời rạc với tốc độ lấy mẫu là 360 mẫu trong 1 giây. Tập dữ liệu gồm 2 kênh chính trong 12 chuyển đạo điện tâm đồ là kênh V 5 và V 2. Lưu ý rằng, tỉ lệ lấy mẫu là 360 sample/s và mỗi bệnh nhận được lấy mẫu liên tục trong 48 giờ. Do vậy, mỗi dữ liệu trong số 48 dữ liệu thuộc tập MIT-BIH Arrhythmia Database sẽ có khoảng 62.208.000 giá trị rời rạc đặc trưng cho tín hiệu xung điện của tim. Trong thí nghiệm thực tế, nhóm tác giả sử dụng 30.000 tín hiệu ECG, tương ứng với 80s cho việc huấn luyện mô hình RC. Tín hiệu ECG thực tế là những tín hiệu xung điện được đo bằng mV. Do vậy, để phù hợp trong huấn luyện mô hình trí tuệ nhân tạo nhóm tác giả chuẩn hóa dữ liệu về khoảng [ -1, 1].
Có 30.000 giá trị rời rạc của tín hiệu ECG sau khi được xử lý sẽ được đưa vào huấn luyện trong Hình 1a, những giá trị này được đưa vào x(t). Tại ngõ ra X (t), mô hình thu được 10000 giá trị đã học được những đặc tính cơ bản của hệ. Lưu ý rằng, giá trị X (t) và giá luyện mô hình RC. Trong đó, 10.000 giá trị sẽ đưa vào tập huấn luyện. Như mô tả trị x(t) được kết hợp để tính Wout được dùng trong phương trình 2. Có 20.000 giá trị còn lại từng giá trị trong 20.000 giá trị lần lượt được đưa vào mô hình qua Khối Input x(t). Theo phương trình 2, mô hình sẽ tính toán từng giá trị y(t) tương ứng. Giá trị thu được hồi được sử dụng để mô hình RC dự đoán giá trị ECG ở đầu ra. Như mô tả trong Hình 1b, quy vào ngõ vào và kết hợp với x(t) để tính toán giá trị tiếp theo tại yˆ(t + 1). Quá trình này lặp lại cho đến giá trị thứ 20.000. Như vậy, tại đầu ra của mô hình chúng ta thu được 20.000 giá trị bằng với số lượng giá trị đầu vào.
Giá trị huấn luyện và giá trị dự đoán cho 2000 tín hiệu đầu tiên được biểu diễn lần lượt bằng đường màu đen và xanh dương trên Hình 3. Trong kết quả mô phỏng này trạng thái Reservoir được xây dựng bởi đồ thị gồm 100 nốt điểm (Reservoir Size = 100) và giá trị riêng lớn nhất của ma trận nhận được từ đồ thị sẽ cố định (p = 0.4). Như chúng ta thấy trong Hình, tín hiệu dự đoán gần khớp với tín hiệu thực tế trong khoảng 100 giá trị đầu tiên. Sau đó, quỹ đạo dự đoán bắt đầu có sự sai khác và giảm dần về biên độ. Tuy nhiên, tín hiệu dự đoán vẫn giữ được quỹ đạo có tính chu kỳ.
Hình 3: Tín hiệu ECG thực tế (màu đen) và dự đoán (xanh dương) với Reservoir Size = 100, p = 0.4
Hình 4: Tín hiệu ECG thực tế (màu đen) và dự đoán (xanh dương) trong 50 tín hiệu đầu tiên với Reservoir Size 90, p = 0.4
Nhóm tác giả cũng khảo sát mức độ ảnh hưởng của số lượng nốt điểm (Reservoir Size) mô hình. Cụ thể như cố định p = 0.4 và thay đổi nhỏ về trạng thái Reservoir ở Reservoir trong trạng thái Reservoir và trị riêng lớn nhất của ma trận kề (p) đến giá trị đầu ra của Size=90 thì mức độ chính xác của mô hình rất thấp như quan sát trong Hình 4. Quỹ đạo Reservoir Size=100 và thay đổi p = 0.45 thì quỹ đạo dự đoán tách khỏi quỹ đạo thực tế dự đoán nhanh chóng tách khỏi quỹ đạo thực tế ở tín hiệu 50. Hình 5 nhóm tác giả cố định ở những tín hiệu đầu tiên.
Trong nghiên cứu này, nhóm tác giả sử dụng mô hình Reservoir Computing, một kỹ thuật mở rộng của mạng nơ-ron hồi quy trong lĩnh vực trí tuệ nhân tạo, nhằm tái lập tín hiệu điện tâm đồ. Nổi bật hơn các mạng nơ-ron hồi quy truyền thống, mô hình Reservoir Computing có ưu điểm chỉ sử dụng một lượng dữ liệu huấn luyện nhỏ. Tập dữ liệu điện tâm đồ dùng huấn luyện mô hình gồm 30.000 tín hiệu chọn lọc từ tập dữ liệu MIT-BIH Arrhythmia Database. Kết quả cho thấy mô hình dự đoán tốt cho khoảng 100 tín hiệu đầu tiên. Trong quá trình mô phỏng, khi thay đổi cấu trúc mạng về số lượng Reservoir Size và trị riêng lớn nhất của ma trận kề thì mô hình dự đoán sai quỹ đạo nghiệm ngay từ những giá trị đầu. Những thay đổi dù rất nhỏ các giá trị tham số này nhưng lại có ảnh hưởng rất lớn đến độ chính xác của mô hình. Trong tương lai, tác giả tập trung nghiên cứu các hướng sau: (Hình 5)
Hình 5: Tín hiệu ECG thực tế (màu đen) và dự đoán (xanh dương) trong 50 tín hiệu đầu tiên với Reservoir Size = 100, p = 0.4
Tài liệu tham khảo:
Using artificial intelligence to reconstruct electrocardiogram signals
Nguyen Thi Thu Hong1
Truong Quoc Tri2
1Faculty of Software Applications, FPT College Ho Chi Minh City
2Faculty of Mechanical - Electrical and Computer Engineering, Van Lang University
Abstract:
Cardiovascular diseases such as arrhythmia and myocardial infarction are often detected late, leading to mortality. Integrating artificial intelligence (AI) into medical devices is crucial for the early detection and diagnosis of these diseases. In this study, the Reservoir Computing model of abnormal signals is used to reconstruct electrocardiogram signals and detect heart abnormalities. Among time series data reconstruction models, the Reservoir Computing model has advantages over traditional neural networks as it uses less data but still has high accuracy. The model is trained on the MIT-BIH Arrhythmia Database. The training results demonstrate the potential for predicting cardiac electrical signals in a short time.
Keywords: artificial intelligence, Reservoir Computing model, electrocardiogram MIT-BIH Arrhythmia Database.
[Tạp chí Công Thương - Các kết quả nghiên cứu khoa học và ứng dụng công nghệ, Số 20 tháng 9 năm 2023]
(CHG) Ngày 14/11, tại Đà Nẵng, Cục kỹ thuật an toàn và Môi trường công nghiệp (Bộ Công Thương) phối hợp với Hiệp hội Công nghiệp môi trường Việt Nam tổ chức Hội nghị tập huấn “Nâng cao năng lực bảo vệ môi trường cho các cơ quan, doanh nghiệp khu vực miền Trung”.
Xem chi tiết(CHG) Ngày 14/11, Sở Công Thương phối hợp với Hiệp hội Doanh nghiệp dịch vụ Logistics Việt Nam tổ chức Diễn đàn “Khu thương mại tự do Đà Nẵng - Động lực mới phát triển ngành logistics thành phố Đà Nẵng”.
Xem chi tiết(CHG) Bộ Chỉ huy Bộ đội Biên phòng tỉnh Long An đã có tân Bí thư Đảng ủy, Chính ủy Bộ Chỉ huy BĐBP tỉnh.
Xem chi tiếtBài báo nghiên cứu "Xu hướng tiêu dùng xanh trong phát triển bền vững tại Việt Nam" do TS. Nguyễn Thị Hạnh (Khoa Kinh tế và Quản trị Kinh doanh, Trường Đại học Hải Phòng) thực hiện.
Xem chi tiếtĐề tài Tự chủ đại học và những vấn đề thực tiễn triển khai tại các trường đại học công lập trực thuộc Bộ Công Thương do TS. Nguyễn Đồng Anh Xuân (Trường Đại học Công nghiệp Hà Nội) thực hiện.
Xem chi tiết