Luận Văn: Phát Hiện Tiếng Ngáy Dựa Trên Học Sâu - Ứng Dụng Công Nghệ AI

Tài liệu nghiên cứu Luận văn phát hiện tiếng ngáy dựa trên học sâu, tổng hợp lý thuyết và thực hành, cung cấp kiến thức chuyên sâu về .

Trường đại học

Học viện Công nghệ Bưu chính Viễn thông

Chuyên ngành

Hệ thống thông tin

Người đăng

Ẩn danh

Thể loại

luận văn thạc sĩ

2020

Phí lưu trữ

30 Point

Mục lục chi tiết

LỜI CAM ĐOAN

1. CHƯƠNG 1: TỔNG QUAN VỀ PHÁT HIỆN TIẾNG NGÁY

1.1. Bài toán phát hiện tiếng ngáy

1.2. Các bệnh lý liên quan đến tiếng ngáy

1.3. Phát biểu bài toán

1.4. Ý nghĩa bài toán

1.5. Các nghiên cứu liên quan

1.5.1. Thiết bị phát hiện tiếng ngáy

1.5.2. Mô hình học máy cổ điển trong phát hiện tiếng ngáy

1.5.3. Mô hình học sâu phát hiện tiếng ngáy

1.5.4. Đánh giá các nghiên cứu

1.6. Kết luận chương

2. CHƯƠNG 2: PHƯƠNG PHÁP PHÁT HIỆN VÀ THEO DÕI TIẾNG NGÁY

2.1. Phương pháp giải quyết bài toán

2.2. Xử lý âm thanh

2.2.1. Biến đổi Fourier (FT)

2.2.2. Biến đổi Fourier thời gian ngắn (STFT)

2.2.3. Phương pháp hệ số biểu diễn phổ của phổ (MFCC)

2.3. Mô hình học nông

2.3.1. Trích đặc trưng của âm thanh

2.3.2. Mô hình học máy SVM

2.3.3. Đánh giá mô hình học máy SVM

2.4. Mô hình CNN cho phát hiện tiếng ngáy

2.4.1. Kiến trúc mạng CNN

2.4.2. Tích chập trong mạng neural

2.4.3. Mô hình mạng CNN trong phát hiện tiếng ngáy

2.5. Mô hình LSTM cho phát hiện tiếng ngáy

2.5.1. Giới thiệu về mạng neural hồi quy

2.5.2. Hồi quy trong mạng neural và mô hình LSTM

2.5.3. Mô hình mạng LSTM trong phát hiện tiếng ngáy

2.6. Mô hình CNN-LSTM cho phát hiện tiếng ngáy

2.7. Kết luận chương

3. CHƯƠNG 3: THỬ NGHIỆM VÀ ĐÁNH GIÁ

3.1. Thu thập dữ liệu

3.2. Kết quả thử nghiệm

3.2.1. Kết quả học nông SVM

3.2.2. Kết quả của phương pháp CNN

3.2.3. Kết quả của phương pháp LSTM

3.2.4. Kết quả của phương pháp CNN-LSTM

3.3. Phân tích và đánh giá

3.4. Kết luận chương

DANH MỤC CÁC TÀI LIỆU THAM KHẢO

Tóm tắt

I. Tổng quan về phát hiện tiếng ngáy

Nghiên cứu về phát hiện tiếng ngáy đã trở thành một lĩnh vực quan trọng trong y học và công nghệ. Tiếng ngáy không chỉ là một hiện tượng phổ biến mà còn là dấu hiệu của nhiều bệnh lý nghiêm trọng như hội chứng ngưng thở khi ngủ (OSA). Việc phát hiện và phân tích tiếng ngáy có thể giúp chẩn đoán sớm các vấn đề sức khỏe, từ đó cải thiện chất lượng cuộc sống. Các nghiên cứu hiện tại đã chỉ ra rằng công nghệ hiện đại có thể được áp dụng để phát hiện tiếng ngáy một cách hiệu quả thông qua các phương pháp như machine learning và deep learning. Những công nghệ này cho phép xử lý và phân tích âm thanh một cách chính xác, từ đó đưa ra các giải pháp công nghệ hỗ trợ theo dõi sức khỏe người dùng.

1.1 Bài toán phát hiện tiếng ngáy

Bài toán phát hiện tiếng ngáy được định nghĩa là việc xác định sự hiện diện của tiếng ngáy trong một chuỗi âm thanh. Đầu vào của hệ thống là một chuỗi âm thanh, và đầu ra là thông tin về việc có tiếng ngáy hay không. Việc phát hiện này không chỉ đơn thuần là nhận diện âm thanh mà còn liên quan đến việc phân tích các đặc trưng âm thanh như biên độ và tần số. Các mô hình học sâu như CNN và LSTM đã được áp dụng để cải thiện độ chính xác trong việc phát hiện tiếng ngáy, cho thấy tiềm năng lớn trong việc ứng dụng công nghệ vào lĩnh vực y tế.

1.2 Các bệnh lý liên quan đến tiếng ngáy

Tiếng ngáy không chỉ là một hiện tượng bình thường mà còn có thể là dấu hiệu của nhiều bệnh lý nghiêm trọng. Nghiên cứu cho thấy rằng tiếng ngáy có liên quan đến các vấn đề sức khỏe như OSA, bệnh tim mạch và các rối loạn giấc ngủ khác. Tỷ lệ mắc OSA ở người trưởng thành khá cao, với khoảng 3-7% đàn ông và 2-5% phụ nữ bị ảnh hưởng. Việc phát hiện sớm tiếng ngáy có thể giúp chẩn đoán và điều trị kịp thời, từ đó giảm thiểu các rủi ro sức khỏe nghiêm trọng.

II. Phương pháp phát hiện và theo dõi tiếng ngáy

Phương pháp phát hiện tiếng ngáy bao gồm nhiều bước quan trọng, từ việc thu thập dữ liệu âm thanh đến xử lý và phân tích âm thanh. Các kỹ thuật như biến đổi Fourier và MFCC được sử dụng để trích xuất đặc trưng âm thanh, giúp cải thiện độ chính xác trong việc phát hiện tiếng ngáy. Mô hình học sâu như CNN và LSTM đã chứng minh hiệu quả trong việc phân loại âm thanh, cho phép phát hiện tiếng ngáy một cách chính xác hơn. Việc áp dụng công nghệ thông minh trong phát hiện tiếng ngáy không chỉ giúp nâng cao chất lượng giấc ngủ mà còn hỗ trợ theo dõi sức khỏe người dùng một cách hiệu quả.

2.1 Xử lý âm thanh

Xử lý âm thanh là bước đầu tiên trong việc phát hiện tiếng ngáy. Các phương pháp như biến đổi Fourier và biến đổi Fourier thời gian ngắn (STFT) được sử dụng để phân tích tín hiệu âm thanh. MFCC là một kỹ thuật phổ biến để trích xuất đặc trưng âm thanh, giúp nhận diện các đặc điểm quan trọng của tiếng ngáy. Việc xử lý âm thanh chính xác là yếu tố quyết định đến hiệu quả của các mô hình học sâu trong việc phát hiện tiếng ngáy.

2.2 Mô hình học sâu cho phát hiện tiếng ngáy

Mô hình học sâu như CNN và LSTM đã được áp dụng để phát hiện tiếng ngáy với độ chính xác cao. CNN giúp nhận diện các đặc trưng không gian trong âm thanh, trong khi LSTM có khả năng xử lý các chuỗi thời gian, cho phép theo dõi sự thay đổi của âm thanh theo thời gian. Việc kết hợp các mô hình này tạo ra một hệ thống mạnh mẽ trong việc phát hiện và phân loại tiếng ngáy, từ đó cung cấp thông tin hữu ích cho người dùng về tình trạng sức khỏe của họ.

III. Thử nghiệm và đánh giá

Thử nghiệm và đánh giá là bước quan trọng để xác định hiệu quả của các mô hình phát hiện tiếng ngáy. Các kết quả thử nghiệm cho thấy rằng mô hình học sâu có thể đạt được độ chính xác cao trong việc phát hiện tiếng ngáy. Việc thu thập dữ liệu từ nhiều nguồn khác nhau giúp cải thiện khả năng tổng quát của mô hình. Đánh giá mô hình không chỉ dựa trên độ chính xác mà còn cần xem xét đến khả năng xử lý thời gian thực và tính khả thi trong ứng dụng thực tế.

3.1 Kết quả thử nghiệm

Kết quả thử nghiệm cho thấy rằng mô hình CNN-LSTM đạt được độ chính xác cao nhất trong việc phát hiện tiếng ngáy. Các mô hình khác như SVM và CNN cũng cho kết quả khả quan, nhưng không bằng mô hình kết hợp. Việc sử dụng dữ liệu đa dạng từ nhiều nguồn khác nhau đã giúp cải thiện độ chính xác và khả năng tổng quát của mô hình. Điều này cho thấy tiềm năng lớn của công nghệ học sâu trong việc phát hiện tiếng ngáy.

3.2 Phân tích và đánh giá

Phân tích và đánh giá kết quả thử nghiệm là bước quan trọng để xác định hiệu quả của các mô hình. Các chỉ số như độ chính xác, độ nhạy và độ đặc hiệu được sử dụng để đánh giá hiệu suất của mô hình. Kết quả cho thấy rằng mô hình học sâu không chỉ có khả năng phát hiện tiếng ngáy mà còn có thể phân loại các loại âm thanh khác nhau, từ đó cung cấp thông tin hữu ích cho người dùng về tình trạng sức khỏe của họ.

13/02/2025

Bạn đang xem trước tài liệu:

Luận văn phát hiện tiếng ngáy dựa trên học sâu

Tải đầy đủ

Nội dung chính

Tổng quan nghiên cứu

Phát hiện tiếng ngáy là một bài toán quan trọng trong lĩnh vực y tế và công nghệ thông tin, đặc biệt liên quan đến chất lượng giấc ngủ và các bệnh lý hô hấp như hội chứng ngưng thở khi ngủ do tắc nghẽn (OSA). Theo Hiệp hội Y học Giấc ngủ Hoa Kỳ (AASM), tỷ lệ ngáy ngủ dao động từ 2% đến 85% trong dân số, với khoảng 3-7% đàn ông trung niên và 2-5% phụ nữ trung niên mắc OSA. Tiếng ngáy không chỉ ảnh hưởng đến chất lượng giấc ngủ mà còn là dấu hiệu cảnh báo các bệnh tim mạch và mạch máu não. Do đó, việc phát hiện và phân loại tiếng ngáy chính xác có ý nghĩa lớn trong việc theo dõi sức khỏe và phòng ngừa các bệnh lý liên quan.

Mục tiêu nghiên cứu của luận văn là phát triển phương pháp phát hiện tiếng ngáy dựa trên học sâu, sử dụng các mô hình mạng neural tích chập (CNN), mạng hồi quy dài ngắn hạn (LSTM) và mô hình kết hợp CNN-LSTM. Nghiên cứu tập trung vào việc xử lý dữ liệu âm thanh tiếng ngáy thu thập từ người Việt Nam, nhằm đánh giá đặc trưng âm thanh và hiệu quả của các mô hình học sâu trong phát hiện tiếng ngáy. Phạm vi nghiên cứu bao gồm dữ liệu thu thập và xử lý tại Việt Nam trong giai đoạn gần đây, với mục tiêu cải thiện độ chính xác phát hiện và ứng dụng trong các thiết bị theo dõi sức khỏe cá nhân.

Nghiên cứu có ý nghĩa thực tiễn cao khi góp phần phát triển các hệ thống giám sát giấc ngủ tự động, hỗ trợ cảnh báo sớm các rối loạn giấc ngủ, từ đó nâng cao chất lượng cuộc sống và sức khỏe cộng đồng. Các chỉ số đánh giá như độ chính xác mô hình, tỷ lệ phát hiện đúng tiếng ngáy và khả năng ứng dụng trong thiết bị di động là các metrics quan trọng được tập trung phân tích.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên hai khung lý thuyết chính: lý thuyết xử lý tín hiệu âm thanh và mô hình học sâu trong trí tuệ nhân tạo.

Xử lý tín hiệu âm thanh: Sử dụng các phương pháp biến đổi Fourier (FT), biến đổi Fourier thời gian ngắn (STFT) và hệ số biểu diễn phổ của phổ (MFCC) để trích xuất đặc trưng âm thanh. MFCC là kỹ thuật chuyển đổi phổ âm thanh sang thang Mel, phản ánh tốt hơn sự nhạy cảm của tai người, giúp mô hình học sâu nhận dạng đặc trưng âm thanh tiếng ngáy hiệu quả.
Mô hình học sâu: Áp dụng các kiến trúc mạng neural tích chập (CNN) để trích xuất đặc trưng không gian từ ảnh phổ âm thanh, mạng hồi quy dài ngắn hạn (LSTM) để xử lý chuỗi thời gian và mô hình kết hợp CNN-LSTM nhằm tận dụng ưu điểm của cả hai mô hình. Các khái niệm chính bao gồm:
- CNN: Tích chập, pooling, lớp fully-connected, tính bất biến vị trí.
- LSTM: Bộ nhớ dài hạn, xử lý chuỗi dữ liệu âm thanh theo thời gian.
- CNN-LSTM: Kết hợp trích xuất đặc trưng không gian và phân tích chuỗi thời gian.

Phương pháp nghiên cứu

Nguồn dữ liệu được thu thập từ các bản ghi âm tiếng ngáy của người Việt Nam, với cỡ mẫu khoảng 90% dữ liệu dùng để huấn luyện và 10% để kiểm thử, áp dụng phương pháp cross-validation để đảm bảo tính khách quan và độ tin cậy của kết quả. Dữ liệu âm thanh được tiền xử lý loại bỏ đoạn không có âm thanh, sau đó trích xuất đặc trưng MFCC với kích thước đầu vào 193x1.

Phương pháp phân tích bao gồm:

Mô hình học nông SVM để so sánh hiệu quả.
Mô hình CNN với 4 lớp tích chập, mỗi lớp có số lượng filter và kích thước patch cụ thể.
Mô hình LSTM gồm hai lớp LSTM và một lớp hồi quy đa thức.
Mô hình CNN-LSTM kết hợp CNN để trích xuất đặc trưng và LSTM để phân tích chuỗi thời gian.

Quá trình nghiên cứu được thực hiện theo timeline từ thu thập dữ liệu, tiền xử lý, huấn luyện mô hình, kiểm thử và đánh giá kết quả. Môi trường thực nghiệm sử dụng Google Colab với các công cụ học sâu phổ biến.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

Hiệu quả mô hình học sâu vượt trội so với học máy truyền thống: Mô hình CNN-LSTM đạt độ chính xác cao nhất, khoảng 95%, trong khi mô hình SVM chỉ đạt khoảng 86%. Mô hình CNN và LSTM riêng lẻ đạt lần lượt khoảng 90% và 92%.
Đặc trưng MFCC phù hợp cho phát hiện tiếng ngáy: Việc sử dụng ảnh phổ MFCC giúp mô hình CNN trích xuất đặc trưng hiệu quả, thể hiện qua việc tăng độ chính xác phân loại lên khoảng 4-5% so với sử dụng sóng âm thô.
Mô hình kết hợp CNN-LSTM tận dụng ưu điểm của cả hai mô hình: CNN trích xuất đặc trưng không gian, LSTM xử lý chuỗi thời gian, giúp mô hình nhận dạng tiếng ngáy chính xác hơn, đặc biệt với các đoạn âm thanh dài và phức tạp.
Phân tích thời gian huấn luyện và độ phức tạp mô hình: Mô hình CNN-LSTM có thời gian huấn luyện lâu hơn khoảng 20% so với CNN hoặc LSTM riêng lẻ, nhưng đổi lại là độ chính xác và khả năng tổng quát hóa tốt hơn.

Thảo luận kết quả

Nguyên nhân chính của sự vượt trội mô hình học sâu là khả năng tự động học đặc trưng từ dữ liệu, giảm thiểu sự phụ thuộc vào kiến thức chuyên gia trong trích chọn đặc trưng. Kết quả phù hợp với các nghiên cứu quốc tế về phát hiện tiếng ngáy và nhận dạng âm thanh, đồng thời khẳng định tính khả thi của việc áp dụng học sâu trong lĩnh vực y tế giấc ngủ.

Biểu đồ so sánh độ chính xác các mô hình (SVM, CNN, LSTM, CNN-LSTM) minh họa rõ sự cải thiện đáng kể khi sử dụng mô hình kết hợp. Bảng thống kê chi tiết kết quả thử nghiệm cũng cho thấy sự ổn định của mô hình CNN-LSTM trên các tập dữ liệu kiểm thử.

Kết quả nghiên cứu có ý nghĩa quan trọng trong việc phát triển các thiết bị theo dõi giấc ngủ thông minh, giúp phát hiện sớm các dấu hiệu rối loạn giấc ngủ và hỗ trợ điều trị kịp thời.

Đề xuất và khuyến nghị

Phát triển ứng dụng di động tích hợp mô hình CNN-LSTM: Triển khai mô hình trên nền tảng điện thoại thông minh để theo dõi tiếng ngáy thời gian thực, hướng tới mục tiêu giảm thiểu chi phí và tăng tính tiện dụng. Thời gian thực hiện dự kiến trong 12 tháng, do các nhóm phát triển phần mềm và chuyên gia y tế phối hợp thực hiện.
Mở rộng bộ dữ liệu tiếng ngáy đa dạng: Thu thập thêm dữ liệu từ nhiều nhóm tuổi, giới tính và vùng miền khác nhau tại Việt Nam để nâng cao độ chính xác và khả năng tổng quát của mô hình. Dự kiến thực hiện trong 18 tháng với sự hỗ trợ của các bệnh viện và trung tâm nghiên cứu.
Tối ưu hóa mô hình để giảm thời gian huấn luyện và yêu cầu phần cứng: Nghiên cứu áp dụng các kỹ thuật giảm chiều dữ liệu, pruning mô hình và chuyển đổi mô hình sang dạng nhẹ (lightweight) để phù hợp với thiết bị di động. Thời gian thực hiện khoảng 6 tháng, do nhóm kỹ thuật AI đảm nhiệm.
Phát triển hệ thống cảnh báo sớm dựa trên phân tích tiếng ngáy: Kết hợp phát hiện tiếng ngáy với các chỉ số sinh học khác để xây dựng hệ thống cảnh báo nguy cơ mắc OSA và các bệnh liên quan. Thời gian thực hiện 12 tháng, phối hợp giữa chuyên gia y tế và kỹ thuật.

Đối tượng nên tham khảo luận văn

Nhà nghiên cứu và sinh viên ngành công nghệ thông tin, trí tuệ nhân tạo: Nghiên cứu các phương pháp học sâu ứng dụng trong xử lý tín hiệu âm thanh và phát hiện tiếng ngáy, từ đó phát triển các đề tài liên quan.
Chuyên gia y tế và bác sĩ chuyên khoa giấc ngủ: Áp dụng kết quả nghiên cứu để hiểu rõ hơn về đặc trưng âm thanh tiếng ngáy, hỗ trợ chẩn đoán và theo dõi bệnh nhân mắc các rối loạn giấc ngủ.
Nhà phát triển thiết bị y tế và ứng dụng sức khỏe thông minh: Tận dụng mô hình phát hiện tiếng ngáy để tích hợp vào các sản phẩm theo dõi sức khỏe cá nhân, nâng cao tính năng và độ chính xác.
Các tổ chức nghiên cứu và doanh nghiệp công nghệ: Khai thác kết quả để phát triển các giải pháp giám sát sức khỏe dựa trên IoT và trí tuệ nhân tạo, mở rộng ứng dụng trong lĩnh vực chăm sóc sức khỏe cộng đồng.

Câu hỏi thường gặp

Phát hiện tiếng ngáy dựa trên học sâu có ưu điểm gì so với phương pháp truyền thống?
Học sâu tự động trích xuất đặc trưng từ dữ liệu, giảm thiểu sự phụ thuộc vào kiến thức chuyên gia, cho độ chính xác cao hơn (khoảng 95% với CNN-LSTM so với 86% của SVM). Ví dụ, mô hình CNN-LSTM kết hợp xử lý không gian và thời gian giúp nhận dạng tiếng ngáy hiệu quả hơn.
Dữ liệu tiếng ngáy được thu thập như thế nào và có đảm bảo đa dạng không?
Dữ liệu thu thập từ người Việt Nam với nhiều nhóm tuổi và giới tính, chiếm khoảng 90% dùng để huấn luyện và 10% để kiểm thử. Việc mở rộng dữ liệu đa dạng hơn được đề xuất để nâng cao khả năng tổng quát của mô hình.
Mô hình CNN-LSTM có thể áp dụng trên thiết bị di động không?
Có thể, tuy nhiên cần tối ưu hóa mô hình để giảm kích thước và thời gian xử lý. Việc này đang được nghiên cứu để triển khai ứng dụng theo dõi tiếng ngáy trên điện thoại thông minh.
MFCC là gì và tại sao được sử dụng trong phát hiện tiếng ngáy?
MFCC là hệ số biểu diễn phổ của phổ âm thanh, phản ánh đặc trưng tần số theo thang Mel phù hợp với thính giác con người. MFCC giúp mô hình học sâu nhận dạng đặc trưng âm thanh tiếng ngáy chính xác hơn so với sử dụng sóng âm thô.
Các mô hình học sâu có thể phát hiện được nguyên nhân gây tiếng ngáy không?
Hiện tại mô hình chủ yếu phân loại tiếng ngáy và không phải tiếng ngáy. Tuy nhiên, với dữ liệu và nhãn phù hợp, mô hình có thể được mở rộng để phân loại các nguồn rung động khác nhau gây ra tiếng ngáy như biểu mô, vách bên hầu họng, lưỡi và màng khẩu.

Kết luận

Luận văn đã phát triển thành công mô hình phát hiện tiếng ngáy dựa trên học sâu, trong đó mô hình CNN-LSTM đạt độ chính xác cao nhất khoảng 95%.
Phương pháp trích xuất đặc trưng MFCC kết hợp với mạng neural tích chập và hồi quy dài ngắn hạn giúp nhận dạng tiếng ngáy hiệu quả trên dữ liệu tiếng ngáy người Việt Nam.
Kết quả nghiên cứu có ý nghĩa thực tiễn trong phát triển các thiết bị theo dõi giấc ngủ và hỗ trợ y tế, góp phần nâng cao chất lượng cuộc sống.
Đề xuất mở rộng dữ liệu, tối ưu mô hình và phát triển ứng dụng di động để tăng tính ứng dụng và khả năng phổ biến.
Các bước tiếp theo bao gồm triển khai ứng dụng thực tế, mở rộng nghiên cứu phân loại nguyên nhân tiếng ngáy và tích hợp hệ thống cảnh báo sớm.

Mời các nhà nghiên cứu, chuyên gia y tế và doanh nghiệp công nghệ quan tâm hợp tác phát triển các giải pháp ứng dụng từ kết quả nghiên cứu này nhằm nâng cao sức khỏe cộng đồng.

Trích đoạn nội dung tài liệu

CHƯƠNG 1: TỔNG QUAN VỀ PHÁT HIỆN TIẾNG NGÁY Nội dung chương này sẽ bao gồm giới thiệu chung về bài toán phát hiện tiếng ngáy, những khó khăn và ý nghĩa của bài toán này. Chương này cũng trình bày về các nghiên cứu liên quan với các vấn đề về phát hiện âm thanh, nghiên cứu về học máy cũng như học sâu .Từ những cơ sở nghiên cứu này sẽ xác định rõ hướng nghiên cứu của luận văn.1 Bài toán phát hiện tiếng ngáy Theo nghiên cứu “Giá trị của sự tỉnh táo: ảnh hưởng của do hạn chế giấc ngủ mãn tính và thiếu ngủ hoàn toàn đối với các chức năng thần kinh và sinh lý” [10] đã nhận xét giấc ngủ là hoạt động hồi phục cho não, ngủ không đủ giấc làm giảm động lực cho các hoạt động thể chất, tăng cân, béo phì và các rốt loạn liên quan khác. Do đó, có nhiều nghiên cứu đã được thực hiện để cải thiện chất lượng giấc ngủ và phân loại giai đoạn giấc ngủ có thể mọi người có thể áp dụng vào thực tế từ đó cải thiện chất lượng cuộc sống. Theo Hiệp hội Y học Giấc ngủ Hoa Kỳ (AASM) đã đưa ra nguyên nhân chính của việc rối loạn giấc ngủ ngon là ngáy.

Ngáy thường được mô tả là một âm thanh thô và rung trong khi ngủ do sự tắc nghẽn một phần của trong hầu họng. Tỷ lệ ngáy ngủ thay đổi từ 2% đến 85%. Ngáy đơn giản có thể là khởi đầu của chứng rối loạn giấc ngủ mãn tính (SDB), bao gồm từ sự co hẹp đường thở một phần và tăng nhẹ sự cản đường thở trên đến sự sụp đổ đường thở hoàn toàn và ngưng thở khi ngủ do tắc nghẽn nghiêm trọng (OSA) kéo dài từ 60 giây trở lên. Có bằng chứng tích lũy rằng ngáy có liên quan đến một số vấn đề sức khỏe, bao gồm buồn ngủ, bệnh tim mạch, hội chứng chuyển hóa (MetS) và tử vong do các nguyên nhân khác nhau.1 Các bệnh lý liên quan đến tiếng ngáy Ngáy ngày càng được công nhận là mối quan tâm về sức khỏe cộng đồng.

Đây là một vấn đề phổ biến ở người lớn và là dấu hiệu của hội chứng ngưng thở khi ngủ do tắc nghẽn (OSA). Một số nghiên cứu về y tế đã chỉ ra các yếu tố liên quan chính 4 đến ngáy dựa trên nghiên cứu đó là lão hóa, giới tính nam, tăng huyết áp, buồn ngủ ban ngày, hút thuốc và huyết thống. Các nghiên cứu đã mô tả điều này ở hầu hết các nước phát triển và một số nước đang phát triển như Hàn Quốc, Trung Quốc. đã chỉ ra những khác biệt phụ thuộc vào yếu tố liên quan này.

Cho đến nay vẫn chưa có nghiên cứu nào được công bố về chủ đề này riêng cho người ở Việt Nam. Việc thực hiện nghiên cứu với dữ liệu tiếng ngáy thu thập từ người Việt Nam có sẽ thấy được đặc trưng sự khác biệt với dữ liệu các nước phát triển qua đó có thể so sánh đánh giá từ những sự khác biệt. Bên cạnh tác động tới chất lượng giấc ngủ của con người thì ngáy cũng có dấu hiệu của chứng ngưng thở (OSA) sau khi mất ngủ, tỷ lệ mắc bệnh rối loạn giấc ngủ cao nhất, ảnh hưởng đến khoảng 3 - 7% đàn ông trung niên và 2-5% phụ nữ trung niên trong dân số nói chung. OSA được đặc trưng bởi các đợt lặp đi lặp lại của sự khó khăn một phần hoặc hoàn toàn của đường hô hấp trên trong khi ngủ, gây ra sự trao đổi khí bị suy yếu và rối loạn giấc ngủ.1: Mô tả về đường đi của không khí khi ngủ Là một tình trạng mãn tính gây ra do tắc nghẽn đường hô hấp trên trong khi ngủ, OSA có thể dẫn đến tăng nguy cơ mắc các bệnh về tim mạch và mạch máu não.

Một phần không thể thiếu trong điều trị thành công là định vị vị trí tắc nghẽn và rung như trên Hình 1. Ngoài ra, tiếng ngáy cần được xác định bốn nguồn rung động khác nhau từ các mẫu ngáy âm thanh: biểu mô, vách bên hầu họng, lưỡi và màng khẩu. Các đặc trưng của âm thanh tiếng ngáy của con người thì được đặc trưng qua biên 5 độ, tần số và các sóng con thông qua các đặc trưng này có thể tạo nên các ảnh phổ của âm thanh, miêu tả các đặc trưng cơ bản nhất của âm thanh.2 Phát biểu bài toán Với sự liên kết chặt chẽ của tiếng ngáy tới sức khỏe của con người thì cần thiết phải chọn ra tiếng ngáy với tần số tiếng ngáy và thời gian diễn ra tiếng ngáy trong khi ngủ. Ý tưởng của luận văn sẽ đi vào giải quyết bài toán phát hiện (âm thanh) tiếng ngáy với: Đầu vào: Một chuỗi âm thanh Đầu ra: Phát hiện âm thanh là tiếng ngáy hay không Hình 1.

Bài toán phát hiện tiếng ngáy Như ví dụ tại hình 1.2, với đầu vào là “chuỗi âm thanh” hệ thống sẽ đưa ra được trong chuỗi âm thanh đó có tiếng ngáy hay không không phải tiếng ngáy, hay một nhóm các âm thanh vào thì hệ thống sẽ phát hiện được có bao nhiêu âm thanh trong đó là tiếng ngáy. Trong bài toán này có các vấn đề cơ bản cần được quan tâm chú ý như: xác định được đầu vào của hệ thống sẽ là các đặc trưng của chuỗi âm thanh hay là toàn bộ của cả chuỗi âm thanh hoặc một loại biểu diễn thông tin khác, với các dữ liệu đầu vào trên thì các cách xử lý của hệ thống thông qua các phương pháp học sâu.để có thể đưa ra thông tin đầu ra sau khi xử lý âm thanh là thuộc lớp tiếng ngáy hay không phải là tiếng ngáy.3 Ý nghĩa bài toán Dựa vào kết quả của luận văn “Phát hiện tiếng ngáy dựa trên học sâu” thì sẽ có được cái nhìn tổng quan về các đặc trưng âm thanh phù hợp với việc phát hiện âm thanh, đặc biệt là tiếng ngáy, các mô hình học sâu, những ưu điểm của các mô hình này so với các thuật toán học nông khác. Từ kết quả của bài toán này có thể giải quyết vấn đề cơ bản trong việc thực hiện sản xuất các thiết bị cải thiện sức khỏe của người sử dụng, theo dõi các vấn đề sức khỏe, đưa ra các cảnh báo sớm thông qua sự thay đổi tiếng ngáy.2 Các nghiên cứu liên quan Việc theo dõi và cải thiện sức khỏe của con người đang ngày càng trở nên cấp thiết, việc phát hiện tiếng ngáy đang được quan tâm rất nhiều trong các cộng đồng nghiên cứu cả về y tế và kỹ thuật. Các nghiên cứu về y tế chỉ ra rằng trong lâm sàng thì tiếng ngáy đặc trưng cho sức khỏe của con người, tiếng ngáy được tạo ra khi dòng khí đi qua các vị trí trên bộ phận hô hấp.

Điều này mang tới thách thức làm thế nào để xây dựng ra được hệ thống mà có thể phát hiện, theo dõi, phân tích và đo lường tiếng ngáy có độ chính xác cao. Trong thời đại số mà lượng thông tin cũng như khả năng xử lý khổng lồ của máy tính thì việc tạo ra một hệ thống như thế hoàn toàn khả thi. Các bài toán của hệ thống đang dần được được thực hiện, kế thừa, cải tiến từ các nghiên cứu trước đó. Bài toán “Phát hiện tiếng ngáy dựa trên học sâu” cũng vậy được phát triển dựa trên các nghiên cứu liên quan sau.1 Thiết bị phát hiện tiếng ngáy Trước đây, các nghiên cứu về phát hiện, phân loại âm nhạc là đề tài thu hút sự quan tâm của cộng đồng nghiên cứu và các cuộc thi về học máy, đây chính là tiền đề cho sự mở rộng của phát hiện và phân lớp các loại âm thanh đặc thù hơn, như nhận dạng bài hát hay phân lớp các âm thanh theo các ngữ cảnh khác nhau.

Và cũng theo sự phát triển đó thì nghiên cứu “Ngáy: phân tích, đo lường, ý nghĩa lâm sàng và ứng 7 dụng”[13] đã nói rằng: “Tiếng ngáy bắt nguồn từ đường hô hấp trên, hoạt động như một ống có thể đóng, mở và có xu hướng đóng lại trong giai đoạn hô hấp. Ngáy là một dấu hiệu quan trọng của rốt loạn hô hấp liên quan tới giấc ngủ, cũng như là một triệu chứng của tắc nghẽn mũi và có liên quan tới csc bệnh tim mạch và hen suyễn về đêm như là một yếu tố gây ra hoặc yếu tố gây bệnh được thể hiện qua âm thanh của tiếng ngáy ” Đây là một nghiên cứu cho thấy sự quan tâm, tính cấp bách của các ứng dụng hỗ trợ cho con người và đặc biệt là sức khỏe. Từ các công trình nghiên cứu về công nghệ lõi thì các sản phẩm áp dụng từ các bài toán gốc này ngày một phát triển hơn. Với các ứng dụng áp dụng vào thực tiễn thì đang được cải tiến như trong ứng dụng tạo ra sản phẩm theo dõi tiếng ngáy với điện thoại thông minh[12] và sản phẩm áp dụng được mô phỏng với mô hình sử dụng như sau: Hình 1.

Mô hình theo dõi tiếng ngáy với thiết bị điện thoại thông minh 8 Mô hình theo dõi tiếng ngáy với điện thoại thông minh được thiết kế thành một mô hình hoàn chỉnh với việc thu nhận âm thanh từ điện thoại thông minh, xử lý, nhận biết được nội dung quan tâm và qua đó có thể phát hiện, kiểm soát chất lượng giấc ngủ với tiếng ngáy người sử dụng. Phân tích có tần số cao hơn 80Hz xảy ra ở bệnh nhân mắc OSA. Sản phẩm sử dụng điện thoại thông minh được thực hiện thì các sản phẩm cải tiến theo phương hướng gọn nhẹ, dễ sử dụng cũng được phát triển lên, đại diện là các thiết bị có khả năng đeo trên người sử dụng[16], sau đây là mô hình của hệ thống Hình 1. Mô hình theo dõi tiếng ngáy với các thiết bị đeo bên người Sự cải tiến về mặt thiết bị thu nhận bên trong hệ thống dần dần được thân thiện với người sử dụng, nhưng về nguyên lý thì vẫn thông qua nhận dạng âm thanh, các âm thanh đầu vào dạng sóng thì sẽ được xử lý và trích các đặc trưng cơ bản của âm thanh, tùy từng bài toán mà các đặc trưng sẽ sự khác biệt với nhau.

Sóng âm thanh tiếng ngáy và khi theo dõi đặc trưng Hình trên là một đề xuất của nghiên cứu [16] khi sử dụng việc theo dõi đặc trưng âm thanh với MFCC, các sóng âm thô sau khi thu nhận được thì sẽ được chuyển về dạng cửa sổ MFCC từ đó tìm ra được quy luật và phát hiện ra tiếng ngáy.

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ

Tài liệu "Phát Hiện Tiếng Ngáy Bằng Học Sâu: Giải Pháp Công Nghệ Hiện Đại" giới thiệu một phương pháp tiên tiến sử dụng học sâu (deep learning) để phát hiện tiếng ngáy, một vấn đề phổ biến liên quan đến sức khỏe giấc ngủ. Bằng cách áp dụng các mô hình AI, giải pháp này không chỉ cải thiện độ chính xác trong việc nhận diện tiếng ngáy mà còn mở ra hướng đi mới trong việc theo dõi và chẩn đoán các rối loạn giấc ngủ. Đây là một bước tiến quan trọng trong lĩnh vực y tế thông minh, giúp người dùng dễ dàng tiếp cận các công cụ chăm sóc sức khỏe tại nhà.

Để hiểu rõ hơn về ứng dụng của học sâu trong các lĩnh vực y tế và giám sát sức khỏe, bạn có thể khám phá thêm qua tài liệu Luận văn thạc sĩ thiết kế bộ thiết bị IoT nhỏ gọn dán ngực theo dõi nhịp tim và cảm biến té ngã có tích hợp AI, nơi AI được tích hợp để phân tích và cảnh báo sớm các vấn đề sức khỏe. Ngoài ra, tài liệu Đồ án HCMUTE ứng dụng xử lý ảnh và AI để nhận biết bệnh viêm phổi ở trẻ em cũng cung cấp góc nhìn sâu hơn về cách AI được sử dụng trong chẩn đoán bệnh lý. Cuối cùng, Đồ án HCMUTE hệ thống ứng dụng Wear OS trong việc hỗ trợ người già sẽ giúp bạn hiểu rõ hơn về việc tích hợp công nghệ vào các giải pháp chăm sóc sức khỏe.

Những tài liệu này không chỉ mở rộng kiến thức về AI và học sâu mà còn giúp bạn khám phá các ứng dụng thực tế trong lĩnh vực y tế và chăm sóc sức khỏe.

#công nghệ AI

#công nghệ y tế

#giải pháp công nghệ

#phát hiện tiếng ngáy

#chẩn đoán giấc ngủ

Chủ đề

Học sâu và machine learning

Ứng dụng AI trong y tế

Công nghệ và sức khỏe

Chẩn đoán và điều trị rối loạn giấc ngủ