Số Hóa Phiếu Xét Nghiệm Sử Dụng Kỹ Thuật Trí Tuệ Nhân Tạo

Chuyên khảo kỹ thuật phân tích Số hóa phiếu xét nghiệm sử dụng kỹ thuật trí tuệ nhân tạo, đánh giá các khía cạnh quan trọng, đề xuất hướng nghiên cứu tiếp theo.

Trường đại học

Trường Đại Học Công Nghiệp Thành Phố Hồ Chí Minh

Chuyên ngành

Khoa Học Máy Tính

Người đăng

Ẩn danh

Thể loại

Luận Văn Thạc Sĩ

2022

Phí lưu trữ

30 Point

Mục lục chi tiết

LỜI CẢM ƠN

TÓM TẮT LUẬN VĂN THẠC SĨ

LỜI CAM ĐOAN

1. MỞ ĐẦU

1.1. Mục tiêu nghiên cứu

1.2. Mục tiêu nghiên cứu tổng quát

1.3. Mục tiêu nghiên cứu cụ thể

1.4. Đối tượng và phạm vi nghiên cứu

1.5. Phạm vi nghiên cứu

1.6. Cách tiếp cận và phương pháp nghiên cứu

1.6.1. Cách tiếp cận

1.6.2. Thời gian nghiên cứu

1.6.3. Địa điểm nghiên cứu

1.6.4. Vật liệu nghiên cứu

1.6.5. Phương pháp

1.7. Ý nghĩa thực tiễn của đề tài

2. TỔNG QUAN VỀ LĨNH VỰC NGHIÊN CỨU

2.1. Tổng quan về đề tài

2.2. Khó khăn thách thức

2.3. Đề xuất hướng giải quyết

2.3.1. Nhận dạng đối tượng, nhận dạng ký tự OCR

2.3.1.1. Nhận dạng đối tượng

2.3.1.2. Các khái niệm, phương pháp tiền xử lý dữ liệu

2.3.1.2.1. Các phiên bản YOLO

2.3.1.2.2. Kiến trúc YOLOv4

2.3.1.2.3. So sánh với các mô hình khác

2.3.1.3. Kiến trúc CTPN

2.3.1.4. So sánh với các phương pháp khác

2.3.1.5. Kiến trúc Transformer OCR

2.3.2. Luận văn thạc sĩ “Đề tài Trí tuệ nhân tạo trong chuyển đổi số: ứng dụng hỗ trợ thu thập chỉ số đường huyết của thai phụ” của học viên Nguyễn Phạm Thanh Tâm

3. PHƯƠNG PHÁP ĐỀ XUẤT

3.1. Mô hình tổng quát

3.2. Thu thập dữ liệu

3.2.1. Tập dữ liệu phiếu xét nghiệm

3.2.2. Tập dữ liệu cho phát hiện văn bản

3.2.3. Tập dữ liệu cho OCR

3.3. Các bước xây dựng phương pháp

3.3.1. Phát hiện đối tượng trên phiếu xét nghiệm

3.3.2. Sử dụng CTPN phát hiện vùng chứa văn bản trên ảnh

3.3.3. Sử dụng Transformer OCR trích xuất văn bản

3.3.4. Quy trình thực nghiệm

4. THỰC NGHIỆM ĐÁNH GIÁ KẾT QUẢ

4.1. Phát hiện đối tượng trên phiếu xét nghiệm bằng YOLOv4

4.2. Phát hiện ảnh chứa văn bản bằng CTPN

4.3. Nhận dạng ký tự tiếng việt bằng Transformer OCR

TÀI LIỆU THAM KHẢO

LÝ LỊCH TRÍCH NGANG CỦA HỌC VIÊN

Tóm tắt

I. Tổng quan về Số Hóa Phiếu Xét Nghiệm Bằng Kỹ Thuật Trí Tuệ Nhân Tạo

Số hóa phiếu xét nghiệm là một trong những xu hướng quan trọng trong ngành y tế hiện đại. Việc áp dụng công nghệ Trí tuệ nhân tạo (AI) vào quy trình này không chỉ giúp nâng cao hiệu quả quản lý dữ liệu mà còn cải thiện chất lượng dịch vụ y tế. Số hóa giúp dễ dàng truy cập, chia sẻ và bảo quản thông tin bệnh nhân, đồng thời giảm thiểu rủi ro mất mát dữ liệu. Nghiên cứu này sẽ đi sâu vào các phương pháp và công nghệ hiện có để thực hiện số hóa phiếu xét nghiệm.

1.1. Lợi ích của Số Hóa Dữ Liệu Y Tế

Số hóa dữ liệu y tế mang lại nhiều lợi ích như tiết kiệm thời gian, giảm thiểu sai sót trong nhập liệu và nâng cao khả năng truy xuất thông tin. Việc lưu trữ dữ liệu dưới dạng số giúp bảo vệ thông tin khỏi mất mát và dễ dàng chia sẻ giữa các cơ sở y tế.

1.2. Vai trò của AI trong Số Hóa Dữ Liệu

AI đóng vai trò quan trọng trong việc tự động hóa quy trình số hóa. Các thuật toán như YOLO và CTPN giúp nhận diện và trích xuất thông tin từ phiếu xét nghiệm một cách chính xác và nhanh chóng, từ đó giảm tải công việc cho nhân viên y tế.

II. Thách Thức Trong Việc Số Hóa Phiếu Xét Nghiệm

Mặc dù số hóa phiếu xét nghiệm mang lại nhiều lợi ích, nhưng vẫn tồn tại nhiều thách thức cần phải vượt qua. Các vấn đề như chất lượng hình ảnh, độ chính xác của thuật toán và bảo mật thông tin là những yếu tố quan trọng cần được xem xét. Việc thu thập dữ liệu mẫu cũng gặp khó khăn do tính nhạy cảm của thông tin y tế.

2.1. Vấn Đề Chất Lượng Hình Ảnh

Chất lượng hình ảnh phiếu xét nghiệm ảnh hưởng trực tiếp đến khả năng nhận diện của các thuật toán AI. Hình ảnh mờ, không rõ nét có thể dẫn đến sai sót trong quá trình trích xuất thông tin.

2.2. Bảo Mật Thông Tin Y Tế

Bảo mật thông tin là một trong những thách thức lớn nhất trong việc số hóa dữ liệu y tế. Cần có các biện pháp bảo vệ thông tin cá nhân của bệnh nhân để tránh rò rỉ và lạm dụng dữ liệu.

III. Phương Pháp Số Hóa Phiếu Xét Nghiệm Hiệu Quả

Để thực hiện số hóa phiếu xét nghiệm một cách hiệu quả, cần áp dụng các phương pháp hiện đại như YOLOv4 và CTPN. Những công nghệ này cho phép nhận diện đối tượng và trích xuất văn bản từ hình ảnh một cách chính xác. Quy trình này bao gồm nhiều bước từ thu thập dữ liệu đến xử lý và lưu trữ thông tin.

3.1. Sử Dụng YOLOv4 Để Nhận Diện Đối Tượng

YOLOv4 là một trong những thuật toán tiên tiến nhất hiện nay cho việc nhận diện đối tượng. Nó cho phép phát hiện nhanh chóng và chính xác các thông tin cần thiết trên phiếu xét nghiệm, từ đó hỗ trợ quá trình số hóa.

3.2. Trích Xuất Văn Bản Bằng CTPN

CTPN là một phương pháp hiệu quả để trích xuất văn bản từ hình ảnh. Bằng cách sử dụng mạng nơ-ron, CTPN giúp nhận diện và chuyển đổi thông tin từ hình ảnh thành văn bản số, phục vụ cho việc lưu trữ và phân tích.

IV. Ứng Dụng Thực Tiễn Của Số Hóa Phiếu Xét Nghiệm

Việc số hóa phiếu xét nghiệm không chỉ dừng lại ở việc lưu trữ thông tin mà còn mở ra nhiều ứng dụng thực tiễn trong ngành y tế. Các chuyên gia có thể dễ dàng truy cập và phân tích dữ liệu, từ đó đưa ra các quyết định chính xác hơn trong việc chăm sóc sức khỏe.

4.1. Tăng Cường Quản Lý Dữ Liệu

Số hóa giúp quản lý dữ liệu bệnh nhân một cách hiệu quả hơn. Thông tin được lưu trữ tập trung, dễ dàng truy cập và chia sẻ giữa các cơ sở y tế, từ đó nâng cao chất lượng dịch vụ.

4.2. Hỗ Trợ Nghiên Cứu Y Tế

Dữ liệu số hóa có thể được sử dụng để phân tích và nghiên cứu các xu hướng sức khỏe, từ đó hỗ trợ các dự án nghiên cứu y tế và cải thiện quy trình chăm sóc sức khỏe.

V. Kết Luận và Tương Lai Của Số Hóa Phiếu Xét Nghiệm

Số hóa phiếu xét nghiệm bằng kỹ thuật Trí tuệ nhân tạo là một bước tiến quan trọng trong việc cải thiện quy trình quản lý dữ liệu y tế. Tương lai của công nghệ này hứa hẹn sẽ mang lại nhiều cải tiến hơn nữa trong việc chăm sóc sức khỏe, từ việc nâng cao độ chính xác đến giảm thiểu thời gian xử lý dữ liệu.

5.1. Xu Hướng Phát Triển Công Nghệ

Công nghệ số hóa sẽ tiếp tục phát triển với sự hỗ trợ của AI, giúp cải thiện độ chính xác và hiệu quả trong việc xử lý dữ liệu y tế. Các nghiên cứu mới sẽ mở ra nhiều cơ hội ứng dụng hơn trong tương lai.

5.2. Tầm Quan Trọng Của Đào Tạo Nhân Lực

Đào tạo nhân lực có kiến thức về công nghệ số hóa và AI là rất cần thiết. Điều này sẽ giúp các chuyên gia y tế nắm bắt và áp dụng công nghệ mới một cách hiệu quả, từ đó nâng cao chất lượng dịch vụ y tế.

08/07/2025

Bạn đang xem trước tài liệu:

Số hóa phiếu xét nghiệm sử dụng kỹ thuật trí tuệ nhân tạo

Tải đầy đủ

Nội dung chính

Tổng quan nghiên cứu

Số hóa phiếu xét nghiệm đóng vai trò quan trọng trong việc xử lý và lưu trữ dữ liệu y tế, đặc biệt trong bối cảnh dịch COVID-19 diễn biến phức tạp với hơn 4 triệu ca nhiễm tại Việt Nam tính đến năm 2022. Việc số hóa giúp giảm tải công tác nhập liệu thủ công, nâng cao hiệu quả quản lý và truy xuất thông tin bệnh nhân. Mục tiêu nghiên cứu của luận văn là phát triển một công cụ số hóa phiếu xét nghiệm COVID-19 dựa trên kỹ thuật trí tuệ nhân tạo (AI), nhằm tự động nhận dạng và trích xuất thông tin từ phiếu xét nghiệm dưới dạng ảnh sang dữ liệu số. Phạm vi nghiên cứu tập trung vào dữ liệu thu thập từ 500 mẫu phiếu xét nghiệm COVID-19 và bộ dữ liệu ICDAR 2013 gồm 3.422 ảnh dùng cho nhận dạng ảnh chứa văn bản, cùng 344 mẫu ảnh dùng cho nhận dạng ký tự. Nghiên cứu được thực hiện tại Trường Đại học Công nghiệp TP. Hồ Chí Minh trong khoảng thời gian từ tháng 8/2021 đến tháng 2/2022. Kết quả nghiên cứu góp phần giảm thiểu sai sót nhập liệu, tiết kiệm thời gian xử lý và nâng cao độ chính xác trong quản lý dữ liệu y tế, đồng thời hỗ trợ công tác phòng chống dịch bệnh hiệu quả hơn.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên ba lý thuyết và mô hình chính trong lĩnh vực học sâu và nhận dạng ảnh:

Mô hình YOLOv4 (You Only Look Once version 4): Đây là mô hình nhận dạng đối tượng nhanh và chính xác, được sử dụng để phát hiện các đối tượng quan trọng trên phiếu xét nghiệm như mã ID, tên xét nghiệm, phương pháp và kết quả. YOLOv4 sử dụng kiến trúc CSPDarknet53 làm backbone, kết hợp các kỹ thuật như CutMix, Mosaic data augmentation và Mish activation để tăng độ chính xác và khả năng tổng quát của mô hình.
Mạng CTPN (Connectionist Text Proposal Network): Mạng này chuyên nhận diện các vùng chứa văn bản trong ảnh. CTPN chia nhỏ ảnh thành các proposal nhỏ, sử dụng Bi-directional LSTM để kết nối các vùng văn bản liên tiếp, giúp phát hiện chính xác các vùng chứa chữ trong điều kiện phức tạp như ảnh thiếu sáng hoặc văn bản nhỏ.
Transformer OCR: Phương pháp nhận dạng ký tự quang học dựa trên kiến trúc Transformer, bao gồm encoder và decoder với cơ chế multi-head attention và positional encoding. Transformer OCR khắc phục nhược điểm của mô hình CNN-LSTM truyền thống, cho phép huấn luyện nhanh hơn và nhận dạng chính xác hơn nhờ khả năng xử lý song song và chú ý ngữ nghĩa trong câu.

Ba khái niệm chính được sử dụng trong nghiên cứu gồm: nhận dạng đối tượng (object detection), nhận dạng vùng chứa văn bản (text detection), và nhận dạng ký tự quang học (optical character recognition - OCR).

Phương pháp nghiên cứu

Nguồn dữ liệu chính bao gồm 500 mẫu phiếu xét nghiệm COVID-19 thu thập từ mạng Internet, bộ dữ liệu ICDAR 2013 với 3.422 ảnh dùng cho huấn luyện CTPN, và 344 mẫu ảnh dùng cho huấn luyện Transformer OCR. Phương pháp chọn mẫu là thu thập dữ liệu thực tế kết hợp với kỹ thuật tăng cường dữ liệu (data augmentation) như CutMix và Mosaic để mở rộng tập huấn luyện, giúp mô hình học được đa dạng đặc trưng.

Phương pháp phân tích gồm ba bước chính:

Phát hiện đối tượng trên phiếu xét nghiệm: Sử dụng YOLOv4 để xác định vị trí và phân loại các đối tượng quan trọng trên phiếu như ID, tên xét nghiệm, phương pháp và kết quả.
Phát hiện vùng chứa văn bản: Áp dụng CTPN để trích xuất các vùng ảnh chứa văn bản từ các đối tượng đã được phát hiện.
Nhận dạng ký tự: Sử dụng Transformer OCR để chuyển đổi ảnh văn bản thành chuỗi ký tự số hóa.

Quá trình nghiên cứu được thực hiện trong vòng 6 tháng, từ tháng 8/2021 đến tháng 2/2022, tại Trường Đại học Công nghiệp TP. Hồ Chí Minh, sử dụng máy tính cấu hình GPU 1080ti hoặc 2080ti để huấn luyện các mô hình.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

Hiệu quả phát hiện đối tượng bằng YOLOv4: Mô hình đạt độ chính xác trung bình (mAP) từ 38% đến 44% trên tập dữ liệu phiếu xét nghiệm, với tốc độ xử lý từ 60 đến 120 khung hình mỗi giây, nhanh gấp đôi so với các mô hình như EfficientDet và tăng 10% độ chính xác so với YOLOv3.
Khả năng nhận diện vùng văn bản của CTPN: Trên bộ dữ liệu ICDAR 2013, CTPN đạt độ chính xác (Precision) khoảng 82%, độ bao phủ (Recall) 73%, và F-score 77%, cho thấy khả năng phát hiện vùng chứa văn bản hiệu quả ngay cả trong điều kiện ảnh thiếu sáng hoặc văn bản kích thước nhỏ.
Chính xác nhận dạng ký tự bằng Transformer OCR: Mô hình Transformer OCR cho kết quả nhận dạng ký tự tiếng Việt với độ chính xác cao, giảm thời gian huấn luyện so với mô hình CNN-LSTM truyền thống nhờ khả năng xử lý song song và cơ chế attention.
Tích hợp hệ thống số hóa: Kết quả thực nghiệm cho thấy hệ thống số hóa phiếu xét nghiệm COVID-19 tự động giúp giảm thiểu sai sót nhập liệu thủ công, tiết kiệm thời gian xử lý và tăng khả năng truy xuất dữ liệu nhanh chóng.

Thảo luận kết quả

Nguyên nhân chính giúp YOLOv4 đạt hiệu quả cao là nhờ kiến trúc CSPDarknet53 và các kỹ thuật tăng cường dữ liệu như CutMix và Mosaic, giúp mô hình học được đa dạng đặc trưng và tránh overfitting. So với các nghiên cứu trước đây sử dụng YOLOv3, kết quả của YOLOv4 vượt trội về cả tốc độ và độ chính xác, phù hợp với yêu cầu xử lý thời gian thực trong môi trường y tế.

CTPN thể hiện ưu thế trong việc phát hiện vùng văn bản nhỏ và phức tạp nhờ cơ chế chia nhỏ ảnh thành các proposal và sử dụng mạng LSTM để kết nối các vùng văn bản liên tiếp. Kết quả này tương đồng với các báo cáo ngành về hiệu quả của CTPN trên bộ dữ liệu ICDAR 2013.

Transformer OCR khắc phục được nhược điểm của mô hình CNN-LSTM truyền thống như thời gian huấn luyện dài và khả năng ghi nhớ ngữ nghĩa kém, nhờ cơ chế multi-head attention và positional encoding. Điều này giúp tăng độ chính xác nhận dạng ký tự tiếng Việt, một ngôn ngữ có nhiều dấu và biến thể phức tạp.

Dữ liệu có thể được trình bày qua biểu đồ so sánh độ chính xác và tốc độ xử lý của YOLOv4 với các mô hình khác, bảng kết quả đánh giá CTPN trên các bộ dữ liệu chuẩn, và biểu đồ loss trong quá trình huấn luyện Transformer OCR để minh họa sự hội tụ của mô hình.

Đề xuất và khuyến nghị

Triển khai hệ thống số hóa phiếu xét nghiệm tại các cơ sở y tế: Áp dụng công cụ số hóa tự động để giảm tải công việc nhập liệu thủ công, nâng cao hiệu quả quản lý dữ liệu bệnh nhân. Thời gian thực hiện trong vòng 6 tháng, chủ thể là các bệnh viện và trung tâm y tế.
Mở rộng tập dữ liệu huấn luyện: Thu thập thêm mẫu phiếu xét nghiệm đa dạng từ nhiều địa phương để cải thiện độ chính xác và khả năng tổng quát của mô hình. Thời gian thực hiện liên tục, chủ thể là các nhóm nghiên cứu và đơn vị y tế.
Tích hợp hệ thống với cơ sở dữ liệu quản lý y tế: Kết nối công cụ số hóa với hệ thống quản lý bệnh viện để tự động cập nhật và truy xuất dữ liệu, giúp bác sĩ và nhân viên y tế dễ dàng theo dõi tình trạng bệnh nhân. Thời gian thực hiện 3-4 tháng, chủ thể là phòng công nghệ thông tin bệnh viện.
Đào tạo nhân viên y tế sử dụng công cụ: Tổ chức các khóa đào tạo để nhân viên y tế làm quen và vận hành hệ thống số hóa hiệu quả, đảm bảo khai thác tối đa lợi ích của công nghệ. Thời gian thực hiện 1-2 tháng, chủ thể là các trung tâm đào tạo và bệnh viện.

Đối tượng nên tham khảo luận văn

Nhân viên y tế và quản lý bệnh viện: Giúp hiểu rõ về công nghệ số hóa phiếu xét nghiệm, từ đó áp dụng vào công tác quản lý và lưu trữ dữ liệu bệnh nhân, giảm thiểu sai sót và tăng hiệu quả công việc.
Nhà nghiên cứu và sinh viên ngành Khoa học Máy tính, Trí tuệ nhân tạo: Cung cấp kiến thức chuyên sâu về ứng dụng các mô hình học sâu như YOLOv4, CTPN và Transformer OCR trong lĩnh vực y tế, làm cơ sở phát triển các nghiên cứu tiếp theo.
Chuyên gia phát triển phần mềm y tế: Hướng dẫn xây dựng hệ thống tự động nhận dạng và số hóa dữ liệu y tế, giúp cải tiến các sản phẩm phần mềm quản lý bệnh viện và chăm sóc sức khỏe.
Cơ quan quản lý y tế và chính sách: Cung cấp cơ sở khoa học để xây dựng các chính sách ứng dụng công nghệ AI trong quản lý dữ liệu y tế, nâng cao hiệu quả phòng chống dịch bệnh và chăm sóc sức khỏe cộng đồng.

Câu hỏi thường gặp

Tại sao chọn YOLOv4 thay vì các phiên bản YOLO khác?
YOLOv4 cung cấp sự cân bằng tốt giữa độ chính xác và tốc độ xử lý, đạt mAP từ 38% đến 44% với tốc độ 60-120 FPS, phù hợp cho ứng dụng thời gian thực trong y tế, vượt trội hơn YOLOv3 và các mô hình khác.
CTPN có thể nhận diện văn bản trong điều kiện ảnh kém như thế nào?
CTPN hoạt động hiệu quả trên ảnh thiếu sáng và văn bản nhỏ nhờ cơ chế chia nhỏ vùng văn bản và sử dụng mạng LSTM để kết nối các proposal, đạt F-score khoảng 77% trên bộ dữ liệu chuẩn ICDAR 2013.
Transformer OCR có ưu điểm gì so với mô hình CNN-LSTM truyền thống?
Transformer OCR cho phép huấn luyện nhanh hơn nhờ khả năng xử lý song song, đồng thời cải thiện độ chính xác nhận dạng ký tự nhờ cơ chế multi-head attention và positional encoding, giúp hiểu ngữ nghĩa tốt hơn.
Làm thế nào để mở rộng ứng dụng số hóa phiếu xét nghiệm cho các loại xét nghiệm khác?
Có thể thu thập thêm dữ liệu mẫu đa dạng, huấn luyện lại mô hình với các nhãn mới và tích hợp thêm các bước tiền xử lý phù hợp để mở rộng sang các loại phiếu xét nghiệm khác ngoài COVID-19.
Hệ thống số hóa có thể tích hợp với các phần mềm quản lý bệnh viện hiện tại không?
Có thể tích hợp thông qua API hoặc Web Service, cho phép tự động cập nhật dữ liệu số hóa vào cơ sở dữ liệu quản lý bệnh viện, giúp đồng bộ và nâng cao hiệu quả quản lý thông tin bệnh nhân.

Kết luận

Luận văn đã phát triển thành công công cụ số hóa phiếu xét nghiệm COVID-19 sử dụng kỹ thuật trí tuệ nhân tạo, bao gồm YOLOv4, CTPN và Transformer OCR.
Mô hình YOLOv4 đạt độ chính xác mAP từ 38% đến 44% với tốc độ xử lý cao, phù hợp ứng dụng thực tế.
CTPN và Transformer OCR giúp nhận diện vùng văn bản và ký tự với độ chính xác cao, giảm thiểu sai sót nhập liệu thủ công.
Hệ thống góp phần nâng cao hiệu quả quản lý dữ liệu y tế, hỗ trợ công tác phòng chống dịch bệnh và chăm sóc sức khỏe cộng đồng.
Các bước tiếp theo bao gồm mở rộng dữ liệu huấn luyện, tích hợp hệ thống vào môi trường y tế thực tế và đào tạo nhân viên vận hành.

Quý độc giả và các đơn vị quan tâm được khuyến khích áp dụng và phát triển tiếp công nghệ số hóa phiếu xét nghiệm nhằm nâng cao chất lượng quản lý y tế trong thời đại chuyển đổi số.

Trích đoạn nội dung tài liệu

Đặt vấn đề Số hóa phiếu xét nghiệm có tầm quan trọng rất lớn đối với việc xử lý, lưu trữ dữ liệu của bệnh nhân. Khắc phục tình trạng nhập liệu quá tải tại các cơ sở khám chữa bệnh, nâng cao hiệu quả công tác chăm sóc sức khỏe người dân trên nền tảng ứng dụng Công nghệ thông tin vào công tác quản lý. Dữ liệu phiếu xét nghiệm được số hóa có thể dễ dàng được truy cập và chia sẻ hơn, không bị mất mát theo thời gian và qua các lần sao chép dữ liệu. Ứng dụng Trí tuệ Nhân tạo để Số hóa phiếu xét nghiệm là quá trình sử dụng các thuật toán Trí tuệ Nhân tạo nhận dạng chuyển đổi thông tin trên phiếu xét nghiệm thành định dạng kỹ thuật số.

Ví dụ: như quét một bức ảnh phiếu xét nghiệm hoặc chuyển đổi một phiếu giấy, hay định dạng PDF thành văn bản kỹ thuật số và lưu trữ thông tin xuống Cơ sở dữ liệu. Hỗ trợ cho việc truy xuất, phân tích một cách dễ dàng. Mục tiêu nghiên cứu 2.1 Mục tiêu nghiên cứu tổng quát - Nhận dạng đối tượng trên phiếu xét nghiệm với dữ liệu đầu vào là bộ cơ sở dữ liệu phiếu xét nghiệm, sử dụng một mô hình mạng nơ-ron nhận dạng đối tượng trên phiếu xét nghiệm. - Nhận dạng ảnh chứa văn bản từ các đối tượng đã được trích xuất từ phiếu xét nghiệm.

- Trích xuất ký tự từ đối tượng ảnh chứa văn bản các đối tượng trên phiếu xét nghiệm.2 Mục tiêu nghiên cứu cụ thể - Nghiên cứu mạng nơ-ron nhân tạo. - Nghiên cứu phương pháp nhận diện ảnh. - Nghiên cứu phương pháp nhận diện ảnh chứa văn bản. - Nghiên cứu phương pháp nhận dạng ký tự quang học.

1 - Áp dụng các phương pháp trên vào việc số hóa phiếu xét nghiệm. Đối tượng và phạm vi nghiên cứu 3.1 Đối tượng - Lý thuyết về nhận dạng đối tượng, ký tự. - Các vấn đề liên quan đến các phương pháp nhận dạng đối tượng – phiếu xét nghiệm. - Phương pháp nhận dạng phiếu xét nghiệm bằng YOLO (You only look once).

- Phương pháp nhận dạng ảnh chứa văn bản bằng CTPN (Connectionist Text Proposal Network). - Phương pháp nhận dạng ký tự Transformer OCR (Optical Character Recognition).2 Phạm vi nghiên cứu - Lĩnh vực: Deep learning. - Không gian: Cài đặt và hiện thực trên máy tính. - Dữ liệu phiếu xét nghiệm được thu thập trên mạng 500 mẫu.

- Dữ liệu được sử dụng cho bài toán nhận dạng ảnh chứa văn bản là bộ dữ liệu ICDAR 2013 3422 mẫu. - Dữ liệu sử dụng nhận diện ký tự được thu thập trên mạng 344. Cách tiếp cận và phương pháp nghiên cứu 4.1 Cách tiếp cận - Tìm hiểu tổng quan về các công trình nghiên cứu có liên quan và các thành tựu đã được hoàn thành trước đây. - Phân loại, nhận dạng ảnh đối tượng sử dụng CNN (Convolution Neural Networks).

- Các phương pháp nhận dạng ký tự quang học. - Phân loại, nhận dạng ảnh đối tượng sử dụng YOLO v4 (You Look Only Once version 4). 2 - Nhập dạng ảnh chứa văn bản sử dụng CTPN. - Nhận dạng ký tự sử dụng Tranformer OCR.

- Xây dựng công cụ nhận dạng nhằm mục đích kiểm tra giải pháp và đánh giá hiệu quả của hệ thống.2 Thời gian nghiên cứu - Thời gian nghiên cứu từ 09/08/2021 đến 09/02/2022.3 Địa điểm nghiên cứu - Nghiên cứu được thực hiện tại trường Đại học Công nghiệp thành phố Hồ Chí Minh.4 Vật liệu nghiên cứu - Máy tính, ảnh, các nguồn thông tin thu thập từ mạng Internet, tài liệu tham khảo.5 Phương pháp - Phương pháp nghiên cứu dựa trên tài liệu: thu thập, phân tích, xử lý thông tin dựa trên các tài liệu như sách, báo, tạp chí,…đã in ấn hoặc công bố trên internet liên quan đến đề tài. - Phương pháp nghiên cứu dựa trên thực nghiệm: thông qua việc thử nghiệm trên dữ liệu và đối sánh với các kết quả đã công bố. Ý nghĩa thực tiễn của đề tài Số hóa phiếu xét nghiệm có tầm quan trọng rất lớn đối với việc xử lý, lưu trữ dữ liệu của bệnh nhân. Số hóa phiếu xét nghiệm là phương pháp hiệu quả giúp: - Kéo dài tuổi thọ của tài liệu gốc, không bị mất mát qua thời gian và qua các lần sao chép dữ liệu.

- Quản lý, lưu trữ và khai thác tập trung trên môi trường số. - Cắt giảm chi phí quản lý, nhập liệu thủ công, giảm thiểu diện tích không gian lưu trữ tài liệu giấy. - Tăng cường khả năng bảo mật thông tin tài liệu. 3 - Khắc phục tình trạng quá tải tại các cơ sở khám chữa bệnh, nâng cao hiệu quả công tác chăm sóc sức khỏe người dân trên nền tảng ứng dụng Công nghệ thông tin vào công tác quản lý.

- Tiết kiệm thời gian tìm kiếm thông tin, dễ dàng được chia sẻ, tự động hóa các quy trình và cho phép khả năng truy cập tốt hơn. Với những lý do trên, tôi quyết định thực hiện đề tài “Số hóa phiếu xét nghiệm sử dụng kỹ thuật Trí Tuệ Nhân Tạo”. 4 TỔNG QUAN VỀ LĨNH VỰC NGHIÊN CỨU 1.1 Tổng quan về đề tài Số hóa tài liệu đang là xu hướng chung và là nhiệm vụ ưu tiên hàng đầu. Số hóa giúp việc lưu trữ, chỉnh sửa, lập chỉ mục và tìm kiếm thông tin trong tài liệu kỹ thuật số dễ dàng hơn so với việc bỏ ra hàng giờ để duyệt qua các tài liệu được in / viết tay / đánh máy.

Hơn nữa, việc tìm kiếm trong một tài liệu với số lượng nội dung lớn không chỉ tốn thời gian mà còn có khả năng chúng ta bỏ lỡ thông tin trong khi chúng ta xem, duyệt tài liệu theo cách thủ công. OCR là thuật ngữ được viết tắt bởi cụm từ Optical Character Recognition (nhận dạng ký tự quang học). Là kỹ thuật nhận đầu vào là các ảnh có kí tự sau đó xử lý và cho ra kết quả kí tự văn bản tương ứng. OCR được biết đến từ những năm 1974, Ray Kurzweil bắt đầu phát triển một công nghệ có thể nhận ra các kí tự trong hình ảnh của các văn bản, công nghệ này được ứng dụng vào thiết bị hỗ trợ đọc cho người khiếm thị.

Công nghệ OCR ngày càng được hoàn thiện và phát triển, cho tới ngày nay thì công nghệ này đã được ứng dụng và rất nhiều vào các lĩnh vực trong cuộc sống từ các ứng dụng nhận dạng chữ viết, văn bản, cho tới các phần mềm hệ thống ứng dụng nhận diện các biển số xe,… [1]. Trong lĩnh vực y tế, các chuyên gia cần quản lý lượng lớn dữ liệu của bệnh nhân và dữ liệu đó tăng liên tục. Sẽ rất hữu ích khi thông tin được lưu trữ trong cơ sở dữ liệu. Với công cụ xử lý OCR, chúng ta có thể trích xuất dữ liệu văn bản từ các ảnh, video và lưu trữ chúng vào cơ sở dữ liệu, từ đó giúp cho việc truy xuất, tìm kiếm, phân tích được dễ dàng hơn cho các công việc về sau.

Trong luận văn này, tôi kết hợp các tiếp cận AI để hỗ trợ việc trích xuất thông tin, chuyển đổi dữ liệu từ dạng ảnh sang dạng văn bản số. Mục tiêu của nghiên cứu này là phát triển công cụ tích hợp trí tuệ nhân tạo trong việc rút trích thông tin từ phiếu xét nghiệm covid19, nhằm tăng tính tự động và giảm tải không gian lưu trữ, nâng cao hiệu quả quá trình số hóa dữ liệu được thu thập trong lĩnh vực y tế. Đề tài khi hoàn thành sẽ giúp các chuyên gia thực hiện các 5 dự án nghiên cứu có yêu cầu thu thập, phân tích và theo dõi, tiết kiệm thời gian nhập liệu thủ công. Sự bùng phát dịch COVID-19 đã mang lại những thách thức chưa từng có.

Đến thời điểm hiện tại hơn 400 triệu người nhiễm bệnh trên thế giới, trong đó có hơn 6 triệu người tử vong. Kể từ khi dịch bùng phát từ đầu 2020 đến nay, Việt Nam đã trải qua bốn đợt bùng phát và đến nay vẫn chưa chấm dứt. Ghi nhận hơn 4 triệu ca nhiễm, hơn 2 triệu người khỏi bệnh, gần 40 nghìn ca tử vong. Covid19 tác động đáng kể đến sự phát triển nền kinh tế Việt Nam.

Tuy được đánh giá là một trong số ít các quốc gia ứng phó tốt với dịch bệnh, nhưng thị trường lao động – việc làm của Việt Nam cũng bị ảnh hưởng nghiêm trọng, việc lưu thông, vận chuyển hàng hóa giữa các tỉnh, thành phố bị hạn chế tối đa, thậm chí mọi loại hình vận tải phải ngưng hoạt động tại các tỉnh giãn cách xã hội. Hoạt động du lịch, nông, lâm nghiệp và thủy sản cũng gặp nhiều khó khăn. Thêm vào đó, nhiều doanh nghiệp, cơ sở kinh phải đóng cửa, hoạt động cầm chừng để duy trì không rơi vào tình trạng phá sản. Trong 7 tháng đầu năm 2021, tại 19 tỉnh, thành phố phía Nam, nơi chiếm 48% số doanh nghiệp trong cả nước đã có tới 79.673 doanh nghiệp rút lui khỏi thị trường, tăng 25,5% so với cùng kỳ năm 2020.

Đặc biệt, đợt dịch này đã và đang tác động mạnh vào khu công nghiệp, khu chế xuất, những nơi tập trung lượng lớn lao động (khoảng 4 triệu người), có các doanh nghiệp lớn trong chuỗi giá trị toàn cầu, đóng góp nhiều cho phát triển kinh tế, thu ngân sách. Tính tới thời điểm ngày 13/8/2021, theo báo cáo nhanh của các tỉnh, thành phố phía Nam, đã có khoảng 2,5 triệu lao động phải ngừng việc, chiếm 70% số lao động phải ngừng việc trong cả nước [2]. Ở Đồng Tháp tình hình covid diễn biến rất phức tạp, liên tục trong các tháng cuối năm 2021 số ca nhiễm ở Đồng Tháp liên tục nằm trong top 3 của cả nước. Tỉnh liên tục chỉ đạo xét nghiệm hàng loạt tầm soát dịch bệnh.

Bên cạnh đó số lượng phiếu xét nghiệm covid rất nhiều, phải cần người nhập liệu các phiếu xét nghiệm covid vào hệ thống, để thống kê, vẽ biểu đồ vùng dịch ở các địa phương. 6 Trong nghiên cứu này, tác giả phát triển một công cụ số hỗ trợ việc số hóa phiếu xét nghiệm covid19. Công cụ nhận dữ liệu đầu vào là hình ảnh phiếu xét nghiệm covid19 sử dụng các kỹ thuật AI để số hóa thu thập dữ liệu. Nghiên cứu này giúp thu thập, lưu trữ số liệu phiếu xét nghiệm covid19 dưới dạng số giúp giảm tải việc nhập liệu, từ đó có thể sử dụng để dự đoán, kiểm tra và điều chỉnh lại số liệu dịch bệnh, bản đồ vùng dịch quản lý chặt chẽ các vùng bùng phát đại dịch.2 Khó khăn thách thức Đề tài “số hóa phiếu xét nghiệm sử dụng kỹ thuật trí tuệ nhân tạo” sử dụng các mẫu phiếu xét nghiệm covid19 được thu thập trên mạng làm dữ liệu huấn luyện.

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ

Tài liệu có tiêu đề Số Hóa Phiếu Xét Nghiệm Bằng Kỹ Thuật Trí Tuệ Nhân Tạo khám phá cách mà công nghệ trí tuệ nhân tạo (AI) có thể được áp dụng để số hóa và tối ưu hóa quy trình xét nghiệm y tế. Bài viết nhấn mạnh những lợi ích của việc sử dụng AI trong việc giảm thiểu sai sót, tăng cường hiệu quả và tiết kiệm thời gian trong việc xử lý dữ liệu xét nghiệm. Độc giả sẽ tìm thấy thông tin hữu ích về cách mà công nghệ này có thể cải thiện chất lượng dịch vụ y tế, đồng thời mở ra hướng đi mới cho việc quản lý và phân tích dữ liệu y tế.

Nếu bạn quan tâm đến các ứng dụng khác của công nghệ trong lĩnh vực y tế và điều khiển, hãy khám phá thêm tài liệu Luận văn thạc sĩ khoa học máy tính nghiên cứu về nhận dạng tiếng nói ứng dụng vào điều khiển xe lăn, nơi nghiên cứu về cách nhận dạng tiếng nói có thể hỗ trợ trong việc điều khiển thiết bị. Bên cạnh đó, tài liệu Luận án mạng neural trong hệ thống điều khiển xe lăn cho người tàn tật nặng sử dụng điện não eeg camera sẽ cung cấp cái nhìn sâu sắc về việc ứng dụng mạng neural trong điều khiển xe lăn cho người khuyết tật. Cuối cùng, bạn cũng có thể tham khảo tài liệu Luận văn nghiên cứu một số phương pháp phát hiện và phân loại nhịp thở sử dụng mạng học sâu đa nhiệm để tìm hiểu thêm về các phương pháp hiện đại trong việc phân tích dữ liệu sinh học. Những tài liệu này sẽ giúp bạn mở rộng kiến thức và hiểu biết về các ứng dụng của công nghệ trong y tế và điều khiển.

#công nghệ thông tin trong y tế

#mô hình học sâu

#ứng dụng AI trong y tế

#Phân tích dữ liệu COVID-19

#nhận dạng ký tự quang học

#Số hóa phiếu xét nghiệm

Chủ đề

Trí tuệ nhân tạo trong y tế

giải pháp công nghệ cho COVID-19

Số hóa dữ liệu y tế

Nhận dạng văn bản và hình ảnh