Luận án tiến sĩ HUS: Phương pháp xác định phổ hấp thụ xen phủ bằng vi tính

Trường đại học

Hus

Người đăng

Ẩn danh

Thể loại

Luận án tiến sĩ
147
0
0

Phí lưu trữ

30 Point

Tóm tắt

I. Khám phá luận án HUS Xác định đồng thời chất xen phủ

Luận án tiến sĩ HUS này mở ra một hướng đi đột phá trong lĩnh vực hóa phân tích, tập trung vào phương pháp xác định đồng thời các chất có phổ hấp thụ xen phủ nhau sử dụng vi tính. Đây là một vấn đề kinh điển nhưng luôn đầy thách thức. Khi các chất trong một hỗn hợp có phổ hấp thụ chồng chập lên nhau, các phương pháp quang phổ truyền thống trở nên kém hiệu quả, thậm chí không thể áp dụng. Nghiên cứu này không chỉ là một luận văn thạc sĩ hóa phân tích nâng cao, mà là một công trình nghiên cứu khoa học HUS chuyên sâu, đề xuất giải pháp toàn diện bằng cách kết hợp phương pháp quang phổ UV-VIS với sức mạnh của hóa lượng tử (chemometrics) và các thuật toán máy tính hiện đại. Mục tiêu chính là xây dựng các quy trình phân tích mới, có khả năng phân giải phổđịnh lượng đồng thời nhiều cấu tử một cách chính xác, nhanh chóng và tiết kiệm chi phí. Công trình đi sâu vào việc phát triển và so sánh hiệu quả của các mô hình hiệu chuẩn đa biến, từ những phương pháp kinh điển như PLS, PCR đến các kỹ thuật tiên tiến như mạng nơ-ron. Luận án không chỉ dừng lại ở lý thuyết mà còn tiến hành xác thực phương pháp phân tích trên các mẫu thực tế, chứng minh tính khả thi và tiềm năng ứng dụng rộng rãi trong các ngành như dược phẩm, môi trường và kiểm nghiệm thực phẩm.

1.1. Tầm quan trọng của việc phân tích đa cấu tử hiện nay

Trong thực tế, các mẫu phân tích hiếm khi chỉ chứa một chất duy nhất. Từ dược phẩm đa thành phần, mẫu nước ô nhiễm đến thực phẩm, chúng đều là những hỗn hợp phức tạp. Việc phân tích đa cấu tử, tức là xác định và định lượng nhiều chất cùng lúc, là yêu cầu cấp thiết. Phương pháp này giúp tiết kiệm thời gian, hóa chất và công sức so với việc phân tích riêng lẻ từng chất. Tuy nhiên, thách thức lớn nhất chính là hiện tượng phổ hấp thụ xen phủ nhau. Khi các dải hấp thụ của các chất chồng lấn, tín hiệu đo được tại một bước sóng không còn tuân theo định luật Lambert-Beer cho một chất duy nhất, gây ra sai số nghiêm trọng. Do đó, việc tìm ra phương pháp hiệu quả để giải quyết vấn đề này có ý nghĩa khoa học và thực tiễn to lớn, thúc đẩy sự phát triển của ngành hóa phân tích hiện đại.

1.2. Vai trò của hóa lượng tử và vi tính trong phân tích phổ

Hóa lượng tử (chemometrics) là ngành khoa học ứng dụng toán học, thống kê và khoa học máy tính để tối ưu hóa và khai thác thông tin từ dữ liệu hóa học. Đối với bài toán phổ chồng chập, chemometrics đóng vai trò then chốt. Thay vì chỉ nhìn vào một điểm dữ liệu (độ hấp thụ tại một bước sóng), các thuật toán chemometrics có khả năng phân tích toàn bộ ma trận dữ liệu quang phổ. Bằng cách sử dụng các phần mềm xử lý phổ (Matlab, R, Python), các nhà khoa học có thể thực hiện xử lý tín hiệu số phức tạp, xây dựng các mô hình dự đoán nồng độ từ dữ liệu phổ tổng hợp. Đây chính là cuộc cách mạng mà vi tính mang lại, biến những dữ liệu quang phổ tưởng chừng như vô dụng thành nguồn thông tin định lượng quý giá, mở đường cho việc xác định nồng độ hỗn hợp một cách chính xác.

II. Thách thức khi xử lý phổ hấp thụ xen phủ nhau trong hóa học

Việc xử lý phổ chồng chập là một trong những trở ngại lớn nhất trong ngành quang phổ phân tử. Về bản chất, phổ hấp thụ phân tử của một hỗn hợp là tổng cộng phổ của các thành phần riêng lẻ. Khi các cấu trúc phân tử tương tự nhau hoặc có các nhóm mang màu gần giống nhau, đỉnh hấp thụ cực đại của chúng sẽ ở gần nhau, gây ra sự xen phủ nghiêm trọng. Phương pháp đường chuẩn đơn biến truyền thống, vốn chỉ dựa vào độ hấp thụ tại một bước sóng duy nhất, hoàn toàn thất bại trong trường hợp này. Mọi nỗ lực đo ở các bước sóng khác nhau đều không thể tách bạch được đóng góp của từng chất. Vấn đề càng trở nên phức tạp khi có sự xuất hiện của các yếu tố nhiễu nền, sự trôi của thiết bị, hoặc sự tương tác hóa học giữa các cấu tử trong dung dịch. Những yếu tố này làm thay đổi hình dạng phổ, khiến cho việc phân giải phổ trở nên khó khăn hơn bao giờ hết. Đây là lý do tại sao các phương pháp phân tích cổ điển không đủ khả năng đáp ứng yêu cầu định lượng đồng thời trong các ma trận mẫu phức tạp, đòi hỏi một sự chuyển đổi sang các kỹ thuật phân tích dữ liệu đa biến tiên tiến.

2.1. Hạn chế của phương pháp quang phổ UV VIS truyền thống

Phương pháp quang phổ UV-VIS truyền thống hoạt động dựa trên nguyên tắc đo độ hấp thụ tại bước sóng hấp thụ cực đại (λmax) của chất phân tích, nơi tín hiệu là mạnh nhất và ít bị ảnh hưởng bởi các chất khác. Tuy nhiên, nguyên tắc này chỉ đúng khi phổ của chất cần phân tích tách biệt hoàn toàn khỏi phổ của các thành phần khác trong mẫu. Khi xảy ra hiện tượng xen phủ, không tồn tại một bước sóng nào mà chỉ có một chất hấp thụ. Độ hấp thụ đo được là tổng cộng từ nhiều chất, vi phạm nghiêm trọng giả định của định luật Lambert-Beer áp dụng cho một cấu tử. Điều này dẫn đến kết quả định lượng sai lệch, độ chính xác và độ đúng thấp, không thể đáp ứng tiêu chuẩn của nhiều ngành công nghiệp và nghiên cứu.

2.2. Nhu cầu cấp thiết về các thuật toán xử lý tín hiệu số

Để vượt qua những hạn chế nêu trên, nhu cầu về các thuật toán xử lý tín hiệu số trở nên cấp thiết. Thay vì loại bỏ thông tin, các phương pháp này tận dụng toàn bộ dải phổ, coi mỗi vạch phổ là một biến số. Các thuật toán này có khả năng "nhìn" thấy các mẫu hình (pattern) ẩn trong ma trận dữ liệu quang phổ mà mắt người không thể nhận ra. Chúng có thể lọc nhiễu, hiệu chỉnh đường nền và quan trọng nhất là xây dựng một mô hình hiệu chuẩn đa biến có khả năng liên kết toàn bộ dữ liệu phổ với nồng độ của các chất. Sự phát triển của máy tính đã cho phép triển khai các thuật toán phức tạp này, mở ra kỷ nguyên mới cho việc xác định đồng thời các chất có phổ hấp thụ xen phủ nhau.

III. Hướng dẫn giải pháp hóa lượng tử xử lý phổ chồng chập

Luận án này tập trung vào việc ứng dụng và so sánh các phương pháp hóa lượng tử (chemometrics) kinh điển để giải quyết bài toán xử lý phổ chồng chập. Hai trong số các kỹ thuật mạnh mẽ và được sử dụng rộng rãi nhất là Hồi quy thành phần chính (PCR)Bình phương tối thiểu riêng phần (PLS). Cả hai phương pháp này đều thuộc nhóm hồi quy đa biến, có khả năng xử lý một lượng lớn dữ liệu với nhiều biến số (bước sóng) và tương quan cao giữa các biến. Nguyên tắc chung là giảm chiều của dữ liệu quang phổ bằng cách phân tích chúng thành một số ít các thành phần chính hoặc biến tiềm ẩn, những thành phần này chứa đựng thông tin quan trọng nhất về sự biến thiên trong dữ liệu. Sau đó, một mô hình hồi quy sẽ được xây dựng dựa trên các thành phần này để dự đoán nồng độ. Luận án đã trình bày chi tiết quy trình xây dựng mô hình hiệu chuẩn đa biến, từ khâu lựa chọn tập mẫu chuẩn, đo phổ, tiền xử lý dữ liệu đến lựa chọn số lượng thành phần tối ưu và xác thực phương pháp phân tích. Những kết quả thu được, thường được công bố trên các Tạp chí Phân tích Hóa, Lý và Sinh học, đã chứng minh rằng PLS và PCR là công cụ hiệu quả cho việc định lượng đồng thời.

3.1. Phân tích nguyên lý của Hồi quy thành phần chính PCR

Hồi quy thành phần chính (PCR - Principal Component Regression) là phương pháp hai bước. Đầu tiên, nó thực hiện Phân tích thành phần chính (PCA) trên ma trận dữ liệu phổ (ma trận X) để tìm ra các thành phần chính (PCs) - những vector trực giao mô tả phương sai lớn nhất trong dữ liệu. Bước này hoàn toàn không quan tâm đến dữ liệu nồng độ (ma trận Y). Sau khi đã giảm chiều dữ liệu bằng cách chọn ra một số ít PC quan trọng, bước thứ hai là thực hiện hồi quy tuyến tính bội giữa các PC này và ma trận nồng độ Y. Ưu điểm của PCR là sự đơn giản và khả năng xử lý tốt hiện tượng đa cộng tuyến. Tuy nhiên, nhược điểm là các PC được chọn có thể không phải là những thành phần có khả năng dự đoán nồng độ tốt nhất.

3.2. Ưu điểm vượt trội của Bình phương tối thiểu riêng phần PLS

Bình phương tối thiểu riêng phần (PLS - Partial Least Squares) là một cải tiến so với PCR. Khác với PCR, thuật toán PLS tìm cách tối ưu hóa đồng thời hiệp phương sai giữa dữ liệu phổ (X) và dữ liệu nồng độ (Y). Điều này có nghĩa là các biến tiềm ẩn (latent variables) được xây dựng không chỉ để mô tả phương sai trong X mà còn để tối đa hóa khả năng dự đoán Y. Nhờ đó, mô hình PLS thường có năng lực dự đoán tốt hơn và cần ít thành phần hơn so với PCR, đặc biệt khi trong phổ có nhiều tín hiệu nhiễu không liên quan đến nồng độ. Luận án đã chứng minh rằng PLS thường cho kết quả chính xác hơn trong việc xác định nồng độ hỗn hợp các chất có phổ xen phủ mạnh.

IV. Bí quyết dùng mạng nơ ron ANN xác định đồng thời chất

Bên cạnh các phương pháp hồi quy tuyến tính, luận án còn khám phá tiềm năng của các kỹ thuật phi tuyến, đặc biệt là Mạng nơ-ron nhân tạo (ANN - Artificial Neural Network), cho bài toán xác định đồng thời các chất. ANN là một mô hình tính toán lấy cảm hứng từ cấu trúc não sinh học, có khả năng học các mối quan hệ phức tạp và phi tuyến giữa đầu vào (dữ liệu phổ) và đầu ra (nồng độ). Điều này đặc biệt hữu ích khi định luật Lambert-Beer bị vi phạm do tương tác hóa học giữa các chất hoặc do các hiệu ứng phi tuyến của thiết bị. Thay vì giả định một mối quan hệ tuyến tính, ANN có thể tự "học" và mô hình hóa bất kỳ mối quan hệ nào từ dữ liệu. Luận án đã xây dựng và huấn luyện các mô hình ANN, so sánh hiệu suất của chúng với PLS và PCR. Kết quả cho thấy trong nhiều trường hợp phức tạp, ANN mang lại độ chính xác dự đoán cao hơn. Việc kết hợp ANN với thuật toán di truyền để tối ưu hóa cấu trúc mạng cũng được đề cập, cho thấy hướng tiếp cận hiện đại trong việc giải quyết các bài toán phân tích đa cấu tử.

4.1. Cấu trúc và nguyên lý hoạt động của Mạng nơ ron nhân tạo

Một mô hình Mạng nơ-ron nhân tạo (ANN) cơ bản bao gồm nhiều lớp (layer) nơ-ron: lớp đầu vào (input layer), một hoặc nhiều lớp ẩn (hidden layers) và lớp đầu ra (output layer). Dữ liệu phổ từ phương pháp quang phổ UV-VIS được đưa vào lớp đầu vào. Mỗi nơ-ron trong các lớp ẩn sẽ nhận tín hiệu từ lớp trước, tính toán một giá trị tổng có trọng số và đưa qua một hàm kích hoạt (thường là phi tuyến). Quá trình này lặp lại qua các lớp cho đến khi tạo ra kết quả ở lớp đầu ra, chính là nồng độ dự đoán. Sức mạnh của ANN nằm ở quá trình "huấn luyện", nơi các trọng số kết nối giữa các nơ-ron được điều chỉnh lặp đi lặp lại để giảm thiểu sai số giữa nồng độ dự đoán và nồng độ thực.

4.2. So sánh hiệu quả giữa ANN và các mô hình hồi quy tuyến tính

So sánh giữa ANN và các mô hình như PLS/PCR là một phần quan trọng trong nghiên cứu khoa học HUS này. Mô hình tuyến tính (PLS, PCR) có ưu điểm là đơn giản, dễ diễn giải và hoạt động tốt khi mối quan hệ giữa phổ và nồng độ là tuyến tính. Ngược lại, ANN là một mô hình "hộp đen", khó diễn giải hơn nhưng có khả năng mô hình hóa các mối quan hệ phi tuyến phức tạp. Luận án chỉ ra rằng, đối với các hệ có độ xen phủ vừa phải và tuân thủ định luật Lambert-Beer, PLS thường cho kết quả tương đương hoặc tốt hơn ANN, đồng thời tránh được hiện tượng quá khớp (overfitting). Tuy nhiên, với các hệ hóa học phức tạp, có tương tác giữa các cấu tử, ANN thể hiện sự vượt trội rõ rệt, chứng tỏ tiềm năng to lớn trong việc giải quyết các bài toán phân tích khó.

V. Ứng dụng thực tiễn Xác định đồng thời chất trong dược phẩm

Để chứng minh tính hiệu quả và khả thi, luận án đã áp dụng thành công các phương pháp xác định đồng thời các chất có phổ hấp thụ xen phủ nhau vào một bài toán thực tế: phân tích hỗn hợp dược phẩm. Cụ thể, nghiên cứu tập trung vào việc định lượng đồng thời Paracetamol (PAR) và Cafein (CAF) trong một chế phẩm thuốc giảm đau. Hai hoạt chất này có phổ hấp thụ UV-VIS chồng chập đáng kể trong dung môi thông thường, khiến việc định lượng bằng phương pháp truyền thống trở nên bất khả thi. Nhóm nghiên cứu đã xây dựng các mô hình hiệu chuẩn đa biến sử dụng cả PLS và ANN dựa trên một tập hợp các mẫu chuẩn được chuẩn bị cẩn thận. Các mô hình sau đó được sử dụng để dự đoán nồng độ PAR và CAF trong các mẫu thuốc thương mại. Quá trình xác thực phương pháp phân tích được tiến hành nghiêm ngặt, đánh giá các thông số như độ đúng, độ chính xác, độ tuyến tính và giới hạn phát hiện. Kết quả cho thấy cả hai mô hình đều cho kết quả đáng tin cậy, phù hợp với kết quả từ phương pháp kiểm nghiệm tiêu chuẩn (ví dụ: HPLC), nhưng với ưu điểm vượt trội về tốc độ và chi phí.

5.1. Quy trình xây dựng mô hình và thu thập ma trận dữ liệu quang phổ

Quy trình bắt đầu bằng việc thiết kế tập mẫu chuẩn (calibration set) và tập mẫu kiểm tra (validation set) theo phương pháp thiết kế thực nghiệm. Nồng độ của PAR và CAF trong các mẫu chuẩn được thay đổi một cách hệ thống để bao phủ toàn bộ khoảng nồng độ làm việc. Phổ hấp thụ của từng mẫu được ghi lại bằng máy quang phổ UV-VIS trong dải bước sóng phù hợp. Dữ liệu thu được được sắp xếp thành một ma trận dữ liệu quang phổ (ma trận X), trong đó mỗi hàng đại diện cho một mẫu và mỗi cột đại diện cho độ hấp thụ tại một bước sóng. Ma trận nồng độ tương ứng (ma trận Y) cũng được xây dựng. Dữ liệu sau đó được tiền xử lý (ví dụ: làm trơn, lấy đạo hàm) để loại bỏ nhiễu và tăng cường tín hiệu.

5.2. Kết quả xác thực phương pháp và đánh giá sai số

Việc xác thực phương pháp phân tích là bước cuối cùng và quan trọng nhất. Luận án đã sử dụng tập mẫu kiểm tra (không dùng trong quá trình xây dựng mô hình) để đánh giá năng lực dự đoán của các mô hình PLS và ANN. Các thông số như Sai số trung bình bình phương của dự đoán (RMSEP) và Hệ số tương quan (R) được tính toán. Kết quả cho thấy cả hai mô hình đều có giá trị RMSEP thấp và R cao (gần bằng 1), chứng tỏ sự tương quan chặt chẽ giữa nồng độ dự đoán và nồng độ thực. Các kiểm định thống kê (ví dụ: kiểm định t) cũng được áp dụng để so sánh kết quả của phương pháp đề xuất với phương pháp đối chứng, cho thấy không có sự khác biệt có ý nghĩa thống kê. Điều này khẳng định độ tin cậy của phương pháp mới trong việc xác định nồng độ hỗn hợp dược phẩm.

VI. Tương lai của phương pháp xác định đồng thời các chất

Công trình luận án tiến sĩ HUS này đã khẳng định mạnh mẽ vai trò không thể thiếu của các phương pháp xác định đồng thời các chất dựa trên chemometrics trong hóa phân tích hiện đại. Hướng nghiên cứu này không chỉ giải quyết một vấn đề cố hữu của phương pháp quang phổ mà còn mở ra vô số tiềm năng ứng dụng mới. Trong tương lai, việc phát triển các phương pháp này sẽ tập trung vào việc tích hợp các thuật toán học máy và học sâu (deep learning) phức tạp hơn nữa để xử lý các hệ thống siêu phức tạp, chẳng hạn như phân tích các chất chuyển hóa trong mẫu sinh học hoặc giám sát đa chỉ tiêu trong quy trình công nghiệp. Việc kết hợp dữ liệu từ nhiều loại cảm biến khác nhau (ví dụ: phổ UV-VIS, phổ hồng ngoại, phổ huỳnh quang) sẽ tạo ra các mô hình tổng hợp mạnh mẽ hơn, cung cấp cái nhìn toàn diện về mẫu phân tích. Hơn nữa, việc phát triển các phần mềm xử lý phổ thân thiện với người dùng, có khả năng tự động hóa quá trình xây dựng và tối ưu hóa mô hình, sẽ giúp phổ biến các kỹ thuật tiên tiến này đến các phòng thí nghiệm thông thường, không đòi hỏi chuyên gia về hóa lượng tử (chemometrics).

6.1. Tổng kết những đóng góp chính của luận án nghiên cứu

Luận án đã có những đóng góp quan trọng. Thứ nhất, hệ thống hóa và so sánh một cách khoa học hiệu quả của các phương pháp hồi quy đa biến kinh điển (PCR, PLS) và các phương pháp học máy hiện đại (ANN) cho bài toán xử lý phổ chồng chập. Thứ hai, xây dựng thành công quy trình phân tích hoàn chỉnh để định lượng đồng thời các hoạt chất trong dược phẩm, từ khâu chuẩn bị mẫu đến xác thực phương pháp phân tích, chứng minh tính ứng dụng thực tiễn cao. Thứ ba, công trình là một tài liệu tham khảo giá trị, có thể được kế thừa và phát triển cho các luận văn thạc sĩ hóa phân tích và các đề tài nghiên cứu sau này, góp phần thúc đẩy sự phát triển của ngành hóa phân tích tại Việt Nam.

6.2. Hướng phát triển và những thách thức nghiên cứu tiếp theo

Hướng phát triển trong tương lai bao gồm việc áp dụng các thuật toán học sâu (Deep Neural Networks) có khả năng tự động trích xuất đặc trưng từ dữ liệu phổ thô, giảm bớt sự phụ thuộc vào bước tiền xử lý. Một thách thức lớn là vấn đề chuyển giao hiệu chuẩn (calibration transfer), tức là làm sao để một mô hình được xây dựng trên một máy quang phổ có thể hoạt động tốt trên một máy khác mà không cần phải xây dựng lại từ đầu. Ngoài ra, việc giải quyết các bài toán phân tích đa cấu tử trong các ma trận nền phức tạp và biến đổi liên tục (như mẫu máu, nước thải) vẫn là một lĩnh vực đòi hỏi nhiều nỗ lực nghiên cứu, hứa hẹn nhiều đột phá mới trong tương lai.

18/07/2025