Tổng quan nghiên cứu

Chi Bacillus là một nhóm vi khuẩn Gram dương, hình que, có khả năng tạo bào tử và lên men, với hơn 396 loài được công bố hợp lệ tính đến năm 2020. Các loài Bacillus được ứng dụng rộng rãi trong y tế, dược phẩm, nông nghiệp và công nghiệp nhờ khả năng sản xuất enzyme, kháng sinh và các chất chuyển hóa quan trọng. Tuy nhiên, việc phân loại chính xác các loài trong chi Bacillus gặp nhiều khó khăn do sự tương đồng cao về trình tự gen 16S rRNA, phương pháp truyền thống thường không phân biệt được các loài có quan hệ họ hàng gần. Mục tiêu nghiên cứu là xây dựng phương pháp định danh các loài Bacillus dựa trên kỹ thuật Multilocus Sequencing Analysis (MLSA) sử dụng trình tự ghép nối của 6 gen 16S rRNA, rpoD, glpF, pta, pycA và purH nhằm nâng cao độ phân biệt loài trong bộ sưu tập giống vi sinh vật HBCM. Nghiên cứu được thực hiện trong năm 2023 tại Trung tâm Công nghệ Sinh học Thành phố Hồ Chí Minh, với ý nghĩa quan trọng trong việc cải thiện độ chính xác phân loại vi khuẩn, hỗ trợ phát triển các ứng dụng sinh học và quản lý nguồn gen vi sinh vật.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Phân tích phát sinh loài dựa trên trình tự phân tử là phương pháp chủ đạo để xác định mối quan hệ tiến hóa giữa các vi sinh vật. MLSA là kỹ thuật phân tích đa gen giữ nhà (housekeeping genes) nhằm đánh giá đa dạng di truyền và phân loại vi khuẩn đến cấp độ loài. Các gen giữ nhà được chọn phải có tính bảo tồn cao, phổ biến trong các chủng nghiên cứu và chứa đủ biến dị để phân biệt các loài gần gũi. Trong nghiên cứu này, 6 gen được lựa chọn gồm 16S rRNA (gen mã hóa tiểu đơn vị ribosome 30S), rpoD (yếu tố sigma 70), glpF (protein vận chuyển glycerol), pta (phosphate acetyltransferase), pycA (pyruvate carboxylase) và purH (enzyme AICAR transformylase). Các phương pháp xây dựng cây phát sinh loài bao gồm Neighbor-Joining (NJ), Maximum Likelihood (ML) và Maximum Parsimony (MP) được sử dụng để đánh giá mối quan hệ giữa các chủng.

Phương pháp nghiên cứu

Nguồn dữ liệu gồm 8 chủng Bacillus spp. từ bộ sưu tập HBCM và 35 chủng tham chiếu từ GenBank. DNA tổng số được tách chiết từ sinh khối nuôi cấy trong môi trường Tryptone Soya Broth (TSB) và Tryptone Soya Agar (TSA). Phản ứng PCR được tối ưu hóa với nhiệt độ bắt cặp riêng cho từng cặp mồi gen rpoD, glpF, pta, pycA, purH và 16S rRNA. Sản phẩm PCR được tinh sạch và giải trình tự bằng phương pháp Sanger. Trình tự thu được được xử lý loại bỏ đoạn kém chất lượng, căn chỉnh bằng thuật toán MUSCLE trong phần mềm MEGA 11. Phân tích đa dạng nucleotide, hàm lượng G+C và chỉ số Information Parsimony Site (IPS) được tính bằng phần mềm DnaSP. Cây phát sinh loài được xây dựng chủ yếu bằng phương pháp Neighbor-Joining với 1000 lần bootstrap để đánh giá độ tin cậy. Nghiên cứu tiến hành trong năm 2023 với quy trình chi tiết từ nuôi cấy, tách chiết DNA, PCR, giải trình tự đến phân tích dữ liệu.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

  1. Nhiệt độ bắt cặp tối ưu cho PCR: Gen purH có nhiệt độ bắt cặp tối ưu là 40,1°C, gen pycA từ 47,6°C đến 52°C, gen rpoD từ 48,1°C đến 60,1°C, gen pta là 48,5°C và gen glpF từ 57,9°C đến 60,1°C. Các nhiệt độ này đảm bảo sản phẩm PCR đặc hiệu, phù hợp cho giải trình tự.

  2. Đặc điểm trình tự gen: Chiều dài gen dao động từ 720 bp (pycA) đến 1475 bp (16S rRNA). Giá trị IPS của gen 16S rRNA thấp nhất (4,27%), trong khi các gen rpoD, glpF, pta, pycA và purH có IPS lần lượt là 31,1%, 33,8%, 38,7%, 42,7% và 45,2%, cho thấy các gen này có mức độ biến dị cao hơn, phù hợp để phân biệt các loài gần gũi. Hàm lượng G+C của 16S rRNA là 54,9%, cao hơn các gen còn lại (khoảng 46-48%).

  3. Phân tích phát sinh loài: Cây phát sinh loài dựa trên gen 16S rRNA chia các chủng thành 4 nhóm nhưng có giá trị bootstrap thấp (<70%) ở nhiều nhánh, không đủ tin cậy để phân biệt các loài gần gũi. Cây phát sinh từ các gen rpoD và glpF cho thấy sự phân biệt rõ ràng hơn với bootstrap đạt 100% cho một số loài như B. sonorensis, tuy nhiên các nhánh chính vẫn có giá trị bootstrap thấp. Cây từ gen pta và purH có giá trị bootstrap cao hơn, đặc biệt phân biệt tốt loài B. pumilus. Cây từ gen pycA có giá trị bootstrap thấp (58%). Kết quả cho thấy việc sử dụng riêng lẻ các gen giữ nhà không đủ để phân loại chính xác.

  4. Phân tích ghép nối gen: Việc ghép nối các gen theo thứ tự 16S rRNA-rpoD, 16S rRNA-rpoD-pta, 16S rRNA-rpoD-pta-purH, 16S rRNA-rpoD-pta-purH-glpF và 16S rRNA-rpoD-pta-purH-glpF-pycA làm tăng giá trị IPS từ 12,2% đến 27,3%, đồng thời cải thiện độ tin cậy của cây phát sinh loài. Tuy nhiên, số lượng gen ghép nối quá nhiều có thể làm giảm mức độ bảo tồn và tăng chi phí, thời gian phân tích.

Thảo luận kết quả

Kết quả nghiên cứu khẳng định rằng gen 16S rRNA mặc dù là công cụ nền tảng trong phân loại vi khuẩn nhưng không đủ độ phân giải để phân biệt các loài Bacillus có quan hệ gần gũi do mức độ bảo tồn cao và sự chồng chéo trình tự. Các gen giữ nhà như rpoD, glpF, pta, pycA và purH có mức độ biến dị cao hơn, giúp phân biệt các loài gần nhau tốt hơn nhưng khi sử dụng riêng lẻ lại thiếu độ tin cậy do giá trị bootstrap thấp ở các nhánh chính. Việc kết hợp gen 16S rRNA với các gen giữ nhà khác trong phương pháp MLSA tạo ra sự cân bằng giữa mức độ bảo tồn và khả năng phân biệt, nâng cao độ chính xác phân loại. So sánh với các nghiên cứu trước đây cho thấy MLSA là phương pháp ưu việt hơn so với DNA-DNA hybridization và DNA fingerprinting về tính tái lập và khả năng mở rộng cho số lượng lớn chủng. Các biểu đồ cây phát sinh loài và ma trận khoảng cách nucleotide minh họa rõ sự khác biệt về độ phân giải giữa các gen và tổ hợp gen, hỗ trợ trực quan cho kết luận về hiệu quả của MLSA trong phân loại Bacillus.

Đề xuất và khuyến nghị

  1. Áp dụng phương pháp MLSA với bộ 6 gen: Khuyến nghị sử dụng đồng thời 6 gen 16S rRNA, rpoD, glpF, pta, pycA và purH để định danh chính xác các loài Bacillus trong bộ sưu tập vi sinh vật, nhằm tăng độ phân giải và độ tin cậy phân loại. Thời gian thực hiện dự kiến 6-8 tuần cho mỗi đợt phân tích.

  2. Tối ưu hóa quy trình PCR: Đề xuất chuẩn hóa nhiệt độ bắt cặp PCR cho từng cặp mồi theo kết quả khảo sát để đảm bảo sản phẩm đặc hiệu, giảm sai số trong giải trình tự. Chủ thể thực hiện là phòng thí nghiệm phân tử tại các trung tâm nghiên cứu.

  3. Xây dựng cơ sở dữ liệu trình tự gen MLSA: Thiết lập cơ sở dữ liệu trình tự gen ghép nối của các loài Bacillus phổ biến tại Việt Nam để hỗ trợ phân loại nhanh và chính xác trong tương lai, đồng thời làm nền tảng cho các nghiên cứu đa dạng sinh học. Thời gian xây dựng khoảng 12 tháng.

  4. Đào tạo và chuyển giao kỹ thuật: Tổ chức các khóa đào tạo về kỹ thuật MLSA cho cán bộ nghiên cứu và kỹ thuật viên tại các viện, trường đại học nhằm nâng cao năng lực phân tích và ứng dụng phương pháp này trong nghiên cứu và công nghiệp.

Đối tượng nên tham khảo luận văn

  1. Nhà nghiên cứu vi sinh vật học: Nghiên cứu về đa dạng và phân loại vi khuẩn, đặc biệt các loài Bacillus, sẽ được cung cấp phương pháp phân tích hiện đại, chính xác và các dữ liệu tham khảo về gen giữ nhà.

  2. Chuyên gia công nghệ sinh học: Ứng dụng trong phát triển chế phẩm sinh học, enzyme, kháng sinh từ Bacillus, giúp lựa chọn chủng phù hợp dựa trên phân loại chính xác.

  3. Cán bộ quản lý bộ sưu tập vi sinh vật: Hỗ trợ trong việc quản lý, phân loại và bảo tồn nguồn gen vi sinh vật, nâng cao chất lượng bộ sưu tập.

  4. Sinh viên và học viên cao học: Tài liệu tham khảo về phương pháp nghiên cứu phân tích phát sinh loài, kỹ thuật giải trình tự gen và phân tích dữ liệu sinh học phân tử.

Câu hỏi thường gặp

  1. MLSA là gì và tại sao lại ưu việt hơn 16S rRNA?
    MLSA là phương pháp phân tích đa gen giữ nhà nhằm phân loại vi khuẩn đến cấp độ loài bằng cách sử dụng trình tự ghép nối của nhiều gen. Nó vượt trội hơn 16S rRNA vì có độ phân giải cao hơn, giúp phân biệt các loài có quan hệ gần gũi mà 16S rRNA không thể phân biệt được do mức độ bảo tồn cao.

  2. Tại sao phải chọn nhiều gen giữ nhà để phân tích?
    Việc sử dụng nhiều gen giữ nhà giúp cân bằng giữa mức độ bảo tồn và biến dị, tăng độ tin cậy và chính xác trong phân loại. Một gen đơn lẻ có thể không đủ thông tin hoặc gây mâu thuẫn trong kết quả.

  3. Nhiệt độ bắt cặp PCR ảnh hưởng thế nào đến kết quả?
    Nhiệt độ bắt cặp tối ưu giúp sản phẩm PCR đặc hiệu, tránh tạo ra sản phẩm không mong muốn làm giảm chất lượng giải trình tự và ảnh hưởng đến phân tích phát sinh loài.

  4. Có thể áp dụng phương pháp này cho các chi vi khuẩn khác không?
    Có, MLSA là phương pháp phổ biến và đã được áp dụng thành công cho nhiều chi vi khuẩn khác nhau nhằm phân loại và đánh giá đa dạng di truyền.

  5. Thời gian và chi phí thực hiện MLSA như thế nào?
    Thời gian thực hiện khoảng 6-8 tuần tùy quy mô mẫu, chi phí phụ thuộc vào số lượng gen và mẫu phân tích, nhưng MLSA tiết kiệm hơn so với các phương pháp lai DNA-DNA truyền thống và có thể mở rộng cho số lượng lớn mẫu.

Kết luận

  • Phương pháp MLSA sử dụng 6 gen giữ nhà 16S rRNA, rpoD, glpF, pta, pycA và purH cho phép phân loại chính xác các loài Bacillus có quan hệ gần gũi.
  • Gen 16S rRNA có mức độ bảo tồn cao nhưng không đủ phân biệt các loài gần nhau, trong khi các gen giữ nhà khác có biến dị cao hơn, hỗ trợ phân loại chi tiết.
  • Kết hợp các gen trong MLSA tạo ra cây phát sinh loài có độ tin cậy cao hơn so với phân tích gen đơn lẻ.
  • Nghiên cứu đề xuất quy trình PCR tối ưu và xây dựng cơ sở dữ liệu trình tự gen để hỗ trợ phân loại vi khuẩn trong tương lai.
  • Các bước tiếp theo bao gồm mở rộng số lượng chủng nghiên cứu, hoàn thiện cơ sở dữ liệu và đào tạo kỹ thuật cho cán bộ nghiên cứu nhằm ứng dụng rộng rãi MLSA trong phân loại vi sinh vật.

Hành động tiếp theo: Áp dụng phương pháp MLSA trong các dự án nghiên cứu và phát triển sản phẩm sinh học, đồng thời chia sẻ kết quả để nâng cao nhận thức và kỹ năng trong cộng đồng khoa học vi sinh.