Luận Văn Thạc Sĩ: Nghiên Cứu Tần Số Allele 22 Locus STR Trên Nhiễm Sắc Thể Thường Ở Người Mông ...

Trường đại học

Học viện Khoa học và Công nghệ

Chuyên ngành

Công nghệ sinh học

Người đăng

Ẩn danh

Thể loại

luận văn thạc sĩ

2023

Phí lưu trữ

35 Point

Mục lục chi tiết

LỜI CẢM ƠN

DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT

DANH MỤC CÁC BẢNG

DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ

1. MỞ ĐẦU

2. TỔNG QUAN TÀI LIỆU

2.1. Tổng quan về đoạn lặp ngắn ngẫu nhiên – STR

2.1.1. Short tandem repeat – STR

2.1.2. STR là gì

3. NGUYÊN VẬT LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU

3.1. Nguyên vật liệu

3.2. Địa điểm thu mẫu. Thu thập và bảo quản

3.3. Phương pháp nghiên cứu

3.3.1. Khuếch đại đoạn gen

3.3.2. Tính toán tần số và các chỉ số pháp y

3.3.3. Xác định mối liên hệ giữa quần thể người Mông tại Hà Giang và các quần thể khác

4. KẾT QUẢ VÀ THẢO LUẬN

4.1. Kết quả thu mẫu và khuếch đại ADN

4.2. Kết quả tính tần số các locus và xác định các allele có tần số thấp

4.3. Kết quả phân tích thống kê

4.3.1. Kiểm định cân bằng Hardy-Weinberg

4.3.2. Giá trị dị hợp tử mong đợi và quan sát được

4.3.3. Kiểm tra tính di truyền liên kết của các locus STR

4.4. Kết quả phân tích các chỉ số pháp y

4.4.1. Chỉ số khả năng trùng hợp ngẫu nhiên - Match probability (MP)

4.4.2. Chỉ số khả năng loại trừ - Power of Exclusion

4.4.3. Chỉ số khả năng phân biệt – Discrimination capacity

4.4.4. Chỉ số đa hình - Polymorphic information content

4.4.5. Chỉ số Parternity index – PI

4.4.6. Các chỉ số pháp y đánh giá tần số các allele của một quần thể

4.5. Kết quả phân tích mối tương quan di truyền với các quần thể khác

5. KẾT LUẬN VÀ KIẾN NGHỊ

TÀI LIỆU THAM KHẢO

PHỤ LỤC 1: Kết quả khuếch đại các locus STR của mẫu đối chứng dương

PHỤ LỤC 2: Kết quả khuếch đại các locus STR của mẫu đối chứng âm

PHỤ LỤC 3: Kết quả kiểm định Chi-square các cặp locus về linkage disequilibrium

PHỤ LỤC 4: Thông tin các mẫu tham gia đề tài

Tóm tắt

I. Giới thiệu

Luận văn thạc sĩ này tập trung vào việc xây dựng cơ sở dữ liệu tần số allele của 22 locus STR trên NST thường ở người Mông tại Hà Giang. Nghiên cứu này nhằm mục đích cung cấp thông tin quan trọng cho các ứng dụng trong di truyền học, phân tích gen, và giám định pháp y. STR là các đoạn trình tự ngắn được lặp lại, có tính đa dạng cao và được sử dụng rộng rãi trong các nghiên cứu về di truyền quần thể. Việc thu thập dữ liệu về tần số allele của các locus STR sẽ giúp xác định mối quan hệ di truyền giữa các nhóm dân tộc khác nhau, đồng thời phục vụ cho công tác xác định danh tính trong các vụ án hình sự.

1.1. Mục tiêu nghiên cứu

Mục tiêu chính của nghiên cứu là xây dựng bộ số liệu tần số allele của 22 locus STR trên NST thường của người Mông. Nghiên cứu cũng nhằm đánh giá các chỉ số thống kê đặc trưng của tần số allele, chỉ số đa dạng di truyền của quần thể, và xác định mối quan hệ di truyền của người Mông với các quần thể gần gũi khác. Việc xây dựng cơ sở dữ liệu này không chỉ có giá trị trong nghiên cứu di truyền học mà còn hỗ trợ cho các hoạt động giám định pháp y và xác định huyết thống.

II. Tổng quan tài liệu

Tổng quan về đoạn lặp ngắn ngẫu nhiên – STR cho thấy rằng STR là các đoạn trình tự ADN có độ dài từ 2 đến 7 nucleotide, nằm rải rác trong hệ gen của con người. Chúng có tính bảo thủ cao và được truyền từ thế hệ này sang thế hệ khác. STR được sử dụng rộng rãi trong giám định pháp y và nghiên cứu di truyền quần thể. Các nghiên cứu trước đây đã chỉ ra rằng mỗi quần thể có những đặc trưng sinh học riêng biệt, thể hiện qua sự phân bố khác nhau về tần suất allele. Việc thu thập dữ liệu về STR từ các dân tộc thiểu số tại Việt Nam, đặc biệt là người Mông, là rất cần thiết để xây dựng cơ sở dữ liệu và phục vụ cho các nghiên cứu tiếp theo.

2.1. Ứng dụng của STR trong giám định pháp y

Trong lĩnh vực giám định pháp y, STR đã trở thành công cụ quan trọng trong việc xác định danh tính. Các chỉ thị STR cho phép phân biệt các cá thể, ngay cả với những cá thể có quan hệ huyết thống gần gũi. Việc sử dụng STR trong các vụ án hình sự đã giúp giải quyết nhiều vụ án phức tạp, từ đó khẳng định vai trò của STR trong việc cung cấp thông tin chính xác và đáng tin cậy. Các bộ kit thương mại hiện nay cho phép khuếch đại nhiều locus STR cùng lúc, nâng cao khả năng phân biệt và giảm thiểu sai sót trong quá trình giám định.

III. Phương pháp nghiên cứu

Nghiên cứu được thực hiện thông qua việc thu thập mẫu ADN từ người Mông tại Hà Giang. Các mẫu được thu thập và bảo quản theo quy trình nghiêm ngặt để đảm bảo chất lượng. Phương pháp khuếch đại đoạn gen sử dụng PCR để xác định tần số allele và các chỉ số pháp y như Match Probability (MP), Power of Exclusion (PE), và Discrimination Capacity (DC). Các chỉ số này sẽ được tính toán và phân tích để đánh giá tính đa dạng di truyền của quần thể. Kết quả thu được sẽ được so sánh với các quần thể khác để xác định mối quan hệ di truyền.

3.1. Khuếch đại và phân tích dữ liệu

Quá trình khuếch đại ADN được thực hiện bằng phương pháp PCR, cho phép tạo ra số lượng lớn các đoạn ADN cần thiết cho phân tích. Sau khi khuếch đại, các sản phẩm sẽ được phân tích bằng điện di mao quản để xác định kích thước và số lượng allele tại mỗi locus STR. Dữ liệu thu được sẽ được xử lý bằng phần mềm thống kê để tính toán các chỉ số di truyền và kiểm định cân bằng Hardy-Weinberg. Việc phân tích này không chỉ giúp xác định tần số allele mà còn cung cấp thông tin về tính đa dạng di truyền của quần thể, từ đó phục vụ cho các nghiên cứu tiếp theo.

IV. Kết quả và thảo luận

Kết quả nghiên cứu cho thấy tần số allele của 22 locus STR trên NST thường ở người Mông tại Hà Giang có sự đa dạng đáng kể. Các chỉ số như MP, PE, và DC đều cho thấy tính khả thi trong việc sử dụng dữ liệu này cho các mục đích giám định pháp y. Kết quả phân tích cũng chỉ ra rằng người Mông có mối quan hệ di truyền gần gũi với một số quần thể khác, điều này mở ra hướng nghiên cứu mới trong lĩnh vực di truyền học và nhân chủng học. Việc xây dựng cơ sở dữ liệu này không chỉ có giá trị trong nghiên cứu mà còn hỗ trợ cho các hoạt động thực tiễn trong công tác giám định.

4.1. Ý nghĩa của nghiên cứu

Nghiên cứu này có ý nghĩa quan trọng trong việc cung cấp cơ sở dữ liệu tần số allele cho người Mông, phục vụ cho công tác giám định pháp y và nghiên cứu di truyền học. Dữ liệu này sẽ giúp các nhà nghiên cứu và các cơ quan chức năng trong việc xác định danh tính và truy xuất nguồn gốc. Hơn nữa, nghiên cứu cũng góp phần làm phong phú thêm kiến thức về di truyền quần thể tại Việt Nam, đặc biệt là trong bối cảnh các dân tộc thiểu số. Điều này không chỉ có giá trị khoa học mà còn có ý nghĩa xã hội sâu sắc.

01/03/2025

Bạn đang xem trước tài liệu:

Luận văn thạc sĩ xây dựng cơ sở dữ liệu về tần số allele 22 locus đa hình str trên nhiễm sắc thể thường ở quần thể người mông tại hà giang việt nam

Tải đầy đủ

Nội dung chính

Tổng quan nghiên cứu

Short tandem repeat (STR) là các đoạn trình tự ADN ngắn, lặp lại từ 2 đến 7 nucleotide, chiếm khoảng 3% hệ gen người và phân bố rải rác trên các nhiễm sắc thể. STR có tính đa hình cao, được truyền từ thế hệ này sang thế hệ khác và không ảnh hưởng đến chức năng sinh học, do đó trở thành chỉ thị phân tử quan trọng trong giám định pháp y, nghiên cứu di truyền quần thể và nhân chủng học. Tại Việt Nam, việc xây dựng cơ sở dữ liệu tần số allele STR cho các dân tộc thiểu số, đặc biệt là người Mông, còn rất hạn chế do địa bàn cư trú phân tán và dân số thấp. Người Mông là dân tộc thiểu số lớn thứ sáu tại Việt Nam, tập trung chủ yếu ở tỉnh Hà Giang với hơn 230 nghìn người, có đặc điểm văn hóa và di truyền riêng biệt.

Nghiên cứu này nhằm xây dựng cơ sở dữ liệu tần số allele của 22 locus STR trên nhiễm sắc thể thường ở quần thể người Mông tại Hà Giang, đánh giá các chỉ số đa dạng di truyền và xác định mối quan hệ di truyền với các quần thể khác. Phạm vi nghiên cứu bao gồm 156 mẫu DNA thu thập từ hai huyện Mèo Vạc và Đồng Văn, tỉnh Hà Giang. Kết quả nghiên cứu sẽ cung cấp cơ sở dữ liệu quan trọng phục vụ công tác giám định pháp y, xác định huyết thống, đồng thời góp phần nghiên cứu đa dạng di truyền và bảo tồn nguồn gen của dân tộc Mông.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Nghiên cứu dựa trên lý thuyết di truyền Mendel với hai định luật cơ bản: định luật phân ly độc lập và định luật phân ly. STR được sử dụng làm chỉ thị phân tử do tính đa hình cao và khả năng phân biệt cá thể. Mô hình đột biến STR được mô tả qua hai mô hình chính: Infinite Allele Model (IAM) và Stepwise Mutation Model (SMM), trong đó SMM phù hợp hơn với đặc tính đột biến của STR do cơ chế gấp đoạn trong quá trình tái bản. Các chỉ số di truyền như cân bằng Hardy-Weinberg (HWE), heterozygosity, linkage disequilibrium (LD) được áp dụng để đánh giá tính đa dạng và sự cân bằng di truyền trong quần thể. Bộ kit PowerPlex Fusion System được sử dụng để khuếch đại 24 locus STR, bao gồm 22 locus trên nhiễm sắc thể thường và 2 locus trên nhiễm sắc thể giới tính, đảm bảo độ nhạy và độ đặc hiệu cao.

Phương pháp nghiên cứu

Nguồn dữ liệu gồm 156 mẫu DNA thu thập từ người Mông tại hai huyện Mèo Vạc (53 mẫu) và Đồng Văn (103 mẫu), với tỷ lệ nam/nữ là 63/93. Mẫu thu thập gồm máu ngoại vi, tóc và niêm mạc miệng, được bảo quản và xử lý theo quy trình chuẩn. DNA được khuếch đại bằng phương pháp PCR sử dụng bộ kit PowerPlex Fusion System với 28 chu kỳ nhiệt trên máy ProFlex 3x32-Well PCR System. Sản phẩm PCR được phân tích bằng điện di mao quản trên máy ABI 3500 Genetic Analyzer, dữ liệu được xử lý bằng phần mềm GeneMapper ID v3.2.

Phân tích tần số allele, các chỉ số đa dạng di truyền (EH, OH), kiểm định cân bằng Hardy-Weinberg, linkage disequilibrium và các chỉ số pháp y (MP, PE, DC, PIC, PI) được thực hiện bằng phần mềm Arlequin v3.5 và công cụ FORSTAT. Mối quan hệ di truyền giữa quần thể người Mông và các quần thể khác được xác định qua cây phát sinh chủng loại xây dựng bằng phần mềm POPTREE2 với phương pháp neighbor joining (NJ) và UPGMA, lặp lại 1000 lần bootstrap.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

Khuếch đại và số lượng allele: Tất cả 156 mẫu đều được khuếch đại thành công 24 locus STR, không ghi nhận hiện tượng mất allele hay tri-allele. Tổng cộng thu được 205 allele khác nhau, trong đó locus Penta E có số lượng allele đa dạng nhất với 16 allele, tiếp theo là D2S1338 (13 allele), D1S1656 và D18S51 (12 allele). Locus TPOX có số allele thấp nhất với 5 allele.
Tần số allele và allele có tần số thấp: Các allele có tần số thấp (≤ 0.016) được phát hiện nhiều nhất ở locus D18S51 và FGA, cho thấy sự đa dạng di truyền đặc trưng của quần thể người Mông. Sự khác biệt về số lượng allele và tần số allele so với quần thể người Kinh có thể do đặc điểm di truyền riêng biệt và kích thước mẫu nghiên cứu.
Kiểm định cân bằng Hardy-Weinberg: Kết quả kiểm định cho thấy toàn bộ 22 locus STR đều tuân theo cân bằng Hardy-Weinberg với giá trị p > 0, chứng tỏ quần thể người Mông tại Hà Giang là quần thể giao phối ngẫu nhiên, không có hiện tượng di nhập gen hay đột biến mới phát sinh đáng kể.
Chỉ số đa dạng di truyền và pháp y: Giá trị dị hợp tử quan sát được (OH) và mong đợi (EH) cho thấy 17 locus có OH > EH, phản ánh sự đa dạng di truyền cao trong quần thể. Kiểm định linkage disequilibrium chỉ phát hiện liên kết di truyền cân bằng giữa hai locus D7S820 và D12S391 (p < 0.002), các locus còn lại không có liên kết di truyền đáng kể.

Thảo luận kết quả

Kết quả khuếch đại thành công 100% mẫu và đa dạng allele cao chứng tỏ phương pháp thu thập mẫu và kỹ thuật PCR sử dụng bộ kit PowerPlex Fusion System phù hợp với điều kiện thực tế tại Việt Nam. Số lượng allele đa dạng ở locus Penta E và D2S1338 phù hợp với các nghiên cứu quốc tế về tính đa hình cao của các locus này, góp phần nâng cao khả năng phân biệt cá thể trong giám định pháp y.

Việc quần thể người Mông tuân theo cân bằng Hardy-Weinberg cho thấy quần thể này có tính ổn định về mặt di truyền, phù hợp với đặc điểm sinh sống quần tụ và tập quán hôn nhân tự do kén chọn bạn đời, hạn chế hôn nhân cận huyết. Sự khác biệt về allele tần số thấp so với quần thể người Kinh phản ánh đặc trưng di truyền riêng biệt của người Mông, đồng thời nhấn mạnh tầm quan trọng của việc xây dựng cơ sở dữ liệu riêng biệt cho từng dân tộc thiểu số.

Phân tích linkage disequilibrium cho thấy hầu hết các locus STR độc lập về mặt di truyền, đảm bảo tính chính xác trong phân tích giám định và nghiên cứu di truyền quần thể. Kết quả cây phát sinh chủng loại (không trình bày chi tiết ở đây) cũng cho thấy mối quan hệ di truyền gần gũi giữa người Mông và các quần thể dân tộc thiểu số khác trong khu vực, phù hợp với các nghiên cứu nhân chủng học trước đó.

Đề xuất và khuyến nghị

Mở rộng quy mô thu thập mẫu: Tăng số lượng mẫu thu thập từ các vùng khác có người Mông sinh sống nhằm nâng cao độ tin cậy và tính đại diện của cơ sở dữ liệu tần số allele STR, dự kiến trong vòng 2-3 năm, do Viện Công nghệ sinh học phối hợp với các cơ quan địa phương thực hiện.
Xây dựng cơ sở dữ liệu STR quốc gia cho các dân tộc thiểu số: Tích hợp dữ liệu STR của người Mông vào hệ thống cơ sở dữ liệu quốc gia phục vụ công tác giám định pháp y và nghiên cứu đa dạng di truyền, nhằm nâng cao hiệu quả truy xuất nguồn gốc và xác định danh tính, thực hiện trong 5 năm tới dưới sự chỉ đạo của Bộ Công an và Viện Khoa học hình sự.
Đào tạo và nâng cao năng lực kỹ thuật cho cán bộ giám định: Tổ chức các khóa đào tạo chuyên sâu về kỹ thuật PCR, phân tích STR và xử lý dữ liệu cho cán bộ phòng thí nghiệm pháp y tại các tỉnh miền núi, đảm bảo chất lượng và độ chính xác của kết quả giám định, thực hiện hàng năm.
Nghiên cứu mở rộng ứng dụng STR trong nhân chủng học và bảo tồn nguồn gen: Khuyến khích các đề tài nghiên cứu liên ngành sử dụng dữ liệu STR để phân tích đa dạng di truyền, lịch sử di cư và bảo tồn nguồn gen của các dân tộc thiểu số, đặc biệt là người Mông, trong vòng 3-5 năm tới.

Đối tượng nên tham khảo luận văn

Các nhà khoa học pháp y và giám định ADN: Sử dụng cơ sở dữ liệu tần số allele STR để nâng cao độ chính xác trong xác định danh tính và giám định huyết thống trong các vụ án hình sự, đặc biệt tại các vùng dân tộc thiểu số.
Nhà nghiên cứu di truyền quần thể và nhân chủng học: Khai thác dữ liệu đa dạng di truyền của người Mông để nghiên cứu lịch sử di cư, cấu trúc quần thể và mối quan hệ di truyền giữa các dân tộc tại Việt Nam và khu vực Đông Nam Á.
Cơ quan quản lý và hoạch định chính sách y tế, dân số: Áp dụng kết quả nghiên cứu để xây dựng các chính sách bảo tồn nguồn gen, phát triển bền vững cộng đồng dân tộc thiểu số, đồng thời hỗ trợ công tác quản lý dân cư.
Sinh viên và học viên cao học ngành sinh học, công nghệ sinh học, pháp y: Tham khảo phương pháp nghiên cứu, kỹ thuật phân tích STR và ứng dụng thực tiễn trong giám định pháp y và nghiên cứu đa dạng sinh học.

Câu hỏi thường gặp

STR là gì và tại sao được sử dụng trong giám định pháp y?
STR là các đoạn ADN ngắn lặp lại có tính đa hình cao, giúp phân biệt cá thể do sự khác biệt về số lần lặp. STR được sử dụng phổ biến trong giám định pháp y vì độ nhạy cao, khả năng phân biệt cá thể tốt và có thể áp dụng trên mẫu ADN phức tạp.
Tại sao cần xây dựng cơ sở dữ liệu tần số allele STR cho từng dân tộc?
Mỗi dân tộc có đặc trưng di truyền riêng biệt, do đó tần số allele STR khác nhau. Cơ sở dữ liệu riêng giúp tăng độ chính xác trong giám định, tránh sai sót do sử dụng dữ liệu không phù hợp với quần thể nghiên cứu.
Phương pháp thu thập mẫu nào được sử dụng trong nghiên cứu này?
Mẫu thu thập gồm máu ngoại vi trên thẻ FTA, tóc có chân và niêm mạc miệng bằng tăm bông y tế. Các mẫu này được bảo quản ở nhiệt độ -20°C và phù hợp với điều kiện thu thập tại vùng núi cao.
Các chỉ số pháp y như MP, PE, DC có ý nghĩa gì?
MP (Match Probability) là xác suất trùng hợp ngẫu nhiên, PE (Power of Exclusion) là khả năng loại trừ cá thể không liên quan, DC (Discrimination Capacity) là khả năng phân biệt cá thể. Các chỉ số này đánh giá hiệu quả của bộ locus STR trong giám định.
Liệu kết quả nghiên cứu có thể áp dụng cho các dân tộc khác tại Việt Nam?
Kết quả chủ yếu phản ánh đặc trưng di truyền của người Mông tại Hà Giang. Mỗi dân tộc có đặc điểm riêng, do đó cần nghiên cứu riêng biệt để xây dựng cơ sở dữ liệu phù hợp cho từng nhóm dân tộc.

Kết luận

Đã xây dựng thành công cơ sở dữ liệu tần số allele của 22 locus STR trên nhiễm sắc thể thường cho quần thể người Mông tại Hà Giang với 156 mẫu thu thập.
Quần thể người Mông tuân theo cân bằng Hardy-Weinberg, có đa dạng di truyền cao và hầu hết các locus không có liên kết di truyền đáng kể.
Bộ kit PowerPlex Fusion System phù hợp và hiệu quả trong việc khuếch đại và phân tích STR tại điều kiện thực tế Việt Nam.
Kết quả nghiên cứu cung cấp cơ sở quan trọng cho công tác giám định pháp y, nghiên cứu di truyền quần thể và bảo tồn nguồn gen dân tộc Mông.
Đề xuất mở rộng quy mô nghiên cứu, xây dựng cơ sở dữ liệu STR quốc gia cho các dân tộc thiểu số và nâng cao năng lực kỹ thuật cho cán bộ giám định.

Tiếp theo, cần triển khai thu thập mẫu bổ sung, hoàn thiện cơ sở dữ liệu và ứng dụng kết quả vào thực tiễn giám định pháp y. Các nhà nghiên cứu và cơ quan chức năng được khuyến khích phối hợp để phát huy tối đa giá trị của nghiên cứu này.

Luận Văn Thạc Sĩ: Xây Dựng Cơ Sở Dữ Liệu Tần Số Allele 22 Locus STR Trên NST Thường Ở Người Mông Tại Hà Giang là một nghiên cứu chuyên sâu về di truyền học, tập trung vào việc xây dựng cơ sở dữ liệu tần số allele của 22 locus STR trên nhiễm sắc thể thường ở người Mông tại Hà Giang. Nghiên cứu này không chỉ cung cấp dữ liệu quan trọng cho các nghiên cứu di truyền học dân tộc mà còn hỗ trợ trong việc xác định danh tính và phân tích phả hệ. Đây là nguồn tài liệu quý giá cho các nhà khoa học, sinh viên và những người quan tâm đến lĩnh vực di truyền học.

Nếu bạn muốn tìm hiểu thêm về các phương pháp phân tích dữ liệu và khai thác thông tin, hãy khám phá Luận văn Advanced Data Mining Techniques, nơi cung cấp các kỹ thuật khai thác dữ liệu tiên tiến. Bên cạnh đó, Luận văn Phân Lớp Dữ Liệu Chuỗi Thời Gian Bằng Mạng Nơron Tích Chập CNN sẽ giúp bạn hiểu rõ hơn về ứng dụng của trí tuệ nhân tạo trong phân tích dữ liệu. Cuối cùng, Luận văn Hệ Thống Làm Sạch Dữ Liệu OpenK là một tài liệu hữu ích để tìm hiểu về các phương pháp phát hiện bất thường trong dữ liệu.

Mỗi liên kết trên là cơ hội để bạn mở rộng kiến thức và khám phá sâu hơn các chủ đề liên quan.

#Luận văn Thạc sĩ

#nghiên cứu di truyền

#nhiễm sắc thể thường

#tần số allele

#cơ sở dữ liệu di truyền

Chủ đề

Khoa học Dữ liệu

nghiên cứu dân tộc

y học dân tộc