Nghiên Cứu Về Nhận Diện Bạo Hành Trong Văn Bản Tiếng Việt

Khóa luận tốt nghiệp khoa học máy tính nghiên cứu nhận diện bạo hành trong văn bản tự sự tiếng Việt, ứng dụng công nghệ AI và NLP.

Trường đại học

Đại học Quốc gia Thành phố Hồ Chí Minh

Chuyên ngành

Khoa học máy tính

Người đăng

Ẩn danh

Thể loại

luận văn thạc sĩ

2024

Phí lưu trữ

30 Point

Mục lục chi tiết

LỜI CAM ĐOAN

LỜI CẢM ƠN

1. CHƯƠNG 1: ĐỘNG LỰC THỰC HIỆN ĐỀ TÀI

1.1. Mô tả đề tài

1.2. Phạm vi nghiên cứu

1.3. Mục tiêu đề tài

1.4. Giá trị thực tiễn và ý nghĩa khoa học

1.5. Các công trình liên quan

1.6. Đóng góp chính của luận văn

1.7. Công bố khoa học

1.8. Cấu trúc luận văn

2. CHƯƠNG 2: KHÁI NIỆM VỀ BẠO HÀNH VÀ PHÂN LOẠI

3. CHƯƠNG 3: XÂY DỰNG BỘ DỮ LIỆU

4. CHƯƠNG 4: THÍ NGHIỆM VÀ ĐÁNH GIÁ

5. CHƯƠNG 5: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN

5.1. Kết luận

5.2. Hướng phát triển

TÀI LIỆU THAM KHẢO

PHỤ LỤC A: CÔNG BỐ KHOA HỌC

PHỤ LỤC B: GUIDELINES GÁN NHÃN DỮ LIỆU

Tóm tắt

I. Tổng Quan Về Nghiên Cứu Nhận Diện Bạo Hành Trong Văn Bản Tiếng Việt

Nghiên cứu về nhận diện bạo hành trong văn bản tiếng Việt đang trở thành một lĩnh vực quan trọng trong bối cảnh xã hội hiện đại. Với sự gia tăng của các hình thức bạo hành, việc phát hiện và phân loại chúng trong văn bản tự sự là cần thiết. Nghiên cứu này không chỉ giúp nâng cao nhận thức về bạo hành trong văn bản mà còn cung cấp cơ sở dữ liệu cho các ứng dụng công nghệ trong tương lai.

1.1. Khái Niệm Bạo Hành Trong Văn Bản Tiếng Việt

Bạo hành được định nghĩa là hành vi thể hiện quyền lực và kiểm soát đối với người khác. Trong văn bản tiếng Việt, bạo hành có thể xuất hiện dưới nhiều hình thức như bạo hành vật lý, tâm lý, và ngôn từ.

1.2. Tầm Quan Trọng Của Nghiên Cứu Nhận Diện Bạo Hành

Nghiên cứu này không chỉ giúp phát hiện các hành vi bạo hành mà còn góp phần nâng cao nhận thức xã hội về vấn đề này. Việc nhận diện chính xác sẽ hỗ trợ trong việc phát triển các ứng dụng tư vấn tâm lý và chăm sóc sức khỏe tinh thần.

II. Vấn Đề Và Thách Thức Trong Nhận Diện Bạo Hành

Mặc dù có nhiều tiến bộ trong công nghệ xử lý ngôn ngữ tự nhiên, việc nhận diện bạo hành vẫn gặp nhiều thách thức. Các vấn đề như độ chính xác trong việc phân loại và sự đa dạng của ngôn ngữ là những yếu tố cần được giải quyết.

2.1. Độ Chính Xác Trong Phân Loại Bạo Hành

Độ chính xác trong việc phân loại các hình thức bạo hành là một thách thức lớn. Các mô hình hiện tại cần được cải thiện để nhận diện chính xác hơn các hành vi bạo hành trong văn bản.

2.2. Sự Đa Dạng Của Ngôn Ngữ Tiếng Việt

Ngôn ngữ tiếng Việt có nhiều biến thể và sắc thái, điều này làm cho việc nhận diện bạo hành trở nên phức tạp hơn. Cần có các phương pháp phù hợp để xử lý sự đa dạng này.

III. Phương Pháp Nghiên Cứu Nhận Diện Bạo Hành

Để thực hiện nghiên cứu này, một số phương pháp đã được áp dụng nhằm phát hiện và phân loại bạo hành trong văn bản tiếng Việt. Các phương pháp này bao gồm xây dựng bộ dữ liệu và áp dụng các mô hình học máy.

3.1. Xây Dựng Bộ Dữ Liệu Chuyên Biệt

Bộ dữ liệu được xây dựng từ các văn bản tự sự trên các nền tảng trực tuyến. Việc này giúp tạo ra một nguồn tài nguyên phong phú cho việc nghiên cứu và phát triển các mô hình nhận diện bạo hành.

3.2. Áp Dụng Các Mô Hình Học Máy

Các mô hình học máy như BERT và PhoBERT đã được áp dụng để phân loại và nhận diện bạo hành. Những mô hình này cho thấy hiệu quả cao trong việc xử lý ngôn ngữ tự nhiên.

IV. Ứng Dụng Thực Tiễn Của Nghiên Cứu Nhận Diện Bạo Hành

Nghiên cứu về nhận diện bạo hành không chỉ có giá trị lý thuyết mà còn có nhiều ứng dụng thực tiễn. Các ứng dụng này có thể hỗ trợ trong việc phát hiện và can thiệp kịp thời các hành vi bạo hành.

4.1. Phát Triển Ứng Dụng Tư Vấn Tâm Lý

Các ứng dụng tư vấn tâm lý có thể được phát triển dựa trên kết quả nghiên cứu này, giúp người dùng nhận diện và xử lý các vấn đề bạo hành trong cuộc sống.

4.2. Hỗ Trợ Các Tổ Chức Xã Hội

Nghiên cứu cũng có thể hỗ trợ các tổ chức xã hội trong việc cảnh báo và nhận diện các vấn đề liên quan đến bạo lực và sức khỏe tâm thần.

V. Kết Luận Và Hướng Phát Triển Tương Lai

Nghiên cứu về nhận diện bạo hành trong văn bản tiếng Việt đã mở ra nhiều hướng đi mới cho các nghiên cứu tiếp theo. Việc phát triển bộ dữ liệu và các mô hình học máy sẽ là nền tảng cho các nghiên cứu trong tương lai.

5.1. Tóm Tắt Kết Quả Nghiên Cứu

Kết quả nghiên cứu cho thấy rằng việc nhận diện bạo hành trong văn bản tiếng Việt là khả thi và có thể được cải thiện hơn nữa thông qua các phương pháp hiện đại.

5.2. Đề Xuất Hướng Nghiên Cứu Tiếp Theo

Các nghiên cứu tiếp theo có thể tập trung vào việc cải thiện độ chính xác của các mô hình và mở rộng bộ dữ liệu để bao quát nhiều hình thức bạo hành hơn.

10/07/2025

Bạn đang xem trước tài liệu:

Khóa luận tốt nghiệp khoa học máy tính nhận diện bạo hành trong văn bản tự sự tiếng việt

Tải đầy đủ

Nội dung chính

## Tổng quan nghiên cứu

Trong bối cảnh xã hội hiện đại, bạo hành không chỉ là vấn đề nhức nhối mà còn là thách thức lớn đối với sức khỏe tâm thần và an toàn xã hội. Theo thống kê từ bộ dữ liệu nghiên cứu, chỉ có khoảng 19.02% trong tổng số 1,041 văn bản tự sự tiếng Việt thu thập từ chuyên mục Tâm Sự của báo điện tử VnExpress chứa các hành vi bạo hành. Nghiên cứu tập trung vào việc phát hiện và phân loại sáu loại bạo hành chính: vật lý, tình dục, lời nói/cảm xúc, tinh thần/tâm lý, tài chính/kinh tế và văn hóa/bản sắc. Mục tiêu chính của luận văn là xây dựng bộ dữ liệu tiếng Việt chuyên biệt, phát triển guidelines gán nhãn dữ liệu và thử nghiệm các mô hình xử lý ngôn ngữ tự nhiên (NLP) để nhận diện tự động các hành vi bạo hành trong văn bản tự sự. Phạm vi nghiên cứu tập trung vào văn bản tự sự tiếng Việt thu thập trong khoảng thời gian gần đây tại Việt Nam, với ý nghĩa thực tiễn cao trong việc hỗ trợ tư vấn tâm lý và nâng cao nhận thức xã hội về bạo hành. Các chỉ số đánh giá như F-score trong phương pháp đánh giá nghiêm ngặt và linh hoạt được sử dụng để đo lường hiệu quả mô hình, mở ra hướng phát triển ứng dụng công nghệ AI trong lĩnh vực sức khỏe tâm thần.

## Cơ sở lý thuyết và phương pháp nghiên cứu

### Khung lý thuyết áp dụng

- **Khái niệm bạo hành:** Được định nghĩa là hành vi nhằm giành lấy hoặc duy trì quyền lực, kiểm soát người khác, không chỉ giới hạn ở bạo hành vật lý mà còn bao gồm lời nói, tâm lý, tài chính và văn hóa.
- **Phân loại bạo hành:** Nghiên cứu dựa trên sáu loại bạo hành chính gồm: vật lý, tình dục, lời nói/cảm xúc, tinh thần/tâm lý, tài chính/kinh tế và văn hóa/bản sắc.
- **Mô hình xử lý ngôn ngữ tự nhiên:** Áp dụng các mô hình pre-trained như PhoBERT, XLM-RoBERTa kết hợp với mạng BiLSTM và lớp giải mã Softmax hoặc CRF để nhận diện và phân loại các đoạn văn bản chứa bạo hành.
- **Phương pháp gán nhãn dữ liệu:** Sử dụng phương pháp gán nhãn theo chuỗi (sequence labeling) với công cụ hỗ trợ Doccano, dựa trên bộ guidelines được xây dựng và hiệu chỉnh qua quá trình huấn luyện annotators.

### Phương pháp nghiên cứu

- **Nguồn dữ liệu:** Hơn 4,800 câu chuyện tự sự thu thập từ chuyên mục Tâm Sự trên báo điện tử VnExpress, trong đó 1,041 văn bản được chọn ngẫu nhiên để gán nhãn và thử nghiệm.
- **Cỡ mẫu:** 1,041 văn bản tự sự, chia thành 700 văn bản cho tập huấn luyện, 100 văn bản cho tập phát triển và 241 văn bản cho tập kiểm tra.
- **Phương pháp phân tích:** Tiền xử lý dữ liệu bao gồm tạo mask label, phân đoạn câu, tokenization bằng tokenizer của PhoBERT. Các mô hình được huấn luyện qua 100 epochs với batch size 32, learning rate 1e-3 giảm dần theo lịch trình tuyến tính.
- **Timeline nghiên cứu:** Quá trình xây dựng bộ dữ liệu, huấn luyện annotators, gán nhãn, thử nghiệm mô hình và đánh giá kết quả được thực hiện trong năm 2023-2024.
- **Phương pháp đánh giá:** Sử dụng hai phương pháp đánh giá nghiêm ngặt (strict evaluation) và linh hoạt (relax evaluation) để đo lường độ chính xác của mô hình trong việc nhận diện và phân loại bạo hành.

## Kết quả nghiên cứu và thảo luận

### Những phát hiện chính

- **Tỷ lệ văn bản chứa bạo hành:** Chiếm 19.02% trong tổng số dữ liệu, cho thấy bạo hành xuất hiện không phổ biến trong văn bản tự sự nhưng vẫn là vấn đề đáng chú ý.
- **Phân bố các loại bạo hành:** Bạo hành lời nói/cảm xúc và tinh thần/tâm lý chiếm hơn 60% tổng số đoạn bạo hành, trong khi bạo hành tình dục và văn hóa/định danh chỉ chiếm lần lượt 2.1% và 3.1%.
- **Độ dài trung bình đoạn bạo hành:** Đoạn bạo hành tài chính/kinh tế có độ dài trung bình lớn nhất với 30.44 từ, trong khi độ dài trung bình chung của các đoạn bạo hành là khoảng 26.59 từ.
- **Hiệu quả mô hình:** Mô hình PhoBERT large kết hợp BiLSTM-CRF đạt F-score cao nhất 86.10% theo phương pháp đánh giá linh hoạt, trong khi F-score theo đánh giá nghiêm ngặt thấp hơn nhiều (khoảng 18.75%), phản ánh thách thức trong việc xác định chính xác điểm bắt đầu và kết thúc đoạn bạo hành.

### Thảo luận kết quả

Kết quả cho thấy sự mất cân bằng dữ liệu giữa các loại bạo hành ảnh hưởng lớn đến hiệu quả dự đoán, đặc biệt là các loại bạo hành tình dục và văn hóa/định danh có tỷ lệ rất thấp dẫn đến mô hình khó nhận diện chính xác. Việc sử dụng CRF làm lớp giải mã cuối cùng giúp cải thiện đáng kể độ chính xác so với Softmax, nhờ khả năng mô hình hóa mối quan hệ phụ thuộc giữa các nhãn trong chuỗi. So sánh với các nghiên cứu trước đây trong lĩnh vực phát hiện ngôn từ xúc phạm và bạo hành trên mạng xã hội, nghiên cứu này mở rộng sang lĩnh vực văn bản tự sự tiếng Việt, góp phần làm phong phú thêm tài nguyên và phương pháp cho xử lý ngôn ngữ tự nhiên tiếng Việt. Biểu đồ phân bố các loại bạo hành và bảng kết quả thí nghiệm minh họa rõ sự chênh lệch hiệu quả giữa các loại bạo hành, đồng thời chỉ ra hướng phát triển cần tập trung vào cân bằng dữ liệu và cải tiến mô hình.

## Đề xuất và khuyến nghị

- **Mở rộng bộ dữ liệu:** Thu thập thêm dữ liệu cho các loại bạo hành tình dục và văn hóa/định danh nhằm cân bằng phân bố và nâng cao hiệu quả dự đoán.
- **Phát triển mô hình đa nhãn:** Nghiên cứu và áp dụng các phương pháp nhận diện đa nhãn cho phép một đoạn văn bản có thể chứa nhiều loại bạo hành đồng thời, phản ánh thực tế phức tạp hơn.
- **Cải tiến kỹ thuật gán nhãn:** Tăng cường huấn luyện annotators và hoàn thiện guidelines để nâng cao độ đồng thuận và chất lượng dữ liệu gán nhãn.
- **Nghiên cứu nhận diện đoạn bạo hành lồng nhau:** Mở rộng phạm vi nghiên cứu để xử lý các trường hợp đoạn bạo hành chồng chéo hoặc lồng nhau, tăng tính chính xác và thực tiễn của mô hình.
- **Ứng dụng trong tư vấn tâm lý:** Phát triển các hệ thống chatbot và trợ lý ảo dựa trên mô hình nhận diện bạo hành để hỗ trợ tư vấn tâm lý và cảnh báo sớm các vấn đề bạo lực trong xã hội.

## Đối tượng nên tham khảo luận văn

- **Nhà nghiên cứu và sinh viên ngành Khoa học Máy tính, Xử lý Ngôn ngữ Tự nhiên:** Tài liệu cung cấp bộ dữ liệu và phương pháp thử nghiệm chi tiết, hỗ trợ phát triển các nghiên cứu tiếp theo về nhận diện hành vi trong văn bản tiếng Việt.
- **Chuyên gia tâm lý và xã hội học:** Hiểu rõ hơn về các biểu hiện bạo hành trong ngôn ngữ tự sự, từ đó áp dụng vào công tác tư vấn và can thiệp tâm lý.
- **Các tổ chức xã hội và cơ quan pháp luật:** Sử dụng kết quả nghiên cứu để xây dựng các công cụ hỗ trợ phát hiện và xử lý các hành vi bạo hành trong cộng đồng.
- **Nhà phát triển công nghệ AI và ứng dụng:** Áp dụng mô hình và bộ dữ liệu để phát triển các sản phẩm công nghệ như chatbot tư vấn tâm lý, hệ thống giám sát nội dung trên mạng xã hội.

## Câu hỏi thường gặp

1. **Bạo hành trong văn bản tự sự được định nghĩa như thế nào?**  
Bạo hành là hành vi nhằm giành quyền lực và kiểm soát người khác, bao gồm nhiều hình thức như vật lý, tình dục, lời nói, tâm lý, tài chính và văn hóa.

2. **Bộ dữ liệu nghiên cứu được thu thập từ đâu?**  
Dữ liệu được thu thập từ hơn 4,800 câu chuyện tự sự trên chuyên mục Tâm Sự của báo điện tử VnExpress, trong đó 1,041 văn bản được chọn để gán nhãn và thử nghiệm.

3. **Mô hình nào được sử dụng để nhận diện bạo hành?**  
Các mô hình pre-trained như PhoBERT và XLM-RoBERTa kết hợp với mạng BiLSTM và lớp giải mã CRF hoặc Softmax được sử dụng để nhận diện và phân loại bạo hành.

4. **Tại sao kết quả đánh giá nghiêm ngặt thấp hơn đánh giá linh hoạt?**  
Đánh giá nghiêm ngặt yêu cầu dự đoán chính xác điểm bắt đầu và kết thúc đoạn bạo hành, trong khi đánh giá linh hoạt cho phép sai số nhỏ, do đó kết quả nghiêm ngặt thường thấp hơn.

5. **Những thách thức chính trong nghiên cứu này là gì?**  
Bao gồm sự mất cân bằng dữ liệu giữa các loại bạo hành, độ dài và phức tạp của đoạn bạo hành, cũng như việc nhận diện đa nhãn và đoạn bạo hành lồng nhau chưa được giải quyết.

## Kết luận

- Xây dựng thành công bộ dữ liệu tiếng Việt chuyên biệt với 1,041 văn bản tự sự, trong đó 519 đoạn chứa bạo hành được phân loại thành sáu loại chính.  
- Áp dụng hiệu quả các mô hình PhoBERT và XLM-RoBERTa kết hợp BiLSTM-CRF, đạt F-score lên đến 86.10% theo đánh giá linh hoạt.  
- Phát hiện sự mất cân bằng dữ liệu ảnh hưởng đến hiệu quả nhận diện, đặc biệt với bạo hành tình dục và văn hóa/định danh.  
- Đề xuất các hướng phát triển như mở rộng dữ liệu, mô hình đa nhãn, và nhận diện đoạn bạo hành lồng nhau để nâng cao chất lượng nghiên cứu.  
- Kêu gọi các nhà nghiên cứu và tổ chức xã hội tiếp tục phát triển ứng dụng công nghệ NLP trong nhận diện và phòng chống bạo hành, góp phần bảo vệ sức khỏe tâm thần cộng đồng.

Trích đoạn nội dung tài liệu

Chương 1: Tổng quan - Chương này giới thiệu khái quát về dé tài nghiên cứu, bao gồm ngữ cảnh, mục đích và ý nghĩa của luận văn. e Chương 2: Khái niệm về bạo hành và phân loại - Chương này trình bày các khái niệm về bạo hành, các định nghĩa của từng loại bạo hành. e Chương 3: Xây dựng bộ dữ liệu - Chương này tập trung vào việc phát triển và mô tả quy trình xây dựng bộ dữ liệu được sử dụng trong nghiên cứu, cũng như phân tích bộ dữ liệu xây được được. e Chương 4: Thí nghiệm và đánh giá - Chương này mô tả việc thực hiện các thử nghiệm và phương pháp sử dụng trong nghiên cứu.

e Chương 5: Kết luận và hướng phát triển - Tổng hợp kết quả nghiên cứu, nhận định về ý nghĩa và tác động của nó. Ngoài ra, chương này cũng đưa ra những đề xuất cho các hướng nghiên cứu tiếp theo, cũng như khả năng áp dụng thực tiễn của nghiên cứu trong tương lai. KHÁI NIEM VE BAO HANH VÀ PHAN LOẠI Trong chương này, học viên sẽ trình bày về khái niệm bạo hành, các định nghĩa của từng loại bạo hành. Khái niệm Có nhiêu khái niệm về bạo hành, ví dụ như: Office on Violence Our Offices Find Help Contac’ Against Women (OVW) U.

Department of Justice Justice.gov > Office on Violence Against Women (OVW) > Focus Areas > Domestic Violence Domestic Violence Share Quick Exit Cf What Is Domestic Violence? partner relationship. This includes any behaviors that intimidate, manipulate, humiliate, isolate, frighten, terrorize, coerce, threaten, blame, hurt, injure, or wound someone.1 Dinh nghia vé bao hanh theo [40] Tổ chức REACH [32], định nghĩa bạo hành cũng tương tự như trên: reachma.org 6 Different Types of Abuse by: REACH TEAM Date: Mar 23, 2017 The commonly held definition of abuse, which we use in all of our trainings, is “a pattern of behavior used by one person to gain and in other words, not just one incident. These behaviors can take on a number of different forms. Many people, when they hear the word “abuse,” think of physical violence.

It’s important to note that physical force is one means of power and control and it is far from the only one. It’s often not the first one an abuser will use. Below are six different types of abuse we discuss in our training with new volunteers or employees.2 Dinh nghĩa về bạo hành của tổ chức REACH [32] Định nghĩa trong từ điển Cambrigde? như sau: *s dictionary.org tionary Translate © Grammar Thesaurus Cambridge Dictionary +Plus ShopZ (Definition of abuse from the Cambridge Advanced Learners Dictionary & Thesaurus © Cambridge University Press) “abuse | AMERICAN DICTIONARY, abuse noun [C/U ] us 4) /objus/ abuse ver [Tb Us4ỳ /e'bjuz/ to treat a person or animal badly or cruelly, or to use something in the wrong way Hình 2.3 Dinh nghĩa về bao hành (abuse) trong từ điển Cambrigde Từ những định nghĩa trên, học viên khái quát lại định nghĩa của bạo hành như sau: là những hành vi, lời nói, hành động được sử dụng bởi một người nhằm mục đích giành lay hoặc duy trì quyền lực, kiểm soát đối với người khác. Phân loại bạo hành & định nghĩa Có 6 loại bạo hành [32]: vat ly (physical), tình duc (sexual), lời nói/cảm xúc (verbal/emotional), tinh than/tam lý (mental/psychological), tài chính/kinh tế (financial/economic), văn hóa/định danh (cutural/identity).

Cụ thé sẽ được trình bày như sau: 2. Bao hành vật ly (physical) [32,40,42] Day là loại bạo hành mà nhiều người khi nghe đến bạo hành thường nghĩ đến nhất. Nó có thể bao gồm các tác động vật lý như: đánh, đấm, tát, đá, bóp cô, hoặc kiềm chế một cách cưỡng bức đối với người khác. Tóm lại là những tác động vật lý bằng bất kỳ cách nào khác lên người khác trái với ý muốn của họ, với mục đích duy trì quyền lực, kiểm soát đối phương.

Thường sẽ có các tình huống tương tự như sau: ! https://dictionary.org/dictionary/english/abuse e Cac hành động đánh, đấm, tát, đá, bóp cô, hoặc khống chế người khác trái với ý muốn của họ. ¢ Bao gồm việc có ý/liều lĩnh lái xe gây tai nạn. e Sử dụng vũ khí dé táo|đØÚb lêmđối phương. e Hoặc hành vi cô ý khác xâm hại đên sức khoẻ, tính mạng của người khác.

Có các từ ngữ mô tả các hành động như sau: e đánh, dam, đá, tát, bóp cô, giết, ban, hành ha, xô ngã, đau, bị thương, sưng, bam tím, lôi cổ, kéo lê,. Bao hành tình dục (sexual) [2,32,40,41] Hành động cưỡng bức, cưỡng ép ai đó về tình dục, trái với mong muốn của họ, hoặc không có sự đồng ý của họ. Thường sẽ có các tình huống tương tự như sau: e Quan hệ tình dục không có sự đồng thuận: một người bị ép buộc phải quan hệ tình dục bởi người khác mà không có sự đồng ý của họ. e Hành vi quấy rồi tinh dục, cưỡng bức.

Ví dụ như: o Một nhân viên bi cấp trên đụng chạm cơ thể hoặc dùng lời lẽ mang tính chất ga gam tình dục tại nơi làm việc. o Một người bị ép buộc phải thực hiện các hành vi tình dục thông qua đe dọa hoặc cưỡng ép. e Lén quay phim, chụp ảnh nhạy cảm mà không có sự cho phép và dùng những hình ảnh nhạy cảm để đe dọa nạn nhân. Các hành vi bên dưới có thể xuất hiện: e _ Đánh đập, khống chế, vũ lực dé cưỡng ép,.

[rong một sỐ trường hợp, hành vi tình dục cưỡng bức có thể đi kèm với bạo hành vật lý như đánh đập hoặc khống chế nạn nhân dé thực hiện hành vi tình dục. Bao hành lời nói/cảm xúc (verbal/emotional) [32,43] Dùng lời nói dé làm tôn thương tinh thần, cảm xúc của người khác. Thường sẽ có các tình huống tương tự như sau: dùng lời nói dé mang chửi, si nhục, bôi nhọ danh dự, sỉ nhục về ngoại hình, hoặc không đúng thực tế và làm ton thương đến tâm lý, 10 tinh than nạn nhân. Và có các từ thường xuất hiện: chửi bới, mắng, sỉ nhục, sỉ vả, bôi nhọ danh dự, xúc phạm, chê bai, mia mai, soi mói, bia đặt, bêu rếu,.

Một số ví dụ: e Ví dụ 1: Một học sinh bị bạn bè liên tục chê bai về ngoại hình, gọi bang những biệt danh xúc phạm. Phân tích: Lời nói gây ton thương tâm lý bạn học sinh này. e Ví dụ 2: Một nhân viên bị đồng nghiệp bêu rếu và vu oan về việc ăn cắp trong công ty, khiến anh ta bị mọi người xa lánh và tinh thần suy sup. Phân tích: Lời nói và hành động này làm tổn hại đến danh dự và tinh thần của nhân viên.

e Vi du 3: Phụ huynh thường xuyên sỉ nhục va mia mai con minh về việc học hành kém cỏi. Phân tích: Lời nói này gây tôn hại tinh thần và tâm lý của đứa trẻ. Bao hành tinh thần/tâm lý (mental/psychological) [32,45] Bạo hành này xảy ra khi một người thông qua một loạt các hành động, làm suy giảm sức khỏe tinh than của người kia. Bao gồm việc làm cho nạn nhân nghỉ ngờ về sự tỉnh táo của chính mình.

Bao gồm chủ yếu là các hành vi được sử dụng dé kiêm soát, cô lập hoặc làm nạn nhân sợ hãi. Thường thì người bạo hành sử dụng nó dé pha vỡ lòng tự trọng va gia tri ban thân của nạn nhân nhằm tạo ra sự phụ thuộc tâm lý vào họ. Thường có các tình huống tương tự như sau: e Nạn nhân luôn bị kiểm soát, điều khiển tâm ly bởi kẻ bạo hành. Vi du: Chồng luôn theo đõi, kiểm soát mọi hoạt động của vợ, từ việc ra ngoài, nói chuyện với ai đến cách ăn mặc.

e BỊ coi thường, mia mai ước mơ. Ví dụ: Một đứa trẻ luôn bị cha mẹ xem thường ước mơ của mình, dù nó đạt được nhiều thành tích trong học tập nhưng vẫn không được công nhận. e Bị đánh giá thấp năng lực, bi cho rằng không đủ khả năng và năng lực dé tự nhận thức về điều gì là phù hợp và tốt cho mình. Ví du: Vợ luôn bị chồng đánh giá thấp, cho rằng cô không đủ khả năng để làm việc hay đưa ra quyết định cho cuộc sông của mình.

11 e Bị tiết lộ và chia sẻ thông tin hoặc những bí mật của riêng cho nhiều người khác, mặc dù chưa có sự đông ý. Bạo hành tài chính/kinh tế (financial/economic) [32,44] Dùng tài chính, kinh tế dé kiểm soát người khác. Bởi vi bạo hành liên quan đến quyền lực và kiểm soát, kẻ bạo hành sé sử dụng bat kỳ phương tiện nao cần thiết dé duy trì sự kiểm soát đó, và thường bao gồm cả tài chính. Có thê là kiểm soát toàn bộ ngân sách trong gia đình và không cho người bị bạo hành truy cập vào tài khoản ngân hàng hoặc tiền chi tiêu của minh, hay mở thẻ tin dụng và tạo ra các khoản nợ dưới tên của người bị bạo hành, hoặc đơn giản là không cho người bị bạo hành có việc làm và kiếm tiền riêng.

Loại bạo hành này thường là lý do lớn khiến ai đó không thê rời khỏi mỗi quan hệ bạo hành. Thường có các tình huống tương tự như sau: e Kiểm soát tài chính của nạn nhân, không cho họ sử dụng tiền của chính họ. o Ví dụ: một người chồng không cho vợ tiếp cận tài khoản ngân hàng hoặc sử dụng thẻ tín dụng của chính mình, kiểm soát mọi chi tiêu của vợ. e Dùng tên nạn nhân dé mở tín dụng, vay mượn không trả dẫn tới nợ xấu.

o_ Ví dụ: một người sử dụng thông tin cá nhân của người khác để mở thẻ tín dụng và vay mượn tiền, sau đó không trả nợ, dẫn đến nạn nhân bị nợ xấu và gặp khó khăn trong việc vay tiền hoặc tìm việc làm. e Không cho nạn nhân (là người trưởng thành, đủ điều kiện đi làm) có việc làm, tự kiếm thu nhập. o Ví dụ: Một người vợ muốn đi làm nhưng bị chồng cắm cản, không cho phép ra khỏi nhà hoặc liên hệ với nhà tuyển dụng. e Lua đảo, ăn cắp tiền của nạn nhân.

Thường có các từ thường xuất hiện như sau: nợ, thiếu tiền, cờ bạc, giam lỏng, cam, tịch thu, ăn cap, lừa đảo, lừa dôi, tài chính, nợ tín dụng, vay mượn. Bao hành văn hóa/định danh (cultural/identity) [19,32,35] Dùng các khía cạnh văn hóa, bản sắc của cá nhân dé làm tốn hại tinh thần, cảm xúc của họ, hoặc đe đọa họ. Bạo hành văn hóa danh tính xảy ra khi kẻ bạo hành sử dụng các khía cạnh trong danh tinh văn hóa của nạn nhân dé gây đau khổ hoặc làm phương tiện kiểm soát.

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ

Tài liệu "Nghiên Cứu Về Nhận Diện Bạo Hành Trong Văn Bản Tiếng Việt" cung cấp cái nhìn sâu sắc về cách nhận diện và phân tích các hành vi bạo hành thông qua ngôn ngữ trong văn bản tiếng Việt. Nghiên cứu này không chỉ giúp người đọc hiểu rõ hơn về các dấu hiệu của bạo hành mà còn cung cấp các phương pháp và công cụ hữu ích để phát hiện và xử lý vấn đề này trong các văn bản.

Đặc biệt, tài liệu này có thể mang lại lợi ích cho các nhà nghiên cứu, giáo viên, và những người làm trong lĩnh vực xã hội học, giúp họ nâng cao nhận thức và khả năng phân tích ngôn ngữ. Để mở rộng thêm kiến thức về các ứng dụng công nghệ trong việc xử lý ngôn ngữ tự nhiên, bạn có thể tham khảo các tài liệu liên quan như Khóa luận tốt nghiệp công nghệ thông tin hệ thống hỏi đáp về sức khỏe, nơi bạn sẽ tìm thấy những ứng dụng của công nghệ trong lĩnh vực sức khỏe, hay Khóa luận tốt nghiệp khoa học máy tính nghiên cứu đọc hiểu tự động dựa trên cấp độ câu cho tiếng việt, giúp bạn hiểu rõ hơn về việc phát triển các hệ thống đọc hiểu tự động. Cuối cùng, tài liệu Khóa luận tốt nghiệp công nghệ thông tin tăng cường dữ liệu tương đồng cho phân loại câu hỏi tiếng việt sẽ cung cấp thêm thông tin về cách tăng cường dữ liệu trong việc phân loại câu hỏi, một khía cạnh quan trọng trong nghiên cứu ngôn ngữ. Những tài liệu này sẽ giúp bạn mở rộng kiến thức và khám phá sâu hơn về các vấn đề liên quan đến ngôn ngữ và công nghệ.

#Xử lý ngôn ngữ tự nhiên tiếng Việt

#Hướng dẫn gán nhãn dữ liệu

#Nhận diện bạo hành trong văn bản

#Dữ liệu văn bản tự sự

#Phân loại bạo hành

#Giá trị thực tiễn của nghiên cứu

Chủ đề

Nghiên cứu về bạo hành trong văn bản

Ứng dụng công nghệ trong nhận diện bạo hành

Phát triển bộ dữ liệu tiếng Việt

Ý nghĩa khoa học và thực tiễn của nghiên cứu