Luận văn thạc sĩ về giải pháp lọc thư điện tử theo phân tích nội dung

Luận văn thạc sĩ nghiên cứu vnu uet giải pháp lọc thư điện tử theo phân tích nội dung, đánh giá hiện trạng, phân tích vấn đề, đề xuất biện pháp hoàn thiện trong lĩnh vực kỹ thuật.

Trường đại học

Đại học Quốc gia Hà Nội

Chuyên ngành

Công nghệ Thông tin

Người đăng

Ẩn danh

Thể loại

luận văn thạc sĩ

2009

Phí lưu trữ

30 Point

Mục lục chi tiết

MỞ ĐẦU

1. CHƯƠNG 1: TỔNG QUAN VỀ LỌC THƯ ĐIỆN TỬ

1.1. Khái niệm chung

1.2. Thư điện tử

1.3. Các giao thức sử dụng trong hệ thống thư điện tử

1.4. Tổng quan về lọc thư điện tử

1.5. Mô hình chung hệ thống lọc thư. Trình duyệt thư

1.6. Các phương pháp lọc thư điện tử

1.6.1. Phương pháp sử dụng DNS blacklist

1.6.2. Phương pháp sử dụng SURBL list

1.6.3. Kiểm tra người nhận

1.6.4. Kiểm tra địa chỉ

1.6.5. Sử dụng bộ lọc Bayesian

1.6.6. Sử dụng danh sách Black/white list. Kiểm tra Header

1.6.7. Sử dụng tính năng Challenge/Response

1.6.8. Một số giải pháp lọc thư thương mại điển hình

1.7. MÔ HÌNH LỌC THƯ ĐIỆN TỬ ĐỀ XUẤT

1.7.1. Yêu cầu đặt ra

1.7.2. Nội dung lọc

1.7.3. Người sử dụng

1.7.4. Mô hình hệ thống

1.7.5. Mô hình mạng

1.7.6. Nguyên lý hoạt động chung

1.7.7. Phương pháp lọc thư Bayesian

1.7.8. Hướng tiếp cận

1.7.9. Các thuộc tính phân loại

1.7.10. Mô hình chi tiết

1.7.11. Kiến trúc và nguyên lý hoạt động của hệ thống

1.7.12. Đặc tả thành phần

1.7.12.1. Bộ điều khiển truyền thư

1.7.12.2. Module Proxy gửi thư

1.7.12.3. Module Proxy nhận thư

1.7.12.4. Các bộ lọc nội dung

1.7.12.4.1. Bộ lọc tiếng Việt

1.7.12.4.2. Bộ lọc tiếng Anh

1.7.12.4.3. Bộ lọc ảnh

1.8. THỰC NGHIỆM VÀ ĐÁNH GIÁ

1.8.1. Hệ thống lọc nội dung thư mFilter

1.8.2. Môi trường tích hợp

1.8.3. Mô tả mô hình thử nghiệm

1.8.4. Tích hợp các bộ lọc

1.8.5. Cài đặt, cấu hình

1.8.6. Thực nghiệm và đánh giá hệ thống

TÀI LIỆU THAM KHẢO

Tóm tắt

I. Tổng quan về giải pháp lọc thư điện tử hiệu quả

Giải pháp lọc thư điện tử ngày càng trở nên quan trọng trong bối cảnh gia tăng thư rác và các mối đe dọa an ninh mạng. Việc áp dụng các phương pháp phân tích nội dung giúp nâng cao hiệu quả lọc thư, bảo vệ thông tin cá nhân và tổ chức. Nghiên cứu này sẽ trình bày các khái niệm cơ bản về lọc thư điện tử và tầm quan trọng của nó trong việc quản lý email.

1.1. Khái niệm về lọc thư điện tử

Lọc thư điện tử là quá trình xác định và loại bỏ các thư không mong muốn, bao gồm thư rác và thư độc hại. Các phương pháp lọc hiện nay sử dụng công nghệ phân tích nội dung để xác định tính chất của thư và quyết định xem có nên cho phép hay chặn thư đó.

1.2. Tầm quan trọng của việc lọc thư điện tử

Việc lọc thư điện tử không chỉ giúp bảo vệ người dùng khỏi các mối đe dọa mà còn cải thiện hiệu suất làm việc. Một hệ thống lọc hiệu quả giúp giảm thiểu thời gian tìm kiếm thông tin quan trọng trong hộp thư, đồng thời bảo vệ thông tin cá nhân khỏi các cuộc tấn công mạng.

II. Vấn đề và thách thức trong lọc thư điện tử

Mặc dù có nhiều giải pháp lọc thư điện tử, nhưng vẫn tồn tại nhiều thách thức trong việc phát hiện và ngăn chặn thư rác. Các phương pháp truyền thống thường không đủ hiệu quả trước sự phát triển của công nghệ gửi thư rác. Nghiên cứu này sẽ phân tích các vấn đề chính trong lọc thư điện tử.

2.1. Sự phát triển của thư rác

Thư rác ngày càng trở nên tinh vi hơn, với các kỹ thuật lừa đảo và giả mạo ngày càng phức tạp. Điều này khiến cho việc phát hiện và chặn thư rác trở nên khó khăn hơn, đòi hỏi các giải pháp lọc phải liên tục được cập nhật và cải tiến.

2.2. Các phương pháp lọc truyền thống

Các phương pháp lọc truyền thống như danh sách đen (blacklist) và danh sách trắng (whitelist) thường không đủ hiệu quả. Chúng có thể dẫn đến việc chặn nhầm thư hợp lệ hoặc bỏ sót thư rác, gây ảnh hưởng đến trải nghiệm người dùng.

III. Phương pháp lọc thư điện tử qua phân tích nội dung

Phân tích nội dung là một trong những phương pháp tiên tiến nhất trong việc lọc thư điện tử. Bằng cách sử dụng các thuật toán học máy và trí tuệ nhân tạo, hệ thống có thể xác định và phân loại thư một cách chính xác hơn. Nghiên cứu này sẽ trình bày các phương pháp chính trong phân tích nội dung.

3.1. Phương pháp lọc Bayesian

Phương pháp lọc Bayesian sử dụng xác suất để phân loại thư. Hệ thống sẽ học từ các mẫu thư đã được phân loại trước đó để đưa ra quyết định về các thư mới. Phương pháp này đã chứng minh được hiệu quả cao trong việc giảm thiểu thư rác.

3.2. Sử dụng công nghệ học máy

Công nghệ học máy cho phép hệ thống tự động cải thiện khả năng phân loại theo thời gian. Bằng cách phân tích các đặc điểm của thư, hệ thống có thể nhận diện các mẫu thư rác mới mà không cần sự can thiệp của con người.

IV. Ứng dụng thực tiễn của giải pháp lọc thư điện tử

Giải pháp lọc thư điện tử qua phân tích nội dung đã được áp dụng thành công trong nhiều tổ chức và doanh nghiệp. Các kết quả nghiên cứu cho thấy rằng việc áp dụng các phương pháp này không chỉ giúp giảm thiểu thư rác mà còn nâng cao hiệu quả làm việc. Nghiên cứu này sẽ trình bày một số ứng dụng thực tiễn.

4.1. Ứng dụng trong doanh nghiệp

Nhiều doanh nghiệp đã áp dụng giải pháp lọc thư điện tử để bảo vệ thông tin nhạy cảm và cải thiện quy trình làm việc. Hệ thống lọc giúp nhân viên tập trung vào các nhiệm vụ quan trọng mà không bị phân tâm bởi thư rác.

4.2. Kết quả nghiên cứu từ các tổ chức

Các nghiên cứu từ các tổ chức cho thấy rằng việc áp dụng giải pháp lọc thư điện tử đã giúp giảm thiểu tỷ lệ thư rác lên đến 90%. Điều này không chỉ tiết kiệm thời gian mà còn bảo vệ thông tin cá nhân và tổ chức khỏi các mối đe dọa.

V. Kết luận và tương lai của lọc thư điện tử

Giải pháp lọc thư điện tử qua phân tích nội dung đang trở thành xu hướng tất yếu trong việc bảo vệ thông tin cá nhân và tổ chức. Tương lai của công nghệ này hứa hẹn sẽ mang lại nhiều cải tiến và hiệu quả hơn nữa. Nghiên cứu này sẽ tóm tắt những điểm chính và dự đoán xu hướng phát triển trong tương lai.

5.1. Xu hướng phát triển công nghệ

Công nghệ lọc thư điện tử sẽ tiếp tục phát triển với sự hỗ trợ của trí tuệ nhân tạo và học máy. Các hệ thống sẽ ngày càng thông minh hơn, có khả năng nhận diện và phân loại thư một cách chính xác hơn.

5.2. Tầm quan trọng của an ninh mạng

An ninh mạng sẽ trở thành một yếu tố quan trọng trong việc phát triển các giải pháp lọc thư điện tử. Việc bảo vệ thông tin cá nhân và tổ chức khỏi các mối đe dọa sẽ là ưu tiên hàng đầu trong tương lai.

22/07/2025

Bạn đang xem trước tài liệu:

Luận văn thạc sĩ vnu uet giải pháp lọc thư điện tử theo phân tích nội dung

Tải đầy đủ

Nội dung chính

Tổng quan nghiên cứu

Trong bối cảnh sự phát triển mạnh mẽ của Internet và sự hội tụ giữa viễn thông và tin học, dịch vụ thư điện tử (email) đã trở thành một phần không thể thiếu trong các hoạt động kinh tế, xã hội và quản lý hiện đại. Theo ước tính, vào tháng 6/2007, có khoảng 100 tỷ thư rác được gửi đi mỗi ngày, tăng từ 55 tỷ thư/ngày vào tháng 6/2006, cho thấy tốc độ phát triển nhanh chóng và mức độ nghiêm trọng của vấn đề thư rác. Thư rác không chỉ gây phiền toái cho người dùng mà còn tiềm ẩn nguy cơ mất an toàn thông tin cá nhân, lãng phí tài nguyên mạng và ảnh hưởng tiêu cực đến hiệu quả sử dụng dịch vụ thư điện tử.

Luận văn tập trung nghiên cứu giải pháp lọc thư điện tử dựa trên phân tích nội dung nhằm nâng cao hiệu quả lọc chặn thư rác và quản lý nội dung thư không lành mạnh. Mục tiêu cụ thể là xây dựng mô hình lọc thư điện tử tích hợp các kỹ thuật phân loại Bayesian, kết hợp với các phương pháp lọc truyền thống như DNS blacklist, SURBL list, kiểm tra địa chỉ người gửi và người nhận, cũng như lọc nội dung văn bản và hình ảnh. Nghiên cứu được thực hiện trong phạm vi hệ thống thư điện tử tại Việt Nam, với môi trường thử nghiệm tích hợp bộ lọc mFilter trên nền tảng mã nguồn mở.

Ý nghĩa của nghiên cứu thể hiện qua việc giảm thiểu tỷ lệ thư rác, bảo vệ người dùng khỏi các nội dung độc hại, đồng thời tiết kiệm băng thông và tài nguyên hệ thống. Các chỉ số đánh giá hiệu quả bao gồm tỷ lệ phát hiện thư rác, tỷ lệ thư hợp lệ bị chặn sai, và khả năng xử lý đa dạng định dạng thư (văn bản, hình ảnh) trong môi trường thực tế.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên các lý thuyết và mô hình sau:

Lý thuyết Bayes và bộ lọc Bayesian: Sử dụng định lý Bayes để tính xác suất một thư là thư rác dựa trên tần suất xuất hiện các từ khóa và đặc điểm trong thư rác và thư hợp lệ. Bộ lọc Bayesian được huấn luyện trên tập dữ liệu gồm khoảng 1000 thư rác và 1000 thư hợp lệ để xây dựng cơ sở dữ liệu từ khóa và dấu hiệu phân loại.
Mô hình phân loại thư rác theo lược đồ liên kết Graham và Central Limit: Áp dụng các biểu đồ đánh giá điểm số thư rác dựa trên các đặc điểm nội dung và tiêu đề thư, giúp phân loại thư thành các nhóm: thư hợp lệ, thư rác và không xác định.
Mô hình hệ thống lọc thư điện tử đa tầng: Bao gồm các thành phần như Mail User Agent (MUA), Mail Transfer Agent (MTA), Mail Proxy, bộ điều khiển định hướng, và module lọc nội dung. Mô hình này cho phép lọc thư ở nhiều mức độ: mức MUA, mức MDA (Mail Delivery Agent), và mức MX (Mail Exchange server).
Các khái niệm chính: Thư điện tử, giao thức SMTP, POP3, IMAP, MIME; DNS blacklist, SURBL list; danh sách đen (blacklist) và danh sách trắng (whitelist); kiểm tra địa chỉ người gửi và người nhận; lọc nội dung văn bản và hình ảnh.

Phương pháp nghiên cứu

Nguồn dữ liệu: Thu thập dữ liệu thư điện tử thực tế từ hệ thống thử nghiệm mFilter, bao gồm thư hợp lệ và thư rác với đa dạng định dạng (HTML, văn bản thuần, PDF, hình ảnh JPG, GIF, PNG, BMP).
Phương pháp phân tích: Áp dụng kỹ thuật phân tích nội dung dựa trên bộ lọc Bayesian kết hợp với các phương pháp lọc truyền thống như kiểm tra DNS blacklist, SURBL list, SPF, kiểm tra header và danh sách đen/trắng. Phân tích dữ liệu được thực hiện thông qua các thuật toán tìm kiếm từ khóa (Boyer-Moore) và xử lý ngôn ngữ tự nhiên (NLP) cho nội dung tiếng Việt và tiếng Anh.
Timeline nghiên cứu: Nghiên cứu được triển khai trong năm 2009, bắt đầu từ việc tổng hợp lý thuyết và khảo sát các giải pháp hiện có, tiếp theo là thiết kế mô hình lọc thư điện tử đề xuất, xây dựng hệ thống thử nghiệm và đánh giá hiệu quả qua các giai đoạn thử nghiệm thực tế.
Cỡ mẫu và chọn mẫu: Sử dụng khoảng 2000 thư (1000 thư rác và 1000 thư hợp lệ) để huấn luyện bộ lọc Bayesian, đồng thời thu thập thêm các thư thử nghiệm trong môi trường thực tế để đánh giá hiệu quả lọc.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

Hiệu quả lọc thư rác bằng bộ lọc Bayesian: Hệ thống lọc thư mFilter đạt tỷ lệ phát hiện thư rác trên 95%, trong khi tỷ lệ thư hợp lệ bị chặn sai (false positive) dưới 3%. Kết quả thử nghiệm lọc thư tiếng Việt và tiếng Anh cho thấy tỷ lệ phát hiện thư rác lần lượt là 94% và 96%.
Tác động của việc kết hợp các phương pháp lọc: Việc tích hợp DNS blacklist, SURBL list và kiểm tra SPF giúp giảm thiểu khoảng 20% thư rác không bị phát hiện khi chỉ sử dụng bộ lọc Bayesian. Tỷ lệ thư rác bị chặn tăng từ khoảng 75% lên trên 90% khi áp dụng các phương pháp kết hợp.
Khả năng lọc nội dung đa dạng định dạng: Hệ thống có thể xử lý hiệu quả các định dạng văn bản (HTML, PDF, Word) và hình ảnh (JPG, GIF, PNG, BMP). Thử nghiệm lọc ảnh cho thấy tỷ lệ phát hiện thư rác chứa hình ảnh không lành mạnh đạt khoảng 90%.
Thống kê máy chủ thư và thư rác: Trong số 2,818,895 máy chủ thư được khảo sát, chỉ có 59,209 máy chủ trả lời kết nối. Tỷ lệ máy chủ thư theo quốc gia và loại MTA cho thấy Postfix chiếm 44%, Microsoft Exchange 16%, Qmail 20%. Tỷ lệ các Open Relay Server chiếm khoảng 44% trong số Postfix, là nguồn phát tán thư rác tiềm năng.

Thảo luận kết quả

Nguyên nhân hiệu quả cao của bộ lọc Bayesian là do khả năng học và thích nghi với đặc điểm nội dung thư rác và thư hợp lệ trong từng môi trường cụ thể. Việc kết hợp các phương pháp lọc truyền thống giúp khắc phục nhược điểm của từng phương pháp riêng lẻ, đặc biệt trong việc phát hiện thư giả mạo và thư chứa liên kết độc hại.

So sánh với các nghiên cứu khác, tỷ lệ phát hiện thư rác trên 95% là mức cao, phù hợp với các hệ thống lọc thư hiện đại trên thế giới. Việc xử lý đa dạng định dạng nội dung giúp hệ thống phù hợp với thực tế sử dụng thư điện tử đa phương tiện ngày nay.

Dữ liệu có thể được trình bày qua các biểu đồ tỷ lệ phát hiện thư rác theo từng phương pháp lọc, biểu đồ phân bố máy chủ thư theo quốc gia và loại MTA, cũng như bảng so sánh tỷ lệ thư rác bị chặn trong các thử nghiệm lọc tiếng Việt, tiếng Anh và lọc ảnh.

Đề xuất và khuyến nghị

Triển khai hệ thống lọc thư đa tầng: Áp dụng mô hình lọc thư tại các mức MUA, MDA và MX để tăng cường hiệu quả lọc, giảm thiểu thư rác đến người dùng cuối. Thời gian thực hiện trong vòng 6 tháng, chủ thể thực hiện là các nhà cung cấp dịch vụ email và tổ chức CNTT.
Cập nhật và duy trì cơ sở dữ liệu từ khóa và danh sách đen/trắng: Thường xuyên cập nhật các từ khóa mới, danh sách IP và miền bị chặn dựa trên phân tích thực tế và phối hợp liên bộ giữa các cơ quan quản lý. Thời gian cập nhật định kỳ hàng tháng, do đội ngũ quản trị hệ thống đảm nhiệm.
Tích hợp kỹ thuật xử lý ngôn ngữ tự nhiên và phân tích hình ảnh: Nâng cao khả năng phân tích nội dung thư đa ngôn ngữ và đa phương tiện, đặc biệt cho tiếng Việt và các định dạng hình ảnh. Chủ thể thực hiện là các nhóm nghiên cứu và phát triển phần mềm, thời gian triển khai 12 tháng.
Đào tạo và nâng cao nhận thức người dùng: Tổ chức các chương trình đào tạo, hướng dẫn người dùng về cách nhận biết và xử lý thư rác, cũng như sử dụng các tính năng lọc thư hiệu quả. Thời gian triển khai liên tục, chủ thể là các tổ chức giáo dục và doanh nghiệp.

Đối tượng nên tham khảo luận văn

Các nhà quản trị hệ thống và kỹ sư CNTT: Hưởng lợi từ việc áp dụng mô hình và kỹ thuật lọc thư điện tử hiệu quả, giúp giảm thiểu rủi ro an ninh mạng và nâng cao chất lượng dịch vụ email.
Các nhà cung cấp dịch vụ email và ISP: Có thể triển khai giải pháp lọc thư tích hợp để nâng cao trải nghiệm người dùng, giảm thiểu thư rác và bảo vệ hệ thống mạng.
Các nhà nghiên cứu và phát triển phần mềm: Tham khảo các phương pháp phân tích nội dung, kỹ thuật Bayesian và xử lý ngôn ngữ tự nhiên để phát triển các công cụ lọc thư tiên tiến hơn.
Cơ quan quản lý nhà nước và tổ chức an ninh mạng: Sử dụng kết quả nghiên cứu để xây dựng chính sách, quy định và giải pháp kỹ thuật nhằm kiểm soát thư rác và bảo vệ người dùng trên môi trường mạng.

Câu hỏi thường gặp

Bộ lọc Bayesian hoạt động như thế nào trong việc phân loại thư rác?
Bộ lọc Bayesian sử dụng định lý Bayes để tính xác suất một thư là thư rác dựa trên tần suất xuất hiện các từ khóa trong thư rác và thư hợp lệ. Ví dụ, nếu từ "khuyến mãi" xuất hiện nhiều trong thư rác nhưng ít trong thư hợp lệ, thư chứa từ này sẽ có xác suất cao là thư rác.
Tại sao cần kết hợp nhiều phương pháp lọc thư?
Mỗi phương pháp có ưu và nhược điểm riêng. Ví dụ, DNS blacklist nhanh nhưng không phát hiện thư giả mạo; bộ lọc Bayesian chính xác nhưng tốn tài nguyên. Kết hợp giúp tăng tỷ lệ phát hiện và giảm sai sót.
Làm thế nào để xử lý thư rác chứa hình ảnh hoặc tệp đính kèm?
Hệ thống sử dụng kỹ thuật phân tích hình ảnh để nhận diện các đặc điểm hình ảnh không lành mạnh, kết hợp kiểm tra kích thước, loại file và từ khóa trong văn bản đi kèm để quyết định chặn hay cho phép.
Có thể áp dụng giải pháp này cho các hệ thống email lớn như Gmail hay Outlook không?
Có thể, vì các kỹ thuật như Bayesian, DNS blacklist và kiểm tra SPF đều là tiêu chuẩn trong ngành. Tuy nhiên, cần điều chỉnh và huấn luyện bộ lọc phù hợp với đặc thù dữ liệu và quy mô hệ thống.
Làm sao để giảm thiểu tỷ lệ thư hợp lệ bị chặn sai?
Cần huấn luyện bộ lọc trên tập dữ liệu cân bằng giữa thư rác và thư hợp lệ, cập nhật thường xuyên danh sách trắng, và áp dụng các chính sách kiểm duyệt lại thư nghi ngờ để tránh chặn nhầm.

Kết luận

Luận văn đã xây dựng thành công mô hình lọc thư điện tử dựa trên phân tích nội dung kết hợp bộ lọc Bayesian và các phương pháp lọc truyền thống, đạt hiệu quả phát hiện thư rác trên 95%.
Hệ thống thử nghiệm mFilter chứng minh khả năng xử lý đa dạng định dạng thư và ngôn ngữ, phù hợp với môi trường thư điện tử hiện đại.
Việc kết hợp nhiều phương pháp lọc giúp khắc phục nhược điểm riêng lẻ, nâng cao độ chính xác và giảm thiểu sai sót.
Đề xuất các giải pháp triển khai thực tế, bao gồm cập nhật cơ sở dữ liệu, tích hợp kỹ thuật NLP và đào tạo người dùng, nhằm nâng cao hiệu quả lọc thư.
Các bước tiếp theo bao gồm mở rộng thử nghiệm trên quy mô lớn, phát triển module phân tích hình ảnh nâng cao và tích hợp hệ thống vào môi trường doanh nghiệp, kêu gọi các tổ chức quan tâm áp dụng giải pháp để bảo vệ người dùng và nâng cao chất lượng dịch vụ thư điện tử.

Trích đoạn nội dung tài liệu

phần mở đầu, ba chƣơng và phần kết luận: Chƣơng 1: Tổng quan về lọc thƣ điện tử theo phân tích nội dung. Giới thiệu các khái niệm liên quan đến thƣ điện tử, giao thức mạng sử dụng trong dịch vụ thƣ; tìm hiểu mô hình, thành phần tham gia quá trình lọc thƣ; tìm hiểu số liệu thống kê liên quan đến vấn đề thƣ và thƣ rác; nghiên cứu các kỹ thuật áp dụng trong lọc thƣ; so sánh các công cụ lọc thƣ, giải pháp lọc thƣ điển hình; Chƣơng 2: Mô hình lọc thƣ điện tử đề xuất Đặt ra yêu cầu đối với mô hình lọc thƣ đề xuất; đề xuất mô hình lọc thƣ điện tử; trình bày phƣơng pháp lọc nội dung áp dụng mô hình phân loại bayesian; mô tả chi tiết nguyên lý hoạt động và đặc tả các thành phần. Chƣơng 3: Thực nghiệm và đánh giá thực nghiệm Xây dựng và thử nghiệm hệ thống thƣ điện tử và bộ lọc dựa trên mã nguồn mở; đánh giá dựa trên kết quả thử nghiệm. viii LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com CHƢƠNG 1.

TỔNG QUAN VỀ LỌC THƢ ĐIỆN TỬ 1. Khái niệm chung 1. Thƣ điện tử Thƣ điện tử, hay email (electronic mail), là một hệ thống chuyển nhận thƣ từ qua các mạng máy tính. Email là một phƣơng tiện thông tin rất nhanh.

Một mẫu thông tin có thể đƣợc gửi đi ở dạng mã hoá hay dạng thông thƣờng và đƣợc chuyển qua các mạng máy tính đặc biệt là mạng Internet. Nó có thể chuyển mẫu thông tin từ một máy nguồn tới một hay rất nhiều máy nhận trong cùng lúc. Ngày nay, email chẳng những có thể truyền gửi đƣợc chữ, nó còn có thể truyền đƣợc các dạng thông tin khác nhƣ hình ảnh, âm thanh, phim, và đặc biệt các phần mềm thƣ điện tử kiểu mới còn có thể hiển thị các email dạng sống động tƣơng thích với kiểu tệp HTML. Mô hình ứng dụng hệ thống thƣ điện tử 1 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Phần mềm thƣ điện tử (email software) là loại phần mềm nhằm hỗ trợ cho ngƣời dùng việc chuyển và nhận các văn bản (thƣờng là dạng chữ).

Thông tin có thể đƣa vào phần mềm thƣ điện tử bằng cách thông dụng nhất qua thiết bị ngoại vi nhƣ bàn phím hay cách phƣơng cách khác ít dùng hơn nhƣ là dùng máy quét hình (scanner), dùng máy ghi hình số (digital camera) đặc biệt là các Web cam. Phần mềm thƣ điện tử giúp đỡ cho việc tiến hành soạn thảo, gửi, nhận, đọc, in, xoá hay lƣu giữ các thƣ. Có loại phần mềm thƣ điện tử: - Loại phần mềm thƣ điện tử đƣợc cài đặt trên từng máy tính của ngƣời dùng gọi là email client, hay phần mềm thƣ điện tử dùng cho máy khách. Các loại phần mềm này bao gồm: Microsoft Outlook, Microsoft Outlook Express, Netscape Comunicator, hay Eudora.

Các phần mềm thƣ điện tử này còn có tên là MUA (mail user agent). - Loại phần mềm thƣ điện tử không cần phải cài đặt mà nó đƣợc cung ứng bởi các máy chủ (Web server) trên Internet gọi là WebMail, hay phần mềm thƣ điện tử qua Web. Để dùng đƣợc các phần mềm loại này ngƣời dùng chỉ cần có máy tính nối vào mạng máy tính có các trình duyệt web tƣơng thích với các nhà cung cấp dịch vụ WebMail. Nơi cung ứng phần mềm cũng nhƣ phƣơng tiện chuyển thƣ điện tử gọi là nhà cung ứng dịch vụ thƣ điện tử (email sevice provider).

Máy tính đảm nhiệm vai trò cung ứng các dịch vụ thƣ điện tử là MTA (mail transfer agent) hay là đại lý chuyển thƣ. Để gửi và nhận thƣ trên hệ thống mạng, ngƣời dùng phải đăng ký một tài khoản với nhà cung cấp dịch vụ hay server cung cấp dịch vụ mail, khi đó mỗi tài khoản sẽ đƣợc cấp một địa chỉ email cố định. Dựa vào các địa chỉ email các ngƣời dùng trên mạng có thể gửi thƣ điện thử cho nhau khi ở bất kỳ vị trí nào trên mạng. Cấu trúc chung của một địa chỉ email bao gồm ba phần chính có dạng định_dạnh_email@tên_miền - Phần định_dạnh_email: Đây là một dạng tên để cho ngƣời đọc thƣ có thể dễ dàng nhận ra ngƣời gửi hay nơi gửi.

Tuy nhiên, trong các thƣ điện tử ngƣời ta có thể không cần cho tên định dạng và lá thƣ điện tử vẫn đƣợc gửi đi đúng nơi. Ví dụ: Trong địa chỉ gửi thƣ tới viết dƣới dạng Nguyễn Ngƣời Gửi nguyennguoigui@yahoo.com hay viết dƣới dạng nguyennguoigui@yahoo.com thì phần mềm thƣ điện tử vẫn hoạt động chính xác và gửi đi đến đúng địa chỉ. Phần tên_email: Đây là phần xác định hộp thƣ. Thông thƣờng, cho dễ nhớ, phần này hay mang tên của ngƣời chủ ghép với một vài kí tự đặc biệt.

Phần tên này thƣờng do ngƣời đăng kí hộp thƣ điện tử đặt ra. Phần này còn đƣợc gọi là phần tên địa phƣơng. 2 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Phần tên_miền: Đây là tên miền của nơi cung cấp dịch vụ thƣ điện tử. Ngay sau phần tên_email bắt đầu bằng chữ "@" nối liền sau đó là tên miền.

Các trƣờng có trong một bức thƣ điện tử: To - đến: chứa địa chỉ của các ngƣời nhận. CC (carbon copies) - Gửi kèm: đây là chỗ chứa thêm địa chỉ gửi kèm, ngoài địa chỉ chính trong phần To bên trên. Các hộp thƣ nhận sẽ đọc đƣợc các địa chỉ ngƣời gửi và các địa chỉ gửi kèm này. BCC (blind carbon copies) - Gửi kèm kín: Đây cũng là chỗ ghi các địa chỉ mà lá thƣ sẽ đƣợc gửi kèm tới, nhƣng các địa chỉ này sẽ đƣợc dấu kín không cho những ngƣời trong phần To hay phần CC biết là có sự đính kèm đến các địa chỉ nêu trong phần BCC.

Subject - Đề mục: Chỗ này thƣờng để tóm tắt ý chính của lá thƣ hay chỗ ghi ngắn gọn điều quan trọng trong thƣ. Body - Nội dung của bức thƣ. Phƣơng thức hoạt động của một hệ thống thƣ điện tử Hình 2. Phƣơng thức hoạt động của hệ thống thƣ điện tử Hoạt động của hệ thống email hiện nay có thể dƣợc minh họa qua phân tích một thí dụ nhƣ sau: Nguyễn dùng phần mềm thƣ điện tử (MUA) của mình để soạn một lá thƣ có địa chỉ ngƣời nhận là Trần với địa chỉ là Tran@b.

Nguyễn nhấn nút Send và phần mềm thƣ điện tử của Nguyễn áp dụng SMPT để gửi mẫu thông tin (lá thƣ) đến MTA, hay máy chủ thƣ điện tử, của Nguyễn. Trong thí dụ thì máy chủ này là smtp.org đƣợc cung cấp từ dịch vụ Internet của Nguyễn. 3 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com MTA này sẽ đọc địa chỉ chỗ nhận (tran@b.org) và dựa vào phần tên miền nó sẽ tìm hỏi địa chỉ của tên miền này, nơi có máy chủ sẽ nhận email gửi đến, qua Hệ thống Tên miền. Máy chủ DNS của b.org là ns.org sẽ trả lời về một bản ghi trao đổi thƣ từ, đây là bảng ghi chỉ ra cách thức làm thế nào định tuyến cho email này.

Trong thí dụ thì mx.org là máy chủ từ dịch vụ cung ứng Internet của Trần.org gửi mẫu thông tin tới mx.org dùng giao thức SMTP, điều này sẽ phân phối lá thƣ đến hộp thƣ của Trần. Khi đọc Trần ra lệnh nhận thƣ trên máy (MUA) của Trần, điều này tạo ra việc lấy về mẫu thông tin bằng cách áp dụng giao thức POP3. Trong trƣờng hợp Nguyễn không có MUA mà chỉ dùng Webmail chẳng hạn thì bƣớc 1 sẽ không xảy ra tức là MTA của Nguyễn sẽ làm việc trực tiếp. Tƣong tự cho trƣờng hợp Trần không có MUA riêng.

Trƣớc đây, nếu một MTA không thể gửi tới đích thì nó có thể ít nhất ngừng lại ở chỗ gần với chỗ nhận. Sự ngừng này sẽ tạo cơ hội để máy đích có thể nhận về các mẫu thông tin trong thời gian trễ hơn. Nhiều MTA sẽ chấp nhận tất cả mẫu thông tin từ ngƣời gửi bất kì và tìm mọi cách để phân nó về đến máy đích. Những MTA nhƣ vậy gọi là những ngƣng đọng thƣ mở (open mail relays).

Điều này khá cần thiết vì sự chất lƣợng liên lạc của hệ thống Internet lúc đó còn yếu. Các giao thức sử dụng trong hệ thống thƣ điện tử Hệ thống thử điện tử đƣợc xây dựng dựa trên một số giao thức sau: Simple Mail Transfer Protocol (SMTP), Post Office Protocol (POP), Multipurpose Internet Mail Extensions (MIME), Interactive Mail Access Protocol (IMAP). Giao thức truyền thƣ - SMTP Giao thức truyền thƣ đơn giản (Simple Mail Transfer Protocol - SMTP) là giao thức tin cậy chịu trách nhiệm phân phát thƣ điện tửl, nó chuyển thƣ từ hệ thống mạng này sang hệ thống mạng khác, chuyển thƣ trong hệ thống mạng nội bộ. Giao thức SMTP đƣợc định nghĩa trong RFC 821, là một dịch vụ ở tầng giao vận dựa trên các kết nối tin cậy, hƣớng kết nối (connection-oriented) đƣợc cung cấp bởi giao thức TCP (Transmission Control Protocol), nó sử dụng số hiệu cổng (well- known port) 25.

Sau đây là danh sách các tập lệnh trong giao thức SMTP. 4 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Lệnh Cú pháp Chức năng Recipient RCPT TO: <to-address> Địa chỉ ngƣời nhận Data DATA Bắt đầu gửi thông điệp Reset RSET Huỷ bỏ thông điệp Verify VRFY <string> Kiểm tra username Expand EXPN <string> Mở rộng danh sách mail Help HELP [string] Yêu cầu giúp đỡ Quit QUIT Kết thúc phiên giao dịch SMTP Bảng biểu 1. Danh sách các tập lệnh trong giao thức SMTP Để sử dụng các lệnh SMTP ta dùng lệnh telnet theo port 25 trên hệ thống ở xa sau đó gửi thƣ thông qua cơ chế dòng lệnh. Kỹ thuật này đƣợc sử dụng để kiểm tra hệ thống SMTP Server, nhƣng điều chính yếu ở đây là chúng ta sử dụng SMTP để minh hoạ làm cách nào thƣ đƣợc gửi qua các hệ thống khác nhau.

Trong ví dụ sau minh hoạ quá trình gửi thƣ thông qua cơ chế dòng lệnh SMTP. Ví dụ kiểm tra giao thức SMTP Ngoài ra còn có một số lệnh khác nhƣ: SEND, SOML, SAML, và TURN đƣợc định trong RFC 821 là những câu lệnh tuỳ chọn và không đƣợc sử dụng thƣờng xuyên. 5 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Lệnh HELP in ra tóm tắt các lệnh đƣợc thực thi. Ví dụ ta dùng lệnh HELP RSET chỉ định các thông tin đƣợc yêu cầu khi sử dụng lệnh RSET, Lệnh VRFY và EXPN thì hữu dụng hơn nhƣng nó thƣờng bị khoá vì lý do an ninh mạng bởi vì nó cung cấp cho ngƣời dùng chiếm dụng băng thông mạng.

Ví dụ lênh EXPN yêu cầu liệt kê ra danh sách địa chỉ email nằm trong nhóm thƣ Admin. Lệnh VRFY để lấy các thông tin cá nhân của một tài khoản nào đó, ví dụ lệnh VRFY. SMTP là hệ thống phân phát thƣ trực tiếp từ đầu đến cuối (từ nơi bắt đầu phân phát cho đến trạm phân phát cuối cùng), điều này rất hiếm khi sử dụng.

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ

Chủ đề

xử lý và lọc thư điện tử spam

phương pháp học máy trong lọc email

kiến trúc hệ thống lọc thư

bảo mật và quản lý email