Luận văn thạc sĩ về phân tích danh tính thiết bị từ dữ liệu trên web

Chuyên ngành

Computer Science

Người đăng

Ẩn danh

Thể loại

master’s thesis

2024

69
2
0

Phí lưu trữ

30.000 VNĐ

Tóm tắt

I. Giới thiệu về phân tích danh tính thiết bị

Trong bối cảnh công nghệ phát triển nhanh chóng, người dùng thường xuyên sử dụng nhiều thiết bị điện tử khác nhau để truy cập Internet. Điều này tạo ra những thách thức trong việc xác định và liên kết các hoạt động của người dùng trên các thiết bị khác nhau. Phân tích dữ liệu từ hành vi web trở nên cần thiết để hiểu rõ hơn về hành vi tiêu dùng của người dùng. Luận văn này phát triển một khung làm việc để giải quyết vấn đề danh tính thiết bị bằng cách sử dụng dữ liệu thực tế từ trang web FPT. Các ứng dụng của công nghệ này bao gồm việc tối ưu hóa quảng cáo, nâng cao khả năng chuyển đổi và hiểu rõ hơn về đối tượng khách hàng.

1.1. Tầm quan trọng của phân tích danh tính

Việc xác định danh tính người dùng từ nhiều thiết bị là rất quan trọng trong việc cung cấp trải nghiệm cá nhân hóa. Công nghệ thông tin hiện đại yêu cầu các phương pháp theo dõi người dùng chính xác hơn, không chỉ dựa vào cookie. Các phương pháp truyền thống đang gặp khó khăn trong việc theo dõi hành vi người dùng khi họ sử dụng nhiều thiết bị khác nhau. Thông qua việc phân tích dữ liệu từ hành vi web, các nhà nghiên cứu có thể phát triển các mô hình giúp nhận diện người dùng một cách hiệu quả hơn, từ đó cải thiện chiến lược marketing và tăng cường sự hài lòng của khách hàng.

II. Khung làm việc cho phân tích danh tính thiết bị

Khung làm việc được đề xuất trong luận văn này bao gồm hai giai đoạn chính: truy xuất và xếp hạng lại. Trong giai đoạn truy xuất, một phương pháp đơn giản dựa trên số lượng địa chỉ IP chia sẻ được áp dụng, giúp xác định các thiết bị có thể thuộc về cùng một người dùng. Giai đoạn xếp hạng lại sử dụng các kỹ thuật phức tạp hơn như học máy có giám sát và mạng nơ-ron Siamese để đánh giá khả năng của các cặp thiết bị thuộc về cùng một người dùng. Sự kết hợp giữa các phương pháp này cho phép xây dựng một mô hình mạnh mẽ để giải quyết vấn đề nhận diện thiết bị.

2.1. Các phương pháp truy xuất và xếp hạng lại

Giai đoạn truy xuất sử dụng các phương pháp như phân tích dữ liệutruy xuất thông tin để xác định các thiết bị có thể liên kết với nhau. Các phương pháp này bao gồm việc sử dụng các mô hình học máy để phân tích hành vi người dùng và đánh giá khả năng kết nối giữa các thiết bị. Giai đoạn xếp hạng lại áp dụng các kỹ thuật như TF-IDF và Doc2Vec để tạo ra vector cho thiết bị, từ đó cải thiện độ chính xác trong việc xác định danh tính người dùng. Các kết quả thử nghiệm cho thấy mô hình này có thể tăng cường khả năng nhận diện danh tính thiết bị một cách hiệu quả.

III. Đánh giá và ứng dụng thực tiễn

Luận văn đã chỉ ra rằng việc áp dụng khung làm việc này có thể mang lại nhiều lợi ích cho các doanh nghiệp trong việc hiểu rõ hơn về hành vi của khách hàng. Các phương pháp phân tích thôgn tinquản lý dữ liệu giúp các doanh nghiệp tối ưu hóa các chiến dịch marketing và cải thiện trải nghiệm người dùng. Hơn nữa, việc nhận diện danh tính thiết bị cũng góp phần bảo vệ quyền riêng tư của người dùng, khi dữ liệu được ẩn danh và không tiết lộ thông tin cá nhân. Điều này không chỉ giúp doanh nghiệp tuân thủ các quy định về bảo mật thông tin mà còn xây dựng lòng tin từ phía khách hàng.

3.1. Tác động đến ngành công nghiệp

Việc phát triển và áp dụng các phương pháp nhận diện thiết bị từ dữ liệu web có thể tạo ra những thay đổi lớn trong ngành công nghiệp quảng cáo và marketing. Các công ty có thể sử dụng những thông tin này để điều chỉnh các chiến dịch quảng cáo của mình, đảm bảo rằng người dùng không bị làm phiền bởi các quảng cáo không liên quan. Hơn nữa, việc hiểu rõ hơn về hành vi người tiêu dùng trên các thiết bị khác nhau sẽ giúp doanh nghiệp tối ưu hóa quy trình bán hàng và cải thiện mối quan hệ với khách hàng.

05/01/2025
Luận văn thạc sĩ khoa học máy tính identity resolution of devices from web data
Bạn đang xem trước tài liệu : Luận văn thạc sĩ khoa học máy tính identity resolution of devices from web data

Để xem tài liệu hoàn chỉnh bạn click vào nút

Tải xuống

Bài luận văn thạc sĩ mang tiêu đề Luận văn thạc sĩ về phân tích danh tính thiết bị từ dữ liệu trên web của tác giả Ngô Triệu Long, dưới sự hướng dẫn của PGS.TS Huỳnh Tường Nguyên và PGS.TS Quản Thành Thơ, được thực hiện tại Trường Đại Học Bách Khoa TP. Hồ Chí Minh vào năm 2024. Nghiên cứu này tập trung vào việc phát triển các giải pháp để phân tích và xác định danh tính thiết bị thông qua dữ liệu thu thập từ web. Những điểm chính của bài luận văn bao gồm phương pháp thu thập dữ liệu, kỹ thuật phân tích và ứng dụng trong thực tế. Độc giả sẽ tìm thấy nhiều lợi ích từ việc hiểu rõ hơn về cách mà dữ liệu web có thể được sử dụng để xác định danh tính thiết bị, từ đó có thể áp dụng vào các lĩnh vực như bảo mật mạng, phân tích hành vi người dùng và tối ưu hóa trải nghiệm người dùng.

Để mở rộng thêm kiến thức về các khía cạnh liên quan, bạn có thể tham khảo các bài viết sau đây: Ứng Dụng Active Learning trong Lựa Chọn Dữ Liệu Gán Nhãn cho Bài Toán Nhận Diện Giọng Nói, nơi trình bày về việc sử dụng dữ liệu để cải thiện nhận diện giọng nói, hay Triển khai ứng dụng mạng neural để phát hiện xâm nhập trái phép, bài viết này có thể giúp bạn hiểu rõ hơn về việc ứng dụng công nghệ trong việc bảo mật và phân tích dữ liệu. Cuối cùng, Nhận dạng giọng nói tiếng Việt qua học sâu và mô hình ngôn ngữ cũng mang lại cái nhìn sâu sắc về cách dữ liệu có thể được áp dụng trong lĩnh vực nhận diện giọng nói. Những tài liệu này sẽ cung cấp cho bạn nhiều góc nhìn bổ ích và mở rộng kiến thức trong lĩnh vực công nghệ thông tin và phân tích dữ liệu.

Tải xuống (69 Trang - 1.99 MB)