Gợi ý món ăn trên website đặt hàng từ luận văn thạc sĩ hệ thống thông tin quản lý xây dựng

Luận văn thạc sĩ hệ thống thông tin quản lý xây dựng module phân loại món ăn hỗ trợ gợi ý chọn món trên website đặt hàng hiệu quả.

Trường đại học

Trường Đại Học Bách Khoa

Chuyên ngành

Hệ Thống Thông Tin Quản Lý

Người đăng

Ẩn danh

Thể loại

luận văn thạc sĩ

2019

Phí lưu trữ

35 Point

Mục lục chi tiết

1. GIỚI THIỆU

1.1. GIỚI THIỆU TÀI LIỆU

1.2. MỤC TIÊU VÀ NỘI DUNG

1.3. GIẢI HẠN TÀI LIỆU

2. LÝ THUYẾT VÀ CÁC NGHIÊN CỨU LIÊN QUAN

2.1. Phân loại dữ liệu

3. XÂY DỰNG MODULE PHÂN LOẠI, HỖ TRỢ GỢI Ý CHẶN MÓN

3.1. Mô hình phân loại

3.2. Thu thập dữ liệu

3.2.1. Công cụ thu thập dữ liệu

3.2.2. Kết quả thu thập và xử lý

3.3. Chuẩn bị dữ liệu cho mô hình

3.3.1. Thống kê dữ liệu

3.3.2. Kết quả thống kê

3.4. Đánh giá thuật toán phân loại

3.4.1. OneVsRest với thuật toán LogisticRegression

3.4.2. OneVsRest với thuật toán Naive Bayes

3.4.3. OneVsRest với thuật toán LinearSVC

3.4.4. Multiple Binary Classifications - (Binary Relevance - BR)

3.4.7. Multilabel k Nearest Neighbor (ML-kNN)

3.4.8. Multi-Label Decision Tree (ML-DT)

4. TÀI LIỆU THAM KHẢO

Tóm tắt

I. Giới thiệu

Trong bối cảnh phát triển nhanh chóng của công nghệ thông tin, giải pháp gợi ý món ăn trên các website đặt hàng trở nên cần thiết hơn bao giờ hết. Luận văn thạc sĩ này trình bày một mô hình phân loại tự động dựa trên tên món ăn, nhằm cải thiện trải nghiệm người dùng. Việc xây dựng một hệ thống thông tin quản lý hiệu quả không chỉ giúp khách hàng dễ dàng tìm kiếm món ăn mà còn tối ưu hóa quy trình đặt hàng. Đặc biệt, việc ứng dụng công nghệ thông tin trong ngành dịch vụ ẩm thực trực tuyến sẽ góp phần nâng cao chất lượng dịch vụ và sự hài lòng của khách hàng.

II. Mục tiêu nghiên cứu

Mục tiêu chính của nghiên cứu này là phát triển một module phân loại món ăn có khả năng gợi ý dựa trên sở thích của người dùng. Để đạt được điều này, nghiên cứu sẽ tập trung vào việc thu thập dữ liệu từ các nguồn khác nhau, phân tích và áp dụng các thuật toán phân loại hiện đại. Điều này không chỉ giúp cải thiện khả năng gợi ý mà còn đảm bảo rằng người dùng có thể tìm thấy món ăn phù hợp với nhu cầu và sở thích của họ một cách nhanh chóng và dễ dàng.

III. Phân tích dữ liệu

Quá trình phân tích dữ liệu là một phần quan trọng trong việc phát triển mô hình gợi ý món ăn. Dữ liệu được thu thập từ nhiều nguồn khác nhau, bao gồm các trang web ẩm thực và các ứng dụng đặt hàng trực tuyến. Việc phân tích này sẽ giúp xác định các yếu tố chính ảnh hưởng đến sở thích của người dùng, từ đó xây dựng một cơ sở dữ liệu vững chắc cho mô hình gợi ý. Sử dụng các kỹ thuật phân tích dữ liệu lớn, nghiên cứu sẽ tìm ra các mẫu và xu hướng trong hành vi của người dùng, giúp cải thiện độ chính xác của hệ thống.

IV. Ứng dụng công nghệ thông tin

Công nghệ thông tin đóng vai trò then chốt trong việc phát triển hệ thống gợi ý món ăn. Sử dụng các thuật toán phân loại như Naive Bayes, Support Vector Machines, và k-Nearest Neighbors, hệ thống sẽ có khả năng phân loại món ăn một cách chính xác và nhanh chóng. Việc ứng dụng các công nghệ này không chỉ giúp nâng cao trải nghiệm của người dùng mà còn tối ưu hóa quy trình quản lý thông tin trong ngành ẩm thực. Hệ thống sẽ liên tục học hỏi và cải thiện dựa trên phản hồi của người dùng, từ đó nâng cao chất lượng dịch vụ.

V. Kết luận

Luận văn thạc sĩ này đã chỉ ra rằng việc phát triển một module gợi ý món ăn không chỉ mang lại lợi ích cho người dùng mà còn cho các nhà hàng và dịch vụ giao hàng. Hệ thống này sẽ giúp tiết kiệm thời gian và nâng cao trải nghiệm của khách hàng khi đặt hàng trực tuyến. Bằng cách áp dụng các công nghệ hiện đại trong lĩnh vực quản lý xây dựng, nghiên cứu góp phần tạo ra một giải pháp hiệu quả cho ngành dịch vụ ẩm thực trực tuyến, mở ra nhiều cơ hội phát triển trong tương lai.

05/01/2025

Bạn đang xem trước tài liệu:

Luận văn thạc sĩ hệ thống thông tin quản lý xây dựng module phân loại món ăn hỗ trợ gợi ý chọn món trên website đặt hàng

Tải đầy đủ

Nội dung chính

Tổng quan nghiên cứu

Trong bối cảnh phát triển mạnh mẽ của thương mại điện tử và dịch vụ giao nhận thực phẩm trực tuyến tại Việt Nam, với giá trị thị trường ước tính khoảng 33 triệu USD vào năm 2018, nhu cầu phân loại và quản lý dữ liệu món ăn trở nên cấp thiết. Việc tìm kiếm và gợi ý món ăn phù hợp cho khách hàng trên các nền tảng như Now, GrabFood với hơn 20.000 nhà hàng và hàng nghìn món ăn đa dạng đòi hỏi một hệ thống phân loại tự động hiệu quả. Vấn đề nghiên cứu tập trung vào xây dựng một module phân loại món ăn dựa trên tên món, nhằm hỗ trợ việc gợi ý chọn món nhanh chóng, chính xác, giảm thiểu thời gian tìm kiếm và nâng cao trải nghiệm người dùng. Mục tiêu cụ thể của luận văn là phát triển module phân loại đa nhãn (multi-label classification) cho món ăn, thu thập và xử lý dữ liệu từ website cooky.vn, áp dụng các thuật toán phân loại phù hợp với đặc thù ngôn ngữ tiếng Việt và đánh giá hiệu quả của các thuật toán này. Nghiên cứu được thực hiện trong giai đoạn từ tháng 2 đến tháng 6 năm 2019 tại Thành phố Hồ Chí Minh, với ý nghĩa quan trọng trong việc nâng cao chất lượng dịch vụ trực tuyến và hỗ trợ quản lý dữ liệu món ăn trong ngành công nghệ thông tin và quản lý.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Phân loại đa nhãn (Multi-label classification): Bài toán phân loại trong đó mỗi đối tượng có thể thuộc về nhiều nhãn khác nhau đồng thời. Các dạng bài toán phân loại đa nhãn được phân loại thành bốn loại chính: phân loại đơn nhãn, phân loại đa nhãn độc lập, phân loại đa nhãn phụ thuộc và phân loại đa nhãn phức hợp.
Thuật toán phân loại đa nhãn:
- OneVsRest (OVR): Chuyển bài toán đa nhãn thành nhiều bài toán phân loại nhị phân độc lập.
- Binary Relevance (BR): Xử lý mỗi nhãn như một bài toán phân loại nhị phân riêng biệt.
- Classifier Chains (CC): Xây dựng chuỗi các bộ phân loại nhị phân, trong đó đầu ra của bộ phân loại trước là đầu vào cho bộ phân loại tiếp theo.
- Random k Labelset (RakEL): Chia tập nhãn thành các tập con ngẫu nhiên và áp dụng phân loại đa lớp trên từng tập con.
- Multi-Label k Nearest Neighbor (ML-kNN): Thuật toán k láng giềng gần nhất thích nghi cho phân loại đa nhãn dựa trên luật Bayes.
- Multi-Label Decision Tree (ML-DT): Sử dụng cây quyết định để phân loại đa nhãn dựa trên thông tin entropy.
Xử lý ngôn ngữ tự nhiên (NLP) cho tiếng Việt:
- Tách từ (word segmentation) là bước quan trọng do đặc thù tiếng Việt không có dấu cách rõ ràng giữa các từ.
- Các công cụ như underthesea và pyvi được sử dụng để tách từ và chuẩn hóa dữ liệu.
- Vector hóa dữ liệu bằng TF-IDF để biểu diễn đặc trưng cho thuật toán học máy.

Phương pháp nghiên cứu

Nguồn dữ liệu:
- Thu thập dữ liệu món ăn và nguyên liệu từ website cooky.vn thông qua công cụ Selenium Web Driver với ngôn ngữ lập trình Python.
- Dữ liệu gồm tên món ăn, cách thực hiện, nguyên liệu và các nhãn phân loại liên quan đến cách chế biến.
Xử lý dữ liệu:
- Làm sạch dữ liệu: loại bỏ thẻ HTML, ký tự đặc biệt, chuẩn hóa chữ hoa chữ thường.
- Tách từ tiếng Việt bằng công cụ underthesea và pyvi, kết hợp hai kết quả để tăng độ chính xác.
- Vector hóa dữ liệu bằng TF-IDF.
Phân loại:
- Áp dụng các thuật toán phân loại đa nhãn như OneVsRest với Logistic Regression, Naive Bayes, LinearSVC; Binary Relevance; Classifier Chains; Random k Labelset; ML-kNN; ML-DT.
- Đánh giá hiệu quả thuật toán dựa trên các tiêu chí: tốc độ huấn luyện, độ chính xác mẫu (sample accuracy), độ chính xác nhãn (label accuracy).
Timeline nghiên cứu:
- Thu thập và xử lý dữ liệu: tháng 2 - tháng 3 năm 2019.
- Xây dựng và huấn luyện mô hình: tháng 4 - tháng 5 năm 2019.
- Đánh giá và hoàn thiện luận văn: tháng 6 năm 2019.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

Hiệu quả phân loại: Thuật toán OneVsRest với Logistic Regression đạt độ chính xác nhãn cao nhất, khoảng 85% trên tập dữ liệu 160 nhãn, vượt trội so với Naive Bayes (khoảng 70%) và LinearSVC (khoảng 80%).
Tốc độ huấn luyện: Thuật toán Naive Bayes có tốc độ huấn luyện nhanh nhất, trung bình dưới 1 phút cho tập dữ liệu 160 nhãn, trong khi Logistic Regression mất khoảng 3 phút và ML-kNN mất hơn 5 phút.
Ảnh hưởng của số lượng nhãn: Khi giảm số lượng nhãn từ 160 xuống 105, độ chính xác của các thuật toán tăng trung bình 5-7%, cho thấy việc lựa chọn nhãn phù hợp giúp cải thiện hiệu quả phân loại.
Độ chính xác nhãn và mẫu: ML-DT và ML-kNN cho kết quả cân bằng giữa độ chính xác nhãn và mẫu, với độ chính xác nhãn khoảng 80% và độ chính xác mẫu khoảng 75%.

Thảo luận kết quả

Kết quả cho thấy việc áp dụng các thuật toán phân loại đa nhãn phù hợp với đặc thù dữ liệu tiếng Việt và cấu trúc món ăn giúp nâng cao hiệu quả phân loại. Đặc biệt, OneVsRest với Logistic Regression thể hiện sự cân bằng tốt giữa độ chính xác và tốc độ huấn luyện, phù hợp cho ứng dụng thực tế. So sánh với các nghiên cứu trước đây về phân loại đa nhãn tiếng Việt, kết quả này tương đồng với xu hướng sử dụng các thuật toán học máy truyền thống kết hợp xử lý ngôn ngữ tự nhiên chuyên biệt cho tiếng Việt. Việc thu thập dữ liệu từ website cooky.vn với hơn 1.500 loại nguyên liệu và 25 nhãn cách chế biến đã tạo ra bộ dữ liệu phong phú, giúp mô hình học được các đặc trưng đa dạng của món ăn. Dữ liệu có thể được trình bày qua biểu đồ so sánh độ chính xác và thời gian huấn luyện của từng thuật toán, cũng như bảng thống kê số lượng nhãn và mẫu trong tập dữ liệu.

Đề xuất và khuyến nghị

Phát triển hệ thống phân loại tích hợp: Triển khai module phân loại đa nhãn vào hệ thống quản lý món ăn trực tuyến nhằm nâng cao trải nghiệm người dùng trong việc tìm kiếm và gợi ý món ăn.
Tối ưu hóa thuật toán: Áp dụng kỹ thuật giảm chiều dữ liệu và lựa chọn nhãn để cải thiện tốc độ huấn luyện và độ chính xác của mô hình, hướng tới thời gian huấn luyện dưới 2 phút cho tập dữ liệu lớn.
Mở rộng dữ liệu huấn luyện: Thu thập thêm dữ liệu từ các nguồn khác nhau, cập nhật thường xuyên để mô hình phản ánh chính xác xu hướng ẩm thực và cách chế biến mới.
Nâng cao xử lý ngôn ngữ tự nhiên: Phát triển các công cụ tách từ và nhận dạng thực thể riêng biệt cho tiếng Việt trong lĩnh vực ẩm thực, nhằm tăng độ chính xác phân loại.
Đào tạo và chuyển giao công nghệ: Tổ chức các khóa đào tạo cho đội ngũ phát triển và quản lý dữ liệu về kỹ thuật phân loại đa nhãn và xử lý ngôn ngữ tự nhiên, đảm bảo vận hành hiệu quả module phân loại.

Đối tượng nên tham khảo luận văn

Nhà phát triển phần mềm và kỹ sư dữ liệu: Hướng dẫn xây dựng và triển khai các mô hình phân loại đa nhãn cho dữ liệu tiếng Việt, đặc biệt trong lĩnh vực ẩm thực và thương mại điện tử.
Chuyên gia nghiên cứu về xử lý ngôn ngữ tự nhiên: Cung cấp các phương pháp xử lý và tách từ tiếng Việt kết hợp với thuật toán học máy đa nhãn.
Quản lý sản phẩm và dịch vụ trực tuyến: Hiểu rõ về cách thức phân loại và gợi ý món ăn tự động, từ đó cải thiện trải nghiệm khách hàng và tối ưu hóa quy trình vận hành.
Sinh viên và học viên cao học ngành công nghệ thông tin, quản lý thông tin: Tài liệu tham khảo về ứng dụng thực tiễn của phân loại đa nhãn và xử lý ngôn ngữ tự nhiên trong môi trường tiếng Việt.

Câu hỏi thường gặp

Module phân loại món ăn này có thể áp dụng cho các lĩnh vực khác không?
Có, phương pháp phân loại đa nhãn và xử lý ngôn ngữ tự nhiên có thể được điều chỉnh để áp dụng cho các lĩnh vực như y tế, giáo dục, thương mại điện tử với dữ liệu đa nhãn tương tự.
Tại sao cần phân loại đa nhãn thay vì phân loại đơn nhãn?
Món ăn thường có nhiều đặc điểm cùng lúc như cách chế biến, nguyên liệu, vùng miền, do đó phân loại đa nhãn giúp mô hình phản ánh chính xác hơn các đặc trưng phức tạp này.
Làm thế nào để xử lý đặc thù ngôn ngữ tiếng Việt trong phân loại?
Sử dụng các công cụ tách từ chuyên biệt cho tiếng Việt như underthesea, pyvi và kết hợp vector hóa TF-IDF giúp mô hình hiểu và phân loại chính xác hơn.
Độ chính xác của mô hình có thể cải thiện như thế nào?
Bằng cách mở rộng dữ liệu huấn luyện, tối ưu thuật toán, và cập nhật thường xuyên bộ nhãn, độ chính xác có thể được nâng cao đáng kể.
Module này có thể tích hợp vào hệ thống hiện có dễ dàng không?
Có, module được thiết kế với kiến trúc mô-đun, dễ dàng tích hợp vào các hệ thống quản lý dữ liệu món ăn hoặc nền tảng thương mại điện tử hiện tại.

Kết luận

Đã xây dựng thành công module phân loại đa nhãn món ăn dựa trên tên món và dữ liệu thu thập từ website cooky.vn với hơn 1.500 nguyên liệu và 25 nhãn cách chế biến.
Thuật toán OneVsRest với Logistic Regression cho hiệu quả phân loại tốt nhất, đạt độ chính xác nhãn khoảng 85% trên tập dữ liệu lớn.
Phương pháp xử lý ngôn ngữ tự nhiên chuyên biệt cho tiếng Việt đóng vai trò quan trọng trong việc nâng cao hiệu quả phân loại.
Kết quả nghiên cứu góp phần nâng cao trải nghiệm người dùng trong các hệ thống thương mại điện tử và dịch vụ giao nhận thực phẩm trực tuyến.
Đề xuất mở rộng dữ liệu, tối ưu thuật toán và đào tạo nhân lực để phát triển ứng dụng trong thực tế, hướng tới triển khai trong vòng 1 năm tới.

Hãy áp dụng các giải pháp và kiến thức từ luận văn này để nâng cao hiệu quả quản lý và phân loại dữ liệu món ăn trong các dự án công nghệ thông tin và thương mại điện tử.

Bài viết "Gợi ý món ăn trên website đặt hàng từ luận văn thạc sĩ hệ thống thông tin quản lý xây dựng" của tác giả Phạm Long Về, dưới sự hướng dẫn của PGS. Nguyễn Thanh Bình, thuộc Trường Đại Học Bách Khoa, đề cập đến việc phát triển hệ thống gợi ý món ăn cho các website đặt hàng. Nghiên cứu này không chỉ cung cấp giải pháp công nghệ thông tin mà còn giúp cải thiện trải nghiệm người dùng, tạo điều kiện thuận lợi cho việc lựa chọn món ăn phù hợp với nhu cầu và sở thích của khách hàng.

Để mở rộng thêm kiến thức về các vấn đề liên quan, bạn có thể tham khảo các bài viết như Nghiên cứu ảnh hưởng của đô thị hóa đến hiệu quả sử dụng đất nông nghiệp ở huyện Phổ Yên, tỉnh Thái Nguyên, nơi khám phá mối liên hệ giữa đô thị hóa và quản lý đất đai. Bên cạnh đó, bài viết Tác động của đô thị hóa đến sử dụng đất nông nghiệp tại huyện Phổ Yên, tỉnh Thái Nguyên giai đoạn 2008-2010 cũng sẽ cung cấp thêm góc nhìn về sự phát triển đô thị và tác động của nó đến các lĩnh vực khác nhau. Cuối cùng, bài viết Luận án tiến sĩ: Ảnh hưởng của các yếu tố đến phát triển quỹ đất và cơ sở hạ tầng đô thị tại Pleiku, Gia Lai cũng sẽ giúp bạn hiểu rõ hơn về các yếu tố ảnh hưởng đến phát triển đô thị và quỹ đất. Những tài liệu này sẽ là nguồn tài nguyên quý giá cho những ai quan tâm đến sự phát triển đô thị và quản lý đất đai.

#Luận văn Thạc sĩ

#trải nghiệm người dùng

#Hệ thống thông tin quản lý

#giải pháp công nghệ

#gợi ý món ăn

#website đặt hàng

Chủ đề

Công nghệ thông tin trong ngành thực phẩm

Phát triển website thương mại điện tử

Hệ thống gợi ý và trí tuệ nhân tạo

Nghiên cứu và ứng dụng trong quản lý thực phẩm