Đồ án HCMUTE: Ứng dụng học máy để phát sinh ảnh thời trang từ mô tả

Chuyên ngành

Công Nghệ Thông Tin

Người đăng

Ẩn danh

2020

67
0
0

Phí lưu trữ

30.000 VNĐ

Tóm tắt

I. Ứng dụng Học máy trong Phát sinh ảnh Thời trang

Đồ án tốt nghiệp này tập trung vào ứng dụng học máy để giải quyết bài toán phát sinh ảnh thời trang từ câu mô tả. Đây là một lĩnh vực đầy tiềm năng, kết hợp giữa công nghệ tạo ảnh AIxu hướng thời trang AI. Nghiên cứu này hướng đến việc tạo ra một mô hình có thể tự động thiết kế trang phục dựa trên yêu cầu bằng văn bản của người dùng, góp phần vào thương mại điện tử thời trang. Việc sử dụng học sâu và cụ thể là GAN thời trang được xem là giải pháp tiềm năng. Các thuật toán phát sinh ảnh được ứng dụng cần vượt qua nhiều thách thức, bao gồm việc xử lý sự đa dạng và phức tạp của dữ liệu ảnh thời trang, và độ chính xác của phân tích ảnh thời trang. Mô hình cần có khả năng hiểu và diễn đạt mô tả ảnh thời trang, chuyển đổi ngôn ngữ tự nhiên thành hình ảnh thời trang có chất lượng cao. Thành công của nghiên cứu này sẽ mang lại sự đột phá trong thiết kế thời trang AItạo nội dung thời trang. Dữ liệu thời trang chất lượng cao là yếu tố quan trọng để huấn luyện mô hình hiệu quả. Mạng nơ-ron nhân tạo đóng vai trò then chốt trong việc xây dựng mô hình này.

1.1 Khó khăn và Thách thức

Bài toán phát sinh ảnh thời trang từ mô tả gặp nhiều khó khăn. Dữ liệu thời trang rất đa dạng, phức tạp về hình dáng, màu sắc, chất liệu. Mô tả ảnh thời trang cũng đa dạng về ngữ nghĩa. Việc xây dựng mô hình cần giải quyết các vấn đề như mất mát hàm mục tiêu, mode collapse, và vanishing gradient. Phân tích ảnh thời trang chính xác là cần thiết để đánh giá chất lượng ảnh tạo ra. Tối ưu hóa mô hình học máy là một quá trình phức tạp, đòi hỏi nhiều thời gian và tài nguyên tính toán. Bộ dữ liệu ảnh thời trang cần đủ lớn và đa dạng để đảm bảo mô hình học tập hiệu quả. Thu thập dữ liệu thời trangbổ sung dữ liệu ảnh là những công đoạn quan trọng để đảm bảo chất lượng mô hình. Xử lý ảnh thời trang cũng cần được chú trọng để tối ưu hóa quá trình huấn luyện mô hình.

1.2 Phương pháp tiếp cận

Đồ án này sử dụng mô hình GAN, cụ thể là AttnGAN (Attentional Generative Adversarial Network)StackGAN-v2, để giải quyết bài toán. AttnGAN được chọn vì khả năng tạo ảnh có độ phân giải cao và chi tiết hơn so với các mô hình khác. Mạng nơ-ron tích chập (CNN)mạng nơ-ron hồi quy (RNN) được tích hợp để xử lý thông tin hình ảnh và văn bản. Cơ chế Attention giúp mô hình tập trung vào các chi tiết quan trọng trong mô tả văn bản, từ đó tạo ra ảnh phù hợp hơn. Quá trình huấn luyện mô hình học máy được thực hiện trên tập dữ liệu Fashion-Gen. Đánh giá mô hình được thực hiện dựa trên các chỉ số như Fréchet Inception Distance (FID) để đo lường sự khác biệt giữa ảnh tạo ra và ảnh thật. Phát triển mô hình bao gồm các giai đoạn: thu thập dữ liệu, tiền xử lý dữ liệu, xây dựng mô hình, huấn luyện mô hình và đánh giá mô hình. Kiến trúc mạng nơ-ron được tối ưu để đảm bảo hiệu quả và chất lượng ảnh tạo ra.

1.3 Kết quả và Ứng dụng

Kết quả cho thấy mô hình AttnGAN đạt hiệu quả tốt hơn StackGAN-v2 trong việc tạo ảnh thời trang từ mô tả. Ảnh tạo ra có độ phân giải cao và chi tiết hơn, tuy nhiên vẫn còn một số hạn chế về độ chính xác của chi tiết. Ứng dụng của nghiên cứu này rất rộng rãi. Mô hình có thể được tích hợp vào các phần mềm thiết kế thời trang, hỗ trợ nhà thiết kế tạo mẫu nhanh chóng. Tìm kiếm ảnh thời trang bằng văn bản cũng trở nên hiệu quả hơn. Công nghệ tạo ảnh AI này có thể cách mạng hóa thời trang trực tuyếnthực tiễn tạo ảnh thời trang. Nhận diện ảnh thời trang cũng được cải thiện nhờ nghiên cứu này. Việc tăng cường dữ liệu ảnh sẽ giúp cải thiện chất lượng mô hình trong tương lai. Phân loại ảnh thời trang cũng là một hướng ứng dụng tiềm năng của mô hình.

01/02/2025
Đồ án hcmute ứng dụng học máy cho bài toán phát sinh ảnh thời trang từ câu mô tả
Bạn đang xem trước tài liệu : Đồ án hcmute ứng dụng học máy cho bài toán phát sinh ảnh thời trang từ câu mô tả

Để xem tài liệu hoàn chỉnh bạn click vào nút

Tải xuống