I. Giới thiệu
Khóa luận tốt nghiệp này tập trung vào việc tìm hiểu và ứng dụng mạng nơron tích chập (CNN) trong lĩnh vực chuyển đổi phong cách nghệ thuật. Mục tiêu chính là xây dựng một ứng dụng minh họa trên điện thoại, cho phép chuyển đổi phong cách nghệ thuật của hình ảnh một cách nhanh chóng và hiệu quả. Deep learning và học sâu là những công nghệ nền tảng được sử dụng để giải quyết bài toán này. Khóa luận cũng đề cập đến các thách thức trong việc tối ưu hóa thuật toán và xây dựng ứng dụng thực tế.
1.1. Mô tả đề tài
Chuyển đổi phong cách nghệ thuật là một kỹ thuật trong xử lý hình ảnh, cho phép tái tạo nội dung của một hình ảnh theo phong cách nghệ thuật của một hình ảnh khác. Khóa luận này sử dụng mạng nơron tích chập để giải quyết bài toán này. Các thuật toán được nghiên cứu và áp dụng bao gồm phương pháp của Gatys và Johnson. Ứng dụng minh họa được xây dựng trên nền tảng Android, kết nối với máy chủ để thực hiện chuyển đổi phong cách nghệ thuật.
1.2. Các nghiên cứu liên quan
Các nghiên cứu liên quan đến chuyển đổi phong cách nghệ thuật đã được thực hiện từ nhiều thập kỷ trước. Gatys và cộng sự là những người tiên phong trong việc sử dụng CNN để tái tạo phong cách hội họa nổi tiếng trên hình ảnh tự nhiên. Phương pháp của họ dựa trên việc tối ưu hóa hàm mất mát, bao gồm mất mát nội dung và mất mát phong cách. Các nghiên cứu sau này như của Johnson và cộng sự đã cải tiến phương pháp này bằng cách đào tạo mạng nơron độc lập để chuyển đổi phong cách trong một lần chuyển tiếp.
II. Cơ sở lý thuyết
Mạng nơron tích chập (CNN) là công cụ chính được sử dụng trong khóa luận này. CNN được thiết kế để xử lý dữ liệu hình ảnh thông qua các lớp tích chập và lớp pooling. Khóa luận cũng đề cập đến các mô hình VGG16 và VGG19, được sử dụng để trích xuất đặc trưng từ hình ảnh. Các hàm mất mát như mất mát nội dung và mất mát phong cách được tính toán dựa trên các đặc trưng này. Thuật toán tối ưu hóa Adam được sử dụng để cải thiện hiệu suất của mô hình.
2.1. Tổng quan về CNN
CNN là một loại mạng nơron sâu được thiết kế đặc biệt để xử lý dữ liệu hình ảnh. Các lớp tích chập trong CNN giúp trích xuất các đặc trưng từ hình ảnh, trong khi các lớp pooling giúp giảm kích thước của dữ liệu. CNN được sử dụng rộng rãi trong các bài toán phân loại hình ảnh và tạo hình ảnh. Trong khóa luận này, CNN được sử dụng để trích xuất đặc trưng từ hình ảnh nội dung và hình ảnh phong cách.
2.2. Mô hình VGG
Mô hình VGG là một trong những mô hình CNN phổ biến nhất, được sử dụng để trích xuất đặc trưng từ hình ảnh. Khóa luận sử dụng VGG16 và VGG19 để tính toán các hàm mất mát. Các đặc trưng được trích xuất từ các lớp khác nhau của mô hình VGG, giúp tái tạo nội dung và phong cách của hình ảnh. Mô hình VGG cũng được sử dụng để huấn luyện các mạng chuyển đổi phong cách nghệ thuật.
III. Kết quả thực nghiệm
Khóa luận đã thực hiện nhiều thí nghiệm để đánh giá hiệu quả của các thuật toán chuyển đổi phong cách nghệ thuật. Các kết quả cho thấy rằng việc sử dụng hàm mất mát TV loss giúp cải thiện chất lượng hình ảnh đầu ra, giảm nhiễu và tăng độ mượt. Các mô hình được huấn luyện thành công, cho phép chuyển đổi phong cách nghệ thuật một cách nhanh chóng. Ứng dụng minh họa trên điện thoại cũng được xây dựng và thử nghiệm, cho kết quả khả quan.
3.1. Quá trình huấn luyện
Quá trình huấn luyện các mô hình chuyển đổi phong cách nghệ thuật được thực hiện trên bộ dữ liệu MS COCO 2014. Các thuật toán của Gatys và Johnson được áp dụng để huấn luyện mô hình. Kết quả cho thấy rằng việc sử dụng VGG19 giúp cải thiện chất lượng hình ảnh đầu ra so với VGG16. Thời gian huấn luyện mô hình cũng được ghi nhận và đánh giá.
3.2. Ứng dụng minh họa
Ứng dụng minh họa được xây dựng trên nền tảng Android, sử dụng Flutter framework và kết nối với máy chủ API. Ứng dụng cho phép người dùng chọn hình ảnh nội dung và hình ảnh phong cách, sau đó thực hiện chuyển đổi phong cách nghệ thuật. Kết quả chuyển đổi được hiển thị trên giao diện ứng dụng, cho thấy tính khả thi và hiệu quả của phương pháp được đề xuất.
IV. Kết luận
Khóa luận đã thành công trong việc tìm hiểu và ứng dụng mạng nơron tích chập để giải quyết bài toán chuyển đổi phong cách nghệ thuật. Các kết quả thực nghiệm cho thấy rằng việc sử dụng hàm mất mát TV loss và mô hình VGG19 giúp cải thiện chất lượng hình ảnh đầu ra. Ứng dụng minh họa trên điện thoại cũng được xây dựng thành công, cho phép người dùng thực hiện chuyển đổi phong cách nghệ thuật một cách nhanh chóng và dễ dàng. Khóa luận mở ra hướng phát triển mới trong lĩnh vực nghệ thuật số và xử lý hình ảnh.