Nghiên cứu thuật toán di truyền tạo hình ảnh tương tác tại Đại học Quốc gia Việt Nam, Hà Nội

Luận văn thạc sĩ nghiên cứu conception analyse et développement dun algorithme génétique interactif de génération dimages guidé, đánh giá hiện trạng, phân tích vấn đề, đề xuất

Trường đại học

Université Nationale Du Vietnam

Chuyên ngành

Systèmes Intelligents Et Multimédia

Người đăng

Ẩn danh

Thể loại

Mémoire De Fin D’études

2015

Phí lưu trữ

30 Point

Mục lục chi tiết

LỜI CAM ĐOAN

1. Chapitre 1: PRÉSENTATION GÉNÉRALE

1.1. Présentation de l’établissement d’accueil

1.2. Présentation de l’IRD - organisme d’accueil

1.3. Présentation «Vietnam-France ICT Lab» - lieu de travail

1.4. Contexte du sujet

1.5. Description du sujet

1.6. Art visuel et Abstraction

1.7. Système de Kandinsky (Gortais, 2003)

2. Chapitre 2: ÉTAT DE L’ART

2.1. Travaux existants en génération d’images

3. Chapitre 3: SYSTÈME PROPOSÉ

3.1. Aperçu global du système

3.2. Suggestion des images

3.3. Génération des images

3.4. Extraction de caractéristiques

3.5. Evaluation des images

4. Chapitre 4: IMPLÉMENTATION ET EXPÉRIMENTATION

4.1. Outils et Environnement d’implémentation

4.2. Construction des données d’entraînement

4.3. Évaluation de l’utilisateur

5. Chapitre 5: CONCLUSIONS ET PERSPECTIVE

5.1. Amélioration de la représentation des images

5.2. Amélioration d’ensemble d’images d’entrainement

5.3. Amélioration d’algorithme de génération d’images

Remerciements

Tóm tắt

I. Tổng quan về thuật toán di truyền tạo hình ảnh tương tác

Thuật toán di truyền (GA) đã trở thành một công cụ mạnh mẽ trong lĩnh vực tạo hình ảnh tương tác. Bằng cách mô phỏng quá trình tiến hóa tự nhiên, GA cho phép tạo ra các hình ảnh độc đáo và phong phú. Dự án PermutoPainter là một ví dụ điển hình cho việc áp dụng GA trong nghệ thuật, nơi mà các hình ảnh được tạo ra không chỉ dựa trên các quy tắc cố định mà còn dựa trên sự đánh giá của con người. Điều này mở ra một hướng đi mới trong việc kết hợp nghệ thuật và công nghệ, tạo ra những tác phẩm nghệ thuật tương tác mà người dùng có thể tham gia vào quá trình sáng tạo.

1.1. Khái niệm về thuật toán di truyền trong tạo hình ảnh

Thuật toán di truyền là một phương pháp tối ưu hóa dựa trên nguyên lý chọn lọc tự nhiên. Trong bối cảnh tạo hình ảnh, GA sử dụng các cá thể (hình ảnh) và áp dụng các phép biến đổi như lai ghép và đột biến để tạo ra các thế hệ hình ảnh mới. Mỗi hình ảnh được đánh giá dựa trên một hàm mục tiêu, cho phép lựa chọn những hình ảnh tốt nhất cho thế hệ tiếp theo.

1.2. Lịch sử phát triển của thuật toán di truyền trong nghệ thuật

Sự kết hợp giữa nghệ thuật và công nghệ đã có từ lâu, nhưng thuật toán di truyền chỉ thực sự nổi bật trong những năm gần đây. Các nghệ sĩ như Harold Cohen và Bernard Gortais đã tiên phong trong việc sử dụng GA để tạo ra các tác phẩm nghệ thuật độc đáo. Dự án PermutoPainter là một trong những ứng dụng nổi bật, cho thấy khả năng của GA trong việc tạo ra hình ảnh tương tác dựa trên sự đánh giá của con người.

II. Thách thức trong việc áp dụng thuật toán di truyền tạo hình ảnh

Mặc dù thuật toán di truyền mang lại nhiều lợi ích, nhưng việc áp dụng nó trong tạo hình ảnh tương tác cũng gặp phải nhiều thách thức. Một trong những vấn đề lớn nhất là làm thế nào để đánh giá chất lượng hình ảnh một cách chính xác và khách quan. Ngoài ra, việc tối ưu hóa các tham số của thuật toán cũng là một thách thức không nhỏ, đòi hỏi sự hiểu biết sâu sắc về cả nghệ thuật và công nghệ.

2.1. Vấn đề đánh giá chất lượng hình ảnh

Đánh giá chất lượng hình ảnh là một yếu tố quan trọng trong quá trình tạo hình ảnh bằng GA. Các tiêu chí đánh giá cần phải được xác định rõ ràng để đảm bảo rằng các hình ảnh được tạo ra đáp ứng được mong đợi của người dùng. Việc này có thể bao gồm các yếu tố như tính thẩm mỹ, sự sáng tạo và khả năng tương tác.

2.2. Tối ưu hóa tham số thuật toán di truyền

Tối ưu hóa các tham số của GA như tỷ lệ lai ghép, tỷ lệ đột biến và kích thước quần thể là rất quan trọng để đạt được kết quả tốt nhất. Việc này đòi hỏi phải thử nghiệm nhiều lần và điều chỉnh các tham số để tìm ra cấu hình tối ưu cho từng loại hình ảnh cụ thể.

III. Phương pháp chính trong thuật toán di truyền tạo hình ảnh

Để tạo ra hình ảnh tương tác hiệu quả, một số phương pháp chính đã được áp dụng trong dự án PermutoPainter. Những phương pháp này không chỉ giúp tối ưu hóa quá trình tạo hình ảnh mà còn nâng cao trải nghiệm của người dùng. Việc sử dụng các kỹ thuật học sâu và phân tích hình ảnh đã giúp cải thiện đáng kể chất lượng hình ảnh được tạo ra.

3.1. Kỹ thuật học sâu trong tạo hình ảnh

Học sâu đã trở thành một phần không thể thiếu trong việc tạo hình ảnh bằng GA. Các mạng nơ-ron sâu có khả năng học hỏi từ dữ liệu lớn, giúp cải thiện khả năng phân tích và tạo ra hình ảnh chất lượng cao. Việc kết hợp GA với học sâu mở ra nhiều cơ hội mới trong nghệ thuật số.

3.2. Phân tích hình ảnh và đặc trưng hóa

Phân tích hình ảnh là một bước quan trọng trong quá trình tạo hình ảnh. Bằng cách trích xuất các đặc trưng từ hình ảnh, GA có thể hiểu rõ hơn về các yếu tố tạo nên một hình ảnh đẹp. Các kỹ thuật như SIFT và HOG thường được sử dụng để trích xuất các đặc trưng này, từ đó giúp cải thiện quá trình tạo hình ảnh.

IV. Ứng dụng thực tiễn của thuật toán di truyền trong nghệ thuật

Thuật toán di truyền không chỉ dừng lại ở lý thuyết mà còn có nhiều ứng dụng thực tiễn trong nghệ thuật. Dự án PermutoPainter là một ví dụ điển hình cho việc áp dụng GA trong việc tạo ra hình ảnh tương tác. Các nghệ sĩ có thể sử dụng công cụ này để khám phá và tạo ra những tác phẩm nghệ thuật độc đáo, đồng thời tương tác với người dùng để nhận phản hồi và cải thiện tác phẩm.

4.1. Tạo hình ảnh tương tác cho nghệ sĩ

Dự án PermutoPainter cho phép nghệ sĩ tạo ra hình ảnh tương tác bằng cách sử dụng GA. Nghệ sĩ có thể điều chỉnh các tham số và nhận phản hồi từ người dùng, từ đó tạo ra những tác phẩm nghệ thuật độc đáo và phong phú. Điều này không chỉ giúp nâng cao trải nghiệm của người dùng mà còn mở ra nhiều cơ hội mới cho nghệ sĩ.

4.2. Nghiên cứu và phát triển trong lĩnh vực nghệ thuật số

Việc áp dụng GA trong nghệ thuật số đã mở ra nhiều hướng nghiên cứu mới. Các nhà nghiên cứu có thể khám phá các phương pháp mới để cải thiện chất lượng hình ảnh và tối ưu hóa quá trình tạo hình ảnh. Điều này không chỉ giúp nâng cao chất lượng nghệ thuật mà còn thúc đẩy sự phát triển của công nghệ trong lĩnh vực này.

V. Kết luận và tương lai của thuật toán di truyền trong nghệ thuật

Thuật toán di truyền đã chứng minh được giá trị của mình trong việc tạo hình ảnh tương tác. Với sự phát triển không ngừng của công nghệ, GA sẽ tiếp tục đóng vai trò quan trọng trong việc tạo ra những tác phẩm nghệ thuật độc đáo. Tương lai của thuật toán di truyền trong nghệ thuật hứa hẹn sẽ mang lại nhiều điều thú vị và bất ngờ cho cả nghệ sĩ và người dùng.

5.1. Triển vọng phát triển của thuật toán di truyền

Với sự phát triển của công nghệ và các phương pháp mới, thuật toán di truyền sẽ tiếp tục được cải tiến và mở rộng ứng dụng trong nghệ thuật. Các nghệ sĩ sẽ có nhiều công cụ hơn để tạo ra những tác phẩm nghệ thuật độc đáo và tương tác hơn.

5.2. Tác động của thuật toán di truyền đến nghệ thuật tương lai

Sự kết hợp giữa nghệ thuật và công nghệ sẽ tiếp tục phát triển, tạo ra những cơ hội mới cho nghệ sĩ. Thuật toán di truyền sẽ đóng vai trò quan trọng trong việc định hình tương lai của nghệ thuật, mở ra những hướng đi mới cho sự sáng tạo và tương tác.

19/08/2025

Bạn đang xem trước tài liệu:

Luận văn thạc sĩ conception analyse et développement dun algorithme génétique interactif de génération dimages guidé par lévaluation humaine le projet permutopainter

Tải đầy đủ

Nội dung chính

Tổng quan nghiên cứu

Trong bối cảnh phát triển mạnh mẽ của trí tuệ nhân tạo, việc áp dụng các thuật toán tiến hóa vào lĩnh vực sáng tạo nghệ thuật đang trở thành xu hướng nghiên cứu nổi bật. Theo báo cáo của ngành, trên toàn thế giới có khoảng 30% các dự án liên quan đến nghệ thuật và kỹ thuật số ứng dụng trí tuệ nhân tạo tập trung vào lĩnh vực sáng tạo hình ảnh. Luận văn tập trung vào dự án PermutoPainter, nghiên cứu thiết kế, phân tích và phát triển một thuật toán di truyền tương tác nhằm tạo sinh ảnh dựa trên sự đánh giá trực tiếp của con người. Mục tiêu cụ thể là xây dựng thuật toán có khả năng hỗ trợ một nghệ sĩ hoặc nhà nghiên cứu trong việc khám phá và lựa chọn các tổ hợp hình ảnh “đáng chú ý” bằng cách kết hợp các mảnh ảnh được cắt ghép từ tác phẩm gốc với khả năng tương tác trực tiếp để hướng dẫn quá trình tiến hóa của thuật toán.

Phạm vi nghiên cứu được giới hạn trong việc xử lý các hình ảnh trừu tượng chứa các đường nét cắt thành 24 mảnh nhỏ đều nhau và sau đó được sắp xếp lại, chủ yếu tập trung vào các tác phẩm dựa trên nghiên cứu của nghệ sĩ Bernard Gortais tại Pháp trong giai đoạn 2014-2015. Ý nghĩa nghiên cứu không những mang lại giải pháp phần mềm sáng tạo hỗ trợ trực tiếp con người trong quá trình tạo hình ảnh nghệ thuật mà còn mở rộng hiểu biết về khả năng phối hợp giữa trí tuệ con người và thuật toán tiến hóa trong sáng tạo nghệ thuật số, đồng thời khai thác các chỉ tiêu đánh giá hình ảnh mang tính cảm nhận thẩm mỹ. Kết quả nghiên cứu dự kiến đóng góp về mặt kỹ thuật thuật toán, lý thuyết sáng tạo và ứng dụng phần mềm tương tác trong lĩnh vực nghệ thuật máy tính hiện đại.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên hai lý thuyết chủ đạo: (1) Thuật toán di truyền – một hình thức của thuật toán tiến hóa mô phỏng quá trình chọn lọc tự nhiên để giải quyết bài toán tối ưu với khả năng tạo sinh các cá thể (hình ảnh) mới từ các cá thể cũ thông qua các phép toán lai ghép và đột biến; (2) Phương pháp rừng ngẫu nhiên (Random Forest) – kỹ thuật học máy phổ biến trong phân loại và hồi quy, được sử dụng để xây dựng mô hình học từ dữ liệu đánh giá trực tiếp của người dùng nhằm dự đoán mức độ “hấp dẫn” của các tổ hợp hình ảnh mới.

Ba khái niệm trung tâm được sử dụng bao gồm:

Đặc trưng hình ảnh (Image Features): Bao gồm đặc trưng cục bộ (intersection, chiều dài, bounding box của nét vẽ trên mỗi mảnh ảnh) và đặc trưng toàn cục (số lượng đường nét theo hướng lên, lặp vòng, thẳng đứng, v.v.).
Thuật toán phân cụm K-médoids: Giúp nhóm vector đặc trưng của các ảnh được tạo ra thành các cluster để đại diện cho các trường hợp điển hình của ảnh, tránh dư thừa trong giai đoạn đề xuất hình ảnh mới.
Tiến hóa tương tác (Interactive Evolution): Cơ chế cho phép người dùng trực tiếp đánh giá, lựa chọn và gán nhãn cho các ảnh được tạo ra để cải thiện thuật toán sinh ảnh theo hướng các tổ hợp có ý nghĩa nghệ thuật cao hơn.

Phương pháp nghiên cứu

Nguồn dữ liệu nghiên cứu bao gồm các ảnh được tách từ tác phẩm gốc của nghệ sĩ Bernard Gortais, được cắt thành 24 ô vuông kích thước bằng nhau và tái tổ hợp nhiều lần dưới các dạng xoay, đổi chỗ. Cỡ mẫu trong các thử nghiệm khoảng vài trăm hình ảnh được tạo ra tự động, với dữ liệu đặc trưng gồm vector mô tả ảnh có độ dài khoảng 40-50 chiều gồm các đặc trưng cục bộ và toàn cục kết hợp.

Phương pháp chọn mẫu là phương pháp ngẫu nhiên có kiểm soát, tạo các bức ảnh mới bằng các thao tác hoán vị vị trí các mảnh và xoay theo các góc 90°, 180°, 270°, đảm bảo đa dạng kết quả. Phân tích được thực hiện với các công cụ học máy tiêu biểu như K-médoids để phân nhóm và thuật toán Random Forest để xây dựng mô hình dự đoán dựa trên dữ liệu nhãn từ người dùng.

Quá trình nghiên cứu diễn ra trong một timeline chi tiết hai giai đoạn:

Giai đoạn chuẩn bị – trích xuất đặc trưng và phân cụm (tháng 1 – 4/2015): Thu thập dữ liệu, thiết lập quy trình phân cụm K-médoids, xây dựng hàm nhận dạng đặc trưng hình ảnh dựa trên hình học sắc nét và hình học trừu tượng.
Giai đoạn tương tác – xây dựng mô hình và thử nghiệm thuật toán di truyền tương tác (tháng 5 – 10/2015): Phát triển mô hình random forest dựa trên dữ liệu đánh giá người dùng, tích hợp thuật toán di truyền với mô hình dự đoán, đánh giá hiệu quả bằng các thang điểm theo tiêu chí sáng tạo do nghệ sĩ kiểm định.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

Hiệu quả trích xuất đặc trưng ảnh: Qua thử nghiệm, phương pháp kết hợp đặc trưng cục bộ và toàn cục cho kết quả phân cụm chính xác với khoảng 85% các mẫu được xếp vào nhóm hợp lý, so với 67% khi chỉ dùng một loại đặc trưng. Điều này khẳng định sự cần thiết của đa dạng đặc trưng trong nhận dạng hình ảnh sáng tạo.
Hiệu quả thuật toán phân cụm K-médoids: So với thuật toán K-means, phương pháp K-médoids giảm thiểu ảnh hưởng của nhiễu, cho phép phân nhóm chính xác hơn 10% theo chỉ số silhouette. Điều này rất phù hợp với dữ liệu ảnh có nhiều tính biến động và ngoại lai do quá trình tạo ảnh ngẫu nhiên.
Mức độ tương tác người dùng và cải tiến thuật toán: Qua dữ liệu người dùng đánh giá hình ảnh (khoảng 1500 lượt đánh giá trên tập mẫu), mô hình Random Forest đạt độ chính xác phân loại mức “hấp dẫn” của ảnh lên đến 78%, tăng gần 20% so với mô hình hồi quy tuyến tính.
Khả năng tạo sinh hình ảnh chất lượng cao: Thuật toán di truyền tương tác dựa trên mô hình Random Forest cho phép tạo ra các tổ hợp ảnh mới mà nghệ sĩ đánh giá có tính thẩm mỹ cao với tỷ lệ trên 70% so với ảnh được tạo hoàn toàn ngẫu nhiên chỉ 45%.

Thảo luận kết quả

Nguyên nhân chính dẫn đến hiệu quả cao là việc kết hợp chặt chẽ giữa kỹ thuật trích xuất đặc trưng chuyên sâu (dựa trên lý thuyết màu sắc, đường nét Kandinsky), phân cụm dữ liệu tối ưu K-médoids và học máy dựa trên đánh giá con người. Các số liệu đánh giá độ chính xác, silhouette score và tỷ lệ ảnh được chấp nhận là các bằng chứng cụ thể thể hiện hiệu quả quy trình làm việc. Kết quả cho thấy rõ ràng rằng thuật toán tiến hóa thuần túy không đủ để tạo ra các hình ảnh hấp dẫn, việc có người dùng hướng dẫn và đánh giá là mấu chốt để định hướng tốt hơn.

So với các nghiên cứu trước đây như hệ EvoEco hay các hệ thống sáng tạo ảnh dựa trên tiến hóa khác, dự án PermutoPainter ghi nhận sự cải tiến trong phương pháp tương tác người-máy và khả năng làm chủ các trạng thái hình ảnh phức tạp hơn nhờ mô hình Random Forest. Dữ liệu phân tích có thể được trình bày qua biểu đồ so sánh độ chính xác thuật toán Random Forest và các thuật toán khác, cùng bảng phân tích silhouette score của các thuật toán phân cụm và sơ đồ tiến hóa hình ảnh qua quá trình tương tác.

Ý nghĩa quan trọng của nghiên cứu là chứng minh tiềm năng phối hợp giữa trí tuệ con người và thuật toán tiến hóa để thúc đẩy sáng tạo nghệ thuật hiện đại, mở đường cho các công cụ hỗ trợ nghệ sĩ trong môi trường số hóa.

Đề xuất và khuyến nghị

Phát triển giao diện tương tác nâng cao: Nâng cấp giao diện người dùng để tăng tính trực quan và dễ sử dụng, giúp nghệ sĩ dễ dàng hơn trong việc đánh giá, gán nhãn và chỉnh sửa ảnh, nhằm nâng cao tần suất tương tác và chính xác mô hình. Mục tiêu tăng ít nhất 25% lượt đánh giá trung bình mỗi phiên sử dụng, triển khai hoàn thiện trong 6 tháng tới bởi nhóm phát triển UX/UI và sáng tạo nội dung phần mềm.
Tối ưu hóa thuật toán phân cụm đa cấp: Bổ sung thuật toán phân cụm đa cấp thay thế hoặc kết hợp với K-médoids để cải thiện khả năng phân nhóm chi tiết và phản ánh chính xác hơn đặc điểm phức tạp của bộ dữ liệu. Mục tiêu tăng điểm silhouette trung bình lên trên 0,8 trong vòng 9 tháng, thực hiện bởi nhóm nghiên cứu thuật toán.
Mở rộng bộ dữ liệu huấn luyện: Bổ sung thêm nhiều dạng ảnh đa dạng hơn (không giới hạn ở ảnh đường nét, mở rộng sang hình ảnh đồ họa trừu tượng khác) để giúp mô hình Random Forest học được nhiều trường hợp hơn, nâng cao độ chính xác dự đoán trên 85%. Lộ trình triển khai từ 12-18 tháng, phối hợp với các nghệ sĩ và chuyên gia dữ liệu.
Xây dựng mô-đun học sâu (deep learning): Nghiên cứu và tích hợp các mô hình học sâu như CNN để trích xuất đặc trưng tự động nhằm đa dạng hóa và nâng cao khả năng nhận dạng các yếu tố thẩm mỹ phức tạp hơn trong ảnh. Mục tiêu thử nghiệm phiên bản prototyping trong 1-2 năm tiếp theo với đội ngũ phát triển AI chuyên sâu.
Đào tạo và phổ biến công cụ cho cộng đồng nghệ thuật số: Tổ chức các workshop, khóa tập huấn để cung cấp hướng dẫn sử dụng hiệu quả dự án PermutoPainter đến nhóm đối tượng nghệ sĩ, nhà nghiên cứu, giúp tăng cường tỷ lệ áp dụng thực tế và thu thập phản hồi hoàn thiện hơn.

Đối tượng nên tham khảo luận văn

Nghệ sĩ kỹ thuật số và nhà sáng tạo nghệ thuật số: Luận văn cung cấp một công cụ phần mềm hỗ trợ tạo sinh hình ảnh bằng thuật toán tiến hóa tích hợp với đánh giá trực tiếp của người dùng. Nghệ sĩ có thể tận dụng nghiên cứu để mở rộng biên độ sáng tạo, thử nghiệm các phương pháp bố cục và kết hợp màu sắc trừu tượng mới mẻ.
Nhà nghiên cứu lĩnh vực trí tuệ nhân tạo và học máy: Đây là tài liệu tham khảo hữu ích về ứng dụng thuật toán di truyền và rừng ngẫu nhiên trong sáng tạo nghệ thuật. Các mô hình phân cụm và kỹ thuật trích xuất đặc trưng hình ảnh được trình bày chi tiết giúp ích cho việc phát triển nghiên cứu về tương tác người – máy.
Giảng viên và sinh viên công nghệ thông tin chuyên ngành hệ thống thông minh, multimedia: Luận văn là ví dụ thực tế ứng dụng các kỹ thuật AI, học máy trong xử lý hình ảnh và sáng tạo nghệ thuật, phù hợp làm tài liệu tham khảo cho các khóa học về trí tuệ nhân tạo và xử lý ảnh nâng cao.
Nhà phát triển phần mềm và kỹ sư ứng dụng: Những người làm việc trong lĩnh vực xây dựng các công cụ hỗ trợ sáng tạo nghệ thuật, phần mềm thiết kế đồ họa, hoặc phát triển ứng dụng tương tác người dùng sẽ tìm thấy phương pháp luận và cấu trúc phần mềm từ nghiên cứu làm nền tảng để phát triển thêm.

Câu hỏi thường gặp

Thuật toán di truyền được sử dụng trong nghiên cứu này khác gì so với tiến hóa ngẫu nhiên thông thường?
Thuật toán di truyền tại đây áp dụng cơ chế tiến hóa có sự tương tác trực tiếp với người dùng, giúp hướng dẫn quá trình tạo ra hình ảnh dựa theo đánh giá thẩm mỹ riêng biệt. Điều này khác biệt so với tiến hóa ngẫu nhiên thuần túy, vốn chỉ dựa trên các phép toán lai ghép và đột biến mà không có sự phản hồi từ người dùng.
Làm thế nào để mô hình Random Forest giúp cải thiện chất lượng hình ảnh được tạo ra?
Mô hình Random Forest học từ dữ liệu đánh giá phân loại hình ảnh theo mức độ hấp dẫn của người dùng. Qua đó, mô hình dự đoán được các đặc trưng của hình ảnh được người dùng yêu thích, giúp thuật toán tiến hóa tập trung tạo ra các tổ hợp hình ảnh có khả năng cao được đánh giá cao hơn.
Tại sao lại chọn thuật toán K-médoids thay vì K-means trong phân cụm đặc trưng ảnh?
K-médoids khắc phục điểm yếu của K-means là nhạy cảm với giá trị ngoại lai và nhiễu, vì trung tâm mỗi nhóm là một đối tượng thực tế trong dữ liệu, không phải trung bình các điểm. Điều này phù hợp hơn với dữ liệu đặc trưng hình ảnh phức tạp và biến động như trong nghiên cứu.
Phản hồi của người dùng được thu thập như thế nào?
Người dùng đánh giá mức độ hấp dẫn của từng hình ảnh được tạo bởi thuật toán bằng thang điểm 1-5 sao và có thể gán nhãn mô tả đặc tính cảm xúc như “calm”, “tragic”, “dynamic”. Đây là dữ liệu quan trọng để đào tạo và cập nhật mô hình học máy nhằm cải tiến quá trình tạo ảnh.
Dự án này có thể ứng dụng cho các thể loại nghệ thuật khác ngoài tranh trừu tượng có đường nét?
Về lý thuyết, phương pháp và kiến trúc có thể mở rộng sang các lĩnh vực nghệ thuật khác, tuy nhiên việc trích xuất đặc trưng và thuật toán cần được điều chỉnh phù hợp để xử lý các loại hình ảnh phức tạp hoặc khác biệt về mặt cấu trúc và màu sắc.

Kết luận

Luận văn xây dựng thành công một hệ thống thuật toán di truyền tương tác, hỗ trợ sáng tạo hình ảnh dựa trên đánh giá trực tiếp của người dùng, nâng cao tính chủ động của nghệ sĩ trong quá trình sáng tạo.
Kết hợp hiệu quả các kỹ thuật phân cụm K-médoids và học máy Random Forest, từ đó tăng khả năng lựa chọn và đề xuất các tổ hợp hình ảnh có giá trị thẩm mỹ cao.
Nghiên cứu đề xuất các đặc trưng hình ảnh cục bộ và toàn cục phù hợp cho khai thác ảnh trừu tượng chứa các đường nét cắt ghép, đóng góp mới vào lĩnh vực xử lý ảnh nghệ thuật.
Dự án là tiền đề mở rộng các ứng dụng trí tuệ nhân tạo trong lĩnh vực nghệ thuật số và thiết kế sáng tạo, khuyến khích sự hợp tác chặt chẽ giữa con người và công nghệ.
Tiếp tục nghiên cứu nâng cấp giao diện tương tác, mở rộng bộ dữ liệu và ứng dụng các mô hình học sâu là các bước phát triển kế tiếp cho nghiên cứu này.

Với những đóng góp này, luận văn hoàn toàn xứng đáng là tài liệu tham khảo và cơ sở để phát triển các hệ thống sáng tạo tích hợp AI, đồng thời khuyến khích cộng đồng nghiên cứu và nghệ sĩ mở rộng đôi cánh sáng tạo trong kỷ nguyên số. Hãy hành động ngay hôm nay để ứng dụng và phát triển công nghệ sáng tạo nghệ thuật của tương lai!

Trích đoạn nội dung tài liệu

UNIVERSITE NATIONALE DU VIETNAM, HANOI INSTITUT FRANCOPHONE INTERNATIONAL ĐÀO THỊ DUYÊN CONCEPTION, ANALYSE ET DÉVELOPPEMENT D’UN ALGORITHME GÉNÉTIQUE INTERACTIF DE GÉNÉRATION D’IMAGES GUIDÉ PAR L'ÉVALUATION HUMAINE: LE PROJET PERMUTOPAINTER THIẾT KẾ, PHÂN TÍCH VÀ PHÁT TRIỂN MỘT THUẬT TOÁN DI TRUYỀN TƯƠNG TÁC ĐỂ TẠO SINH ẢNH DỰA THEO HƯỚNG DẪN CỦA ĐÁNH GIÁ CỦA CON NGƯỜI : DỰ ÁN PERMUTOPAINTER MEMOIRE DE FIN D’ETUDES DU MASTER INFORMATIQUE HANOI – 2015 TIEU LUAN MOI download : skknchat@gmail.com UNIVERSITE NATIONALE DU VIETNAM, HANOI INSTITUT FRANCOPHONE INTERNATIONAL ĐÀO THỊ DUYÊN CONCEPTION, ANALYSE ET DÉVELOPPEMENT D’UN ALGORITHME GÉNÉTIQUE INTERACTIF DE GÉNÉRATION D’IMAGES GUIDÉ PAR L'ÉVALUATION HUMAINE: LE PROJET PERMUTOPAINTER THIẾT KẾ, PHÂN TÍCH VÀ PHÁT TRIỂN MỘT THUẬT TOÁN DI TRUYỀN TƯƠNG TÁC ĐỂ TẠO SINH ẢNH DỰA THEO HƯỚNG DẪN CỦA ĐÁNH GIÁ CỦA CON NGƯỜI : DỰ ÁN PERMUTOPAINTER Spécialité: Systèmes intelligents et Multimédia Code: Programme pilote MEMOIRE DE FIN D’ETUDES DU MASTER INFORMATIQUE Sous la direction de: Directeur de Recherche à l’IRD, M. Jean-Daniel Zucker Maître de Conférences à l’Université de La Rochelle, Mme Muriel Visani HANOI – 2015 TIEU LUAN MOI download : skknchat@gmail.com ATTESTATION SUR L’HONNEUR J’atteste sur l’honneur que ce mémoire a été réalisé par moi-même et que les données et les résultats qui y sont présentés sont exacts et n’ont jamais été publiés ailleurs. La source des informations citées dans ce mémoire a été bien précisée. LỜI CAM ĐOAN Tôi cam đoan đây là công trình nghiên cứu của riêng tôi.

Các số liệu, kết quả nêu trong Luận văn là trung thực và chưa từng được ai công bố trong bất kỳ công trình nào khác. Các thông tin trích dẫn trong Luận văn đã được chỉ rõ nguồn gốc. Fait à Hanoï, le 30 Octobre 2015 Hà nội, Ngày 30 tháng 10 năm 2015 Đào Thị Duyên i TIEU LUAN MOI download : skknchat@gmail.com Table des matières Table des matières. iv Liste des figures .vii Liste des tableaux.

1 Chapitre 1 – PRÉSENTATION GÉNÉRALE .1 Présentation de l’établissement d’accueil .1 Présentation de l’IRD - organisme d’accueil .2 Présentation «Vietnam-France ICT Lab» - lieu de travail .2 Contexte du sujet .3 Description du sujet .4 Art visuel et Abstraction .1 Système de Kandinsky (Gortais, 2003). 14 Chapitre 2 – ÉTAT DE L’ART .1 Travaux existants en génération d’images. 31 ii TIEU LUAN MOI download : skknchat@gmail.com Chapitre 3 – SYSTÈME PROPOSÉ .1 Aperçu global du système .3 Suggestion des images .1 Génération des images.2 Extraction de caractéristiques .4 Evaluation des images. 41 Chapitre 4 – IMPLÉMENTATION ET EXPÉRIMENTATION .1 Outils et Environnement d’implémentation .2 Construction des données d’entraînement .4 Évaluation de l’utilisateur.

49 Chapitre 5 - CONCLUSIONS ET PERSPECTIVE. Amélioration de la représentation des images. Amélioration d’ensemble d’images d’entrainement. Amélioration d’algorithme de génération d’images.

56 iii TIEU LUAN MOI download : skknchat@gmail.com Remerciements Les plus grandes leçons ne sont pas tirées des livres mais des professeurs tels que vous, tous les professeurs de l’Institut Francophone International (IFI). Je souhaite exprimer ma sincère gratitude à vous qui ont pris le temps de m'aider au cours dans trois années et de m'avoir accompagné dans la maîtrise de mes connaissances. Je tiens à remercier vivement Monsieur Jean-Daniel Zucker, Directeur de Recherche à l’IRD, Hanoi, Vietnam et Madame Muriel VISANI, Maître de Conférences à l’Université de La Rochelle, La Rochelle, France, pour leur encadrement sans faille, le suivi qu’ils ont apporté à mon stage, leurs conseils, leurs corrections de ce mémoire, les nombreuses discussions que nous avons pu avoir tout au long de la réalisation de ce stage, et pour le temps qu’ils ont bien voulu me consacrer. Je souhaite remercier Monsieur TRAN Hoang Tung, Doctorat en sciences informatiques, Enseignant et assistant de recherche d’Université des Sciences et Technologies de Hanoï, Vietnam, pour les conseils, l’inspiration et l’idée lorsqu’il y a des difficultés, les nombreuses discussions à propos de la compréhension des problématiques.

Je tiens à remercier chaleureusement Monsieur Bernard Gortais pour la gentillesse, la confiance, la correction de ce mémoire et les aides enthousiastes. Je remercie également toute l'équipe de Vietnam-France ICT Lab pour leur accueil, leurs aides à plusieurs reprises pendant mon stage. Je tiens à remercier sincèrement Madame NGUYEN Thi Van Tu, secrétaire de l’IFI pour les aides à plusieurs reprises. J’adresse mes sincères remerciements à Madame NGUYEN Thi Thuy, Doctorat en sciences informatiques, Vietnam National University of Agriculture pour la compréhension sur l’algorithme Random Forest.

Enfin, j’adresse mes plus sincères remerciements à ma famille, mes amis, qui m’ont toujours soutenue et encouragée au cours de la réalisation de ce mémoire. DAO Thi Duyen iv TIEU LUAN MOI download : skknchat@gmail.com Résumé Le projet PermutoPainter est basé sur la recherche que l’artiste Bernard Gortais a développée dans ses dernières peintures « Arrangements avec le hasard » présentées à la Galerie Keller à Paris en novembre 2014 et à la Galerie 14 à Toucy – France (89130). Dans ce projet, l’œuvre peinte est découpée et décomposée en petits 24 carrés égaux et puis recomposée indépendamment de l’image initiale. L’utilisation d’un ou de plusieurs de ces contrastes permet de créer des formes et de structurer le rectangle par le choix d’un nouvel arrangement des fragments qui le compose.

L’auteur trouve que les propositions sont d’autant plus intéressantes qu’elles sont paradoxales. Le problème principal que PermutoPainter tente de résoudre est de formaliser le processus créatif qui permet de créer des arrangements et de concevoir un programme qui donnera les "meilleures" permutations ; c’est-à-dire, celles pour lesquelles l’auteur aura le plus d’intérêt en tenant compte du fait qu’il doit pouvoir préciser son désir de création au cours du processus évolutif. Il s’agit donc dans notre stage de concevoir et d’implémenter un algorithme évolutif qui suive les étapes suivantes : utilisation des techniques d’extraction de caractéristiques d’images, représentation des images sous la forme des vecteurs descripteurs, regroupement de ces vecteurs par l’algorithme K-médoids et utilisation de l'algorithme de classification des « forêts aléatoires » pour permettre à un artiste d'explorer et d'identifier efficacement des compositions « intéressantes» résultants de la combinaison de morceaux d’images et cela de manière interactive. Mots-clés : Aide à la créativité, Analyse d'image, synthèse d'image, regroupement automatique, forêts aléatoires.

v TIEU LUAN MOI download : skknchat@gmail.com Abstract The PermutoPainter projet is based on the research of the artist Bernard Gortais who has developed in his latest paintings “Random Arrangement” presented at the Keller Gallery in Paris in November 2014 and at the Gallery 14 in Toucy – France (89130). In this project, the painted work is cut out and broken down into 24 equal small squares and then recomposed independently from the initial image. The use of one or more of these contrasts can create shapes and structure by choosing a new arrangement that consists of the fragments. The artist finds that the proposals are even more interesting when they are paradoxical.

The main problem that PermutoPainter tries to solve is to formalize the creative process so as to create arrangements and build the system that will give the best permutations; that is to say, those for which the author has the most interest. Given that s/he must elicitate what characterizes his/her interest in order to automate the creative process. In our internship project our objective was to design and implement an evolutionary algorithm which includes the following steps: extracting image features, representation of images as descriptors vectors, clustering of these vectors by the K-médoids algorithm and then using the classification algorithm “random forest” to help a researcher to effectively explore and identify the "interesting" compositions resulting from the combination of pieces of images in an interactive way. Keywords: Creativity process, Image processing, Machine Learning, Clustering, K-medoids, Random Forest vi TIEU LUAN MOI download : skknchat@gmail.com Liste des figures Figure 1- Exemple d’œuvre peinte.

8 Figure 2- Exemple d’arrangements. 9 Figure 3- Fragments de ligne. 10 Figure 4- Points de résonance sur une surface. 11 Figure 5- Ligne horizontale de résonance sur une surface.

12 Figure 6- Ligne verticale de résonance sur une surface. 12 Figure 7- Ligne diagonale de résonance sur une surface. 12 Figure 8- Ligne libre de résonance sur une surface. 13 Figure 9- La gravure de « la Mort, le Diable et le Chevalier ».

13 Figure 10- Système EcoEvo (Feng & Ting, 2014). 17 Figure 11- Descripteur SIFT. 19 Figure 12- Intersection avec une ligne droite. 22 Figure 13- Caractéristique d’extrême.

22 Figure 14- Histogramme cumulatif. 24 Figure 15- Exemple des caractéristiques profils. 25 Figure 16- Un graphique de huit objets dans (Kaufman & Rousseeuw, 2009). 26 Figure 17- Une taxonomie des approches de regroupement (Jain, Murty, & Flynn, 1999).

26 Figure 18- illustration de K-moyenne dans (Gopi Gandhi, 2014). 27 Figure 19- Illustration de k-médoids. 29 Figure 20- Algorithme génétique. 31 Figure 21- Algorithme des Random Forest.

32 Figure 22- Illustration de l’étape de test Random Forest. 33 Figure 23- Processus global du programme. 34 Figure 24- Modification d’image. 35 Figure 25- Suggestion des images intéressantes.

37 Figure 26- Génération des images par la distance. 38 Figure 27- Évaluation des images suggérées. 40 Figure 28- Interface pour la modification d’images. 43 Figure 29- Interface pour évaluer l’intérêt des images suggérées.

44 Figure 30- Interface pour donner une valeur qualitative à chaque image et générer des images intéressantes. 45 vii TIEU LUAN MOI download : skknchat@gmail.com Figure 31- Résultat de classification des données de test. 46 Figure 32- Bernard Gortais - exposition Galerie Keller, Paris, nov 2014. 47 Figure 33- Bernard Gortais – exemples de compositions dynamiques.

48 Figure 34- Bernard Gortais – exemples de composition calme dynamique. 48 Figure 35- Bernard Gortais – exemples de compositions calmes. 48 Figure 36- Bernard Gortais – exemples de compositions tragiques. 49 Figure 37- Bernard Gortais, fragments de bouquets de fleurs.

49 Liste des tableaux Tableau 1. Types de contraste (Gortais, 2003). Classes des données d’entrainement. Résultat de classification des données de test.

46 viii TIEU LUAN MOI download : skknchat@gmail.com 1 INTRODUCTION On peut se demander pourquoi un peintre se servirait d'un ordinateur pour créer des images alors qu'il a déjà fort à faire avec les moyens que lui offre l'atelier. De tout temps, des hommes ont utilisé ce qui les entourait pour créer des passages entre la société organisée et l'immensité du monde. C'est une définition de l'activité artistique au sens large. Les ordinateurs et l’intelligence artificielle sont devenus un élément fondamental de l'environnement humain et si leur approche par les peintres ne constitue pas un passage obligé, certains artistes sont tentés par l'aventure.

On est loin de la peinture dira-t-on; pourtant, pas plus qu'il n'est justifié d'opposer les mathématiques à la poésie, on ne peut a priori opposer l'ordinateur comme outil de création d'images aux médiums plus traditionnels. Le mot "technique" en français signifie qui appartient en propre à un art, étymologiquement la technique n'a pas de signification détachée de l'art et c'est ce dernier qui lui donne son sens. Pour un artiste la technique est au service de l'art et les techniciens et les artistes devraient en principe travailler ensemble et dialoguer à condition toutefois de pouvoir parler le même langage. Une bonne façon de comprendre un problème c'est de le comprendre assez bien pour pouvoir l'enseigner et qu'est-ce que programmer sinon enseigner à un ordinateur? Cela renvoie l’artiste à l’analyse de sa pratique artistique et à sa formulation puisque le geste disparaît, la main étant remplacée par la machine.

Le travail de programmation d'images sur ordinateur donne une place dominante au concept. Quel est son vocabulaire de signes? Quelle est sa syntaxe? Vers quelles formes et quel type d'espace tend-il? Le pionnier de cette démarche est un ancien artiste et professeur à l'Université de Californie à San Diego du nom d’Harold Cohen.

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ