Tổng quan nghiên cứu

Tìm kiếm kiến trúc mạng neural (Neural Architecture Search - NAS) là một lĩnh vực nghiên cứu trọng điểm trong khoa học máy tính, đặc biệt trong phát triển mạng neural sâu (deep neural networks) phục vụ trí tuệ nhân tạo. Với hơn 1,000 công trình nghiên cứu được công bố từ năm 2017, NAS đã chứng minh vai trò quan trọng trong tự động hóa thiết kế kiến trúc mạng neural, giúp giảm thiểu thời gian và công sức so với phương pháp thủ công truyền thống. Tuy nhiên, việc thiết kế kiến trúc mạng neural hiệu quả không chỉ đòi hỏi tối ưu hiệu năng mà còn phải cân bằng các mục tiêu đa dạng như độ phức tạp mô hình, độ trễ suy luận, và khả năng triển khai trên các nền tảng phần cứng khác nhau.

Luận văn tập trung vào bài toán NAS đa mục tiêu, trong đó mục tiêu là tìm ra tập hợp kiến trúc mạng neural tối ưu Pareto, cân bằng giữa hiệu năng và các chỉ số phức tạp như số lượng tham số hoặc FLOPS. Phạm vi nghiên cứu áp dụng trên ba bộ điểm chuẩn NAS phổ biến: NAS-Bench-101, NAS-Bench-201 và MacroNAS, với các bộ dữ liệu CIFAR-10, CIFAR-100 và ImageNet16-120. Mục tiêu cụ thể là phát triển và đánh giá các thuật toán metaheuristic, bao gồm thuật toán cắt tỉa không huấn luyện, thuật toán tìm kiếm địa phương đa mục tiêu và thuật toán tiến hóa đa mục tiêu, nhằm nâng cao hiệu suất tìm kiếm kiến trúc mạng neural đa mục tiêu với chi phí tính toán thấp.

Nghiên cứu có ý nghĩa lớn trong việc giảm thiểu tài nguyên tính toán, rút ngắn thời gian tìm kiếm, đồng thời cung cấp các giải pháp linh hoạt cho việc thiết kế mạng neural phù hợp với nhiều nền tảng phần cứng khác nhau. Các chỉ số đánh giá hiệu suất như Inverted Generational Distance (IGD) và Hypervolume (HV) được sử dụng để đo lường chất lượng tập kiến trúc tối ưu Pareto thu được, đảm bảo tính đa dạng và hiệu quả của các kiến trúc mạng neural được đề xuất.

Cơ sở lý thuyết và phương pháp nghiên cứu

Khung lý thuyết áp dụng

Luận văn dựa trên các lý thuyết và mô hình sau:

  • Tối ưu hóa đa mục tiêu (Multi-objective Optimization): Mô hình hóa bài toán NAS dưới dạng tối ưu hóa đa mục tiêu, trong đó các mục tiêu như độ lỗi thực nghiệm, số lượng tham số, và FLOPS được tối thiểu hóa đồng thời. Tập hợp các kiến trúc tối ưu được biểu diễn dưới dạng tập xấp xỉ Pareto, thể hiện sự cân bằng hiệu quả giữa các mục tiêu đối nghịch.

  • Mạng cực trị địa phương (Local Optima Network - LON): Sử dụng LON để khảo sát và trực quan hóa cảnh quan độ thích nghi (fitness landscape) của bài toán NAS đa mục tiêu, giúp hiểu rõ cấu trúc không gian tìm kiếm và thiết kế thuật toán tìm kiếm địa phương hiệu quả.

  • Chỉ số hiệu năng không huấn luyện (Training-free Performance Metrics): Áp dụng các chỉ số như Synaptic Flow và SNIP để ước lượng hiệu năng kiến trúc mạng neural mà không cần huấn luyện, giúp giảm đáng kể chi phí tính toán trong quá trình tìm kiếm.

  • Thuật toán metaheuristic: Bao gồm thuật toán cắt tỉa không huấn luyện (TF-MOPNAS), thuật toán tìm kiếm địa phương đa mục tiêu (LOMONAS), và thuật toán tiến hóa đa mục tiêu (E-TF-MOENAS), được thiết kế để khai thác hiệu quả các chỉ số training-free và cấu trúc không gian tìm kiếm.

Các khái niệm chính bao gồm: tập xấp xỉ Pareto, chỉ số IGD, chỉ số HV, supernet, DAG (đồ thị không chu trình có hướng), và các phép biến đổi lai ghép, đột biến trong thuật toán tiến hóa.

Phương pháp nghiên cứu

  • Nguồn dữ liệu: Sử dụng ba bộ điểm chuẩn NAS-Bench-101, NAS-Bench-201 và MacroNAS, với các bộ dữ liệu CIFAR-10, CIFAR-100 và ImageNet16-120. Các bộ benchmark này cung cấp thông tin huấn luyện và hiệu năng của hàng trăm nghìn kiến trúc mạng neural, giúp đánh giá thuật toán một cách khách quan và tiết kiệm tài nguyên.

  • Phương pháp phân tích:

    • Thiết kế và triển khai các thuật toán metaheuristic dựa trên các chỉ số training-free để tìm kiếm tập kiến trúc tối ưu Pareto.
    • Khảo sát fitness landscape bằng mạng cực trị địa phương để hiểu cấu trúc không gian tìm kiếm.
    • So sánh hiệu suất thuật toán qua các chỉ số IGD và HV, cùng với thời gian tìm kiếm thực tế.
    • Thực hiện 31 lần chạy thực nghiệm cho mỗi thuật toán trên từng bài toán để đảm bảo tính ổn định và độ tin cậy của kết quả.
    • Kiểm định thống kê Student's T-test với mức ý nghĩa 0.01 để đánh giá sự khác biệt hiệu quả giữa các thuật toán.
  • Timeline nghiên cứu: Quá trình nghiên cứu được thực hiện trong năm 2023, với các giai đoạn chính gồm khảo sát lý thuyết, thiết kế thuật toán, thực nghiệm trên các bộ benchmark, phân tích kết quả và hoàn thiện luận văn.

Kết quả nghiên cứu và thảo luận

Những phát hiện chính

  1. Hiệu quả thuật toán cắt tỉa không huấn luyện TF-MOPNAS:

    • Trên NAS-Bench-101, TF-MOPNAS đạt giá trị IGD trung bình gần 0.0046 và HV đạt 2,381, tương đương với thuật toán MOENAS sử dụng chỉ số training-based nhưng với thời gian tìm kiếm nhanh hơn 140 lần (khoảng 2,381 giây so với 349,759 giây).
    • Trên NAS-Bench-201, TF-MOPNAS và TF-MOENAS đều đạt IGD gần 0, cho thấy khả năng xấp xỉ biên Pareto tối ưu rất tốt, trong khi MOENAS có IGD cao hơn nhưng HV tốt hơn.
  2. Tác động của chỉ số training-free:

    • Thuật toán TF-MOPNAS sử dụng chỉ số Synaptic Flow giúp giảm đáng kể chi phí tính toán so với các phương pháp training-based.
    • Tuy nhiên, chỉ số HV của các thuật toán training-free thấp hơn so với thuật toán training-based, phản ánh mức độ bao phủ không gian tìm kiếm kém hơn.
  3. Khảo sát fitness landscape và thuật toán tìm kiếm địa phương LOMONAS:

    • Phân tích mạng cực trị địa phương cho thấy không gian tìm kiếm NAS đa mục tiêu có nhiều cực trị địa phương nhưng số lượng không lớn, cho phép thuật toán tìm kiếm địa phương dễ dàng thoát khỏi cực trị cục bộ.
    • Thuật toán LOMONAS và phiên bản không tham số IMS-LOMONAS vượt trội hơn các thuật toán tiến hóa đa mục tiêu state-of-the-art về hiệu suất tìm kiếm.
  4. Nâng cao hiệu suất tìm kiếm:

    • Kết hợp thuật toán tìm kiếm địa phương với các chỉ số training-free giúp cải thiện chất lượng lời giải và tăng tốc quá trình tìm kiếm.
    • Thuật toán tiến hóa đa mục tiêu E-TF-MOENAS sử dụng chiến lược ước lượng hiệu năng đồng thời nhiều chỉ số training-free cho hiệu quả tìm kiếm vượt trội với chi phí tính toán thấp.

Thảo luận kết quả

Kết quả thực nghiệm cho thấy việc sử dụng các chỉ số hiệu năng không huấn luyện như Synaptic Flow giúp giảm đáng kể chi phí tính toán trong quá trình tìm kiếm kiến trúc mạng neural đa mục tiêu. Thuật toán TF-MOPNAS tận dụng cơ chế cắt tỉa tuần tự kết hợp với định nghĩa thống trị Pareto để trả về tập xấp xỉ Pareto đa dạng, đáp ứng tốt yêu cầu của bài toán đa mục tiêu.

Mặc dù các thuật toán training-free có chỉ số HV thấp hơn, điều này có thể do mức độ bao phủ không gian tìm kiếm kém hơn so với các thuật toán training-based, nhưng bù lại thời gian tìm kiếm được rút ngắn đáng kể, phù hợp với các ứng dụng thực tế có hạn chế về tài nguyên.

Phân tích fitness landscape bằng mạng cực trị địa phương cung cấp cái nhìn sâu sắc về cấu trúc không gian tìm kiếm, giúp thiết kế thuật toán tìm kiếm địa phương hiệu quả, có khả năng thoát khỏi cực trị cục bộ và tiếp cận cực trị toàn cục. Kết quả này phù hợp với các nghiên cứu trước đây trên bài toán NAS đơn mục tiêu, mở rộng thành công sang bài toán đa mục tiêu.

Việc kết hợp nhiều chỉ số training-free trong chiến lược ước lượng hiệu năng giúp cải thiện độ chính xác đánh giá kiến trúc, từ đó nâng cao hiệu suất thuật toán tiến hóa đa mục tiêu. Điều này khẳng định tính khả thi và hiệu quả của việc sử dụng các chỉ số training-free trong NAS đa mục tiêu, đồng thời giảm thiểu chi phí tính toán so với các phương pháp truyền thống.

Các biểu đồ IGD và HV minh họa sự hội tụ nhanh chóng của TF-MOPNAS và LOMONAS so với các thuật toán khác, đồng thời bảng so sánh thời gian tìm kiếm cho thấy ưu thế vượt trội về mặt hiệu quả tài nguyên của các thuật toán đề xuất.

Đề xuất và khuyến nghị

  1. Ứng dụng thuật toán cắt tỉa không huấn luyện TF-MOPNAS trong thiết kế mạng neural đa mục tiêu:

    • Động từ hành động: Triển khai
    • Target metric: Giảm thời gian tìm kiếm và chi phí tính toán
    • Timeline: Ngay lập tức trong các dự án phát triển mạng neural
    • Chủ thể thực hiện: Các nhóm nghiên cứu và phát triển AI, doanh nghiệp công nghệ
  2. Phát triển và áp dụng thuật toán tìm kiếm địa phương LOMONAS và IMS-LOMONAS:

    • Động từ hành động: Áp dụng và mở rộng
    • Target metric: Tăng độ chính xác và đa dạng kiến trúc tối ưu
    • Timeline: Trung hạn (6-12 tháng)
    • Chủ thể thực hiện: Các nhà nghiên cứu khoa học máy tính, nhóm phát triển thuật toán NAS
  3. Kết hợp nhiều chỉ số training-free trong chiến lược ước lượng hiệu năng cho thuật toán tiến hóa đa mục tiêu:

    • Động từ hành động: Tích hợp
    • Target metric: Cải thiện hiệu suất tìm kiếm và độ tin cậy của kết quả
    • Timeline: Trung hạn (6 tháng)
    • Chủ thể thực hiện: Các nhà phát triển thuật toán NAS, nhóm nghiên cứu AI
  4. Khuyến nghị sử dụng các bộ benchmark NAS chuẩn để đánh giá thuật toán:

    • Động từ hành động: Chuẩn hóa
    • Target metric: Đảm bảo tính khách quan và khả năng so sánh kết quả
    • Timeline: Liên tục trong quá trình nghiên cứu và phát triển
    • Chủ thể thực hiện: Cộng đồng nghiên cứu AI, các tổ chức phát triển benchmark
  5. Nâng cao khả năng mở rộng và ứng dụng thuật toán trên các nền tảng phần cứng đa dạng:

    • Động từ hành động: Tối ưu hóa
    • Target metric: Đảm bảo tính khả thi triển khai trên thiết bị thực tế
    • Timeline: Dài hạn (1-2 năm)
    • Chủ thể thực hiện: Các nhà phát triển phần mềm, kỹ sư hệ thống AI

Đối tượng nên tham khảo luận văn

  1. Nhà nghiên cứu và phát triển trong lĩnh vực học máy và trí tuệ nhân tạo:

    • Lợi ích: Nắm bắt các phương pháp tối ưu hóa đa mục tiêu trong NAS, áp dụng thuật toán metaheuristic hiệu quả.
    • Use case: Phát triển thuật toán NAS cho các ứng dụng thực tế, nghiên cứu nâng cao hiệu suất mạng neural.
  2. Kỹ sư AI và Data Scientist trong doanh nghiệp công nghệ:

    • Lợi ích: Tiết kiệm thời gian và tài nguyên khi thiết kế kiến trúc mạng neural phù hợp với yêu cầu đa mục tiêu.
    • Use case: Tối ưu hóa mô hình AI triển khai trên các nền tảng phần cứng khác nhau như điện thoại, xe tự hành.
  3. Sinh viên và học viên cao học chuyên ngành khoa học máy tính, trí tuệ nhân tạo:

    • Lợi ích: Hiểu sâu về các thuật toán tìm kiếm kiến trúc mạng neural, các chỉ số đánh giá hiệu năng và kỹ thuật metaheuristic.
    • Use case: Tham khảo để phát triển đề tài nghiên cứu, luận văn thạc sĩ hoặc tiến sĩ.
  4. Nhà quản lý dự án và chuyên gia hoạch định chiến lược công nghệ:

    • Lợi ích: Đánh giá các giải pháp tự động hóa thiết kế mạng neural, cân nhắc chi phí và hiệu quả triển khai.
    • Use case: Lập kế hoạch đầu tư nghiên cứu phát triển AI, lựa chọn công nghệ phù hợp với nguồn lực.

Câu hỏi thường gặp

  1. Tại sao cần xem xét NAS dưới góc độ đa mục tiêu thay vì đơn mục tiêu?
    NAS đa mục tiêu giúp cân bằng hiệu năng mạng neural với các yếu tố như độ phức tạp, độ trễ, và khả năng triển khai trên phần cứng đa dạng. Điều này phù hợp với thực tế triển khai AI trên nhiều nền tảng khác nhau, tránh việc chỉ tối ưu hiệu năng mà bỏ qua các yếu tố quan trọng khác.

  2. Chỉ số training-free là gì và tại sao lại quan trọng?
    Chỉ số training-free ước lượng hiệu năng kiến trúc mạng neural mà không cần huấn luyện, giúp tiết kiệm tài nguyên tính toán đáng kể. Ví dụ, chỉ số Synaptic Flow đánh giá dựa trên trọng số khởi tạo, cho phép đánh giá nhanh các kiến trúc trong quá trình tìm kiếm.

  3. Thuật toán TF-MOPNAS khác gì so với các phương pháp cắt tỉa truyền thống?
    TF-MOPNAS không chỉ trả về một kiến trúc duy nhất mà trả về tập xấp xỉ Pareto đa dạng, đồng thời sử dụng chỉ số training-free để đánh giá hiệu năng, giúp giảm chi phí tính toán và tăng tính hữu dụng của kết quả cho người ra quyết định.

  4. Làm thế nào thuật toán tìm kiếm địa phương LOMONAS giúp cải thiện hiệu suất tìm kiếm?
    LOMONAS khai thác cấu trúc fitness landscape đa cực trị nhưng ít cực trị cục bộ, giúp thuật toán dễ dàng thoát khỏi các cực trị cục bộ và tiếp cận cực trị toàn cục, từ đó nâng cao chất lượng lời giải và tốc độ hội tụ.

  5. Chiến lược ước lượng hiệu năng sử dụng đồng thời nhiều chỉ số training-free có ưu điểm gì?
    Việc kết hợp nhiều chỉ số giúp tăng độ chính xác trong đánh giá hiệu năng kiến trúc, khắc phục hạn chế của từng chỉ số riêng lẻ, từ đó nâng cao hiệu quả tìm kiếm và giảm thiểu sai lệch trong lựa chọn kiến trúc tối ưu.

Kết luận

  • Luận văn đã phát triển thành công các thuật toán metaheuristic hiệu quả cho bài toán tìm kiếm kiến trúc mạng neural đa mục tiêu, bao gồm TF-MOPNAS, LOMONAS và E-TF-MOENAS.
  • Sử dụng các chỉ số hiệu năng training-free giúp giảm đáng kể chi phí tính toán, rút ngắn thời gian tìm kiếm mà vẫn đảm bảo chất lượng lời giải.
  • Phân tích fitness landscape bằng mạng cực trị địa phương cung cấp cơ sở lý thuyết vững chắc cho thiết kế thuật toán tìm kiếm địa phương hiệu quả.
  • Kết quả thực nghiệm trên các bộ benchmark NAS chuẩn cho thấy các thuật toán đề xuất đạt hiệu suất cạnh tranh hoặc vượt trội so với các phương pháp state-of-the-art.
  • Hướng phát triển tiếp theo bao gồm mở rộng thuật toán cho các bài toán NAS đa mục tiêu phức tạp hơn, tối ưu hóa khả năng triển khai trên phần cứng thực tế và tích hợp sâu hơn các chỉ số training-free đa dạng.

Để tiếp tục nghiên cứu và ứng dụng, độc giả được khuyến khích triển khai các thuật toán đề xuất trong các dự án thực tế, đồng thời mở rộng nghiên cứu về các chỉ số hiệu năng mới và kỹ thuật tìm kiếm nâng cao nhằm đáp ứng nhu cầu ngày càng đa dạng của lĩnh vực mạng neural sâu.