Luận văn thạc sĩ vnu uet nghiên cứu về mạng neural convolutional áp dụng vào bài toán nhận dạng đối tượng trong lĩnh vực thị giác máy tính

Luận văn thạc sĩ toán học nghiên cứu vnu uet nghiên cứu về mạng neural convolutional áp dụng vào bài toán nhận dạng đối tượng trong lĩnh, khảo sát thực trạng, phân tích nguyên

Trường đại học

Trường Đại Học Công Nghệ, Đại Học Quốc Gia Hà Nội

Chuyên ngành

Công Nghệ Thông Tin

Người đăng

Ẩn danh

Thể loại

Luận Văn Thạc Sĩ

2019

Phí lưu trữ

30 Point

Mục lục chi tiết

LỜI CAM ĐOAN

1. CHƯƠNG 1: TỔNG QUAN VỀ MẠNG NƠ RON VÀ GIỚI THIỆU VỀ MẠNG NƠ RON TÍCH CHẬP

1.1. Nơ ron nhân tạo

1.1.1. Lịch sử của nơ ron nhân tạo

1.1.2. Cấu tạo và quá trình xử lý của một nơ ron sinh học

1.1.3. Cấu tạo và quá trình xử lý của một nơ ron nhân tạo

1.2. Các mô hình hàm kích hoạt của mạng nơ ron nhân tạo

1.3. Mạng nơ ron nhân tạo

1.3.1. Giới thiệu mạng nơ ron nhân tạo

1.3.2. Một số kiểu mạng nơ ron

1.3.3. Mạng nơ ron lan truyền ngược

1.4. Mạng nơ ron tích chập

1.4.1. Khái niệm về mạng nơ ron tích chập

1.4.2. Mô hình mạng nơ ron tích chập

1.4.3. Xây dựng mạng nơ ron tích chập

2. CHƯƠNG 2: BÀI TOÁN NHẬN DẠNG BẰNG MẠNG NƠ RON TÍCH CHẬP

2.1. Khái niệm về nhận dạng

2.1.1. Nhận dạng đối tượng

2.1.2. Nhận dạng khuôn mặt

2.2. Lịch sử và phát triển

2.3. Cách thức hoạt động

2.4. Phương pháp nhận dạng đối tượng từ ảnh chụp của camera

2.4.1. Nhận diện khuôn mặt

2.4.2. Phát hiện các điểm quan trọng trên khuôn mặt

2.4.3. Liên kết khuôn mặt

2.5. Kết quả các thuật toán sử dụng mạng nơ ron nhân tạo

2.5.1. Mô hình DeepID 2 (NIPS 2014)

2.5.2. Mô hình DeepID3 (arXiv 2015)

2.5.3. Mô hình DeepFace (Facebook, CVPR 2014)

2.5.4. Mô hình FaceNet (Google 2015)

2.5.5. Mô hình Baidu (2015)

3. CHƯƠNG 3: SỬ DỤNG MẠNG NƠ RON TÍCH CHẬP TRONG NHẬN DẠNG ĐỐI TƯỢNG

3.1. Sơ lược về áp dụng mạng nơ ron tích chập vào các giải pháp thông minh trong thực tế

3.2. Áp dụng mạng nơ ron tích chập để xây dựng hệ thống nhận diện người vào/ra và đánh giá thực nghiệm, so sánh với phương pháp HOG

3.2.1. Giới thiệu hệ thống nhận diện và đếm lượt người vào/ra sử dụng mạng nơ ron tích chập

3.2.2. Giới thiệu kiến trúc của máy chủ xử lý nhận diện và đếm lượng người

3.2.3. Giới thiệu sơ lược về phương pháp mô tả đặc trưng HOG sẽ được dùng để so sánh

3.2.4. So sánh khả năng nhận diện của hệ thống nhận diện người vào/ra sử dụng mạng nơ ron tích chập với phương pháp HOG đã có

3.2.5. Mô tả cơ chế chạy nhận diện người trong lõi máy chủ tính toán

3.2.6. Mô tả quá trình sử dụng hệ thống ở giao diện người dùng để hiển thị kết quả

3.3. Áp dụng mạng nơ ron tích chập để xây dựng hệ thống nhận diện khuôn mặt và đánh giá thực nghiệm, so sánh với phương pháp HOG

3.3.1. Xây dựng hệ thống nhận diện khuôn mặt

3.3.2. Giới thiệu cơ chế của máy chủ xử lý nhận diện

3.3.3. Giới thiệu sơ lược về phương pháp phát hiện khuôn mặt sử dụng HOG sẽ được dùng để so sánh

3.3.4. So sánh hệ thống nhận diện khuôn mặt với phương pháp HOG đã có

3.3.5. So sánh khả năng nhận diện khuôn mặt giữa HOG và CNN

3.3.6. Kết quả hệ thống web nhận diện khuôn mặt

3.4. Kết quả đã thực hiện được của luận văn

3.5. Phương hướng phát triển luận văn

TÀI LIỆU THAM KHẢO

Tóm tắt

I. Tổng quan về mạng neural convolutional trong nhận dạng đối tượng

Mạng neural convolutional (CNN) đã trở thành một trong những công nghệ tiên tiến nhất trong lĩnh vực nhận dạng đối tượng trong thị giác máy tính. Với khả năng xử lý hình ảnh mạnh mẽ, CNN đã mở ra nhiều cơ hội mới cho các ứng dụng thực tiễn. Bài viết này sẽ khám phá các khía cạnh quan trọng của mạng CNN, từ lịch sử phát triển đến ứng dụng hiện tại trong nhận dạng đối tượng.

1.1. Lịch sử phát triển của mạng neural convolutional

Mạng neural convolutional được phát triển từ những năm 1980, với những đóng góp quan trọng từ các nhà nghiên cứu như Yann LeCun. Mô hình LeNet-5, ra đời vào năm 1989, đã đặt nền móng cho sự phát triển của các mạng CNN hiện đại. Sự phát triển này đã dẫn đến những cải tiến đáng kể trong khả năng nhận diện hình ảnh.

1.2. Cấu trúc và nguyên lý hoạt động của mạng CNN

Mạng CNN bao gồm nhiều lớp khác nhau, bao gồm lớp tích chập, lớp gộp và lớp kết nối đầy đủ. Mỗi lớp có vai trò riêng trong việc trích xuất đặc trưng từ hình ảnh, giúp cải thiện độ chính xác trong nhận dạng đối tượng. Nguyên lý hoạt động của mạng CNN dựa trên việc học từ dữ liệu hình ảnh lớn, cho phép mô hình tự động tối ưu hóa các tham số.

II. Thách thức trong việc áp dụng mạng neural convolutional

Mặc dù mạng CNN đã đạt được nhiều thành công, nhưng vẫn tồn tại một số thách thức trong việc áp dụng chúng vào thực tế. Các vấn đề như độ phức tạp tính toán, yêu cầu về dữ liệu lớn và khả năng tổng quát của mô hình là những yếu tố cần được xem xét.

2.1. Độ phức tạp tính toán và yêu cầu tài nguyên

Mạng CNN thường yêu cầu tài nguyên tính toán lớn, đặc biệt khi xử lý các tập dữ liệu lớn. Điều này có thể gây khó khăn cho việc triển khai trên các thiết bị có hạn chế về phần cứng, như điện thoại thông minh hoặc các thiết bị nhúng.

2.2. Khả năng tổng quát của mô hình

Một thách thức lớn khác là khả năng tổng quát của mô hình. Mạng CNN có thể hoạt động tốt trên tập dữ liệu huấn luyện nhưng lại gặp khó khăn khi áp dụng vào các tình huống thực tế khác. Việc cải thiện khả năng tổng quát là một trong những mục tiêu nghiên cứu quan trọng hiện nay.

III. Phương pháp chính trong nghiên cứu mạng neural convolutional

Để giải quyết các thách thức trong việc áp dụng mạng CNN, nhiều phương pháp đã được phát triển. Các phương pháp này bao gồm cải tiến kiến trúc mạng, tối ưu hóa thuật toán huấn luyện và sử dụng các kỹ thuật tăng cường dữ liệu.

3.1. Cải tiến kiến trúc mạng CNN

Nhiều nghiên cứu đã chỉ ra rằng việc cải tiến kiến trúc mạng CNN có thể giúp tăng cường hiệu suất nhận dạng. Các kiến trúc như ResNet và Inception đã được phát triển để giải quyết vấn đề độ sâu của mạng và cải thiện khả năng học tập.

3.2. Tối ưu hóa thuật toán huấn luyện

Tối ưu hóa thuật toán huấn luyện là một yếu tố quan trọng trong việc nâng cao hiệu suất của mạng CNN. Các phương pháp như Adam, RMSprop và SGD đã được áp dụng để cải thiện tốc độ hội tụ và độ chính xác của mô hình.

IV. Ứng dụng thực tiễn của mạng neural convolutional trong nhận dạng đối tượng

Mạng CNN đã được áp dụng rộng rãi trong nhiều lĩnh vực khác nhau, từ nhận diện khuôn mặt đến phân loại hình ảnh. Các ứng dụng này không chỉ mang lại giá trị kinh tế mà còn cải thiện chất lượng cuộc sống.

4.1. Nhận diện khuôn mặt

Nhận diện khuôn mặt là một trong những ứng dụng nổi bật của mạng CNN. Công nghệ này đã được sử dụng trong nhiều hệ thống bảo mật và giám sát, giúp nâng cao độ chính xác và hiệu quả trong việc nhận diện người dùng.

4.2. Phân loại hình ảnh trong y tế

Mạng CNN cũng đã được áp dụng trong lĩnh vực y tế, đặc biệt trong việc phân loại hình ảnh y tế. Công nghệ này giúp bác sĩ chẩn đoán bệnh nhanh chóng và chính xác hơn, từ đó cải thiện chất lượng điều trị cho bệnh nhân.

V. Kết luận và tương lai của mạng neural convolutional

Mạng neural convolutional đã chứng minh được tiềm năng to lớn trong lĩnh vực nhận dạng đối tượng. Tuy nhiên, vẫn còn nhiều thách thức cần phải vượt qua để tối ưu hóa hiệu suất và khả năng ứng dụng của công nghệ này trong thực tế.

5.1. Tương lai của mạng CNN trong thị giác máy tính

Với sự phát triển không ngừng của công nghệ, mạng CNN hứa hẹn sẽ tiếp tục đóng vai trò quan trọng trong thị giác máy tính. Các nghiên cứu mới sẽ tập trung vào việc cải thiện khả năng tổng quát và giảm thiểu yêu cầu tài nguyên.

5.2. Xu hướng nghiên cứu và phát triển

Xu hướng nghiên cứu hiện nay đang hướng tới việc kết hợp mạng CNN với các công nghệ khác như học sâu và học máy, nhằm tạo ra các mô hình mạnh mẽ hơn, có khả năng xử lý các bài toán phức tạp trong nhận dạng đối tượng.

22/07/2025

Bạn đang xem trước tài liệu:

Luận văn thạc sĩ vnu uet nghiên cứu về mạng neural convolutional áp dụng vào bài toán nhận dạng đối tượng trong lĩnh vực thị giác máy tính

Tải đầy đủ

Trích đoạn nội dung tài liệu

CHƯƠNG 1. TỔNG QUAN VỀ MẠNG NƠ RON VÀ GIỚI THIỆU VỀ MẠNG NƠ RON TÍCH CHẬP 1. Nơ ron nhân tạo 1.1 Lịch sử của nơ ron nhân tạo Vào năm 1943, nhà thần kinh học Warren McCulloch đã cùng nhà toán học Walter Pitts đã viết một cuốn sách về cách mạng thần kinh hoạt động. Và họ đã thực hiện mô phỏng một mạng thần kinh đơn giản trên một mạch điện.

[9] Vào năm 1949, Donald Hebb đã viết cuốn sách Organization of Behavior. Điểm nhấn chính là mạng thần kinh nào được sử dụng nhiều sẽ được tăng cường. Vào năm 1959, David Hubel và Torsten Wiesel đã xuất bản cuốn sách Receptive fields of single neurons in the cat’s striate cortex, miêu tả về phản ứng của các tế bào thần kinh thị giác trên loài mèo, cũng như cách loài mèo ghi nhớ và nhận diện hình dạng trên kiến trúc vỏ não của nó.1 Hình ảnh thí nghiệm của David Hubel và Torsten Wiesel trên mèo [10] Vào năm 1989, Yann LeCun đã áp dụng thuật toán học cho mạng nơ ron theo kiểu lan truyền ngược vào kiến trúc mạng nơ ron tích chập của Fukushima. Sau đó vài năm, LeCun đã công bố LeNet-5 [13].

Có thể nói, LeNet-5 là một trong những mạng nơ ron tích chập sơ khai nhất, tuy nhiên các dấu ấn của nó vẫn tồn tại tới ngày nay, có thể thấy thông qua một số thành phần thiết yếu mà các mạng nơ ron tích chập của ngày nay vẫn đang sử dụng 4 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.2 Cấu tạo và quá trình xử lý của một nơ ron sinh học Hình 1.2: Hình ảnh một nơ ron sinh học [14] Một nơ ron gồm có: thân nơ ron, tua gai thần kinh, sợi trục thần kinh, trong đó:  Thân nơ ron: là nơi xử lý các tín hiệu được đưa vào;  Tua gai thần kinh: là nơi nhận các xung điện vào trong nơ ron;  Sợi trục thần kinh: là nơi đưa tín hiệu ra ngoài sau khi được xử lý bởi nơ ron;  Khớp thần kinh: vị trí nằm giữa tua gai thần kinh và sợi trục thần kinh, đây là điểm liên kết đầu ra của nơ ron này với đầu vào của nơ ron khác.3 Cấu tạo và quá trình xử lý của một nơ ron nhân tạo Dựa vào cấu tạo của một nơ ron sinh học, các nhà khoa học nghiên cứu và lập trình đã đưa ra kiến trúc của một nơ ron nhân tạo: Hình 1.3: Công thức của một nơ ron nhân tạo [41] 5 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Mạng nơ ron nhân tạo có thể mô tả đơn giản lại như sau: Hình 1.4: Hình ảnh một nơ ron nhân tạo Trong đó:  Danh sách các đầu vào: Là các thuộc tính đầu vào của một nơ ron. Số lượng thuộc tính đầu vào thường nhiều hơn một, do dữ liệu thô đầu vào thường là một vector nhiều chiều, hoặc nhiều nơ ron tầng trước kết nối tới một nơ ron tầng sau.  Trọng số liên kết: Các liên kết được thể hiện độ mạnh yếu qua một giá trị được gọi là trọng số liên kết. Kết hơp với các đầu truyền, tín hiệu đến các nơ ron nhân tạo khác sẽ được tính bằng ; Hình 1.5: Hình ảnh vị trí thiên lệch được thêm vào trong thực tế 6 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com  Hàm tổng: Tổng các tích của các đầu vào với trọng số liên kết mô phỏng các khớp kết nối.

Sau đó đi qua hàm tính tổng để tính ra giá trị trước khi đưa vào hàm truyền;  Thiên lệch (b): Độ lệch được đưa vào sau khi khi tính toán xong hàm tổng, tạo ra giá trị cuối cùng trước khi đưa vào hàm truyền. Mục đích của việc thêm vào thiên lệch nhằm dịch chuyển chức năng của hàm kích hoạt sang trái hoặc phải, giúp ích khi mạng được huấn luyện. Hình ảnh vị trí thiên lệch được thêm vào trong mạng nơ ron thực tế. Hình ảnh huấn luyện khi có và không có thiên lệch: Hình 1.6: Kết quả của hàm sigmoid với các trọng số đầu vào khác nhau nhưng không có thiên lệch Hình 1.7: Kết quả của hàm sigmoid với các trọng số thiên lệch khác nhau Hàm kích hoạt (Activation functions): Hàm này được sử dụng để tính toán giá trị của đầu ra dựa vào giá trị của hàm Tổng.

7 LUAN VAN CHAT LUONG download : add luanvanchat@agmail. Các mô hình hàm kích hoạt của mạng nơ ron nhân tạo 1.1 Hàm Sigmod  Biểu diễn hàm:  Đạo hàm của hàm: Hàm Sigmoid được sử dụng vì ngưỡng của nó nằm trong khoảng (0, 1). Do đó, hàm này được sử dụng nhiều cho các mô hình dự đoán xác suất đầu ra, tức kết quả chỉ tồn tại trong khoảng từ 0 đến 1: khi đầu vào là số dương lớn, đầu ra của hàm sigmoid gần bằng 1. Khi nhỏ hơn 0, đầu ra gần bằng 0.

Tuy nhiên, việc tối ưu của hàm này khó khăn, nguyên nhân vì nếu giá trị đầu vào của hàm là 1 số rất lớn, thì đầu ra của hàm càng về 2 đầu xấp xỉ 1 hoặc 0, nên tốc độ hội tụ sẽ rất chậm.8: Đồ thị hàm Sigmoid 1.2 Hàm TanH  Biểu diễn hàm:  Đạo hàm của hàm: Hàm TanH được sử dụng vì đầu ra của hàm nằm trong khoảng , thích hợp với các mô hình đầu ra có ba giá trị: âm, trung tính (0) và dương. Chúng ta có thể thấy rõ hơn điều này trong hình minh họa. 8 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.9: Đồ thị hàm TanH 1. Hàm tuyến tính  Biểu diễn hàm:  Đạo hàm của hàm: Hàm tuyến tính áp dụng thao tác nhận dạng trên dữ liệu với dữ liệu đầu ra tỷ lệ thuận với dữ liệu đầu vào.10: Đồ thị hàm tuyến tính 1.4 Hàm RELU  Biểu diễn hàm:  Đạo hàm của hàm: Hàm RELU áp dụng với những trường hợp cần đầu ra nằm trong khoảng (0, +∞).

Hàm RELU có tốc độ tính toán rất nhanh, gán các giá trị âm trở thành 0 ngay lập tức, phù 9 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com hợp cho việc huấn luyện từ dữ liệu chuẩn. Tuy nhiên, điều này khiến hàm RELU không ánh xạ các giá trị âm một cách thích hợp.11: Đồ thị hàm RELU 1.5 Hàm ELU  Biểu diễn hàm:  Đạo hàm của hàm: Hàm ELU là một biến thể của hàm RELU. Hàm thường được sử dụng khi ngưỡng đầu ra của nó nằm trong khoảng (-1, +∞). Hàm ELU khắc phục hạn chế ánh xạ các giá trị âm của hàm RELU.12: Đồ thị hàm ELU 10 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.2 Mạng nơ ron nhân tạo 1.1 Giới thiệu mạng nơ ron nhân tạo Mạng nơ ron nhân tạo (Artificial Neural Network ANN) là một chuỗi các giải thuật lập trình, mô phỏng dựa trên cách hoạt động của mạng lưới thần kinh trong não bộ các sinh vật sống.

Mạng nơ ron nhân tạo được sử dụng để tìm ra mối quan hệ của một tập dữ liệu thông qua một thiết kế kiến trúc chứa nhiều tầng ẩn (hidden layer), mỗi tầng lại chứa nhiều nơ ron. Các nơ ron được kết nối với nhau và độ mạnh yếu của các liên kết được biểu hiện qua trọng số liên kết. Lập trình thông thường có thể làm được rất nhiều phần mềm lớn, như tính toán mô phỏng các vụ nổ hạt nhân trong siêu máy tính ở các phòng thí nghiệm, hoặc tái hiện các tế bào ở cấp độ phân tử để phân tích các thử nghiệm thuốc. Một siêu máy tính có thể tính toán được nhiều tỉ phép tính trên giây, tuy nhiên lập trình thông thường lại gặp khó khăn trong việc nhận ra các mẫu đơn giản, ví dụ như nhận diện mặt người, điều mà một bộ não sinh học xử lý nhanh và chính xác hơn nhiều.

Áp dụng với các kỹ thuật học sâu, mạng nơ ron nhân tạo hiện nay đang được áp dụng để giải quyết những vấn đề mà lập trình theo logic thông thường khó có thể giải quyết được. Do đó, mạng nơ ron nhân tạo đang nhanh chóng trở nên phổ biến, và là xu thế trên nhiều lĩnh vực.2 Một số kiểu mạng nơ ron Có hai kiểu mạng nơ ron chính: mạng nơ ron truyền thằng (feedforward neural network) và mạng nơ ron hồi quy (recurrent neural network). Mạng truyền thẳng và hồi quy được minh họa như sau: Hình 1.13: Mạng nơ ron truyền thẳng 11 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Dễ thấy, ở mạng nơ ron truyền thẳng, các nơ ron trong tầng ẩn đều được kết nối với các nơ ron trong tầng n. Do có nhiều tầng ẩn nên chúng ta có thể thấy rằng mạng truyền thẳng kéo dài trong không gian, và là không có bất kỳ đường tuần hoàn (cyclic path) nào nằm trong mạng.

Mạng nơ ron truyền thẳng rất phổ biến hiện nay.14: Mạng nơ ron hồi quy Một loại khác là mạng nơ ron hồi quy. Không giống như mạng nơ ron truyền thẳng, mạng nơ ron hồi quy có ít nhất một đường dẫn tuần hoàn. Chúng ta có thể thấy nó ở hình minh họa phía trên. Vì có một đường dẫn tuần hoàn, nên mạng nơ ron hồi quy có thể gây ra vòng lặp vô cực.

Tuy nhiên, mạng nơ ron tuần hoàn có một ứng dụng quan trọng là chúng có thể nhận diện cho các giai đoạn thời gian khác nhau, như hình minh họa sau: Hình 1.15: Cách huấn luyện cho một mạng nơ ron hồi quy Như ví dụ trên, có một nút A kết nối với nút B và một chu kỳ đến chính nút A. Mạng nơ ron hồi quy không xử lý đường dẫn tuần hoàn và các kết nối cùng một lúc. Mạng nơ ron hồi quy giả sử rằng đầu ra của nút A trong thời gian n là đầu vào của nút B và nút A trong thời gian n + 1. Vì vậy, ngoài tính chất kéo dài trong không gian khi kết nối với các tầng nơ ron tiếp theo, mạng nơ ron hồi quy cũng nằm sâu trong thời gian.

Vì vậy, các mạng nơ ron hồi quy có thể mô hình hóa các hệ thống thay đổi theo bối cảnh. Ví dụ: mạng nơ ron hồi quy thường được sử dụng trong xử lý ngôn ngữ theo ngữ cảnh. Mạng 12 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com nơ ron hồi quy có thể xử lý các phụ thuộc xa (long-term dependencies) theo mốc thời gian, ví dụ như mạng bộ nhớ dài-ngắn (Long Short Term Memory networks).3 Mạng nơ ron lan truyền ngược 1.1 Tổng quan về mạng nơ ron lan truyền ngược Giải thuật lan truyền ngược được mô tả ngắn gọn như sau: 1. Bước 1: Lan truyền.

Giai đoạn lan truyền có hai bước, lan truyền tiến và lan truyền ngược. Bước lan truyền tiến là nhập dữ liệu huấn luyện vào các mạng nơ ron và tính toán đầu ra. Sau đó, dựa vào kết quả đầu ra, so sánh với dữ liệu huấn luyện.

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ

Chủ đề

Trí tuệ nhân tạo và học máy

Xử lý ảnh và thị giác máy tính

Mạng neural sâu và ứng dụng

Luận văn thạc sĩ vnu uet nghiên cứu về mạng neural convolutional áp dụng vào bài toán nhận dạng đối tượng trong lĩnh vực thị giác máy tính

LỜI CAM ĐOAN

1. CHƯƠNG 1: TỔNG QUAN VỀ MẠNG NƠ RON VÀ GIỚI THIỆU VỀ MẠNG NƠ RON TÍCH CHẬP

1.1. Nơ ron nhân tạo

1.1.1. Lịch sử của nơ ron nhân tạo

1.1.2. Cấu tạo và quá trình xử lý của một nơ ron sinh học

1.1.3. Cấu tạo và quá trình xử lý của một nơ ron nhân tạo

1.2. Các mô hình hàm kích hoạt của mạng nơ ron nhân tạo

1.3. Mạng nơ ron nhân tạo

1.3.1. Giới thiệu mạng nơ ron nhân tạo

1.3.2. Một số kiểu mạng nơ ron

1.3.3. Mạng nơ ron lan truyền ngược

1.4. Mạng nơ ron tích chập

1.4.1. Khái niệm về mạng nơ ron tích chập

1.4.2. Mô hình mạng nơ ron tích chập

1.4.3. Xây dựng mạng nơ ron tích chập

2. CHƯƠNG 2: BÀI TOÁN NHẬN DẠNG BẰNG MẠNG NƠ RON TÍCH CHẬP

2.1. Khái niệm về nhận dạng

2.1.1. Nhận dạng đối tượng

2.1.2. Nhận dạng khuôn mặt

2.2. Lịch sử và phát triển

2.3. Cách thức hoạt động

2.4. Phương pháp nhận dạng đối tượng từ ảnh chụp của camera

2.4.1. Nhận diện khuôn mặt

2.4.2. Phát hiện các điểm quan trọng trên khuôn mặt

2.4.3. Liên kết khuôn mặt

2.5. Kết quả các thuật toán sử dụng mạng nơ ron nhân tạo

2.5.1. Mô hình DeepID 2 (NIPS 2014)

2.5.2. Mô hình DeepID3 (arXiv 2015)

2.5.3. Mô hình DeepFace (Facebook, CVPR 2014)

2.5.4. Mô hình FaceNet (Google 2015)

2.5.5. Mô hình Baidu (2015)

3. CHƯƠNG 3: SỬ DỤNG MẠNG NƠ RON TÍCH CHẬP TRONG NHẬN DẠNG ĐỐI TƯỢNG

3.1. Sơ lược về áp dụng mạng nơ ron tích chập vào các giải pháp thông minh trong thực tế

3.2. Áp dụng mạng nơ ron tích chập để xây dựng hệ thống nhận diện người vào/ra và đánh giá thực nghiệm, so sánh với phương pháp HOG

3.2.1. Giới thiệu hệ thống nhận diện và đếm lượt người vào/ra sử dụng mạng nơ ron tích chập

3.2.2. Giới thiệu kiến trúc của máy chủ xử lý nhận diện và đếm lượng người

3.2.3. Giới thiệu sơ lược về phương pháp mô tả đặc trưng HOG sẽ được dùng để so sánh

3.2.4. So sánh khả năng nhận diện của hệ thống nhận diện người vào/ra sử dụng mạng nơ ron tích chập với phương pháp HOG đã có

3.2.5. Mô tả cơ chế chạy nhận diện người trong lõi máy chủ tính toán

3.2.6. Mô tả quá trình sử dụng hệ thống ở giao diện người dùng để hiển thị kết quả

3.3. Áp dụng mạng nơ ron tích chập để xây dựng hệ thống nhận diện khuôn mặt và đánh giá thực nghiệm, so sánh với phương pháp HOG

3.3.1. Xây dựng hệ thống nhận diện khuôn mặt

3.3.2. Giới thiệu cơ chế của máy chủ xử lý nhận diện

3.3.3. Giới thiệu sơ lược về phương pháp phát hiện khuôn mặt sử dụng HOG sẽ được dùng để so sánh

3.3.4. So sánh hệ thống nhận diện khuôn mặt với phương pháp HOG đã có

3.3.5. So sánh khả năng nhận diện khuôn mặt giữa HOG và CNN

3.3.6. Kết quả hệ thống web nhận diện khuôn mặt

3.4. Kết quả đã thực hiện được của luận văn

3.5. Phương hướng phát triển luận văn

TÀI LIỆU THAM KHẢO

I. Tổng quan về mạng neural convolutional trong nhận dạng đối tượng

1.1. Lịch sử phát triển của mạng neural convolutional

1.2. Cấu trúc và nguyên lý hoạt động của mạng CNN

II. Thách thức trong việc áp dụng mạng neural convolutional

2.1. Độ phức tạp tính toán và yêu cầu tài nguyên

2.2. Khả năng tổng quát của mô hình

III. Phương pháp chính trong nghiên cứu mạng neural convolutional

3.1. Cải tiến kiến trúc mạng CNN

3.2. Tối ưu hóa thuật toán huấn luyện

IV. Ứng dụng thực tiễn của mạng neural convolutional trong nhận dạng đối tượng

4.1. Nhận diện khuôn mặt

4.2. Phân loại hình ảnh trong y tế

V. Kết luận và tương lai của mạng neural convolutional

5.1. Tương lai của mạng CNN trong thị giác máy tính

5.2. Xu hướng nghiên cứu và phát triển

Tài liệu liên quan

THÔNG TIN CHI TIẾT

Tác giả: Nguyễn Mạnh Hùng

Người hướng dẫn: PGS.TS Đỗ Trung Tuấn

Trường học: Trường Đại Học Công Nghệ, Đại Học Quốc Gia Hà Nội

Chuyên ngành: Công Nghệ Thông Tin

Đề tài: Nghiên Cứu Về Mạng Neural Convolutional, Áp Dụng Vào Bài Toán Nhận Dạng Đối Tượng Trong Lĩnh Vực Thị Giác Máy Tính

Loại tài liệu: Luận Văn Thạc Sĩ

Năm xuất bản: 2019

Địa điểm: Hà Nội

Có thể bạn quan tâm