Đồ Án: Robot Bám Theo Người Hỗ Trợ Vận Chuyển Hàng Hóa HCMUTE

Đồ án HCMUTE: Nghiên cứu chế tạo robot bám theo người, hỗ trợ vận chuyển hàng hóa hiệu quả trong nhà xưởng. Giải pháp tự động hóa tối ưu.

Chuyên ngành

CNKT Cơ Điện Tử

Người đăng

Ẩn danh

Thể loại

Đồ Án Tốt Nghiệp

2023

98
2
0

Phí lưu trữ

35 Point

Mục lục chi tiết

LỜI CAM KẾT

LỜI CẢM ƠN

TÓM TẮT ĐỒ ÁN

ABSTRACT

MỤC LỤC

1. CHƯƠNG 1: TỔNG QUAN ĐỀ TÀI

1.1. Tính cấp thiết của đề tài

1.2. Tình hình nghiên cứu trong và ngoài nước

1.2.1. Các nghiên cứu liên quan trên thế giới

1.2.2. Các nghiên cứu liên quan trong nước

1.3. Mục tiêu nghiên cứu của đề tài

1.4. Phạm vi và nội dung nghiên cứu của đề tài

1.5. Kết cấu của đồ án tốt nghiệp

2. CHƯƠNG 2: CƠ SỞ LÍ THUYẾT

2.1. Mô hình hóa robot

2.2. Cơ cấu Rocker-Bogie tinh giản

2.3. Nhận dạng xử lí và theo dõi người

2.3.1. Kiến trúc mạng thần kinh MobileNet SSD v2

2.3.2. Nguyên lý Maximum a Posteriori Probabilities (MAP)

2.4. Xác định khoảng cách giữa người được bám theo và robot

2.5. Thuật toán điều khiển robot

2.6. Tìm thông số cho bộ điều khiển động cơ

3. CHƯƠNG 3: TÍNH TOÁN CÁC THÔNG SỐ, THIẾT KẾ VÀ THI CÔNG MÔ HÌNH

3.1. Tính toán bền cho khung robot

3.2. Tính toán chọn động cơ

3.3. Chế tạo mô hình cơ khí

3.3.1. Khung sườn robot

3.3.2. Thanh vi sai

3.3.3. Trục chính của thân robot

3.3.4. Cụm gá bánh tự lựa

3.3.5. Bản vẽ tổng thể của robot

3.4. Phần điện và thiết bị điều khiển

3.4.1. Jetson nano developer kit A02

3.4.2. Động cơ và mô hình toán học của động cơ

3.4.3. Webcam Xiaomi Xiaovv XVV-6320S-USB 1080P

3.4.4. Cảm biến siêu âm HCSR04

3.5. Thi công mạch điện cho robot

3.6. Thiết kế bộ điều khiển

3.6.1. Lưu đồ bộ điều khiển PID

3.6.2. Lưu đồ bộ phận xử lí ảnh và theo dõi

3.6.3. Lưu đồ tổng của hệ thống

4. CHƯƠNG 4: KẾT QUẢ THỰC NGHIỆM

4.1. Kết quả thực nghiệm

4.2. Nhận xét kết quả

5. CHƯƠNG 5: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN

5.1. Hướng phát triển

TÀI LIỆU THAM KHẢO

Phụ lục hình ảnh

Phụ lục bảng

Danh mục từ viết tắt

Tóm tắt

I. Robot Bám Theo Người Xu Hướng Mới Của Logistics 4

Trong bối cảnh cuộc cách mạng công nghiệp 4.0, tự động hóa kho hànglogistics 4.0 đã trở thành những yếu tố then chốt quyết định lợi thế cạnh tranh của doanh nghiệp. Một trong những giải pháp đột phá nhất hiện nay là robot bám theo người, một dạng robot cộng tác (cobot) được thiết kế để hỗ trợ con người trong các nhiệm vụ vận chuyển nội bộ. Khác với các hệ thống tự động hoàn toàn, robot này hoạt động song hành cùng nhân viên, giúp giảm tải công việc nặng nhọc, tăng năng suất và tối ưu hóa luồng di chuyển hàng hóa trong các môi trường phức tạp như nhà xưởng, sân bay hay trung tâm thương mại. Sự ra đời của loại robot này đánh dấu một bước tiến quan trọng, kết hợp sức mạnh của máy móc và sự linh hoạt của con người, tạo ra một giải pháp intralogistics hiệu quả và tiết kiệm chi phí. Chúng không chỉ đơn thuần là công cụ vận chuyển, mà còn là một phần của hệ thống kho thông minh, nơi con người và máy móc tương tác liền mạch. Công nghệ này hứa hẹn sẽ định hình lại tương lai của ngành vận chuyển, giúp các doanh nghiệp xây dựng mô hình nhà máy thông minh một cách bền vững và hiệu quả hơn.

1.1. Định nghĩa robot đi theo người và vai trò trong intralogistics

Một robot đi theo người là một thiết bị tự hành được trang bị hệ thống cảm biến và trí tuệ nhân tạo (AI) để nhận diện, khóa mục tiêu và di chuyển theo một người cụ thể. Nhiệm vụ chính của nó là vận chuyển hàng hóa, hành lý hoặc công cụ, giải phóng con người khỏi việc phải đẩy hoặc kéo các xe hàng nặng. Trong lĩnh vực intralogistics, vai trò của robot này là cực kỳ quan trọng. Nó giúp tối ưu hóa các quy trình "person-to-goods" (người đến kệ hàng), giảm thời gian di chuyển không cần thiết của nhân viên và giảm thiểu rủi ro tai nạn lao động liên quan đến việc khuân vác. Bằng cách tự động hóa khâu vận chuyển, nhân viên có thể tập trung vào các công việc đòi hỏi kỹ năng cao hơn như sắp xếp, kiểm kê và quản lý hàng hóa.

1.2. So sánh robot bám theo người AGV và AMR trong kho hàng

Robot tự hành AGV (Automated Guided Vehicle) thường di chuyển theo các đường dẫn định sẵn như vạch từ, băng dính hoặc mã QR. Chúng thiếu linh hoạt khi gặp vật cản và yêu cầu hạ tầng cố định. Ngược lại, AMR (Autonomous Mobile Robot) sử dụng các công nghệ như công nghệ SLAM (Simultaneous Localization and Mapping) để tự lập bản đồ và tìm đường đi tối ưu, giúp chúng linh hoạt hơn AGV. Tuy nhiên, xe tự hành đi theo người lại là một giải pháp khác biệt. Nó không cần bản đồ định sẵn hay đường dẫn cố định, mà dựa vào khả năng nhận diện và bám theo người điều hành. Điều này làm cho nó trở nên lý tưởng cho các môi trường làm việc năng động, nơi luồng công việc thay đổi liên tục và sự tương tác trực tiếp giữa người và robot là cần thiết để đạt hiệu quả cao nhất.

II. Thách Thức Vận Chuyển Nội Bộ Trong Nhà Máy Thông Minh

Quá trình vận chuyển nội bộ hàng hóa trong các khu vực như nhà kho, phân xưởng, sân bay luôn đòi hỏi sự linh hoạt và nhanh chóng. Tuy nhiên, các phương pháp truyền thống đang bộc lộ nhiều hạn chế. Việc phụ thuộc vào sức người không chỉ làm giảm năng suất, tăng chi phí nhân công mà còn tiềm ẩn nguy cơ về an toàn lao động. Theo nghiên cứu, "việc vận chuyển hàng hóa từ nơi này đến nơi khác hiện tại vẫn chưa tối ưu". Mặt khác, việc triển khai một hệ thống tự động hóa hoàn toàn, chẳng hạn như hệ thống robot tự hành AGV, lại đối mặt với rào cản lớn về chi phí. Tài liệu gốc chỉ ra rằng "giá thành cực kì cao đi đôi với việc cần có một đội hỗ trợ về kĩ thuật cho hệ thống sắp xếp tự động". Hơn nữa, nhiều cơ sở hạ tầng tại Việt Nam, đặc biệt là các nhà xưởng cũ, có địa hình không bằng phẳng, gây khó khăn cho hoạt động của các robot vận chuyển thông thường. Những thách thức này đòi hỏi một giải pháp cân bằng giữa hiệu quả, chi phí và khả năng thích ứng với điều kiện thực tế.

2.1. Hạn chế của phương pháp vận chuyển hàng hóa thủ công

Vận chuyển thủ công dựa hoàn toàn vào sức lao động của con người, dẫn đến nhiều hạn chế cố hữu. Thứ nhất, năng suất bị giới hạn bởi thể chất và sức bền của nhân viên, dễ gây ra tình trạng mệt mỏi và giảm hiệu quả công việc theo thời gian. Thứ hai, nguy cơ chấn thương và các vấn đề sức khỏe liên quan đến việc nâng, kéo vật nặng là rất cao. Thứ ba, quá trình này dễ xảy ra sai sót do con người, chẳng hạn như giao nhầm hàng hoặc làm hỏng sản phẩm trong quá trình di chuyển. Cuối cùng, chi phí nhân công cho việc vận chuyển chiếm một tỷ trọng đáng kể trong tổng chi phí vận hành của một kho hàng hoặc nhà máy, đặc biệt khi quy mô hoạt động mở rộng.

2.2. Chi phí và rào cản khi triển khai hệ thống kho thông minh

Mặc dù hệ thống kho thông minh mang lại hiệu quả vượt trội, việc triển khai chúng không hề đơn giản. Rào cản lớn nhất là chi phí đầu tư ban đầu cho các robot vận chuyển hàng, hệ thống phần mềm quản lý và cơ sở hạ tầng đi kèm. Đối với các doanh nghiệp vừa và nhỏ, đây là một khoản đầu tư rất lớn. Thêm vào đó, việc tích hợp một hệ thống tự động mới vào quy trình làm việc hiện có đòi hỏi thời gian, nguồn lực đào tạo và một đội ngũ kỹ thuật chuyên trách để bảo trì, vận hành. Các loại robot như AGV còn yêu cầu cải tạo mặt bằng để lắp đặt đường dẫn, làm tăng thêm chi phí và gián đoạn hoạt động sản xuất. Những yếu tố này khiến nhiều doanh nghiệp chần chừ trong việc áp dụng công nghệ tự động hóa.

III. Cách Robot Bám Theo Người Nhận Diện và Di Chuyển Chính Xác

Để một robot bám theo người có thể hoạt động hiệu quả, nó cần một hệ thống "mắt thần" và "bộ não" tinh vi. Trọng tâm của hệ thống này là công nghệ thị giác máy tính và các cảm biến hỗ trợ. Dựa trên đồ án của nhóm sinh viên Trường Đại học Sư phạm Kỹ thuật TP.HCM, robot sử dụng một sự kết hợp thông minh giữa phần cứng và phần mềm để đạt được độ chính xác cao. Máy tính nhúng Jetson Nano đóng vai trò là bộ xử lý trung tâm, thực hiện các tác vụ nặng về phân tích hình ảnh. Dữ liệu hình ảnh thu được từ webcam được xử lý thông qua kiến trúc mạng thần kinh 'SSD-Mobilenet' để phát hiện và phân loại các đối tượng trong khung hình. Ngay sau khi xác định được mục tiêu là con người, thuật toán theo vết đối tượng CSRT (Channel and Spatial Reliability Tracker) từ thư viện OpenCV sẽ được kích hoạt. Thuật toán này khóa mục tiêu và liên tục cập nhật vị trí của người đó qua các khung hình tiếp theo, đảm bảo robot không bị mất dấu ngay cả khi đối tượng di chuyển nhanh hoặc bị che khuất một phần. Sự kết hợp này tạo nên một hệ thống nhận diện mạnh mẽ, linh hoạt và hiệu quả về mặt tính toán.

3.1. Phân tích công nghệ thị giác máy tính SSD Mobilenet CSRT

Kiến trúc SSD-Mobilenet v2 được lựa chọn vì sự cân bằng giữa tốc độ và độ chính xác, rất phù hợp cho các thiết bị có tài nguyên hạn chế như máy tính nhúng. Mobilenet, với cấu trúc nhẹ, giúp trích xuất đặc trưng hình ảnh một cách nhanh chóng, trong khi lớp SSD (Single Shot Detector) cho phép phát hiện đối tượng chỉ trong một lần xử lý duy nhất. Sau khi SSD-Mobilenet xác định được bounding box (hộp giới hạn) của người cần theo dõi, thuật toán CSRT sẽ tiếp quản. CSRT hoạt động dựa trên nguyên lý Maximum a Posteriori Probabilities (MAP), phân tích các đặc trưng về kênh màu và không gian để tạo ra một bộ lọc đáng tin cậy. Bộ lọc này giúp dự đoán vị trí của đối tượng trong khung hình kế tiếp với độ chính xác cao, giúp robot duy trì việc bám theo một cách mượt mà và ổn định.

3.2. Vai trò của cảm biến siêu âm trong việc duy trì khoảng cách

Trong khi thị giác máy tính giúp robot "nhìn" và "bám theo", việc duy trì một khoảng cách an toàn là nhiệm vụ của các cảm biến khác. Mặc dù các công nghệ tiên tiến như cảm biến LiDAR hay RADAR cung cấp độ chính xác rất cao trong việc lập bản đồ môi trường, chúng có giá thành đắt đỏ. Nghiên cứu đã chỉ ra rằng, đối với bài toán giữ khoảng cách với một mục tiêu phía trước, việc sử dụng cảm biến siêu âm HC-SR04 là một giải pháp tối ưu về chi phí và hiệu quả. Cảm biến này phát ra sóng siêu âm và đo thời gian sóng phản xạ trở lại để tính toán khoảng cách. Dữ liệu khoảng cách này được gửi về vi điều khiển để điều chỉnh tốc độ của robot, đảm bảo nó luôn giữ một cự ly an toàn, tránh va chạm với người đi trước.

IV. Phương Pháp Thiết Kế Cơ Khí Tối Ưu Cho Robot Vận Chuyển

Để một robot vận chuyển hàng hoạt động bền bỉ, đặc biệt trên các địa hình không bằng phẳng trong nhà xưởng, thiết kế cơ khí đóng vai trò quyết định. Đồ án nghiên cứu đã đề xuất một giải pháp sáng tạo bằng cách áp dụng cơ cấu Rocker-Bogie tinh giản. Cơ cấu này, vốn được NASA sử dụng cho các robot thám hiểm sao Hỏa, đã được điều chỉnh để phù hợp với môi trường công nghiệp. Thay vì 6 bánh phức tạp, phiên bản tinh giản sử dụng một hệ thống treo độc lập cho mỗi bên, cho phép các bánh xe linh hoạt điều chỉnh độ cao khi đi qua chướng ngại vật nhỏ hoặc bề mặt gồ ghề. Một thành phần quan trọng là thanh vi sai, có chức năng giữ thăng bằng cho thân robot, ngăn robot bị lật và đảm bảo tải trọng luôn được phân bổ đều. Khung sườn của robot được chế tạo từ nhôm định hình 20x20, một vật liệu nhẹ, bền và dễ lắp ráp, giúp tối ưu hóa trọng lượng và chi phí sản xuất. Toàn bộ hệ thống cơ khí này được thiết kế để chịu tải trọng 15kg và di chuyển với vận tốc 5km/h, đáp ứng các yêu cầu thực tế của việc vận chuyển nội bộ.

4.1. Cơ cấu Rocker Bogie tinh giản cho địa hình không bằng phẳng

Cơ cấu Rocker-Bogie nguyên bản có cấu trúc phức tạp, nhưng phiên bản tinh giản trong nghiên cứu này đã loại bỏ cụm Bogie để giảm độ phức tạp và chi phí. Mỗi bên của robot bao gồm một thành phần rocker nối trực tiếp với bánh xe dẫn động và một bánh xe tự lựa phía trước. Khi một bánh xe gặp chướng ngại vật và bị nâng lên, cơ cấu rocker cho phép nó di chuyển độc lập mà không làm nghiêng toàn bộ thân xe. Thanh vi sai kết nối hai cụm rocker hai bên, hoạt động như một cơ cấu cân bằng. Khi một rocker nghiêng xuống, rocker còn lại sẽ được đẩy lên, giúp robot duy trì sự ổn định và đảm bảo ít nhất ba bánh xe luôn tiếp xúc với mặt đất. Thiết kế này giúp robot đi theo người di chuyển mượt mà hơn trên các bề mặt không hoàn hảo.

4.2. Nguyên lý điều khiển động cơ PID để đảm bảo vận hành ổn định

Sự ổn định trong di chuyển không chỉ đến từ cơ khí mà còn từ hệ thống điều khiển điện tử. Để đảm bảo robot di chuyển với tốc độ ổn định và đáp ứng chính xác các lệnh điều khiển, thuật toán điều khiển PID (Proportional-Integral-Derivative) đã được áp dụng. Vi điều khiển STM32F103C8T6 nhận tín hiệu từ bộ xử lý hình ảnh và cảm biến khoảng cách, sau đó tính toán sai số giữa tốc độ hiện tại và tốc độ mong muốn. Bộ điều khiển PID sử dụng ba thành phần—tỷ lệ (P), tích phân (I), và đạo hàm (D)—để tạo ra tín hiệu điều chế độ rộng xung (PWM) phù hợp cho driver động cơ. Điều này giúp động cơ tăng hoặc giảm tốc một cách mượt mà, loại bỏ hiện tượng giật cục và duy trì tốc độ ổn định, ngay cả khi tải trọng thay đổi hoặc khi di chuyển trên các đoạn đường dốc nhẹ.

V. Ứng Dụng Thực Tiễn và Tương Lai Của Robot Cộng Tác

Mô hình robot bám theo người được phát triển trong đồ án tốt nghiệp tại Trường Đại học Sư phạm Kỹ thuật TP.HCM không chỉ là một sản phẩm học thuật mà còn mở ra nhiều tiềm năng ứng dụng thực tiễn. Kết quả thực nghiệm cho thấy robot có khả năng nhận diện, bám theo đối tượng và duy trì khoảng cách ổn định, đáp ứng các mục tiêu thiết kế ban đầu. Giải pháp này đặc biệt phù hợp cho các ngành công nghiệp cần sự kết hợp giữa tự động hóa và sự linh hoạt của con người, chẳng hạn như trong các trung tâm hoàn tất đơn hàng thương mại điện tử, dây chuyền lắp ráp, hoặc thậm chí là tại các sân bay để hỗ trợ vận chuyển hành lý. Trong tương lai, robot cộng tác hay cobot được dự báo sẽ trở thành một phần không thể thiếu của chuỗi cung ứng hiện đại. Chúng sẽ không thay thế hoàn toàn con người, mà sẽ trở thành những người trợ lý đắc lực, giúp tăng cường năng lực và đảm bảo an toàn cho người lao động. Sự phát triển của trí tuệ nhân tạo và công nghệ cảm biến sẽ tiếp tục nâng cao khả năng của những xe tự hành đi theo người này, giúp chúng thông minh hơn và tương tác tự nhiên hơn.

5.1. Kết quả thực nghiệm và tiềm năng trong tự động hóa kho hàng

Theo báo cáo, mô hình robot thực tế đã hoàn thành các bài kiểm tra chức năng. Robot nhận diện chính xác đối tượng người trong nhiều điều kiện ánh sáng khác nhau và bám theo với tốc độ ổn định. Hệ thống điều khiển PID cho thấy tốc độ đáp ứng của động cơ nhanh và ít sai số. Những kết quả này chứng minh tính khả thi của việc sử dụng các công nghệ chi phí thấp như webcam và cảm biến siêu âm để xây dựng một giải pháp intralogistics hiệu quả. Tiềm năng ứng dụng trong tự động hóa kho hàng là rất lớn, giúp các doanh nghiệp giảm chi phí vận hành, tăng tốc độ xử lý đơn hàng và tạo ra một môi trường làm việc an toàn, hiện đại hơn.

5.2. Hướng phát triển cho cobot và xe tự hành đi theo người

Hướng phát triển trong tương lai cho các loại cobot này rất đa dạng. Đầu tiên là cải thiện khả năng nhận diện đa đối tượng và cho phép robot chuyển đổi mục tiêu theo lệnh. Tiếp theo là tích hợp thêm các cảm biến như camera 3D hoặc cảm biến LiDAR giá rẻ để tăng cường khả năng nhận biết môi trường và tránh vật cản một cách thông minh hơn. Về phần mềm, việc áp dụng các thuật toán học máy tiên tiến hơn có thể giúp robot học hỏi hành vi của người dùng và dự đoán hướng di chuyển, tạo ra sự tương tác mượt mà và tự nhiên hơn. Cuối cùng, việc kết nối các robot này vào một hệ thống quản lý trung tâm sẽ tạo nên một hệ thống kho thông minh thực sự, nơi mọi hoạt động được điều phối và tối ưu hóa trong thời gian thực.

21/09/2025

Trích đoạn nội dung tài liệu

chương 1 nói về các vấn đề nghiên cứu trong và ngoài nước; chương 2 nói về các cở sở lí thuyết sử dụng trong đề tài; chương 3 trình bày về các phân tích và tính toán các thông số để đáp ứng được các thông số ban đầu đưa ra và quá trình thiết kế và thi công mô hình cơ khí cho robot; chương 4 và 5 nói về các kết quả đạt được trong đề tài và các hướng phát triển. 5 CHƯƠNG 2: CƠ SỞ LÍ THUYẾT 2. Mô hình hóa robot Robot giao hàng sử dụng cơ cấu Rocker- Bogie tinh giản sử dụng hai động cơ để di chuyển. Khi robot di chuyển thì tốc độ của các bánh mỗi bên phải đồng bộ với nhau.

Mô hình robot di chuyển trên mặt phẳng xOy và chuyển hướng theo góc định hướng được phác họa như bên dưới Hình 2. 1: Mô hình chuyển động trong mặt phẳng của robot Hình trên cho thấy các tham số được sinh ra trong một mô hình chuyển động của mobile robot, trong đó: L: chiều rộng của thân robot : góc xoay của robot từ vị trí hiện tại đến vị trí đích : tốc độ chuyển hướng của robot : bán kính bánh xe Từ mô hình động của robot, ta có: 6 (1) Vận tốc mỗi bên của robot: = + { 2 = − 2 Mà = (2) (3) { = Từ (1) và (2) chúng ta có phương trình vận tốc: =2 + { 2 + = (4) Từ (1), vận tốc dài và vận tốc gốc của robot được biểu diễn như sau: 1 = (5) ( +) 2 { 1 = (6) 2 ( −) Phương trình động học của mobile robot: ̇= = { ̇= ̇ Từ (4) và (5) ta có: 1 ̇= 2( + ) 1 ̇= 2( + ) ̇ 1 ( = { 7 CHƯƠNG 2: CƠ SỞ LÍ THUYẾT Từ (2) và (6) ta có: ̇= ( + ) 2 ̇= ( + ) 2 − ) = ( { Với cơ cấu thông thường, để thay đổi hướng chuyển động ta cần phải sử dụng thêm cơ cấu lái được gắn vào hai bánh trước. Tuy nhiên, với việc trang bị hai bánh xe tự lựa thì để điều khiển robot quay chỉ cần điều chỉnh vận tốc hai bánh đẩy. Cơ cấu Rocker-Bogie tinh giản Cơ cấu Rocker-Bogie được sử dụng bởi NASA trong chiến dịch thám hiểm sao hỏa.

Cơ cấu được trang bị cho robot mang tên “Spirit” và “Opportunity”. Robot này có nhiệm vụ di chuyển trên sao hỏa để thu thập các mẫu đá và các mẫu vật thể cần thiết cho việc nghiên cứu về sự tồn tại của sự sống trên bề mặt sao hỏa. 2: Cơ cấu Rocker-Bogie 8 CHƯƠNG 2: CƠ SỞ LÍ THUYẾT Hình 2. 3: Robot thám hiểm sao hỏa sử dụng cơ cấu Rocker-Bogie Cơ cấu này giúp cho robot thám hiểm sao hỏa có thể di chuyển ổn định trên bề mặt có nhiều sỏi đá như bề mặt sao hỏa.

Cơ cấu bao gồm sáu bánh xe được chia thành hai cụm hai bên robot. Mỗi cụm bánh xe bao gồm một cơ cấu Rocker (1 bánh xe) và một cơ cấu Bogie (2 bánh xe). Cơ cấu này có nhiều ứng dụng trong thực tế và khả năng chịu tải tốt do tải luôn luôn được chia đều cho 6 bánh. Cơ cấu này có thể được dùng cho các robot di dộng hoạt động trên đường gồ ghề hoặc leo cầu thang.

Tuy nhiên việc di chuyển trong nhà máy sẽ dễ dàng hơn so với việc di chuyển trên bề mặt gồ ghề như trên sao hỏa thế nên trong đồ án này, robot đi theo người được thiết kế giảm bớt cơ cấu Bogie. Cơ cấu sẽ được tinh giản và thiết kế lại như hình bên dưới. 4: Cơ cấu đơn giản của Rocker-Bogie 9 CHƯƠNG 2: CƠ SỞ LÍ THUYẾT Cơ cấu bên trên được đơn giản bớt cụm Bogie và giảm số lượng động cơ dẫn động còn lại 2 để giảm bớt giá thành cũng như giảm bớt độ phức tạp cho việc điều khiển robot nhưng vẫn đảm bảo được việc đáp ứng các yếu tố đầu vào của bài báo cáo. Một cơ cấu quan trọng trong cơ cấu Rocker-Bogie mà vẫn được giữ lại ở cơ cấu tinh giản này là cơ cấu thanh vi sai (Hình 2.

Thanh vi sai là cơ cấu có chức năng giữ thăng bằng cho thân robot, ngăn chặn việc thân robot bị lật về trước do thành phần rocker nối với thân robot thông qua một trục tròn duy nhất. Thanh vi sai Hình 2. 5: Cơ cấu thanh vi sai Hình 2. 6: Robot khi không có thanh vi sai Cơ cấu thanh vi sai này còn có chức năng là truyền động giữ hai rocker của robot.

Khi một trong 2 bánh trước bị nâng lên, phần khớp nối trên cùng của rocker sẽ di chuyển về sau. 10 CHƯƠNG 2: CƠ SỞ LÍ THUYẾT Đồng thời kéo một đầu thanh vi sai về sau và nâng một bên robot lên. Nhờ vào đó, sẽ luôn có 3 bánh xe nằm trên cùng một mặt phẳng để xe có thể ổn định hơn. 7: Cơ cấu hoạt động thanh vi sai 2.

Nhận dạng xử lí và theo dõi người 2. Kiến trúc mạng thần kinh MobileNet SSD v2 2. Giới thiệu MobileNet SSD v2 Trong nghiên cứu này, kiến trúc mạng MobileNet SSD được ứng dụng cho nhiệm vụ phát hiện và phân loại đối tượng trong khung hình. Kiến trúc được lựa chọn vì nó kết hợp các ưu điểm của kiến trúc MobileNet (nhẹ, nhanh) và SSD (phát hiện được các đối tượng ở các kích cỡ khác nhau).

So với các mạng sử dụng kiến trúc VGG và Resnet, MobileNet SSD nhẹ và nhanh hơn nhiều nhờ tích chập tách rời (separable convolution). Và khi so sánh với MobileNet SSD, phiên bản version 2 (v2) có độ chính xác cao hơn do sử dụng nhiều lớp tích chập hơn ở lớp SSD để phát hiện nhiều kích cỡ của đối tượng hơn. 11 CHƯƠNG 2: CƠ SỞ LÍ THUYẾT Hình 2. 8: Độ chính xác và độ trễ của hai phiên bản Nhìn chung, kiến trúc mạng thực hiện tốt nhiệm vụ phát hiện và phân loại đối tượng trên hình ảnh, phát hiện đối tượng trên video nhờ tính chất nhẹ và nhanh, hơn nữa kiến trúc rất phù hợp để phát triển các ứng dụng trên thiết bị di động với yêu cầu tính toán hạn chế.

Kết hợp hai kiến trúc mạng MobileNet và SSD Kiến trúc mạng Mobilenet V2: - Mobilenet V2 là một kiến trúc mạng học sâu được tối ưu hóa cho việc triển khai trên các thiết bị di động và máy tính có tài nguyên hạn chế. - Nó sử dụng các khối cơ sở chia thành lớp chập rộng và lớp chập hẹp, giúp giảm số lượng tham số và tối ưu việc tính toán, đồng thời vẫn duy trì độ chính xác cao. - Mobilenet V2 được thiết kế để đạt hiệu suất cao với tài nguyên tính toán thấp, làm cho nó trở thành lựa chọn phổ biến trong các ứng dụng trên thiết bị di động. [8] Kiến trúc mạng SSD (Single Shot Multibox Detector): - SSD là một phương pháp nhận diện đối tượng trong hình ảnh sử dụng mạng học sâu để đề xuất các hộp giới hạn (bounding boxes) chứa các đối tượng và phân loại chúng cùng một lúc.

- Khác với các phương pháp truyền thống yêu cầu nhiều giai đoạn xử lý, SSD thực hiện việc nhận diện một cách nhanh chóng chỉ trong một lần duy nhất (single shot), giúp tăng tốc độ xử lý và hiệu quả. - SSD sử dụng nhiều lớp chập có tỷ lệ khác nhau để nhận diện các đối tượng ở nhiều kích thước khác nhau trong ảnh, từ đó tăng tính đa dạng và chính xác của việc nhận diện. 12 CHƯƠNG 2: CƠ SỞ LÍ THUYẾT Hình 2. 9: Mô hình kết hợp kiến trúc mạng MobileNet và SSD Sơ đồ 2.9 mô tả khái quát kiến trúc mạng kết hợp của Mobilenet và SSD.

Đầu vào của kiến trúc SSD-Mobilenet V2 là một hình ảnh có kích thước cố định. Các hình ảnh đầu vào phải được chuẩn hóa trước khi đưa vào mạng để đảm bảo tính ổn định và nhất quán. Đầu ra của kiến trúc SSD-Mobilenet V2 là các hộp giới hạn (bounding boxes) chứa các đối tượng được nhận diện trong hình ảnh, cùng với các nhãn (labels) tương ứng cho từng đối tượng. Mỗi hộp giới hạn được xác định bởi bốn thông số: tọa độ của góc trên trái (top-left) và góc dưới phải (bottom-right), cùng với điểm số (confidence score) cho đối tượng đó.

Các lớp (layer) chính trong kiến trúc bao gồm: - Mobilenet backbone layers: Đây là các lớp Mobilenet V2, chịu trách nhiệm xử lý hình ảnh và trích xuất các đặc trưng quan trọng của hình ảnh. Các lớp này giúp mạng nhận diện các đối tượng trong hình ảnh. - Convolutional layers: Các lớp tích chập được sử dụng để thực hiện các phép tích chập trên các đặc trưng trích xuất từ lớp Mobilenet. Điều này giúp mạng tìm ra các thông tin quan trọng và đặc trưng của đối tượng trong hình ảnh.

- Predictive layers: Đây là các lớp dự đoán, tạo ra các hộp giới hạn và các điểm số liên quan đến đối tượng. Predictive layers đảm bảo rằng các đối tượng trong hình ảnh được nhận diện chính xác và đáng tin cậy. MobileNet SSD v2 kết hợp kiến trúc MobileNet và SSD để tạo ra một mạng phát hiện vật thể hiệu quả về tính toán được thiết kế cho các thiết bị di động. Lớp MobileNet đóng vai trò là backbone (phần cơ sở) của mạng, cung cấp các lớp tích chuẩn hóa sâu để rút trích đặc trưng từ ảnh vào.

Phần SSD head (phần đầu) được nối tiếp sau MobileNet, thực hiện công việc phát hiện vật thể. [9] 13 CHƯƠNG 2: CƠ SỞ LÍ THUYẾT Việc kết hợp hai thành phần mang lại nhiều lợi ích. Đầu tiên, MobileNet với kiến trúc tiết kiệm tài nguyên giúp mạng hoạt động nhanh trên thiết bị di động. Thứ hai, phương pháp SSD cho phép phát hiện nhiều hộp giới hạn (bounding boxes) và nhiều kích cỡ đối tượng (multi-scale) nhằm đạt độ chính xác cao.

Cụ thể, khi huấn luyện, phần MobileNet được huấn luyện trước bằng cách giảm loss (tổn thất) của lớp fully-connected cuối. Sau đó phần SSD head được nối tiếp vào đầu ra của MobileNet rồi huấn luyện tiếp để tối ưu hóa loss cho việc phát hiện. Hơn nữa, MobileNet SSD v2 là một trong những mô hình single-shot detector (bộ phát hiện đơn lẻ) phổ biến trong việc phát hiện đối tượng trên ảnh. Cụ thể, single-shot detector là một thuật toán phát hiện đối tượng mà chỉ cần một lần chạy mô hình để tạo ra các kết quả.

So với các phương pháp phát hiện đối tượng truyền thống, single-shot detector có thể đạt được tốc độ xử lý nhanh hơn nhờ vào việc chỉ cần chạy một lần. Tuy nhiên, so với các single-shot detector khác, MobileNet SSD v2 có nhiều ưu điểm.

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ