chương 1 nói về các vấn đề nghiên cứu trong và ngoài nước; chương 2 nói về các cở sở lí thuyết sử dụng trong đề tài; chương 3 trình bày về các phân tích và tính toán các thông số để đáp ứng được các thông số ban đầu đưa ra và quá trình thiết kế và thi công mô hình cơ khí cho robot; chương 4 và 5 nói về các kết quả đạt được trong đề tài và các hướng phát triển. 5 CHƯƠNG 2: CƠ SỞ LÍ THUYẾT 2. Mô hình hóa robot Robot giao hàng sử dụng cơ cấu Rocker- Bogie tinh giản sử dụng hai động cơ để di chuyển. Khi robot di chuyển thì tốc độ của các bánh mỗi bên phải đồng bộ với nhau.
Mô hình robot di chuyển trên mặt phẳng xOy và chuyển hướng theo góc định hướng được phác họa như bên dưới Hình 2. 1: Mô hình chuyển động trong mặt phẳng của robot Hình trên cho thấy các tham số được sinh ra trong một mô hình chuyển động của mobile robot, trong đó: L: chiều rộng của thân robot : góc xoay của robot từ vị trí hiện tại đến vị trí đích : tốc độ chuyển hướng của robot : bán kính bánh xe Từ mô hình động của robot, ta có: 6 (1) Vận tốc mỗi bên của robot: = + { 2 = − 2 Mà = (2) (3) { = Từ (1) và (2) chúng ta có phương trình vận tốc: =2 + { 2 + = (4) Từ (1), vận tốc dài và vận tốc gốc của robot được biểu diễn như sau: 1 = (5) ( +) 2 { 1 = (6) 2 ( −) Phương trình động học của mobile robot: ̇= = { ̇= ̇ Từ (4) và (5) ta có: 1 ̇= 2( + ) 1 ̇= 2( + ) ̇ 1 ( = { 7 CHƯƠNG 2: CƠ SỞ LÍ THUYẾT Từ (2) và (6) ta có: ̇= ( + ) 2 ̇= ( + ) 2 − ) = ( { Với cơ cấu thông thường, để thay đổi hướng chuyển động ta cần phải sử dụng thêm cơ cấu lái được gắn vào hai bánh trước. Tuy nhiên, với việc trang bị hai bánh xe tự lựa thì để điều khiển robot quay chỉ cần điều chỉnh vận tốc hai bánh đẩy. Cơ cấu Rocker-Bogie tinh giản Cơ cấu Rocker-Bogie được sử dụng bởi NASA trong chiến dịch thám hiểm sao hỏa.
Cơ cấu được trang bị cho robot mang tên “Spirit” và “Opportunity”. Robot này có nhiệm vụ di chuyển trên sao hỏa để thu thập các mẫu đá và các mẫu vật thể cần thiết cho việc nghiên cứu về sự tồn tại của sự sống trên bề mặt sao hỏa. 2: Cơ cấu Rocker-Bogie 8 CHƯƠNG 2: CƠ SỞ LÍ THUYẾT Hình 2. 3: Robot thám hiểm sao hỏa sử dụng cơ cấu Rocker-Bogie Cơ cấu này giúp cho robot thám hiểm sao hỏa có thể di chuyển ổn định trên bề mặt có nhiều sỏi đá như bề mặt sao hỏa.
Cơ cấu bao gồm sáu bánh xe được chia thành hai cụm hai bên robot. Mỗi cụm bánh xe bao gồm một cơ cấu Rocker (1 bánh xe) và một cơ cấu Bogie (2 bánh xe). Cơ cấu này có nhiều ứng dụng trong thực tế và khả năng chịu tải tốt do tải luôn luôn được chia đều cho 6 bánh. Cơ cấu này có thể được dùng cho các robot di dộng hoạt động trên đường gồ ghề hoặc leo cầu thang.
Tuy nhiên việc di chuyển trong nhà máy sẽ dễ dàng hơn so với việc di chuyển trên bề mặt gồ ghề như trên sao hỏa thế nên trong đồ án này, robot đi theo người được thiết kế giảm bớt cơ cấu Bogie. Cơ cấu sẽ được tinh giản và thiết kế lại như hình bên dưới. 4: Cơ cấu đơn giản của Rocker-Bogie 9 CHƯƠNG 2: CƠ SỞ LÍ THUYẾT Cơ cấu bên trên được đơn giản bớt cụm Bogie và giảm số lượng động cơ dẫn động còn lại 2 để giảm bớt giá thành cũng như giảm bớt độ phức tạp cho việc điều khiển robot nhưng vẫn đảm bảo được việc đáp ứng các yếu tố đầu vào của bài báo cáo. Một cơ cấu quan trọng trong cơ cấu Rocker-Bogie mà vẫn được giữ lại ở cơ cấu tinh giản này là cơ cấu thanh vi sai (Hình 2.
Thanh vi sai là cơ cấu có chức năng giữ thăng bằng cho thân robot, ngăn chặn việc thân robot bị lật về trước do thành phần rocker nối với thân robot thông qua một trục tròn duy nhất. Thanh vi sai Hình 2. 5: Cơ cấu thanh vi sai Hình 2. 6: Robot khi không có thanh vi sai Cơ cấu thanh vi sai này còn có chức năng là truyền động giữ hai rocker của robot.
Khi một trong 2 bánh trước bị nâng lên, phần khớp nối trên cùng của rocker sẽ di chuyển về sau. 10 CHƯƠNG 2: CƠ SỞ LÍ THUYẾT Đồng thời kéo một đầu thanh vi sai về sau và nâng một bên robot lên. Nhờ vào đó, sẽ luôn có 3 bánh xe nằm trên cùng một mặt phẳng để xe có thể ổn định hơn. 7: Cơ cấu hoạt động thanh vi sai 2.
Nhận dạng xử lí và theo dõi người 2. Kiến trúc mạng thần kinh MobileNet SSD v2 2. Giới thiệu MobileNet SSD v2 Trong nghiên cứu này, kiến trúc mạng MobileNet SSD được ứng dụng cho nhiệm vụ phát hiện và phân loại đối tượng trong khung hình. Kiến trúc được lựa chọn vì nó kết hợp các ưu điểm của kiến trúc MobileNet (nhẹ, nhanh) và SSD (phát hiện được các đối tượng ở các kích cỡ khác nhau).
So với các mạng sử dụng kiến trúc VGG và Resnet, MobileNet SSD nhẹ và nhanh hơn nhiều nhờ tích chập tách rời (separable convolution). Và khi so sánh với MobileNet SSD, phiên bản version 2 (v2) có độ chính xác cao hơn do sử dụng nhiều lớp tích chập hơn ở lớp SSD để phát hiện nhiều kích cỡ của đối tượng hơn. 11 CHƯƠNG 2: CƠ SỞ LÍ THUYẾT Hình 2. 8: Độ chính xác và độ trễ của hai phiên bản Nhìn chung, kiến trúc mạng thực hiện tốt nhiệm vụ phát hiện và phân loại đối tượng trên hình ảnh, phát hiện đối tượng trên video nhờ tính chất nhẹ và nhanh, hơn nữa kiến trúc rất phù hợp để phát triển các ứng dụng trên thiết bị di động với yêu cầu tính toán hạn chế.
Kết hợp hai kiến trúc mạng MobileNet và SSD Kiến trúc mạng Mobilenet V2: - Mobilenet V2 là một kiến trúc mạng học sâu được tối ưu hóa cho việc triển khai trên các thiết bị di động và máy tính có tài nguyên hạn chế. - Nó sử dụng các khối cơ sở chia thành lớp chập rộng và lớp chập hẹp, giúp giảm số lượng tham số và tối ưu việc tính toán, đồng thời vẫn duy trì độ chính xác cao. - Mobilenet V2 được thiết kế để đạt hiệu suất cao với tài nguyên tính toán thấp, làm cho nó trở thành lựa chọn phổ biến trong các ứng dụng trên thiết bị di động. [8] Kiến trúc mạng SSD (Single Shot Multibox Detector): - SSD là một phương pháp nhận diện đối tượng trong hình ảnh sử dụng mạng học sâu để đề xuất các hộp giới hạn (bounding boxes) chứa các đối tượng và phân loại chúng cùng một lúc.
- Khác với các phương pháp truyền thống yêu cầu nhiều giai đoạn xử lý, SSD thực hiện việc nhận diện một cách nhanh chóng chỉ trong một lần duy nhất (single shot), giúp tăng tốc độ xử lý và hiệu quả. - SSD sử dụng nhiều lớp chập có tỷ lệ khác nhau để nhận diện các đối tượng ở nhiều kích thước khác nhau trong ảnh, từ đó tăng tính đa dạng và chính xác của việc nhận diện. 12 CHƯƠNG 2: CƠ SỞ LÍ THUYẾT Hình 2. 9: Mô hình kết hợp kiến trúc mạng MobileNet và SSD Sơ đồ 2.9 mô tả khái quát kiến trúc mạng kết hợp của Mobilenet và SSD.
Đầu vào của kiến trúc SSD-Mobilenet V2 là một hình ảnh có kích thước cố định. Các hình ảnh đầu vào phải được chuẩn hóa trước khi đưa vào mạng để đảm bảo tính ổn định và nhất quán. Đầu ra của kiến trúc SSD-Mobilenet V2 là các hộp giới hạn (bounding boxes) chứa các đối tượng được nhận diện trong hình ảnh, cùng với các nhãn (labels) tương ứng cho từng đối tượng. Mỗi hộp giới hạn được xác định bởi bốn thông số: tọa độ của góc trên trái (top-left) và góc dưới phải (bottom-right), cùng với điểm số (confidence score) cho đối tượng đó.
Các lớp (layer) chính trong kiến trúc bao gồm: - Mobilenet backbone layers: Đây là các lớp Mobilenet V2, chịu trách nhiệm xử lý hình ảnh và trích xuất các đặc trưng quan trọng của hình ảnh. Các lớp này giúp mạng nhận diện các đối tượng trong hình ảnh. - Convolutional layers: Các lớp tích chập được sử dụng để thực hiện các phép tích chập trên các đặc trưng trích xuất từ lớp Mobilenet. Điều này giúp mạng tìm ra các thông tin quan trọng và đặc trưng của đối tượng trong hình ảnh.
- Predictive layers: Đây là các lớp dự đoán, tạo ra các hộp giới hạn và các điểm số liên quan đến đối tượng. Predictive layers đảm bảo rằng các đối tượng trong hình ảnh được nhận diện chính xác và đáng tin cậy. MobileNet SSD v2 kết hợp kiến trúc MobileNet và SSD để tạo ra một mạng phát hiện vật thể hiệu quả về tính toán được thiết kế cho các thiết bị di động. Lớp MobileNet đóng vai trò là backbone (phần cơ sở) của mạng, cung cấp các lớp tích chuẩn hóa sâu để rút trích đặc trưng từ ảnh vào.
Phần SSD head (phần đầu) được nối tiếp sau MobileNet, thực hiện công việc phát hiện vật thể. [9] 13 CHƯƠNG 2: CƠ SỞ LÍ THUYẾT Việc kết hợp hai thành phần mang lại nhiều lợi ích. Đầu tiên, MobileNet với kiến trúc tiết kiệm tài nguyên giúp mạng hoạt động nhanh trên thiết bị di động. Thứ hai, phương pháp SSD cho phép phát hiện nhiều hộp giới hạn (bounding boxes) và nhiều kích cỡ đối tượng (multi-scale) nhằm đạt độ chính xác cao.
Cụ thể, khi huấn luyện, phần MobileNet được huấn luyện trước bằng cách giảm loss (tổn thất) của lớp fully-connected cuối. Sau đó phần SSD head được nối tiếp vào đầu ra của MobileNet rồi huấn luyện tiếp để tối ưu hóa loss cho việc phát hiện. Hơn nữa, MobileNet SSD v2 là một trong những mô hình single-shot detector (bộ phát hiện đơn lẻ) phổ biến trong việc phát hiện đối tượng trên ảnh. Cụ thể, single-shot detector là một thuật toán phát hiện đối tượng mà chỉ cần một lần chạy mô hình để tạo ra các kết quả.
So với các phương pháp phát hiện đối tượng truyền thống, single-shot detector có thể đạt được tốc độ xử lý nhanh hơn nhờ vào việc chỉ cần chạy một lần. Tuy nhiên, so với các single-shot detector khác, MobileNet SSD v2 có nhiều ưu điểm.