MINISTRY OF EDUCATION AND TRAINING HO CHI MINH CITY UNIVERSITY OF TECHNOLOGY AND EDUCATION FACULTY FOR HIGH QUALITY TRAINING GRADUATION THESIS ELECTRONICS AND TELECOMMUNICATION ENGINEERING TECHNOLOGY A SMART SHOPPING CART WITH AUTOMATED PAYMENT BASED ON ARTIFICIAL INTELLIGENCE ADVISOR : Ph. BUI HA DUC STUDENT: TRAN NGO MINH TRI NGUYEN HOAI NAM NGUYEN VAN TONG SKL 0 1 0 9 6 1 Ho Chi Minh City, July 2023 MINISTRY OF EDUCATION AND TRAINING HO CHI MINH CITY UNIVERSITY OF TECHNOLOGY AND EDUCATION --------------------------------- FACULTY FOR HIGH QUALITY TRAINING GRADUATION THESIS Project title: A smart shopping cart with automated payment based on Artificial Intelligence ADVISOR: BUI HA DUC, PhD STUDENTS: TRAN NGO MINH TRI – 19146033 NGUYEN HOAI NAM – 19146219 NGUYEN VAN TONG – 19146279 CLASS: 19146CL2B ACADEMIC YEAR: 2019 – 2023 Ho Chi Minh City, July 2023 CỘNG HOÀ XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập - Tự do – Hạnh phúc NHIỆM VỤ ĐỒ ÁN TỐT NGHIỆP Học kỳ 2 / năm học 2022-2023 Giảng viên hướng dẫn: TS Bùi Hà Đức Sinh viên thực hiện: Trần Ngô Minh Trí MSSV: 19146033 Hệ đào tạo: CLV Nguyễn Hoài Nam MSSV: 19146219 Hệ đào tạo: CLV Nguyễn Văn Tòng MSSV: 19146279 Hệ đào tạo: CLV 1. Mã số đề tài: – Tên đề tài: Xe đẩy siêu thị thông minh tự động bám theo người kết hợp thanh toán tự động ứng dụng công nghệ trí tuệ nhân tạo. Các số liệu, tài liệu ban đầu: Mô hình phần cứng và số liệu đã hoàn thành từ đồ án trước.
Nội dung chính của đồ án: Thiết kế và gia công xa đẩy siêu thị thông minh có khả năng tự đi theo khách hàng, hỗ trợ định giá, thanh toán các sản phẩm trong siêu thị. Các sản phẩm dự kiến Sản phẩm đúng kích thước có thể vận hành thực tế. Ngôn ngữ trình bày: Bản báo cáo: Tiếng Anh Tiếng Việt i Trình bày bảo vệ: Tiếng Anh Tiếng Việt Ghi chú: Hệ chất lượng cao tiếng Anh thực hiện thuyết minh và báo cáo bằng tiếng Anh TRƯỞNG KHOA TRƯỞNG NGÀNH GIẢNG VIÊN HƯỚNG DẪN (Ký, ghi rõ họ tên) (Ký, ghi rõ họ tên) (Ký, ghi rõ họ tên) ii LỜI CAM KẾT - Tên đề tài: Xe đẩy siêu thị thông minh tự động bám theo người kết hợp thanh toán tự động ứng dụng công nghệ trí tuệ nhân tạo. - GVHD: TS Bùi Hà Đức.
- Thông tin sinh viên: 1. Trần Ngô Minh Trí – MSSV: 19146033 – Lớp: 19146CL2B Địa chỉ: 46/3, Tân Hòa 2, phường Hiệp Phú, TP Thủ Đức, SĐT: 0343455542. Nguyễn Hoài Nam – MSSV: 19146219 – Lớp 19146CL2B Địa chỉ: đường 5 phường Linh Xuân TP Thủ Đức, SĐT:0906732772 Email: 19146219@student. Nguyễn Văn Tòng – MSSV: 19146279 – Lớp 19146CL2B Địa chỉ: 2a Đường số 37, Phường Linh Đông, TP Thủ Đức, SĐT: 0375843385 Email: 19146279@student.vn - Ngày nộp khóa luận tốt nghiệp: 21/07/2023 - Lời cam kết: “Tôi xin cam đoan khóa luận tốt nghiệp (ĐATN) này là công trình do chính tôi nghiên cứu và thực hiện.
Tôi không sao chép từ bất kỳ một bài viết nào đã được công bố mà không trích dẫn nguồn gốc. Nếu có bất kỳ một sự vi phạm nào, tôi xin chịu hoàn toàn trách nhiệm”. Hồ Chí Minh, ngày 21 tháng 07 năm 2023 Ký tên iii LỜI CẢM ƠN Đầu tiên nhóm xin chân thành gửi lời cảm ơn đế thầy hướng dẫn – TS Bùi Hà Đức, nhóm xin cảm ơn thầy trong suốt khoảng thời gian làm đồ án thầy đã nhiệt tình hướng dẫn, đưa ra những hướng giải quyết những khó khăn về chuyên môn gặp phải. Ngoài ra thầy đã dạy cho các thành viên trong nhóm nhiều kỹ năng quan trọng mà người kỹ sư cần có.
Nhóm cảm ơn thầy vì đã cho các thành viên sự định hướng trong tương lai những khi thành viên gặp khó khăn trên con đường học vấn cũng như sự nghiệp của mình. Trong suốt khoảng thời gian từ đồ án Cơ điện tử cho đến đồ án tốt nghiệp, thầy đã cho hỗ trợ cho nhóm mượn để sử dụng tại phòng những thiết bị mà nhóm không đủ điều kiện mua để nhóm có thể nghiên cứu và hoàn thiện đồ án. Được sự hướng dẫn của thầy là điều mà tất cả các thành viên đều cảm thấy may mắn và quý trọng. Thứ hai, xin gửi lời cảm ơn đến các bạn Nguyễn Hoài Nam và Nguyễn Văn Tòng đã đồng hành cùng với nhau, đi cùng nhau từ khoảng thời gian ý tưởng chỉ ở trên giấy đến khi hoàn thiện và vận hành.
Cảm ơn các bạn vì sự nhiệt huyết, đam mê với khoa học kỹ thuật mà lấy đó làm động lực để đi tiếp trong những lúc gặp khó khăn. Cuối cùng xin gửi lời cảm ơn đến những người thân trong gia đình đặc biệt là cha, mẹ của các thành viên nhóm đã tin tưởng, hỗ trợ cho tất cả thành viên hoàn thành chương trình đại học, và đi đến chặn cuối cùng là hoàn thiện đồ án tốt nghiệp. Họ là những nguồn động lực lớn nhất mà chúng tôi dùng để hoàn thành đồ án này. Đại diện nhóm Trí Trần Ngô Minh Trí iv ABSTRACT Project title: A smart shopping cart with automated payment based on Artificial Intelligence With the growing population in large cities such as Ho Chi Minh City or Ha Noi, supermarkets and shopping malls are facing increasing pressure to enhance the in-store shopping experience for their customers, especially during peak hours.
This thesis proposes a mobile robot that aims to improve the experience of customers when shopping at supermarkets and shopping malls by providing them with a more convenient and efficient way to shop at hypermarkets and shopping centers. The proposed product utilizes a depth camera to capture 2D and 3D images of customers to define the distance and deviation angle with the robot and then track them. In addition, the robot is equipped with an RGB camera to capture images when the customer puts a product into the cart. These images are then processed using a deep learning model that has been trained with datasets collected and labeled by the research team.
By analyzing the images, the deep learning model is able to identify the name of the product and track the direction of the product to change the bills. This product can be applied in the large supermarket and in the future, we can modify them for more functionalities such as customer behavior analysis. v TABLE OF CONTENTS NHIỆM VỤ ĐỒ ÁN TỐT NGHIỆP. i LỜI CAM KẾT.
iii LỜI CẢM ƠN. v TABLE OF CONTENTS. vi LIST OF TABLES. x LIST OF FIGURES.
xi LIST OF ABBREVIATIONS. xv CHAPTER 1: INTRODUCTION .5 Research subjects and scopes. 4 CHAPTER 2: LITERATURE REVIEW .3 Deep learning and Convolutional Neural Networks.1 Metrics are used for the object detection task.2 Choosing a model to deploy on Jetson Nano. 20 CHAPTER 3: HARDWARE AND MECHANICAL DESIGN .3 3D Structural Design of the Robot.4 Building the robot base.1 Calculations and motor selection.2 Calculations and selection of the belt transmission system.
Selection of bearing supports. Selection of omnidirectional wheels.5 Designing the base plate.5 Calculating the kinematics of the robot.6 Calculating the dynamics of the robot. 38 CHAPTER 4: ELECTRICAL DESIGN .2 Block diagram and overview of the electrical system.3 Power supply block.1 Calculating and selecting the power supply.2 Buck converter circuits.4 Main data processing block. 54 CHAPTER 5: ALGORITHM DESIGN .1 Designing 2D and 3D image processing algorithms.2 Following person module.3 Automatic checkout module.2 Semantic Entity Recognition module.4 Algorithm for Robot navigation.5 The control algorithm on STM32.
65 CHAPTER 6: EXPERIMENTS AND RESULTS .1 PID Controller for Motor Speed Control.1 The structure of a PID controller.2 Finding the transfer function of the motor from experimentation.3 Find the parameters of the PID controller for speed control of the motor.4 The PID control diagram of each motor.5 The experimental results of the PID controller on two motors.1 The main base plate deformation testing.2 The cargo compartment deformation testing.3 The base frame deformation testing.3 Training the semantic entity recognition model.3 Training the model.5 Recognizing user actions.6 User interface designing. The result of the tracking model when the person is occluded. 92 viii CHAPTER 7: CONCLUSION AND FUTURE DEVELOPMENTS. 95 ix LIST OF TABLES Table 3.
The calculated motor parameters. Symbol table of kinematic parameters used for calculations. Symbol table of dynamic parameters used for calculations .38 x LIST OF FIGURES Figure 1. Customers waiting to pay at the supermarket.
The Amazon Dash Cart scans items, and interacts with a customer’s Amazon account for payment. Veeve's new product attaches to regular carts, turning them into smart carts. Autonomous Mobile robots of major brands. Timeline of state-of-the-art object detection methods.
Output of Object Detection. Accuracy of YOLOv2, SSD, and Faster-RCNN models for each object size category. The fps versus batch size in five detection algorithms. Illustration of Intersection over Union (IoU).
The basic structure of the SSD network model. Architecture of MobileNetV2. Show performance of SSD algorithm with several different backbone on. Performance results of various Machine Learning networks on Jetson Nano using NVIDIA's TensorRT library, with FP16 accuracy and batch_size 1.
The comparison accuracy of state-of-the-art tracking models. RGB image (top-left), point cloud (top-right), and depth image (bottom) received from the depth camera Realsense D435. Diagram of a PID Controller. Basic Configuration of a Robot.
3D Design of the Robot. Robot Base Component. The main drive wheels. The main forces acting on the robot during movement.
Table of rolling friction coefficients. Planet motor 24VDC 60W 320RPM. Vertical shaft bearing support. Robot base plate.
Description of the robot moves in a straight line. Describes the robot while moving in a circular arc. Description of the Dynamic Model of the Robot. Block diagram of the electrical system.
Accumulator battery 12VDC (14000 mAh). Lithium Polymer 12VDC (5200 mAh). Buck converter circuit XL4016. Buck converter circuit XL4015.
The block diagram of the main data processing block. Board Jetson Nano. Realsense Camera D435 of Intel. The block diagram of the control block.
Shows the configuration of the pins that are used. The structure of the H-bridge driver. H-bridge driver HI216. Diagram of system for the automated payment feature.
Diagram of system for the individual person following feature. Input and output of detecting and tracking node. A result of object detection model. Data processing pipeline of OCR system.
Some sample of product name in the packaging. The comparison accuracy of state-of-the-art sense text detection models. Results of DB model. The comparison accuracy of state-of-the-art text recognition models.
Architecture of LayoutXLM model. The flowchart of the algorithm for robot navigation. Describes the position of the person relative to the robot. The flowchart of the control algorithm on STM32.
The diagram of a PID controller. The collected data on the speed variations of the two motors. The interface of the System Identification Tool. Displays the data that has been input into the System Identification Tool.
The graph shows the speed variations corresponding to the 24VDC voltage over time. The parameters of the relative transfer function for the right motor. The parameters of the relative transfer function for the left motor. The general form of the PID control function.
The PID control diagram of the right motor .