Luận án tiến sĩ: Nâng cao hiệu quả phát hiện công thức toán học trong ảnh văn bản

Chuyên ngành

Computer Science

Người đăng

Ẩn danh

Thể loại

doctoral dissertation

2021

154
0
0

Phí lưu trữ

30.000 VNĐ

Mục lục chi tiết

DECLARATION OF AUTHORSHIP

ACKNOWLEDGEMENT

ABSTRACT

1. CONTENT

1.1. DECLARATION OF AUTHORSHIP

1.2. LIST OF TABLES

1.3. LIST OF FIGURES

1.4. Objectives of the thesis

1.5. Introduction of the ME detection and recognition

1.5.1. Introduction of MEs

1.5.2. Introduction of ME detection

1.5.3. Introduction of ME recognition

1.6. Contributions of this thesis

1.7. Structure of this thesis

1.8. ME detection methods in document images

1.8.1. Rule-based detection

1.8.2. Handcrafted feature extraction methods for the ME detection

1.8.3. Deep neural network for ME detection

1.8.3.1. Deep neural networks
1.8.3.2. Deep neural network models for ME detection

1.8.4. Traditional approaches for ME recognition

1.8.5. Neural network approaches for ME recognition

1.8.6. Datasets and evaluation metrics

1.8.7. Existing systems for ME recognition

1.8.8. Summary of the chapter

2. THE DETECTION OF MEs USING THE LATE FUSION OF HANDCRAFTED AND DEEP LEARNING FEATURES

2.1. Overview of the proposed method

2.2. Handcrafted feature extraction for ME detection

2.2.1. Handcrafted feature extraction for isolated ME detection

2.2.2. Handcrafted feature extraction for inline ME detection

2.3. Deep learning method for ME detection

2.4. Late fusion of handcrafted and deep learning features for ME detection

2.5. Post-processing for ME detection

2.6. Performance evaluation of the detection of MEs using different machine learning algorithms

2.7. Performance evaluation of the detection of MEs using the fusion of handcrafted and deep learning features with different operations

2.8. Performance evaluation of the detection of isolated and inline MEs on different public datasets

2.9. Evaluation of the impact of image resolution on the ME detection

2.10. Evaluation of the impact of the post-processing

2.11. Visualization of extracted features of images using the handcrafted and deep learning feature approaches

2.12. Error analysis and discussion

2.13. Measurement of execution time

2.14. Summary of the chapter

3. THE DETECTION OF MEs USING THE COMBINATION OF THE DISTANCE TRANSFORM AND FASTER R-CNN

3.1. Overview of the proposed method for ME detection using the DT and the Faster R-CNN

3.2. The detection of MEs using the DT and the Faster R-CNN

3.2.1. Distance transform of document image

3.2.2. ME detection using a Faster R-CNN

3.2.3. Region proposal network

3.2.4. Fully connected detection network

3.3. Loss function of the training Faster R-CNN

3.3.1. Loss function of the training process of Faster R-CNN

3.4. Evaluation of the impact of the DT and anchor box generation to the performance of the ME detection

3.5. Comparison of Faster R-CNN models in ME detection

3.6. Comparison of the proposed and state-of-the-art methods used in ME detection

3.7. Performance comparison of the proposed method on cross datasets

3.8. Illustration of feature extraction of the Resnet-50

3.9. Error analysis and discussion

3.10. Measurement of execution time

3.11. Summary of the chapter

4. THE DETECTION AND RECOGNITION OF MEs IN DOCUMENT IMAGES

4.1. Overview of the proposed system for the detection and recognition of MEs

4.2. ME recognition using the WAP network

4.2.1. Watcher module of the WAP network

4.2.2. Parser module of the WAP network

4.3. Training the WAP network

4.4. Performance evaluation of the detection and recognition of MEs

4.5. Error analysis and discussion

4.6. Measurement of execution time

4.7. Summary of the chapter

ABBREVIATIONS

LIST OF TABLES

LIST OF FIGURES

Luận án tiến sĩ mang tiêu đề "Nâng cao hiệu quả phát hiện công thức toán học trong ảnh văn bản" của tác giả Bùi Hải Phong, dưới sự hướng dẫn của PGS. Hoàng Mạnh Thắng và PGS. Lê Thị Lan, được thực hiện tại Trường Đại Học Bách Khoa Hà Nội vào năm 2021. Bài luận án này tập trung vào việc cải thiện khả năng nhận diện các công thức toán học trong hình ảnh văn bản, một vấn đề quan trọng trong lĩnh vực xử lý ảnh và trí tuệ nhân tạo. Những cải tiến trong phương pháp phát hiện này không chỉ giúp nâng cao độ chính xác mà còn mở ra nhiều ứng dụng thực tiễn trong giáo dục và nghiên cứu khoa học.

Để mở rộng thêm kiến thức về các chủ đề liên quan, bạn có thể tham khảo các tài liệu sau:

Những tài liệu này sẽ giúp bạn có cái nhìn toàn diện hơn về các phương pháp và ứng dụng trong lĩnh vực toán học và công nghệ thông tin.