Đồ án Tốt Nghiệp: Xây Dựng Data Lakehouse trên Nền Tảng Databricks cho Doanh Nghiệp Kinh Doanh Bất Động Sản

2024

85
2
0

Phí lưu trữ

30.000 VNĐ

Mục lục chi tiết

LỜI CẢM ƠN

LỜI CAM ĐOAN

KẾ HOẠCH THỰC HIỆN

DANH MỤC BẢNG BIỂU

DANH MỤC HÌNH ẢNH

DANH MỤC CÁC TỪ VIẾT TẮT

1. CHƯƠNG 1: KIẾN THỨC NỀN TẢNG

1.1. Giới thiệu các kiến trúc cơ bản

1.2. Khái niệm cơ bản về Data Lakes

1.3. Data Warehouse và vai trò trong quản lý dữ liệu

1.4. Data LakeHouse và sự kết hợp của Data Lakes và Data Warehouse

1.5. Định nghĩa và cấu trúc của Data Lake

1.6. Sự liên kết với Big Data và dữ liệu phi cấu trúc

1.7. Khái niệm và mục tiêu của Data Warehouse

1.8. Kiến trúc và cấu trúc dữ liệu trong Data Warehouse

1.9. Ưu điểm của Data Warehouse

1.10. Mục tiêu trong xây dựng Data Warehouse và Business Intelligence

1.11. Quy trình xây dựng Data Warehouse

1.12. Giới thiệu về Mô hình dữ liệu đa chiều (Dimensional Modeling)

1.13. Phân biệt giữa Data Warehouse và Data Lakes

1.14. Giới thiệu về Data Lakehouse

1.15. Mối quan hệ giữa Lakehouse và Data Warehouse, Data Lake

1.16. Cấu trúc của Data Lakehouse

1.17. Ưu điểm và nhược điểm của Lakehouse

1.18. Tích hợp dữ liệu phi cấu trúc và cấu trúc trong Data LakeHouse

2. CHƯƠNG 2: GIỚI THIỆU VỀ NỀN TẢNG DATABRICKS

2.1. Khái niệm về Databricks

2.2. Kiến trúc của Databricks

2.3. Apache Spark trên Databricks

2.4. Quản lý mô hình học máy với Databricks

3. CHƯƠNG 3: XÂY DỰNG DATA LAKEHOUSE

3.1. Kiến trúc của hệ thống

3.2. Kiến trúc tổng quan của hệ thống

3.3. Kiến trúc Data Lakehouse

3.4. Các công nghệ sử dụng

3.5. Thu thập và lưu trữ dữ liệu

3.6. Thiết kế mô hình nhiều chiều

3.7. Mô hình hóa dữ liệu

3.8. Thiết kế Dimension

3.9. Thiết kế Fact

3.10. Thiết kế mối quan hệ giữa các bảng

3.11. Xây dựng bảng báo cáo

3.11.1. Bảng báo cáo tổng quan

3.11.2. Bảng báo cáo chi tiết từng khu vực

3.11.3. Bảng báo cáo bổ sung từng loại bất động sản

3.12. Đào tạo mô hình dự đoán

3.12.1. Giới hạn dữ liệu cho phần học máy

3.12.2. Lựa chọn các đặc trưng từ lớp gold

3.12.3. Mô hình Linear Regression

3.12.4. Mô hình Random Forest

3.12.5. Mô hình Neuron

3.12.6. Đánh giá và nhận xét chung

TÀI LIỆU THAM KHẢO

Đồ án tốt nghiệp kỹ thuật dữ liệu xây dựng data lakehouse trên nền tảng databricks đáp ứng các dịch vụ bi cho doanh nghiệp kinh doanh bất động sản

Bạn đang xem trước tài liệu:

Đồ án tốt nghiệp kỹ thuật dữ liệu xây dựng data lakehouse trên nền tảng databricks đáp ứng các dịch vụ bi cho doanh nghiệp kinh doanh bất động sản

Xây dựng Data Lakehouse trên Databricks cho Doanh Nghiệp Bất Động Sản là tài liệu chuyên sâu hướng dẫn cách triển khai và tối ưu hóa Data Lakehouse trên nền tảng Databricks, đặc biệt dành cho các doanh nghiệp bất động sản. Tài liệu này nhấn mạnh lợi ích của việc tích hợp dữ liệu đa nguồn, từ đó giúp doanh nghiệp phân tích và đưa ra quyết định dựa trên dữ liệu một cách hiệu quả. Các điểm chính bao gồm: kiến trúc Data Lakehouse, cách quản lý dữ liệu lớn, và ứng dụng thực tiễn trong ngành bất động sản. Đây là nguồn tài liệu hữu ích cho các chuyên gia CNTT và nhà quản lý muốn nâng cao hiệu suất dữ liệu của doanh nghiệp.

Để mở rộng kiến thức về quản lý và xử lý dữ liệu, bạn có thể tham khảo thêm các tài liệu liên quan như Luận văn thạc sĩ khoa học thiết kế kho dữ liệu và ứng dụng, Đồ án tốt nghiệp áp dụng các kỹ thuật trong big data vào lưu trữ dữ liệu, và Luận văn thạc sĩ công nghệ thông tin tìm hiểu mô hình điện toán đám mây và vấn đề bảo mật dữ liệu trong điện toán đám mây. Mỗi tài liệu này đều cung cấp góc nhìn chuyên sâu và bổ sung kiến thức liên quan đến quản lý dữ liệu hiện đại.