PHÁT HIỆN TRI THỨC THEO MÙA VỤ TỪ CƠ SỞ DỮ LIỆU CHUỖI THỜI GIAN Học viên: Trần Văn Thái – K10T2 Người hướng dẫn: TS Đỗ Văn Thành LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Mục lục. CHUỖI THỜI GIAN VÀ PHÂN TÍCH CHUỖI THỜI GIAN. Chuỗi thời gian và dự báo chuỗi thời gian.Định nghĩa chuỗi thời gian.Dự báo chuỗi thời gian. Ứng dụng chuỗi thời gian. Đại lƣợng đặc trƣng của chuỗi thời gian. Phân tích chuỗi thời gian. Các mô hình chuỗi thời gian đơn giản.Mô hình bƣớc ngẫu nhiên .Bƣớc ngẫu nhiên có bụi. Một số phƣơng pháp kiểm định thống kê.Kiểm định Durbin-Watson .Kiểm định nghiệm đơn vị .Tiêu chuẩn thông tin Akaike (AIC), Schwarz (SIC) . MÔ HÌNH ARIMA THƢỜNG VÀ THEO MÙA VỤ. Mô hình ARIMA thƣờng.21 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.Toán tử trễ .Chuỗi thời gian dừng.Quá trình tuyến tính.Quá trình tự hồi qui - AR(p).Quá trình trung bình trƣợt – MA(q). Quá trình trung bình trƣợt tự hồi qui ARMA(p,q).Mô hình tích hợp trung bình trƣợt tự hồi qui ARIMA(p,d,q).Qui trình xây dựng mô hình ARIMA (p, d, q).Nguyên tắc tằn tiện. Mô hình ARIMA theo mùa vụ.Chuỗi mùa vụ.Biến đổi chuỗi mùa vụ thành chuỗi dừng.Mô hình tích hợp trung bình trƣợt tự hồi qui theo mùa vụ ARIMA(p,d,q)x(P,D,Q)s. ỨNG DỤNG MÔ HÌNH ARIMA THEO MÙA VỤ .82 TÀI LIỆU THAM KHẢO .88 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Danh sách hình vẽ. Hình 1 - Chuỗi thời gian về chỉ số giá tiêu dùng Việt Nam đo theo tháng .6 Hình 3 – Đồ thị chuỗi dừng về chỉ số giá tiêu dùng Việt Nam.22 Hình 4 - ACF/PACF của chuỗi không dừng về chỉ số giá tiêu dùng Việt Nam .23 Hình 5 - Chuỗi về chỉ số giá tiêu dùng Việt Nam sau khi sai phân bậc 1 .24 Hình 6 - Chuỗi về chỉ số giá tiêu dùng Việt Nam sau sai phân bậc 1 và sai phân trễ mùa vụ bậc 1 .25 Hình 7 - Chuỗi biến đổi chỉ số giá tiêu dùng Việt Nam qua hàm biến đổi.25 Hình 8 - Mô hình lọc tuyến tính .26 Hình 7 - Các bước xây dựng mô hình ARIMA .38 Danh sách bảng biểu. Bảng 1: Đặc trưng ACF và PACF trong các mô hình tham số .35 LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com Bảng từ viết tắt. Từ Từ hoặc cụm từ Từ tiếng Anh viết tắt Hàm tự tƣơng quan ACF AutoCorrelation Function Kiểm định DF ADF Argumented Dickey-Fuller Tiêu chuẩn thông tin AIC/SIC AIC/SIC Akaike Information Criteria, Schwarz Information Criteria Sai số phần trăm tuyệt đối APE Absolute Percent Error Tự hồi qui AR AutoRegression Tích hợp trung bình trƣợt tự hồi qui ARIMA AutoRegressive Integrated Moving Average Trung bình trƣợt tự hồi qui ARMA AutoRegressive Moving Average Kiểm định DW DW Durbin-Watson Phân phối đồng nhất độc lập I.D Independent Identical Distribution Trung bình trƣợt MA Moving Average Sai số tuyệt đối trung bình MAE Mean Absolute Error Sai số bình phƣơng trung bình MSE Mean Square Error Hàm tự tƣơng quan từng phần PACF Partial AutoCorrelation Function Tự hồi qui theo mùa vụ SAR Seasonal AutoRegressive Tích hợp trung bình trƣợt tự hồi qui SARIMA Seasonal AutoRegressive Integrated theo mùa vụ Moving Average Trung bình trƣợt theo mùa vụ SMA Seasonal Moving Average Tổng bình phƣơng sai số SSE Sum of Square Error Nhiễu trắng WN White Noise LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com -1- MỞ ĐẦU Nền kinh tế hiện đại ngày càng dựa trên yếu tố thông tin. Điều đó làm biến đổi sâu sắc đến môi trƣờng kinh doanh, phƣơng thức quản lý kinh tế và cách thức tổ chức các hoạt động sản xuất kinh doanh. Đặc biệt là đối với nƣớc ta đang trong quá trình chuyển đổi từ nền kinh tế tập trung quan liêu bao cấp sang xây dựng nền kinh tế thị trƣờng trong bối cảnh hội nhập và cạnh tranh quốc tế gay gắt, hoạt động quản lý nhà nƣớc cũng đang chuyển mạnh từ phƣơng thức quản lý theo mệnh lệnh sang sử dụng các công cụ cơ chế chính sách thì vai trò của thông tin, nhất là thông tin dự báo phục vụ phát triển kinh tế - xã hội càng trở lên cấp thiết và quan trọng. Vì thế, cách thức thu thập, phân tích và sử dụng các thông tin, dữ liệu phục vụ cho quá trình đó cũng chịu sự biến đổi mạnh mẽ. Hiện tại, với việc ứng dụng rộng rãi công nghệ thông tin, một số luợng lớn thông tin và dữ liệu đƣợc thu thập bằng nhiều cách thức khác nhau trong môi trƣờng trực tuyến, thời gian thực…đã tạo ra một khối lƣợng thông tin, dữ liệu khổng lồ. Trong đó những dữ liệu có yếu tố thời gian có thể đƣợc kết hợp lại tùy theo đặc tính trong khoảng thời gian thích hợp cũng đã tạo ra một số lƣợng rất lớn các chuỗi dữ liệu trong các khoảng thời gian nhƣ nhau đƣợc gọi là dữ liệu chuỗi thời gian (series time data, gọi tắt là chuỗi thời gian). Nhƣ đã biết, phần lớn các dữ liệu phản ánh hoạt động sản xuất kinh doanh của doanh nghiệp, phản ánh tình hình phát triển kinh tế - xã hội của một quốc gia đều là chuỗi thời gian và do vậy phần lớn các cơ sở dữ liệu về kinh tế - xã hội cũng là cơ sở dữ liệu chuỗi thời gian (series time database). Việc phân tích nhằm phát hiện tri thức mới từ các cơ sở dữ liệu chuỗi thời gian thƣờng đƣợc dựa trên các phƣơng pháp phân tích chuỗi thời gian hiện đại thông qua sử dụng các công cụ tin học nhƣ: EViews, SPSS, SAS (Statistical Analysis System)… Một đặc trƣng rất quan trọng của chuỗi thời gian về kinh tế - xã hội là có tính mùa vụ, chẳng hạn giá cả và số lƣợng bán ra của một mặt hàng nào đó ví dụ nhƣ máy điều hòa nhiệt, hoặc là chỉ số giá tiêu dùng của các mặt hàng nói chung là khác nhau tại mỗi tháng trong năm, hay tình hình đầu tƣ của nƣớc ngoài vào LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com -2- Việt Nam, kim ngạch xuất khẩu của Việt Nam tại các tháng hoặc quý khác nhau trong năm cũng thƣờng rất khác nhau… Làm cách nào để có thể phát hiện đƣợc tri thức mới, dự báo đƣợc dữ liệu tƣơng lai dựa trên dữ liệu hiện tại và quá khứ trong các cơ sở dữ liệu chuỗi thời gian có tính mùa vụ nhƣ vậy. Luận văn ”phát hiện tri thức theo mùa vụ từ cơ sở dữ liệu chuỗi thời gian” sẽ góp phần làm rõ phƣơng pháp giải quyết vấn đề đƣợc đặt này. Luận văn gồm 3 chƣơng nội dung, phần mở đầu, phần kết luận, phần phụ lục và tài liệu tham khảo. Chương 1: Chuỗi thời gian và phân tích chuỗi thời gian sẽ giới thiệu một cách tóm tắt những khái niệm chủ yếu liên quan đến chuỗi thời gian và các bƣớc tiến hành phân tích và dự báo chuỗi thời gian, giới thiệu một số mô hình chuỗi thời gian đơn giản và kiểm định thống kê sử dụng cho phân tích chuỗi thời gian trong dự báo dữ liệu. Chương 2: Mô hình ARIMA thường và theo mùa vụ sẽ trình bày mô hình phân tích chuỗi thời gian điển hình nhất để dự báo dữ liệu cho cả 2 trƣờng hợp dữ liệu chuỗi thời gian có và không có tính chất mùa vụ, tƣơng ứng đó là mô hình ARIMA theo mùa vụ và mô hình ARIMA thƣờng. Ứng dụng mô hình ARIMA theo mùa vụ. Mục đích của chƣơng này là ứng dụng mô hình ARIMA theo mùa vụ để dự báo một số chỉ số kinh tế vĩ mô quan trọng phản ánh mức độ tăng trƣởng kinh tế Việt Nam nhƣ dự báo chỉ số giá tiêu dùng theo tháng (CPI), giá trị hàng hóa xuất khẩu theo tháng. Dữ liệu đƣợc sử dụng để dự báo là số liệu thực tế của nền kinh tế. Phần kết luận sẽ tổng kết những công việc đã thực hiện và kết quả đạt đƣợc trong luận văn này, phần này cũng đề cập công việc và hƣớng nghiên cứu trong tƣơng lai. Tác giả luận văn này xin gửi lời cảm ơn sâu sắc nhất đến TS. Đỗ Văn Thành, Trung tâm thông tin và dự báo Kinh tế - Xã hội Quốc gia - Bộ kế hoạch và đầu LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com -3- tƣ, ngƣời đã hƣớng dẫn tận tình và giúp đỡ tôi rất nhiều trong quá trình thực hiện luận văn này, ngƣời đã mở ra cho tôi những cách tiếp cận mới của công nghệ thông tin vào trong đời sống thực tế. Xin bày tỏ lời cảm ơn tới các thầy TS. Hà Quang Thụy, GS-TSKH. Phan Đình Diệu, PGS-TS. Trịnh Nhật Tiến, PGS-TS. Đoàn Văn Ban, TS. Nguyễn Việt Hà, TS. Hoàng Xuân Huấn, PGS-TS. Nguyễn Văn Bình,TS. Đinh Mạnh Tƣờng, . những ngƣời đã truyền cho tác giả nhiều kiến thức và kinh nghiệm quý báu trong thời gian tác giả theo học cao học tại Trƣờng Đại học Công nghệ. Cuối cùng, xin gửi lời cảm ơn chân thành đến các cán bộ thuộc Tổng cục Thống kê Việt Nam, những ngƣời đã giúp đỡ nhiệt tình trong việc cung cấp số liệu đầy đủ, trung thực phục vụ cho cuốn luận văn này và cũng xin gửi lời cám ơn tới tất cả ngƣời thân trong gia đình, bạn bè đã giúp đỡ trong quá trình học tập và công tác. Tác giả Trần Văn Thái LUAN VAN CHAT LUONG download : add luanvanchat@agmail.com -4- CHƢƠNG 1. CHUỖI THỜI GIAN VÀ PHÂN TÍCH CHUỖI THỜI GIAN. Để phân tích biến động, hành vi của hiện tƣợng qua thời gian, ngƣời ta thƣờng dùng phƣơng pháp phân tích chuỗi các quan sát theo thời gian. Trong phƣơng pháp này thƣờng giả định các giá trị quan sát không độc lập với nhau, ngƣợc lại chính sự phụ thuộc giữa các giá trị quan sát là đặc điểm, cơ sở cho việc xây dựng các phƣơng pháp nghiên cứu và dự báo về chuỗi thời gian. Phân tích chuỗi thời gian có thể đƣợc chia làm hai loại: Phân tích các mức độ theo thời gian và phân tích mối liên hệ nguyên nhân – kết quả. Phƣơng pháp dự báo bằng phân tích mức độ theo thời gian liên quan đến việc dự báo các giá trị tƣơng lai của yếu tố đƣợc nghiên cứu dựa trên sự tƣơng quan với các quan sát trong quá khứ và hiện tại. Trong khi đó phân tích mối liên hệ nhân quả liên quan đến việc xác định các nhân tố khác ảnh hƣởng đến yếu tố muốn dự báo, nhƣ dùng phƣơng pháp phân tích hồi qui bội xem xét GDP phụ thuộc vào lƣợng đầu tƣ trong nƣớc, lƣợng đầu tƣ nƣớc ngoài, dân số… Trong luận văn này, chỉ tập trung chủ yếu vào phân tích mức độ theo thời gian đƣợc dựa trên giả định cơ bản là các yếu tố ảnh hƣởng đến biến động của hiện tƣợng trong quá khứ và hiện tại sẽ còn tiếp tục tồn tại trong tƣơng lai.
Luận Văn Thạc Sĩ: Phát Hiện Tri Thức Theo Mùa Vụ Từ Cơ Sở Dữ Liệu Chuỗi Thời Gian
Luận văn thạc sĩ nghiên cứu vnu uet phát hiện tri thức theo mùa vụ từ cơ sở dữ liệu chuỗi thời gian luận văn ths công nghệ, đánh giá hiện trạng, phân tích vấn đề, đề xuất biện
Trường đại học
Trường Đại học Công nghệChuyên ngành
Kinh tế - Xã hộiNgười đăng
Ẩn danhThể loại
Luận vănPhí lưu trữ
35 PointMục lục chi tiết
THÔNG TIN CHI TIẾT
Tác giả: Trần Văn Thái
Người hướng dẫn: TS. Đỗ Văn Thành
Trường học: Trường Đại học Công nghệ
Chuyên ngành: Kinh tế - Xã hội
Đề tài: Phát Hiện Tri Thức Theo Mùa Vụ Từ Cơ Sở Dữ Liệu Chuỗi Thời Gian
Loại tài liệu: Luận văn
Trích đoạn nội dung tài liệu
Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ