« Home « Kết quả tìm kiếm

Một mô hình mờ hóa chuỗi thời gian cải tiến


Tóm tắt Xem thử

- MỘT MÔ HÌNH MỜ HÓA CHUỖI THỜI GIAN CẢI TIẾN.
- Dự báo, chuỗi thời gian mờ, mờ hóa, sự biến đổi của dữ liệu.
- Dựa trên những cải tiến trong việc xây dựng tập nền, mối quan hệ của mỗi phần tử trong chuỗi và nguyên tắc giải mờ, bài viết này đề xuất một mô hình mờ hóa dữ liệu chuỗi thời gian.
- Các tham số trong mô hình đề nghị được xem xét để có thể ứng dụng trong thực tế và được minh họa cụ thể qua các bước thực hiện bởi ví dụ số.
- Mô hình đề nghị có ưu điểm hơn một số mô hình phổ biến được sử dụng hiện tại qua nhiều tập dữ liệu chuẩn được xem xét.
- Nó cũng được áp dụng trong dự báo đỉnh mặn cho một tỉnh ven biển Đồng bằng sông Cửu Long.
- Áp dụng này cũng cho thấy tiềm năng trong dự báo của mô hình được nghiên cứu..
- Một mô hình mờ hóa chuỗi thời gian cải tiến.
- Dự báo là việc tiên đoán những kết quả sẽ xảy ra trong tương lai dựa vào số liệu quá khứ và một qui tắc được thiết lập.
- Chính vì vậy, dự báo luôn nhận được sự quan tâm của các nhà quản lý, các nhà khoa học.
- Trong thống kê để thiết lập mô hình dự báo, chúng ta phải dựa vào số liệu quá khứ.
- Trong các loại dữ liệu, chuỗi thời gian được lưu trữ phổ biến và có nhu cầu rất lớn trong thực tế cho dự báo..
- Với dữ liệu này, hai mô hình chính được sử dụng để dự báo là hồi quy và chuỗi thời gian.
- Mô hình hồi quy có những ràng buộc về điều kiện của dữ liệu mà trong thực tế rất khó thỏa mãn, do đó nó có hạn chế trong nhiều trường hợp (Box and Jenkins, 1970;.
- Mô hình chuỗi thời gian (TSM) được đánh giá có nhiều ưu điểm hơn nên được sử dụng rất phổ biến ngày nay.
- Nhiều nhà nghiên cứu đã sử dụng các mô hình TSM như tự hồi quy (AR), mô hình tự hồi quy trung bình trượt (ARIMA) để ứng dụng trong kinh tế, môi trường và thuỷ văn (Huarng, 2001.
- Tuy nhiên, để xây dựng được mô hình TSM tốt thì dữ liệu phải dừng và sai số của nó phải là ồn trắng.
- Do đó, nhiều trường hợp cho kết quả dự báo kém khi sử dụng các mô hình TSM.
- (2013), Oliveira and Ludermir (2014) đã cố gắng cải thiện mô hình ban đầu, nhưng họ vẫn còn gặp nhiều khó khăn để thực hiện dự báo hợp lý cho nhiều dữ liệu thực tế.
- Cho đến nay, một mô hình có thể được đánh giá tốt hơn các mô hình khác dựa trên từng dữ liệu cụ thể mà không phải cho tất cả các trường hợp..
- Một vấn đề khác là các mô hình TSM truyền thống không thể giải quyết các vấn đề dự báo, nơi các dữ liệu lịch sử được trình bày bằng các biến ngôn ngữ.
- Các mô hình chuỗi thời gian mờ (FTS) đã giải quyết nhược điểm này.
- Các mô hình FTS được phát triển theo hai hướng chính.
- Hướng thứ nhất là xây dựng các mô hình từ dữ liệu gốc và sử dụng nó để dự báo cho tương lai một cách trực tiếp.
- Hướng thứ hai là sự mờ hoá dữ liệu gốc để có được mối quan hệ giữa các phần tử trong chuỗi, sau đó áp dụng các mô hình dự báo đã biết cho dữ liệu đã mờ hóa này.
- Theo hướng thứ hai, mô hình FTS thông thường bao gồm ba giai đoạn: (i) xác định tập nền từ dữ liệu gốc, chia khoảng cho tập nền và tìm số lượng các phần tử cho mỗi khoảng.
- Đối với (i), nhiều tác giả đã sử dụng giá trị nhỏ nhất và giá trị lớn nhất của dữ liệu ban đầu để xác định tập nền (Chen, 1996.
- Một cách khác để xây dựng tập nền là dựa trên sự thay đổi dữ liệu giữa các khoảng thời gian liên tiếp hoặc tỷ lệ phần trăm thay đổi (Abbasov and Mamedova, 2003).
- Nhiều tác giả khác đã chia số tập mờ bằng cách kiểm tra trong nhiều trường hợp để có các thông số đánh giá thích hợp cho từng dữ liệu mà không phải là một quy tắc chung cho tất cả các trường hợp (Singh, 2007;.
- Bài báo này đóng góp cho ba giai đoạn (i), (ii) và (iii) đối với mô hình FTS.
- Đây là sự đóng góp cho giai đoạn (iii) của mô hình chuỗi thời gian mờ.
- Kết hợp tất cả các cải tiến, bài viết này đề nghị mô hình mờ hóa dữ liệu chuỗi tốt hơn so với các mô hình hiện có thông qua nhiều bộ dữ liệu khác nhau được xem xét.
- Một đóng góp quan trọng của mô hình này là việc ứng dụng mô hình đề nghị dự báo đỉnh mặn tại hai trạm đo chính của tỉnh Trà Vinh.
- Phần 2 xem xét một số khái niệm cơ bản về mô hình FTS, đề xuất mô hình mới và một số vấn đề liên quan đến mô hình này.
- Phần 3 minh họa thuật toán đề nghị và so sánh nó với các mô hình khác qua một số bộ số liệu chuẩn quan trọng.
- Cho một chuỗi dữ liệu thực tế {X i } và giá trị dự đoán tương ứng { Xi.
- n, khi đó ta có các tiêu chuẩn sau để đánh giá các mô hình FTS:.
- Khi thực hiện dự báo, mô hình nào có các tiêu chuẩn trên càng nhỏ thì nó càng tốt..
- 2.2 Thuật toán đề nghị.
- n  Dựa vào bài toán phân tích chùm, mô hình FTS được đề nghị với 6 bước như sau:.
- Bước 1: Tìm phần trăm biến đổi dữ liệu giữa hai thời gian liên tiếp..
- là trung bình các khoảng cách Euclide của các điểm dữ liệu và  là.
- 0 thì tập dữ liệu có kích thước n sẽ có n khoảng chia.
- thì tập dữ liệu có duy nhất một khoảng chia.
- Sau khi các bước lặp kết thúc, mỗi phần tử trong dữ liệu sẽ hội tụ về phần tử đại diện của chùm mà phần tử đó thuộc.
- Bước 3.2: Tính khoảng cách từ mỗi phần tử đến trọng tâm của mỗi chùm.
- Bước 4: Xác định tập nền U cho dữ liệu dựa vào công thức:.
- Bước 6: Dự báo cho tập Y theo quy tắc:.
- n Bước 7: Tính toán giá trị dự báo FX t theo công thức:.
- Trong phần này dữ liệu tuyển sinh (Enrollment) của trường Đại học Alabama được sử dụng để minh họa cho thuật toán đề nghị.
- Dữ liệu này đã được sử dụng trong nhiều nghiên cứu về mô hình FTS như Song and Chisson (1993), Chen (1996), Huarng (2001), Singh (2007.
- Nó thường được lấy làm dữ liệu chuẩn để để so sánh hiệu quả của các mô hình FTS.
- Bảy bước của mô hình đề nghị được trình bày như sau:.
- Bảng 1: Phần trăm biến đổi Y giữa hai năm liên tiếp của dữ liệu Enrollment.
- Bước 2: Sử dụng thuật toán tìm số chùm thích hợp cho 21 phần tử của Y .
- Bước 3: Sử dụng thuật toán phân tích chùm 13- trung bình để xác định các phần tử và tính trọng tâm cho mỗi chùm ta được kết quả như Bảng 2..
- Bảng 2: Các phần tử và trọng tâm của 13 chùm.
- Chùm Phần tử Trọng tâm (c i.
- c và c ta xác định được tập nền cho dữ liệu Y như sau:.
- U 13 được kết quả:.
- Bảng 4: Kết quả mờ hóa dữ liệu Enrollment của thuật toán đề nghị.
- Bước 7: Dự báo.
- Sử dụng công thức (8), ta tính được:.
- Bên cạnh dữ liệu Enrollment, bài viết này sử dụng nhiều tập dữ liệu chuẩn khác nhau để so sánh mô hình đề nghị với các mô hình phổ biến khác.
- Đó là các tập dữ liệu Actual và NYSE.
- Đây là những tập dữ liệu phổ biến được sử dụng để đánh giá hiệu quả.
- của các mô hình trong nhiều bài báo (Tai, 2018)..
- Mỗi tập dữ liệu được chia thành 2 phần: Tập huấn luyện và tập kiểm tra với tỉ lệ lần lượt là 80% và 20%.
- Tập huấn luyện được sử dụng để xây dựng các mô hình khác nhau, trong đó có mô hình đề nghị..
- Tập kiểm tra được sử dụng để đánh giá hiệu quả của việc mờ hóa.
- Dự báo từ số liệu gốc, số liệu mờ hóa cho mô hình ARIMA (ARIMAR, ARIMAP), dự báo từ số liệu gốc, số liệu mờ hóa cho mô hình AM (AMR, AMP), dự báo từ số liệu gốc, số liệu mờ hóa cho mô hình IFTS (IFTSR, IFTSP) để so sánh với số liệu thực của tập kiểm tra..
- Bảng 5: So sánh mô hình đề nghị và các mô hình khác cho tập huấn luyện.
- Dữ liệu Phương pháp MAE MAPE MSE.
- Mô hình đề nghị .
- Bảng 6: So sánh mô hình đề nghị và các mô hình khác cho tập kiểm tra.
- Bảng 5 cho thấy trong giai đoạn mờ hóa của tập huấn luyện, mô hình đề nghị luôn cho kết quả tốt nhất với cả 3 bộ dữ liệu.
- Bảng 6 cho thấy với tập kiểm tra của cả ba bộ số liệu, khi sử dụng số liệu mờ hóa từ mô hình đề nghị, những mô hình dự báo đều cho kết quả tốt hơn mô hình gốc (ARIMAP, AMP, IFTSP), trong đó ARIMAP cho kết quả tốt nhất với Enrollment và AMP cho kết quả tốt nhất với Actual..
- 4 ÁP DỤNG TRONG DỰ BÁO ĐỈNH MẶN TỈNH TRÀ VINH.
- Để hạn chế tác hại này, trước hết chúng ta phải có được dự báo đúng mức độ sự xâm nhập mặn, từ đó có biện pháp đối phó phù hợp.
- Mặc dù được sự quan tâm của các nhà quản lý và các nhà khoa học, nhưng việc dự báo xâm nhập mặn của tỉnh Trà Vinh cũng như các địa phương khác trong cả nước còn nhiều hạn chế.
- Trong phần này, bài viết sử dụng dữ liệu quá khứ (Bảng 7) và mô hình đề nghị để dự báo đỉnh mặn tại hai trạm đo chính của tỉnh Trà Vinh là Cầu Quan và Trà Vinh..
- i) Đánh giá mô hình: Chia dữ liệu ban đầu thành tập huấn luyện và tập kiểm tra với tỉ lệ lần lượt là 80% và 20%.
- Mờ hóa dữ liệu tập huấn luyện bằng mô hình đề nghị, sau đó sử dụng các mô hình ARIMA và AM để dự báo trên số liệu gốc và số liệu mờ hóa cho tập kiểm tra.
- ii) Dự báo: Sử dụng toàn bộ dữ liệu để mờ hóa bằng mô hình đề nghị.
- Sau đó, dùng mô hình ARIMA trên bộ số liệu này để dự báo đỉnh mặn tại các trạm đo cho đến năm 2025..
- Bảng 8 và Bảng 9 cho thấy số liệu dự báo đỉnh mặn tại trạm đo Cầu Quan trên tập huấn luyện và tập kiểm tra theo mô hình đề nghị đều cho kết quả tốt nhất.
- Đối với trạm đo Trà Vinh, mặc dù số liệu dự báo trên tập huấn luyện của mô hình đề nghị không phải là tốt nhất nhưng trên tập kiểm tra thì nó đạt được kết này.
- Chính vì vậy, mô hình ARIMAP được chọn để dự báo cho tương lai..
- Sử dụng toàn bộ dữ liệu để mờ hóa từ mô hình đề nghị, lấy số liệu nhận được từ kết quả này dự báo đỉnh mặn đến năm 2025 cho hai trạm bằng mô hình ARIMA, ta có được Bảng 10..
- Bảng 10: Kết quả dự báo đỉnh mặn tại các trạm đo.
- Bảng 10, Hình 1 và Hình 2 cho thấy dữ liệu đỉnh mặn ở cả hai trạm không có sự biến động nhiều, có xu hướng tăng trong những năm tiếp theo.
- Trong đó, đỉnh mặn tại trạm đo Cầu Quan được dự báo là tăng mạnh hơn..
- Hình 1: Đồ thị đỉnh mặn thực tế và dự báo tại trạm Cầu Quan Mặc dù kết quả thực hiện từ tập kiểm tra (Bảng.
- 9) cho thấy mô hình đề nghị có độ tin cậy tương đối tốt, tuy nhiên chúng ta cần phải so sánh từ số liệu.
- thực tế tương lại mới có thể đánh giá được hiệu quả thực sự của mô hình đề nghị..
- Hình 2: Đồ thị đỉnh mặn thực tế và dự báo tại trạm Trà Vinh 5 KẾT LUẬN.
- Bài báo này đề nghị một mô hình mờ hóa dữ liệu chuỗi thời gian dựa trên cải tiến từ những bước chính của các mô hình hiện tại.
- Các bước của mô hình đề nghị được trình bày cụ thể về mặt lý thuyết và được minh họa chi tiết trên số liệu thực.
- Thông qua các tham số MSE, MAE và MAPE, thực hiện cho nhiều bộ số liệu chuẩn, mô hình đề nghị đã cho kết quả tốt hơn các mô hình đang được sử dụng phổ biến.
- Áp dụng thực tế của mô hình đề nghị có thể thực hiện tương tự trong dự báo cho rất nhiều vấn đề thực tế khác.
- Trong tương lai, chúng tôi tiếp tục thử nghiệm mô hình đề nghị để dự báo cho nhiều vấn đề thực tế đang đòi hỏi cấp thiết.