« Home « Kết quả tìm kiếm

Nghiên cứu ứng dụng thuật toán di truyền (Genetic Algorithm) trong dự báo chất lượng không khí.


Tóm tắt Xem thử

- Mô hình mạng thần kinh nhân tạo.
- Thiết kế và chạy mô hình.
- Thiết kế và chạy mô hình FFNN.
- Thiết kế và chạy mô hình FFNN có kết hợp GA.
- Đánh giá độ tin cậy của mô hình.
- Dự báo chất lƣợng không khí sử dụng FFNN.
- Dự báo đối với SO2.
- Độ tin cậy của mô hình đối với SO2.
- Dự báo đối với PM10.
- Độ tin cậy của mô hình đối với PM10.
- Dự báo chất lƣợng không khí sử dụng FFNN kết hợp với GA.
- Độ tin cậy của mô hình GA-FFNN dự báo SO2.
- Độ tin cậy của mô hình GA-FFNN dự báo PM10.
- Mô hình nơ-ron nhân tạo.
- Tƣơng quan với giá trị đo của kết quả dự báo bằng mô hình FFNN(1-2-1) đối với SO2.
- Tƣơng quan với giá trị đo của kết quả dự báo bằng mô hình FFNN(1-5-1) đối với SO2.
- Tƣơng quan với giá trị đo của kết quả dự báo bằng mô hình FFNN(1-10-1) đối với SO2.
- Tƣơng quan với giá trị đo của kết quả dự báo bằng mô hình FFNN(1-20-1) đối với SO2.
- Tƣơng quan với giá trị đo của kết quả dự báo bằng mô hình FFNN (1-2-1) đối với PM10.
- Tƣơng quan với giá trị đo của kết quả dự báo bằng mô hình FFNN (1-5-1) đối với PM10.
- Tƣơng quan với giá trị đo của kết quả dự báo bằng mô hình FFNN (1-10-1) đối với PM10.
- Tƣơng quan với giá trị đo của kết quả dự báo bằng mô hình FFNN (1-20-1) đối với PM10.
- Do đó dự báo chất lƣợng không khí là cần thiết để phòng ngừa và hạn chế các tác động xấu có thể xảy ra.
- Hiện nay, hai loại mô hình đƣợc sử dụng phổ biến để dự báo chất lƣợng không khí là: mô hình tham số (parametric/statistical model) và mô hình số trị (numerical model) [18].
- Trong đó, mô hình dự báo số trị dựa trên động lực học khí quyển có thể dự báo đƣợc sự đóng góp của nồng độ các chất ô nhiễm nhờ mô phỏng sự di chuyển và biến đổi hóa học của chúng trong không khí.
- Chính vì vậy, loại mô hình này cung cấp thông tin một cách chi tiết về tình trạng chất lƣợng không khí trên diện rộng, ngay cả những nơi không có trạm quan trắc.
- Tuy nhiên, để xây dựng và vận hành các mô hình này yêu cầu cao về cơ sở hạ tầng, cũng nhƣ chuyên môn của ngƣời sử dụng do lƣợng dữ liệu đầu vào của mô hình rất lớn và phức tạp.
- Trong khi đó, mô hình tham số hay còn gọi là mô hình thống kê khá đơn giản và không đòi hỏi quá cao về cơ sở hạ tầng do nó dựa trên sự phân tích thống kê dữ liệu chất lƣợng không khí trong quá khứ (đƣợc lƣu lại trên các trạm quan trắc chất lƣợng không khí).
- Hiện nay, rất nhiều mô hình dự báo thống kê chất lƣợng không khí đã đƣợc nghiên cứu và ứng dụng thành công tại nhiều quốc gia cho thấy tiềm năng rất lớn của chúng trong lĩnh vực này.
- việc xác định kiến trúc ANN tối ƣu là không đơn giản và chủ yếu phụ thuộc vào kinh nghiệm của ngƣời xây dựng, mà kiến trúc này có ảnh hƣởng rất lớn đến hiệu suất dự báo của mô hình.
- Chính vì thế, việc ứng dụng ANN cũng nhƣ sự kết hợp ANN với GA để dự báo chất lƣợng không khí đã đƣợc chọn làm nội dung nghiên cứu của luận văn.
- Đánh giá khả năng ứng dụng mạng thần kinh nhân tạo (ANN) trong dự báo chất lƣợng không khí - Đánh khả năng kết hợp thuật toán di truyền vào mạng thần kinh nhân tạo trong dự báo chất lƣợng không khí.
- Mô hình mạng nơ-ron truyền thuận-FFNN - Mô hình FFNN kết hợp GA 3 CHƢƠNG 1: TỔNG QUAN Để dự báo chất lƣợng không khí có thể sử dụng nhiều loại mô hình nhƣ: mô hình hực nghiệm hay mô hình tham số (thống kê).
- Có thể khái quát ƣu nhƣợc điểm một số mô hình dự báo cơ bản nhƣ sau [3-30]: Mô hình dự báo Ƣu điểm Nhƣợc điểm Phƣơng pháp dự báo thực nghiệm đơn giản: Mô hình chuẩn tắc Thời gian tính toán nhỏ.
- Không thể sử dụng một cách độc lập Mô hình khí tƣợng Thời gian tính toán nhỏ.
- Mô hình kinh nghiệm Thời gian tính toán nhỏ.
- Là một trong những phƣơng pháp mạnh để dự báo các trƣờng hợp ô nhiễm cao.
- Không thể dự báo chính xác đƣợc nồng độ chất cần dự báo.
- Mô hình tham số (thống kê) Mô hình phân lớp và cây hồi quy (CART) Thời gian tính toán nhỏ.
- Dự báo tốt đối với phạm vị hẹp.
- Không thể dự báo đƣợc các trƣờng hợp có sự cố.
- Không thích hợp với trƣờng hợp dự báo khu vực lớn.
- Dự báo tốt trong khu vực nhỏ.
- Chất lƣợng dự báo tốt.
- Dự báo tốt đối với khu vực nhỏ.
- Độ chính xác khi dự báo sự cố không cao.
- Hạn chế trong việc dự báo quy mô lớn.
- Qua đây nhận thấy tiềm năng lớn của mô hình ANN trong dự báo chất lƣợng không khí tại Việt Nam vì bộ dữ liệu của Việt Nam còn bị hạn chế về số lƣợng và chất lƣợng.
- Cấu tạo của tế bào nơ-ron Với mục đích tạo ra một mô hình tính toán phỏng theo cách làm việc của nơ-ron trong bộ não con ngƣời, vào năm 1943 tác giả McCulloch và Pitts đã đề xuất một mô hình toán cho một nơ-ron nhƣ sau: Hình1.2.
- Mô hình nơ-ron nhân tạo Nó đƣợc cấu tạo từ các thành phần sau.
- Mô hình mạng thần kinh nhân tạo 1.1.2.1.
- Vấn đề học quá khớp (overfitting): đây là một vấn đề thƣờng xuyên gặp phải không chỉ của ANN mà còn của các mô hình thống kê dữ liệu.
- Vì vậy, học quá khớp là một vấn đề không mong muốn đối với bất kỳ một mô hình thống kê nào, trong đó có ANN do nó không khái quát đƣợc kiến thức (thông tin) cho các trƣờng hợp khác.
- Ứng dụng của ANN và GA trong dự báo chất lƣợng không khí a.
- Tổng quan tình hình nghiên cứu ứng dụng ANN và GA trong dự báo chất lƣợng không khí 17 Hiện nay để dự báo số liệu theo chuỗi thời gian với các biến ngẫu nhiên, rất nhiều dạng mô hình đã đƣợc sử dụng trong đó ANN đƣợc sử dụng rộng rãi vì nó dựa trên các số liệu từ quá khứ và làm việc tốt với các dữ liệu phi tuyến [22].
- Tuy nhiên, nhƣ đã phân tích ở trên, nhƣợc điểm lớn nhất của ANN chính là việc xác định các tham số cấu trúc của mạng (tốc độ học, số lớp ẩn/ số nơ-ron ẩn…) là tƣơng đối khó khăn và có ảnh hƣởng lớn đến độ tin cậy của mô hình.
- Các thông số chủ yếu đƣợc dự báo trong chất lƣợng không khí là SO2 [28], NOx [25], O3 [20-26], PM10 [19] và các thông số khí tƣợng thủy văn [11], nhiệt độ không khí [8].
- Độ chính xác của các mô hình đều đạt đƣợc trên 85%.
- Điều này cho thấy trong tất cả các trƣờng hợp mô hình ANN cho kết quả dự báo chính xác hơn.
- Mặc dù kết quả của mô hình là rất khả quan, tuy nhiên, vẫn còn có một số những tồn tại cần giải quyết: Tác giả chỉ mới quan tâm đến nồng độ ô zôn trong khoảng thời gian từ 6h00 đến 9h00 sáng, mà theo phân tích đây là thời gian nguồn ô nhiễm (giao thông) hoạt động mạnh nhất.
- Kết quả của mô hình là nồng độ ô zôn trung bình trong thời gian từ 6h00 đến 9h00, không mang ý nghĩa nhiều trong công tác cảnh báo.
- Mô hình dự báo chất lƣợng không khí cho thành phố Palermo, Italy: Trong nghiên cứu, tác giả ứng dụng Elman - ANN để phát triển một mô hình dự báo nồng độ một số chất ô nhiễm điển hình trong không khí cho 02 ngày kế tiếp bao gồm SO2, O3, PM10, NO2 và CO cho thành phố Palermo, Italy.
- Trong nghiên cứu, tác giả nghiên cứu kiểm chứng giữa 02 mô hình ANN (MLP và Elman-NN).
- Mô hình dự báo đƣợc xây dựng dựa trên mạng thần kinh nhân tạo Elman (1990).
- Để đánh giá độ tin cậy của mô hình nghiên cứu, tác giả đã ứng dụng thử nghiệm trên đối tƣợng khí ô nhiễm SO2 và so sánh một số chỉ số thống kê (độ lệch trung bình tuyệt đối – MAE.
- Kết quả so sánh cho thấy, hiệu năng của MLP kém ổn định hơn so với Elman, cá biệt tại một số trạm nhƣ Dibsali chỉ số RMSE lên đến 329,43 μg/m3 và hệ số tƣơng quan r chỉ đạt 0,28 trong khi đó mô hình Elman là 17,14 μg/m3 và 0,94 tƣơng ứng.
- Đối với 07 trạm còn lại, kết quả dự báo của mô hình Elman là tƣơng đƣơng hoặc tốt hơn.
- Chính vì vậy, tác giả đã lựa chọn mạng thần kinh Elman với cấu trúc gồm 09 nơ ron đầu vào bao gồm 05 thông số cần dự báo và 04 thông số có ảnh hƣơng đến biến động nồng độ các chất ô nhiễm cần dự báo nhƣ VOC, và một số thông số khí tƣợng để xây dựng mô hình dự báo chất lƣợng không khí cho thành phố Palermo, Italy.
- Kết quả thử nghiệm đối với bộ dữ liệu nghiên cứu cho thấy hệ số tƣơng quan của tất cả các thông số dự báo (SO2, O3, NO2, CO, PM10) tại các trạm là khá tốt, nằm trong khoảng từ 0,72 đến 0,97.
- Độ lệch chuẩn của kết quả dự báo MAE tƣơng đối nhỏ, nằm trong khoảng 0,09 đến 5,58 [76].
- Mô hình một lần nữa đã chứng minh đƣợc điểm mạnh của việc ứng dụng ANNs trong dự báo thống kê chất lƣợng không khí.
- Tuy nhiên, việc xây dựng mô hình này cũng vẫn còn tồn tại một số nhƣợc điểm cần khắc phục: Xem xét quá ít thông số ảnh hƣởng đến sự biến động các chất ô nhiễm cần dự báo, đặc biệt là O3, NO2 và CO, chính vì vậy, các chỉ sô kiểm tra thống kê nhƣ MAE, RMSE, MSE và r của các thông số này thƣờng kém hơn.
- Mô hình dự báo nồng độ ô zôn cho thành phố Athens, Hi Lạp.
- Trong nghiên cứu, tác giả phát triển đồng thời 02 mô hình (Mô hình hồi quy đa tuyến tính MLR và mạng thần kinh nhân tạo ANN) để dự báo nồng độ ô zôn mặt đất tại thành phố Athens.
- Mô hình sử dụng 03 biến đầu vào tƣơng ứng gồm: nồng 21 độ O3.
- Kết quả dự báo của mô hình MLR và ANN cho thấy độ tin cậy của 02 mô hình này là tƣơng đƣơng, mô hình ANN có tốt hơn nhƣng không đáng kể, cụ thể: đối với chỉ số RMSE mô hình MLR là 25,5 μg/m3 và ANN là 25,1 μg/m3.
- hệ số tƣơng quan của kết quả dự báo so với số liệu thực lần lƣợt là 0,653 đối với mô hình MLR và 0,666 đối với mô hình ANN.
- Đối với xu hƣớng biến động nồng độ O3 dự báo của cả hai mô hình so với thực tế có sự tƣơng quan tƣơng đối tốt [18].
- Tuy nhiên, cũng cùng chung nhƣợc điểm với 02 mô hình trên.
- Mô hình nghiên cứu sử dụng quá ít các thông số đầu vào, chƣa quan tâm đến sự biến đổi hóa học của chất ô nhiễm, trong khi đó O3 là một chất ô nhiễm thứ cấp, đƣợc sinh ra do phản ứng quang hóa của các NOx theo chu trình NO2 – NO – O3 [80].
- Mô hình dự báo nồng độ CO tại Tehran, Iran.
- Kết quả nghiên cứu cho thấy, hiệu năng của các mô hình ANN đã nghiên cứu gồm ANN, ANFIS là khá tốt, độ lệch trung bình (MAE) nằm trong khoảng 0,34 đến 0,42 đối với ANN và 0,37 đến 0,48.
- hệ số tƣơng quan nằm trong khoảng từ 0,87 đến 0,9 đối với mô hình ANN và 0,88 đến 0,91 đối với mô hình lai.
- Chính vì vậy, kết quả dự báo là rất tốt.
- Mô hình dự báo nồng độ O3tại Oporto, Bồ Đào Nha Trong nghiên cứu này, thuật toán di truyền GA đƣợc sử dụng để xác định cấu trúc mạng thần kinh nhân tạo ANN cụ thể là xác định hàm kích hoạt trong lớp ẩn và số nơ-ron trong lớp ẩn.
- Mô hình đã xem xét đƣợc cụ thể và đầy đủ các thông số chất ô nhiễm và khí tƣợng ảnh hƣởng đến nông độ O3.
- Đây là một kết quả dự báo rất tốt.
- 23 CHƢƠNG 2: PHƢƠNG PHÁP NGHIÊN CỨU Quy trình nghiên cứu Bộ dữ liệu chất lƣợng không khí 2002-2010 Đánh giá độ tin cậy của mô hình Mục tiêu 1: Đánh giá khả năng ứng dụng FFNN để dự báo chất lƣợng không khí Chạy thử và hiệu chỉnh mô hình lựa chọn các tham số mô hình Mục tiêu 2: Đánh giá khả năng ứng dụng GA vào ANN để dự báo chất lƣợng không khí Xây dựng mô hình FFNN Thiết kế kiến trúc mạng Xây dựng mô hình FFNN-GA Thiết kế kiến trúc mạng Chạy mô hình với tham số tối ƣu Kế quả dự báo chất lƣợng không khí 24 2.1.
- Dữ liệu đầu vào mô hình (input data): tùy thuộc vào mục tiêu dự báo đầu ra (output data) mà lựa chọn đầu vào dựa trên kinh nghiệm của các nghiên cứu trƣớc đó và mối tƣơng quan giữa nồng độ các chất ô nhiễm với các chất khác và các yếu tố khí tƣợng thủy văn.
- Trong luận văn này, chỉ các dữ liệu nồng độ các chất ô nhiễm đƣợc sử dụng để làm dữ liệu đầu vào của mô hình.
- Dựa vào những phân tích trên, hai thông số gồm SO2 và PM10 đã đƣợc lựa chọn để nghiên cứu mô hình FFNN và mô hình GA-FFNN trong giai đoạn từ đến với lí do: PM10 và SO2 là 2 thông số ô nhiễm điển hình [34] có liên quan mật thiết với nhau [35].
- Thiết kế và chạy mô hình 2.2.1.
- Thiết kế và chạy mô hình FFNN 2.2.1.1 Cấu trúc mạng Mô hình dự báo đƣợc xây dựng trên nền Matlab©2010b dựa trên kiến trúc chuẩn FFNN bao gồm 3 lớp: 01 lớp đầu vào (input layer): với 01 nơ-ron (nồng độ chất ô nhiễm Ct-n trong quá khứ) 01 lớp ẩn (hiden layer): số nơ ron thay đổi lớp đầu ra (output layer): là nồng độ chất ô nhiễm cần dự báo.
- Thiết kế mạng trên chƣơng trình Matlab Mô hình đƣợc thiết kế trên Matlab với trình tự sau.
- Truy xuất kết quả đầu ra của mô hình trên bộ dữ liệu kiểm tra (testing) theo cú pháp: outputs=net(input_test.
- Thiết kế và chạy mô hình FFNN có kết hợp GA Nhƣ đã trình bày ở trên, thuật toán di truyền (GA) đƣợc sử dụng để tối ƣu hóa cấu trúc của mạng FFNN, mà cụ thể là tối ƣu hóa số lƣợng nơ-ron trong lớp ẩn.
- Đánh giá độ tin cậy của mô hình Các chỉ tiêu thống kê gồm: Độ lệch trung bình tuyệt đối (MAE), căn bậc hai sai số bình phƣơng trung bình (RMSE, nRMSE), độ chính xác tuyệt đối (MAPA) và chỉ số tƣơng đồng (IA) đƣợc sử dụng để đánh giá độ tin cậy của kết quả dự báo từ mô hình nghiên cứu, theo các phƣơng trình sau: a.
- Độ lệch trung bình tuyệt đối: MAE (Mean Absolute Error) 11NiiiMAE O PN Trong đó Oi là giá trị đo đạc, Pi là giá trị dự báo 34 Chỉ số MAE cho biết biên độ trung bình của sai số mô hình.
- Khi MAE=0, giá trị mô hình hoàn toàn trùng khớp với giá trị quan trắc.
- Nếu RMSE càng gần MAE sai số mô hình càng ổn định

Xem thử không khả dụng, vui lòng xem tại trang nguồn
hoặc xem Tóm tắt