« Home « Kết quả tìm kiếm

Ứng dụng phương pháp phân tích cụm và phân tích biệt số đánh giá nhiễm mặn tầng chứa nước pleistocen ở huyện Tân Thành, tỉnh Bà Rịa - Vũng Tàu


Tóm tắt Xem thử

- ỨNG DỤNG PHƯƠNG PHÁP PHÂN TÍCH CỤM VÀ PHÂN TÍCH BIỆT SỐ ĐÁNH GIÁ NHIỄM MẶN TẦNG CHỨA NƯỚC PLEISTOCEN.
- Nước dưới đất, phân tích cụm, phân tích biệt số, xâm nhập mặn.
- Phương pháp phân tích cụm (Cluster Analysis - CA) và phân tích biệt số (Discriminant Analysis - DA) đã được sử dụng nhằm đánh giá nhiễm mặn nước dưới đất ở khu vực huyện Tân Thành, tỉnh Bà Rịa – Vũng Tàu.
- Các mẫu nước dưới đất được thu thập từ 18 giếng quan trắc vào tháng 4 năm 2012..
- Các thông số chất lượng nước được lựa chọn trong kỹ thuật phân tích thống kê trên bao gồm: pH, độ cứng, TDS, Cl.
- Kết quả phân tích CA nhóm bộ dữ liệu quan trắc thành ba cụm giếng có liên quan đến hoạt động nông nghiệp, hoạt động công nghiệp và sự nhiễm mặn..
- Phân tích biệt số được thực hiện nhằm nghiên cứu sự tồn tại khác biệt có ý nghĩa giữa các cụm, xây dựng hàm phân tích phân biệt và xác định cụm gây ra sự khác biệt giữa các nhóm cụm.
- phương sai các biến phụ thuộc cụm được giải thích bởi mô hình DA..
- Kết quả nghiên cứu đã cho thấy phân tích cụm và biệt số là những phương pháp thống kê hiệu quả trong phân vùng xâm nhập mặn..
- Ứng dụng phương pháp phân tích cụm và phân tích biệt số đánh giá nhiễm mặn tầng chứa nước pleistocen ở huyện Tân Thành, tỉnh Bà Rịa - Vũng Tàu.
- Phân tích thống kê đa biến (MSA - Multivariate Statistics Analysis) bao gồm các kỹ thuật thống kê khác nhau, chẳng hạn như phân tích cụm (CA - Cluster Analysis) và phân tích biệt số (DA - Discriminant Analysis - DA), phân tích nhân tố (FA -Factor Analysis.
- phân tích thành phần chính (PCA - Principal Component Analysis.
- Các phương pháp này giúp giải thích các ma trận dữ liệu phức tạp để hiểu rõ hơn về chất lượng nước, cho phép xác định các nhân tố hoặc nguồn ảnh hưởng đến chất lượng nước và cung cấp một công cụ có giá trị để quản lý và khai thác sử dụng tài nguyên nước..
- Một trong những thuận lợi chính của những kỹ thuật này là khả năng phân tích dữ liệu lớn và phức tạp, có nhiều biến và nhiều đơn vị thí nghiệm..
- Những phương pháp này đôi khi tạo ra các biến mới bằng cách giảm số lượng của các biến ban đầu trong việc so sánh và giải thích các dữ liệu.
- Phân tích cụm (CA) là phương pháp phân loại các đối tượng hay các biến sao cho các đối tượng trong cùng một cụm xét theo các đặc tính được chọn để phân tích.
- Phân tích phân biệt (DA) là phương pháp phân tích dữ liệu khi biến phụ thuộc là biến phân loại và biến độc lập là biến định lượng.
- Phân tích phân biệt đòi hỏi phải biết trước số nhóm và các đối tượng trong mỗi nhóm trước khi tiến hành phân tích, xây dựng hàm phân tích phân biệt, nghiên cứu sự tồn tại khác biệt có ý nghĩa giữa các nhóm, xác định biến độc lập là nguyên nhân lớn nhất gây ra sự khác biệt giữa các nhóm và phân loại các quan sát vào một nhóm nhất định dựa vào giá trị của các biến độc lập..
- Trong những năm gần đây, các phương pháp phân tích cụm và phân tích phân biệt đã được sử dụng rộng rãi trong các ứng dụng môi trường, bao gồm các đánh giá quan trắc diễn biến chất lượng nước ngầm, nước mặt, kiểm tra kết quả các mô hình mô phỏng chất lượng nước theo không gian và thời gian, xác định các yếu tố hóa học liên quan đến các điều kiện thủy văn, và đánh giá các chỉ thị chất lượng môi trường.
- Ở Mỹ và các nước châu Âu như Pháp, Thổ Nhĩ Kỳ (Varol et al., 2012) và các quốc gia ở châu Á như Nhật Bản (Shrestha et al., 2007), Malaysia (Kura et al., 2013), Ấn Độ (Mavukkandy et al., 2014), Trung Quốc (Yang et al., 2015), các nghiên cứu này đã ứng dụng nhiều phương pháp thống kê đa biến đánh giá chất lượng nước mặt, nước dưới đất ở các lưu vực sông dựa vào mối quan hệ giữa các thông số đo đạc với các đặc điểm nguồn thải, đề xuất được các thông số đặc trưng chất lượng nước của lưu vực để giám sát và quản lí hiệu quả..
- Các nghiên cứu trong lĩnh vực môi trường chủ yếu sử dụng phương pháp phân tích hồi quy tuyến tính để xử lí các số liệu phân tích thí nghiệm, kiểm định thông số mô hình mô phỏng.
- Phân tích đánh giá chất lượng nước chỉ dựa vào phương pháp so sánh với qui chuẩn cho phép, phân vùng dựa vào chỉ số chất lượng nước (WQI) và mô hình toán, chưa có nghiên cứu nào sử dụng các kĩ thuật phân tích thống kê đa biến đánh giá chất lượng nước một cách đầy đủ, riêng biệt..
- Huyện Tân Thành đã và đang trở thành một trong ba địa phương có nền kinh tế phát triển bậc nhất tỉnh Bà Rịa – Vũng Tàu, là nơi tập trung nhiều khu công nghiệp nhất của tỉnh.
- Theo số liệu điều tra năm 2012 từ Sở Tài Nguyên và Môi trường tỉnh Bà Rịa - Vũng Tàu thì tổng lưu lượng khai thác nước dưới đất trung bình m 3 /năm, trong đó cấp nước sinh hoạt là 13.174.310m 3 /năm và cho sản xuất là 5.434.120 m 3 /năm, nước được khai thác chủ yếu trong tầng chứa nước lỗ hổng các trầm tích Pleistocen.
- Hai nguyên nhân chính ảnh hưởng đến chất lượng nước dưới đất ở khu vực nghiên cứu là do phía Tây huyện Tân Thành nằm dọc theo sông Thị Vải và hoạt động khai thác nước dưới đất từ các trạm cấp nước lớn (Phú Mỹ - Mỹ Xuân, Tóc Tiên) và nhỏ lẻ thuộc địa bàn.
- một số giếng có độ tổng khoáng hóa tăng cao cho thấy chất lượng nước dưới đất có khả năng chịu sự tác động của quá trình biên mặn lấn sâu vào đất liền và hoạt động phát triển kinh tế - xã hội trên lưu vực..
- Trong nghiên cứu này, các thông số lí hóa của chất lượng nước dưới đất trong tầng chứa nước Pleistocen khu vực huyện Tân Thành, tỉnh Bà Rịa – Vũng Tàu được tập trung phân tích bằng các phương pháp thống kê đa biến (CA và DA).
- Kết quả phân tích cho phép đánh giá thông tin về sự tương đồng trong các trạm quan trắc khác nhau, từ đó xác định các thông số chất lượng nước đặc trưng theo không gian, tác động của các nguồn ô nhiễm trên lưu vực đến chất lượng nước..
- 2 TÀI LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU.
- 2.1 Mô tả vùng nghiên cứu.
- Huyện Tân Thành thuộc tỉnh Bà Rịa – Vũng Tàu, phía Đông giáp huyện Châu Đức, phía Tây giáp huyện Cần Giờ và thành phố Vũng Tàu, phía Nam giáp thành phố Bà Rịa và phía Bắc giáp.
- Hình 1: Sơ đồ vị trí quan trắc huyện Tân Thành, tỉnh Bà Rịa – Vũng Tàu 2.2 Tài liệu nghiên cứu.
- Trong bài báo này, 15 thông số chất lượng nước (Ca 2.
- từ 18 giếng quan trắc chất lượng nước dưới đất trên địa bàn huyện Tân Thành được Sở Tài nguyên và Môi trường tỉnh Bà Rịa – Vũng Tàu thực hiện vào mùa khô năm 2012 (NB2C, NB2A, NB3A, NB1B, NB4, VT2B, NB1A, VT2A, VT6, QT5B, NB2B, QT11, QT7B, NB3B, QT5A, VT4B, QT7A, VT4A) được lựa chọn xử lý và đánh giá.
- Vị trí các giếng quan trắc được trình bày trong sơ đồ vị trí quan trắc ở Hình 1..
- 2.3 Phương pháp phân tích thống kê đa biến và xử lý số liệu.
- Tất cả các tính toán toán học và thống kê được thực hiện bằng cách sử dụng phần mềm Excel 2013 (Microsoft Office).
- Các phân tích CA,.
- 2.3.1 Phân tích cụm (Clustering Analysis - CA) Trong nghiên cứu này, phương pháp phân tích CA được lựa chọn là phương pháp phân tích cụm tích tụ dựa vào phương sai là “thủ tục Ward” trong loại thủ tục phân cụm thứ bậc (Hierarchical clustering).
- Theo thủ tục Ward thì ta sẽ tính giá trị trung bình tất cả các biến cho từng cụm một.
- sau đó, tính khoảng cách Euclid bình phương (Squared Euclidean distance) giữa các phần tử trong cụm với giá trị trung bình của cụm, rồi lấy tổng tất cả các khoảng cách bình phương này.
- Cụ thể hơn, trong phương pháp này khoảng cách hoặc sự.
- 2.3.2 Phân tích biệt số (Discriminant Analysis - DA).
- Phương pháp phân tích phân biệt (DA) là kỹ thuật phân tích dữ liệu khi biến phụ thuộc là biến phân loại và biến độc lập là biến định lượng.
- Mục tiêu của phân tích biệt số là việc xây dựng các hàm phân tích phân biệt hay một hàm tuyến tính kết hợp các biến độc lập sao cho phân biệt rõ các biểu hiện của biến phụ thuộc, nghiên cứu sự tồn tại khác biệt có ý nghĩa giữa các nhóm xét theo biến độc lập, xác định biến độc lập nào là nguyên nhân chính gây ra sự khác biệt giữa các nhóm và phân loại các quan sát này vào trong một nhóm nhất định dựa vào các giá trị của biến độc lập.
- Mô hình phân tích biệt số có dạng tuyến tính như sau:.
- b k X k (2) Trong đó, D là biệt số, b là hệ số hay trọng số phân biệt và X là biến độc lập.
- Các hệ số hay trọng số được tính toán sao cho các nhóm có các giá trị của hàm phân biệt (biệt số D) khác nhau càng nhiều càng tốt.
- 3 KẾT QUẢ VÀ THẢO LUẬN.
- Dựa vào biểu đồ phân tích cụm (Hình 2) và kết quả phân tích phân bố các cụm giếng quan trắc (Bảng 2) cho thấy chất lượng nước của 18 giếng quan trắc được phân thành 3 cụm như sau:.
- Cụm 1 gồm 13 giếng với giá trị trung bình NO 3 - vượt trội hơn so với hai cụm còn lại, hiện tượng này có thể kết luận rằng các giếng thuộc cụm 1 chịu ảnh hưởng khá lớn bởi hoạt động nông nghiệp diễn ra xung quanh khu vực quan trắc.
- Tuy nhiên, giá trị trung NO 3 - đạt 0,827 mg/l vẫn nằm trong quy chuẩn cho phép (<15 mg/l) do đó chất lượng nước thuộc các giếng ở cụm 1 vẫn còn khá tốt (Yang, et al., 2015)..
- Cụm 2 gồm 2 giếng có giá trị Cr 6+ và Cu 2+.
- Cụm 3 gồm 3 giếng mang giá trị Mg 2.
- Đặc biệt, giá trị Cl - và Fe 2+ còn vượt cả quy chuẩn cho phép với Cl - vượt gấp 2,4 lần và Fe 2+ vượt 5,9 lần cho thấy rằng cụm 3 có khả năng chịu ảnh hưởng của quá trình xâm nhập mặn lên các giếng có vị trí gần bờ biển cũng như gần các ranh mặn..
- Hình 2: Biểu đồ phân tích cụm Bảng 2: Bảng phân bố các cụm giếng quan trắc.
- Thông số.
- quan trắc Đơn vị.
- QT5A VT4B, QT7A, VT4A Giá trị trung bình.
- 3.2 Xác định các biến phân biệt có ý nghĩa giữa các cụm.
- Từ kết quả phân tích DA cho thấy các biến thuộc yếu tố nhiễm mặn (TDS, Mg 2.
- chiếm ưu thế hệ số chuẩn hóa, hệ số chuẩn hóa càng lớn thì đóng góp nhiều vào khả năng phân biệt của hàm, các biến này chủ.
- Giá trị Eigenvalue tương ứng của hàm 1 lớn và chiếm 99,1% phương sai giải thích kết quả.
- Bảng 4: Hệ số hàm phân biệt CỤM.
- Nông nghiệp Công nghiệp Nhiễm mặn.
- Biểu đồ phân tán của các nhóm ảnh hưởng đến chất lượng nước dưới đất (Nông nghiệp, Công nghiệp và Xâm nhập mặn) được diễn tả theo hàm thứ nhất và hàm thứ hai của biểu đồ.
- Có thể thấy rõ rằng nhóm 3 (Xâm nhập mặn) có trị số cao nhất theo hàm thứ nhất so với hai nhóm còn lại, vì hàm thứ nhất chủ yếu gắn với các biến (TDS, Mg 2.
- nên có thể thấy rằng nhóm 3 được phân biệt một cách rõ ràng theo các biến này.
- Những giếng mang giá trị cao ở hàm thứ hai có nguy cơ bị nhiễm mặn nhiều hơn so với các giếng còn lại (Hình 3)..
- Có thể thấy rằng trung tâm của nhóm 3 (Xâm nhập mặn) nằm tại vị trí ổn định và ít bị lẫn so với hai nhóm còn lại, dấu hiệu này cho thấy nhóm 3 mang tính đại diện cao nhất cho bộ dữ liệu quan trắc với ba giếng đặc trưng cho yếu tố nhiễm mặn (VT4A, VT4B và QT7A) của chất lượng nước dưới đất năm 2012..
- Hình 3: Sự phân bố các cụm phân biệt Hình 4: Biểu đồ thể hiện giá trị trung tâm của mỗi nhóm.
- Giá trị trung tâm.
- Bên cạnh đó, vào mùa khô, lượng nước bổ cập cho tầng chứa nước là rất ít, hầu như không xảy ra mạnh mẽ như mùa mưa.
- Một nguyên nhân nữa là do mực nước các vùng sông hồ giảm gây khó khăn trong việc khai thác, do đó tần suất khai thác nước dưới đất phục vụ cho sinh hoạt cũng như các hoạt động nông nghiệp, công nghiệp diễn ra với cường độ lớn, góp phần gây suy giảm chất lượng và cạn kiệt nước dưới đất.
- VT4A, VT4B, QT7A là các giếng quan trắc có quan hệ thủy lực với nước sông, có đặc điểm là tầng chứa nước nằm nông, lớp cách nước có nguồn gốc sông - biển và nằm ngay ranh giới mặn – nhạt, theo quy luật thì mùa mưa bị đẩy.
- ra biển và mùa khô xâm nhập mặn sẽ lại tiến sâu vào đất liền gây ảnh hưởng đến chất lượng nước dưới đất khu vực nghiên cứu..
- Hầu hết các giếng quan trắc đều phân bố ở khu vực thuộc loại nước Ca 2.
- Hơn thế nữa, các giếng quan trắc còn có xu hướng trội hơn nghiêng về loại nước Cl.
- đặc biệt một số giếng quan trắc còn mang hàm lượng TDS rất lớn (VT4A, VT4B)..
- Từ đó có thể giả định được rằng kết quả trên có thể là do sự hạ thấp mực nước dưới đất vào mùa khô và quá trình nhiễm mặn đã ảnh hưởng nhất định đến các giếng quan trắc phân bố ở khu vực gần bờ biển..
- Kỹ thuật thống kê đa biến được ứng dụng trong nghiên cứu này như một công cụ hữu hiệu trong việc phân tích và giải thích chất lượng nước, giúp các nhà quản lý hiểu rõ hơn về sự biến đổi theo không gian của chất lượng nước dưới đất, từ đó đưa ra được các giải pháp nhằm quản lý bền vững nguồn tài nguyên nước.
- Kết quả phân tích cụm (CA) đã nhóm 18 giếng quan trắc thành 3 cụm đặc trưng cho chất lượng nước của các giếng quan trắc (hoạt động nông nghiệp, hoạt động công nghiệp và nhiễm mặn) dựa vào đặc tính tương đồng của bộ dữ liệu.
- Phân tích biệt số (DA) tiếp tục kiểm định kết quả phân tích cụm bằng cách xác định các biến phân biệt có ý nghĩa giữa các cụm, giải thích được.
- 99,8% phương sai các biến và chỉ ra nhóm 3 (VT4A, VT4B, QT7A) mang tính đại diện cao nhất cho bộ dữ liệu ban đầu..
- Nghiên cứu này được thực hiện bởi sự hỗ trợ dữ liệu từ Sở Tài nguyên và Môi trường tỉnh Bà Rịa – Vũng Tàu..
- Phân tích dữ liệu nghiên cứu với SPSS.
- Bước đầu áp dụng kỹ thuật phân tích thống kê đa biến phân tích số liệu chất lượng nước lưu vực sông Thị Tính, tỉnh Bình Dương.
- Sở Tài nguyên và Môi trường tỉnh Bà Rịa – Vũng Tàu, 2013.
- Báo cáo “Vận hành mạng quan trắc nước dưới đất tỉnh Bà Rịa – Vũng Tàu giai đoạn