« Home « Kết quả tìm kiếm

Lựa chọn tham số phân đoạn phù hợp để phân loại ảnh vệ tinh đa phổ Landsat 8 OLI


Tóm tắt Xem thử

- Ảnh đa phổ Landsat 8, eCognition, Nearest neighbor, phân đoạn Multiresolution, Scale, Shape.
- Nghiên cứu này lựa chọn các tham số phân đoạn phù hợp đối với ảnh vệ tinh đa phổ Landsat 8 để phân loại thảm phủ/sử dụng đất (LULC-Land Use Land Cover).
- Đầu tiên thuật toán phân đoạn đa phân giải (Multiresolution) được sử dụng để phân đoạn ảnh theo các mức độ khác nhau.
- Hai tham số được sử dụng để phân đoạn ảnh là tham số quy mô (Scale) và tham số hình dạng (Shape).
- Nghiên cứu đã thử nghiệm phân đoạn với các cấp độ khác nhau của hai tham số này.
- Sau đó sử dụng thuật toán Nearest Neighbor để phân loại ảnh thành 7 lớp thảm phủ/sử dụng đất dựa vào vùng mẫu đã được lựa chọn trên thực địa và dữ liệu có sẵn.
- Cuối cùng sử dụng bộ dữ liệu độc lập để đánh giá kết quả phân loại dựa vào độ chính xác toàn bộ (Overall Accuracy) và hệ số Kappa.
- Lựa chọn tham số phân đoạn phù hợp để phân loại ảnh vệ tinh đa phổ Landsat 8 OLI.
- Phân loại ảnh vệ tinh dựa vào pixel (pixel- based) là phương pháp truyền thống, trong thời gian gần đây phương pháp phân loại theo hướng đối tượng (object-based) cũng chứng tỏ được hiệu quả trong việc sử dụng các thuật toán phân loại nhằm nâng cao độ chính xác kết quả phân loại như Nguyễn Văn Thị và Trần Quang Bảo (2014), Machala and Zejdová (2014)..
- Kavzoglu và Yildiz (2014) đã chỉ ra phân loại theo hướng đối tượng là một quá trình gồm các bước phân đoạn và phân loại lặp đi lặp lại nhiều lần để làm tăng giá trị của thông tin phân tích và đủ điều kiện để đáp ứng các yêu cầu cụ thể của người sử dụng.
- Phân đoạn ảnh được sử dụng để hợp nhất các điểm ảnh vào các đối tượng, sau đó quá trình phân loại sẽ được thực hiện dựa trên các đối tượng này thay vì các pixel riêng lẻ.
- Sau đó một quy trình đánh giá độ chính xác được thực hiện để kiểm tra kết quả phân loại..
- Mỗi phương pháp phân loại đều sử dụng những thuật toán nhất định.
- Đối tượng ảnh được tạo ra trong một mạng lưới cấp bậc và có sự liên kết hợp lý, do đó trong quá trình phân loại nghiên cứu đã sử dụng thuật toán Nearest Neighbor để phân loại các lớp hình ảnh.
- (2015) đã lựa chọn thuật toán Multiresolution để phân đoạn ảnh LiDar dựa vào phần mềm eCognition, sau đó sử dụng ba thuật toán phân loại Nearest Neighbor, Feature Space Optimization và Support Vector Machine để tìm ra được thuật toán phân loại tối ưu nhất.
- Kết quả độ chính xác phân loại lần lượt là: 91%, 88%.
- Điều này cho thấy thuật toán phân loại Nearest Neighbor được đánh giá cao trong việc phân loại đối với nhiều loại ảnh vệ tinh khác nhau..
- Ở Việt Nam, nhiều nghiên cứu đã sử dụng phương pháp phân loại dựa vào pixel để phân loại ảnh như: Hoàng Xuân Thành (2010).
- Để ước lượng trữ lượng lâm phần rừng tự nhiên lá rộng thường xanh bị tác động ở các mức độ khác nhau dựa vào ảnh SPOT 5, Nguyễn Thị Thanh Hương (2016) đã sử dụng phương pháp này phân loại ảnh SPOT 5 để thành lập bản đồ trạng thái rừng với 4 mức độ tác động như Rừng nghèo kiệt, Rừng nghèo, Rừng trung bình và Rừng giàu.
- Trong thời gian gần đây, tiếp cận phân loại ảnh vệ tinh theo hướng đối tượng đã được một số tác giả quan tâm.
- lựa chọn thuật toán Multiresolution trong phần mềm eCognigtion để phân đoạn ảnh SPOT 6 tại khu vực huyện Đắk Song, tỉnh Đắk Nông.
- Các tác giả đã sử dụng đồng thời hai phương pháp: (1) ước tính giá trị các tham số phân đoạn theo công thức toán học dựa vào giá trị phổ và hình dạng đối tượng.
- (2) ước tính giá trị các tham số phân đoạn dựa vào kinh nghiệm để tìm ra được các tham số phù hợp.
- Theo nghiên cứu này việc ước tính các tham số phân đoạn dựa vào các công thức toán học sẽ hạn chế được việc mất thời gian thử nghiệm các phân đoạn cũng như giá trị các tham số không bị ảnh hưởng bởi kinh nghiệm người nghiên cứu.
- Kết quả tìm ra được phân đoạn bám sát hình dạng đối tượng và phù hợp với ranh giới của khu vực nghiên cứu, cụ thể là theo phương pháp dựa vào kinh nghiệm thì tham số Scale/Shape/Compactness lần lượt là trong khi theo phương pháp dựa vào công thức toán học thì giá trị các tham số là đồng thời đưa ra các bước cơ bản để phân đoạn ảnh.
- Tuy nhiên, nghiên cứu chỉ dừng lại ở việc ước tính các tham số phân đoạn mà chưa phân loại thảm phủ và đánh giá độ chính xác của các nhóm đối tượng cụ thể, hơn nữa nghiên cứu này đã sử dụng với ảnh vệ tinh thương mại là ảnh SPOT 6 với độ phân giải khá cao với band đa phổ là 6 m cùng với band toàn sắc là 1,5 m..
- (2012) đã so sánh phương pháp phân loại dựa vào pixel và phân loại theo hướng đối tượng đối với có độ phân giải rất cao Worldview.
- Kết quả cho thấy phân loại dựa vào pixel chỉ sử dụng thông tin phổ để chiết tách thông tin lớp phủ, do vậy kết quả dễ bị nhầm lẫn, với độ chính xác là 73%.
- Trong khi đó, phương pháp hướng đối tượng phân tích tổng hợp các thông tin về phổ, thông tin về không gian và độ chính xác phân loại sẽ tăng lên khi ảnh có độ phân giải cao, độ chính xác thu được là 81%.
- Do đó, phương pháp hướng đối tượng là một phương pháp khả quan để phân loại ảnh viễn thám có độ phân giải cao..
- Các nghiên cứu đề cập ở trên cho thấy khả năng áp dụng phương pháp phân loại theo hướng đối tượng khá hiệu quả, tuy vậy độ chính xác của phân loại còn phụ thuộc vào loại ảnh, số lớp được phân chia và phương pháp được sử dụng.
- Hầu hết các nghiên cứu trước đây sử dụng phương pháp phân loại hướng đối tượng đối với ảnh vệ tinh có độ phân giải cao như Zhou và Troy (2008).
- Một số nghiên cứu đã sử dụng ảnh có độ phân giải trung bình như ảnh Landsat để phân loại với số lớp khá hạn chế như Poursanidis et al.
- Từ cơ sở của những kết quả nghiên cứu trước, để tìm hiểu khả năng ứng dụng của phương pháp phân loại theo hướng đối tượng dựa vào ảnh vệ tinh có độ phân giải trung bình khi phân thành nhiều lớp phủ bề mặt hơn, nghiên cứu này đã sử dụng ảnh vệ tinh Landsat 8 được thu thập miễn phí từ trang web http://earthexplorer.usgs.gov để phân loại ảnh thành 7 lớp đối tượng LULC khác nhau cho khu vực tỉnh Đăk Nông, Tây Nguyên và Việt Nam..
- Nghiên cứu nhằm đạt được các mục tiêu cụ thể sau: i) Lựa chọn được giá trị tham số phân đoạn Scale và Shape phù hợp để phân loại ảnh Landsat 8 cho khu vực tỉnh Đắk Nông, Tây Nguyên.
- Đánh giá độ chính xác phân loại khi sử dụng các tham số phân đoạn để phân loại dựa vào ảnh vệ tinh đa phổ Landsat 8 OLI..
- Phần mềm eCognition Developer 8.7 được sử dụng chính trong quá trình phân đoạn và phân loại ảnh.
- 2.2.2 Thuật toán phân đoạn Multiresolution Phân đoạn đối tượng nghiên cứu là một bước đầu rất quan trọng trong việc phân loại ảnh..
- Kavzoglu and Yildiz (2014) đã chỉ ra rằng phân đoạn tạo ra các đối tượng bằng cách nhóm các đặc tính quang phổ tượng tự trên ảnh.
- Phân đoạn ảnh được sử dụng để xác định vị trí các đối tượng và ranh giới giữa các đối tượng..
- Thông thường phân đoạn Multiresolution sử dụng ba tham số trong quy trình là quy mô (Scale), hình dạng (Shape) và kết cấu (Compactness).
- Tham số Shape là tham số xác định tiêu chí hình dạng cần có khi phân đoạn hình ảnh, biến động từ 0-1 (Klatt, 2012).
- Giá trị của nó càng cao, ảnh hưởng của màu sắc trên quá trình phân đoạn càng thấp.
- Kavzoglu và Yildiz (2014) đã chỉ ra tham số Compactness có ảnh hưởng không đáng kể đến việc tạo các vùng đối tượng phân đoạn do đó được quy thành một giá trị không đổi bằng giá trị mặc định ban đầu là 0,5.
- Kavzoglu and Yildiz (2014) đã phân đoạn ảnh IKONOS với tham số Shape bắt đầu từ 0,1 với bước nhảy là 0,1, để từ đó dựa vào độ chính xác chọn ra giá trị tối ưu nhất cho phân đoạn của mình..
- 2.2.3 Phân loại Nearest Neighbor.
- Thuật toán Nearest Neighbor được sử dụng để phân loại ảnh trong nghiên cứu này.
- Đây là một thuật toán phân loại dựa trên mẫu do người dùng xác định, một thuật toán kết hợp với các bộ tính năng xác định trước được sử dụng để gán các đối tượng cho các lớp..
- Sau khi phân đoạn ảnh, bước tiếp theo là phân loại ảnh.
- Các giá trị đặc trưng khác nhau của phân đoạn được sử dụng để nhóm các đối tượng của cùng một lớp lại với nhau.
- Đây là một bước quan trọng vì nó sẽ đưa ra các kết quả phân loại cuối cùng..
- Các lớp phân loại này đều được sử dụng thuật toán Nearest Neighbor để phân loại.
- Các mẫu phân loại (training site) được lấy trong từng vùng phân đoạn, phân đoạn lớn thì vùng mẫu cũng sẽ lớn.
- Vùng mẫu được phân bố đều trên các vùng phân đoạn đại diện, giữa chúng có khoảng cách nhất định để đảm bảo giữa các vùng mẫu có độ phân biệt tốt, nâng cao tính khách quan cho kết quả phân loại.
- RTX: Rừng thường xanh 2.2.3 Đánh giá kết quả phân loại.
- Độ tin cậy trong phân loại nhằm đo lường mức độ chính xác hay phù hợp giữa một dữ liệu chuẩn (dữ liệu kiểm định) với dữ liệu ảnh được phân loại..
- Nếu ảnh phân loại phù hợp với dữ liệu chuẩn thì được gọi là tin cậy.
- Theo đó, nghiên cứu đã đánh giá kết quả phân loại dựa trên hai chỉ tiêu là độ chính xác toàn bộ (Overall Accuracy) và hệ số Kappa như Nguyễn Thị Thanh Hương (2016) đã sử dụng để đánh giá độ chính xác.
- Để kiểm định kết quả phân loại, sử dụng ít nhất 20 vùng mẫu độc lập cho mỗi lớp tức là vùng mẫu không tham gia trong quá trình phân loại.
- LUẬN 3.1 Phân đoạn ảnh (Segmentation).
- Nghiên cứu này đã sử dụng7 band của anh Landsat 8 OLI từ band1 đến band 7 là những band có cùng độ phân giải không gian là 30mx30m để thực hiện phân loại .
- Sử dụng thuật toán phân đoạn Multiresolution để phân đoạn ảnh với tham số ban đầu là Scale=20, Shape=0,1.
- Hình 2 minh họa kết quả phân đoạn ảnh theo các tham số khác nhau..
- Hình 2 cho thấy các giá trị tham số đầu tiên (Hình 2a) vùng phân đoạn còn khá nhỏ, nhưng vẫn có sự bám sát hình dạng đối tượng.
- Tuy nhiên, phân đoạn Scale/Shape 20/0,4 (Hình 2d) cho thấy có sự nhầm lẫn về giá trị phổ của các đối tượng với nhau, cụ thể vùng phân đoạn có màu nâu nhạt đã bị đồng nhất với đối tượng màu xanh nhạt, điều đó được thể hiện trong vòng tròn khoanh màu trắng..
- Tương tự ở Scale 40, kích thước đối tượng khá lớn do đó số phân đoạn bị lẫn giá trị phổ xuất hiện nhiều hơn được mô tả trong Hình 2i, Hình 2k, Hình 2m, đồng thời kích thước các vùng đối tượng tuy không cùng giá trị phổ bị đồng nhất tăng theo giá trị tăng của các tham số Scale/Shape..
- Hình 2 cho thấy tham số Scale ở ngưỡng 20 và 30 các vùng phân đoạn bám sát hình dạng đối tượng và ít bị lẫn về giá trị phổ hơn so với Scale 40.
- Điều đó chỉ ra rằng kích thước đối tượng phân đoạn nhỏ hoặc lớn chưa chắc đã tốt cho kết quả phân loại vì nhiều điểm ảnh giống nhau cũng sẽ bị tách riêng.
- Do đó, nếu tăng kích thước đối tượng hình ảnh mà không giữ được sự đồng nhất của các điểm ảnh sẽ làm giảm đáng kể tính chính xác của việc phân loại tiếp theo..
- Hình 2: Kết quả phân đoạn ảnh theo các tham số Scale/Shape khác nhau lần lượt là a:20/0,1.
- m Phân loại Nearest Neighbor và đánh giá.
- kết quả phân loại.
- Sử dụng thuật toán Nearest Neighbor trong phần mềm eCognition để phân loại đối với từng giá trị tham số phân đoạn khác nhau như đã mô tả ở.
- Sử dụng dữ liệu độc lập để kiểm định kết quả phân loại cho từng kết quả phân đoạn theo 2 tiêu chí là độ chính xác toàn bộ và hệ số Kappa.
- Bảng 3: Độ chính xác phân loại dựa theo độ chính xác toàn bộ và hệ số Kappa Tham số quy mô.
- Tham số hình dạng.
- K: hệ số Kappa Bảng 3 cho thấy tỷ lệ số pixel được phân loại chính xác trên ảnh và trong bộ dữ liệu kiểm định dùng để xây dựng ma trận sai số đạt được độ chính xác toàn bộ cao nhất là 81,9%, hệ số K=0,788 đối với giá trị tham số Scale 40, Shape 0,3.
- Độ chính.
- Theo quan sát, khi tham số Scale/Shape tăng lên thì một vùng phân đoạn sẽ có khả năng chứa thêm đối tượng khác của những pixel gần bên.
- cạnh, điều này sẽ gây ra nhầm lẫn khi phân loại ảnh.
- Kết quả cho thấy độ chính xác toàn bộ thấp nhất là 67,1% với Scale=20, Shape=0,1 và cao nhất là 78,8% được tạo bởi sự kết hợp giữa tham số Scale=40 và Shape=0,3, theo quan sát nghiên cứu cũng nhận thấy khi các tham số Scale và Shape càng tăng thì thời gian phân đoạn và phân loại càng nhanh.
- Giá trị tham số Scale 40, Shape 0,3 đạt được kết quả phân loại tốt nhất cũng như thời gian phân loại khá nhanh..
- (2015) đã sử dụng ảnh Landsat để phân loại độ che phủ đất tại khu vực hai hạt ở.
- Nghiên cứu đã thay đổi các tham số phân đoạn Scale 2-20 với bước nhảy là 2, Shape từ 0,1-0,5 với bước nhảy 0,1, với 6 loại thảm phủ: đất nông nghiệp, khu đô thị, rừng, trảng cỏ, cây bụi và mặt nước.
- Điều đó cũng cho thấy được rằng tùy vào khu vực nghiên cứu mà lựa chọn giá trị Scale/Shape và số lớp phân loại cho phù hợp.
- Từ đó cho thấy kết quả phân loại các tham số phân đoạn Scale/Shape có ảnh hưởng trực tiếp đến độ chính xác phân loại.
- Bảng 4 tổng hợp độ chính xác phân loại gồm độ chính xác thực hiện (Producer’s Accuracy_PA) và độ chính xác sai sót/sử dụng (User’s Accuracy_UA) của các loại LULC..
- Bảng 4: Độ chính xác thực hiện (Producer’s Accuracy_PA) và độ chính xác sai sót/sử dụng (User’s Accuracy_UA) của phân đoạn tham số quy mô=40, tham số hình dạng=0,3.
- LULC Độ chính xác.
- Kết quả trên cho thấy độ chính xác lớp mặt nước cao nhất chứng tỏ không có đối tượng mặt nước nào bị phân loại nhầm, theo sau là rừng bán thường xanh, khu dân cư và rừng thường xanh..
- Nghiên cứu cho thấy tham số phân đoạn đóng vai trò rất quan trọng trong việc phân loại ảnh vệ tinh để thành lập bản đồ LULC.
- Việc lựa chọn các tham số phân đoạn là một giai đoạn thiết yếu trong quá trình phân đoạn hình ảnh, xác định các tham số phân đoạn cần phù hợp với đối với hình ảnh và đặc trưng lĩnh vực nghiên cứu.
- Cụ thể nghiên cứu đã lựa chọn được giá trị các tham số phân đoạn phù hợp Scale/Shape lần lượt 40/0,3..
- Độ chính xác phân loại được thể hiện thông qua quá trình thay đổi các tham số phân đoạn được trình bày trong Bảng 3.
- Phân loại dựa trên đối tượng sử dụng ảnh Landsat 8 OLI cho kết quả độ chính xác tổng thể 81,9% và hệ số Kappa 0,788..
- Tuy vậy, nghiên cứu chỉ thực hiện trên các band của ảnh Landsat 8 nên cần có các thử nghiệm với các loại ảnh khác cũng như bổ sung thêm các thông tin bổ trợ như mô hình số địa hình DEM, ảnh chỉ số thực vật NDVI, ảnh thành phần chính PCA… để có thể nâng cao hơn độ chính xác hoặc phân loại thành các đối tượng chi tiết hơn..
- Các tác giả chân thành cảm ơn tất cả những người tham gia vào việc thu thập dữ liệu về phân loại và Chương trình tài trợ..
- Nghiên cứu nâng cao độ chính xác phân loại ảnh bằng việc tích hợp dữ liệu DEM, NDVI với dữ liệu vệ.
- Ứng dụng kỹ thuật phân loại ảnh hướng đối tượng nhằm phân loại trạng thái rừng theo thông tư số 34.
- So sánh phương pháp phân loại dựa vào điểm ảnh và phân loại định hướng đối tượng chiết xuất thông tin lớp phủ bề mặt từ ảnh độ phân giải cao