« Home « Kết quả tìm kiếm

Phân cụm mờ trọng số địa lý


Tóm tắt Xem thử

- Tổng quan về các thuật toán phân cụm dữ liệu địa lý.
- Thuật toán FCM.
- Thuật toán NE.
- Thuật toán FGWC.
- Thuật toán CFGWC.
- Thuật toán CFGWC2.
- Thuật toán IPFGWC.
- Thuật toán MIPFGWC.
- CHƢƠNG 2: THUẬT TOÁN KMIPFGWC.
- Nhƣợc điểm của thuật toán MIPFGWC.
- Tổng quan về nhóm thuật toán phân cụm sử dụng hàm nhân.
- Thuật toán KMIPFGWC.
- Độ phức tạp thuật toán.
- Khảo sát các đặc trƣng của thuật toán KMIPFGWC.
- FCM Fuzzy C-means, Thuật toán phân cụm mờ.
- NE Neighbourhood Effects, Thuật toán hiệu ứng.
- Thuật toán phân cụm dữ liệu theo trọng số địa lý CFGWC Context Fuzzy Geographically.
- Thuật toán phân cụm địa lý kết hợp ngữ cảnh IPFGWC Intuitionistic Possiblistic Fuzzy.
- Thuật toán phân cụm địa lý trên tập mờ trực cảm MIPFGWC Modification Intuitionistic.
- Thuật toán phân cụm địa lý hiệu chỉnh trên tập mờ trực cảm.
- Thuật toán phân cụm địa lý hiệu chỉnh trên tập mờ trực cảm sử dụng hàm nhân.
- Hình 1.3: Kết quả phân cụm khi sử dụng thuật toán FCM.
- Hình 1.4: Kết quả phân cụm khi sử dụng thuật toán NE.
- Hình 1.5: Kết quả phân cụm khi sử dụng thuật toán FGWC.
- Hình 1.6: Kết quả phân cụm khi sử dụng thuật toán CFGWC.
- Hình 1.7: Kết quả phân cụm khi sử dụng thuật toán IPFGWC.
- Hình 1.8: Kết quả phân cụm khi sử dụng thuật toán MIPFGWC.
- DANH MỤC CÁC BẢNG BIỂU Bảng 3.1: Giá trị IFV của các thuật toán theo số lƣợng cụm C và các tham số .
- 62 Bảng 3.2: Thời gian tính toán của các thuật toán theo số lƣợng cụm C và các tham số.
- Cho đến nay, thuật toán phân cụm mờ trọng số địa lý tốt nhất cho bài toán này là thuật toán MIPFGWC [10].
- nhằm nâng cao chất lƣợng phân cụm của thuật toán.
- Thuật toán thu đƣợc sẽ đƣợc kiểm chứng so sánh đánh giá với MIPFGWC và một số thuật toán khác về chất lƣợng phân cụm..
- Chƣơng 2: Trình bày thuật toán phân cụm mờ trọng số địa lý KMIPFGWC, với hàm mục tiêu sử dụng độ đo khoảng cách là hàm nhân Gaussian thay vì sử dụng hàm Euclidean truyền thống và sử dụng mô hình SIM 2 để nâng cao chất lƣợng phân cụm cho bài toán..
- Tổng quan về các thuật toán phân cụm dữ liệu địa lý 1.2.1.
- Thuật toán FCM [3] là thuật toán phân cụm đƣợc sử dụng rất rộng rãi..
- Mặc dù nó chƣa sử dụng các tham số địa lý nhƣng nó lại là tiền đề để phát triển các thuật toán phân cụm dữ liệu địa lý sau này..
- Thuật toán FCM đƣợc mô tả nhƣ sau:.
- Các bƣớc thực hiện thuật toán:.
- Thuật toán đơn giản, dễ thực hiện..
- Đây là thuật toán phân cụm mờ nói chung, chƣa sử dụng các yếu tố địa lý..
- Thuật toán NE [24] là thuật toán phân cụm dữ liệu có tính đến yếu tố địa lý đầu tiên, đƣợc đƣa ra bởi Feng và Flowerdew vào năm 1998..
- Thuật toán đƣợc mô tả nhƣ sau:.
- Kết hợp đặc trƣng địa lý và giúp cải thiện chất lƣợng phân cụm cho thuật toán FCM..
- Thuật toán loại trừ ảnh hƣởng của yếu tố dân số - một yếu tố quan trọng cho bài toán phân cụm dữ liệu địa lý..
- Thời gian thực hiện thuật toán chậm..
- Nhƣ đã trình bày ở trên, FGWC là thuật toán đƣợc cho là thuật toán phân cụm dữ liệu địa lý tốt và phổ biến nhất hiện nay.
- Tuy nhiên, thuật toán vẫn còn nhƣợc điểm là tốn nhiều thời gian thực hiện thuật toán và chất lƣợng phân cụm thu đƣợc là chƣa cao.
- Các thuật toán phân cụm dữ liệu truyền thống không chỉ mất nhiều thời gian để thực hiện toàn bộ dữ liệu mà còn khiến các kết quả ít có ý nghĩa với ngữ cảnh đề xuất..
- Trong khi đó, các thuật toán phân cụm dựa trên ngữ cảnh đồng thời đẩy nhanh tốc độ và cải thiện ngữ nghĩa..
- Tăng tốc độ tính toán cho thuật toán FGWC..
- Mất nhiều thời gian thực hiện hơn so với những thuật toán trình bày ở trên..
- Thuật toán MIPFGWC [10] đƣợc tích hợp mô hình tƣơng tác hiệu chỉnh không gian mới SIM 2 [10] vào trong thuật toán IPFGWC để tăng chất lƣợng phân cụm..
- Các bƣớc thực hiện thuật toán.
- thì dừng thuật toán.
- Chất lƣợng phân cụm tốt hơn IPFGWC và các thuật toán khác.
- Thời gian thực hiện thuật toán lớn hơn IPFGWC và các thuật toán khác 1.2.9.
- Kết quả phân cụm bộ dữ liệu trên sử dụng các thuật toán FCM, NE, FGWC, CFGWC, IPFGWC, MIPFGWC đƣợc thể hiện trong các hình .
- hình 1.8 là hình phân bố các cụm của thuật toán FGWC.
- thuật toán CFGWC.
- thuật toán IPFGWC.
- Trong chƣơng này, chúng tôi đã trình bày tổng quan về các thuật toán phân cụm dữ liệu địa lý, và kết quả cho thấy thuật toán MIPFGWC là thuật toán phân cụm mờ trọng số địa lý tốt nhất.
- Thuật toán này đƣợc xây dựng dựa trên các lý thuyết về tập mờ trực cảm, phân cụm mờ xác suất và sử dụng mô hình SIM 2 và cho kết quả phân cụm tốt nhất..
- Thuật toán MIPFGWC đƣợc xây dựng dựa trên lý thuyết về tập mờ trực cảm thể hiện trong phƣơng trình (2.1), giá trị độ thuộc, mức độ do dự và giá trị.
- Về cơ bản, Thuật toán MIPFGWC thực hiện tính tâm cụm mới và giá trị độ thuộc thông qua hàm Euclidean và sử dụng mô hình SIM 2 để cập nhật giá trị độ thuộc.
- Với những lý do này, nên có một phƣơng pháp tốt hơn thay thế cho hàm Euclidean để thuật toán MIPFGWC có đƣợc chất lƣợng phân cụm cao..
- Với vấn đề thứ nhất chúng tôi đƣa ra ý tƣởng về lý thuyết hàm nhân [23] nhằm nâng cao chất lƣợng phân cụm của thuật toán.
- Thuật toán mới này đƣợc gọi tắt là KMIPFGWC..
- Trong phần này chúng tôi trình bày tổng quan về nhóm các thuật toán phân cụm sử dụng hàm nhân..
- Thuật toán phân cụm sử dụng hàm nhân đầu tiên đƣợc trình bày bởi Wu et al.
- giới thiệu một thuật toán phân cụm mờ không gian BFCM tích hợp tham số không gian khu vực lân cận vào hàm mục tiêu dƣới đây..
- Nhận xét về nhóm thuật toán phân cụm mờ sử dụng hàm nhân:.
- Từ những kết quả trên, chúng ta có thể so sánh chất lƣợng phân cụm của hai thuật toán thông qua chỉ số IFV.
- IFV đƣợc sử dụng để đánh giá chất lƣợng phân cụm của MIPFGWC với các thuật toán khác [10], nó đã đƣợc chứng minh là chắc chắn và ổn định đối với dữ liệu không gian.
- Định lý 3: Độ chênh lệnh nghiệm của thuật toán KMIPFGWC có sử dụng hàm nhân Gaussian (ký hiệu là K1) và không sử dụng hàm nhân (ký hiệu là K2) là:.
- Định lý 4: Độ chênh lệnh nghiệm của thuật toán KMIPFGWC có gắn mô hình SIM 2 vào trong hàm mục tiêu (ký hiệu là K1) và không gắn mô hình SIM 2 vào trong hàm mục tiêu (ký hiệu là K3) là:.
- Trong phần này, chúng tôi trình bày chi tiết về thuật toán KMIPFGWC Input: Dữ liệu X có số lƣợng phần từ (N) trong r chiều.
- Thuật toán KMIPFGWC:.
- r nên độ phức tạp thuật toán trong một bƣớc lặp là.
- Trong chƣơng này, chúng tôi đã trình bày về thuật toán phân cụm mờ trực cảm xác suất trọng số địa lý hiệu chỉnh sử dụng hàm nhân KMIPFGWC.
- Một số tính chất của giải pháp KMIPFGWC và so sánh chất lƣợng phân cụm giữa KMIPFGWC với thuật toán MIPFGWC cho thấy chất lƣợng phân cụm của KMIPFGWC là tốt hơn so với MIPFGWC..
- Mục tiêu: Chúng tôi đánh giá chất lƣợng phân cụm và thời gian tính toán của các thuật toán và nghiên cứu một số đặc điểm của thuật toán KMIPFGWC theo các trƣờng hợp khác nhau với các thông số của hàm nhân Gaussian..
- Trong bảng 3.1 chúng tôi so sánh giá trị IFV của thuật toán KMIPFGWC với hai thuật toán MIPFGWC và FGWC theo số lƣợng phân cụm và các tham số..
- Khi số lƣợng các cụm tăng lên 3, các giá trị IFV của tất cả các thuật toán đều tăng, nhƣng giá trị IFV của thuật toán KMIPFGWC vẫn lớn hơn là và 3.798240.
- Trong các trƣờng hợp khác khi số lƣợng cụm là 4, 5, 6 và 7 thì giá trị IFV của KIMPFGWC đều lớn hơn hai thuật toán kia.
- Điều này cho thấy chất lƣợng phân cụm của thuật toán KIMPFGWC là tốt hơn so với các thuật toán khác..
- Bảng 3.1: Giá trị IFV của các thuật toán theo số lƣợng cụm C và các tham số C.
- Các tỷ lệ giúp chúng ta dự đoán các giá trị IFV của các thuật toán khi tăng lên một cụm..
- Tƣơng tự, chúng tôi xác định giá trị IFV của các thuật toán bằng việc tác động thay đổi các giá trị các tham số.
- Kết quả cho thấy rằng giá trị IFV của thuật toán KMIPFGWC và MIPFGWC là ổn định khi thay đổi các giá trị của tham số..
- Ví dụ, các giá trị trung bình IFV của thuật toán KMIPFGWC từ trƣờng hợp đầu tiên đến trƣờng hợp thứ sáu tƣơng ứng là và .
- Ta cũng tính đƣợc thời gian thực hiện các thuật toán nhƣ trong bảng 3.2:.
- kết quả cho thấy thời gian thực hiện thuật toán của KMIPFGWC là lớn hơn của MIPFGWC và FGWC.
- Bảng 3.2: Thời gian tính toán của các thuật toán theo số lƣợng cụm C và các tham số C.
- Chất lƣợng phân cụm của KMIPFGWC là tốt hơn so với thuật toán MIPFGWC và FGWC..
- Trong phần này, chúng tôi khảo sát một số đặc trƣng của thuật toán KMIPFGWC bởi các trƣờng hợp khác nhau của hàm Gaussian đƣợc thể hiện dƣới đây.
- Mục đích là để kiểm tra tác động của việc thay đổi các tham số tới giá trị IFV trong thuật toán MIPFGWC.
- Trong chƣơng này, phần đầu chúng tôi đánh giá chất lƣợng phân cụm của thuật toán KMIPFGWC so với thuật toán MIPFGWC và FGWC thông qua chỉ số IFV.
- Kết quả thu đƣợc cho thấy, chất lƣợng phân cụm của thuật toán KMIPFGWC tốt hơn so với các thuật toán MIPFGWC và FGWC.
- Phần cuối trong chƣơng này, chúng tôi khảo sát một số đặc trƣng của thuật toán KMIPFGWC bởi các trƣờng hợp khác nhau của hàm Gaussian.
- đồng thời trình bày sơ lƣợc về các thuật toán phân cụm dữ liệu địa lý nhƣ FCM, NE, FGWC, CFGWC, CFGWC2, IPFGWC, MIPFGWC cùng các ƣu nhƣợc điểm của chúng, từ đó đề xuất thuật toán KMIPFGWC..
- Thuật toán phân cụm mờ trọng số địa lý KMIPFGWC, với hàm mục tiêu sử dụng độ đo khoảng cách là hàm nhân Gaussian thay vì sử dụng hàm Euclidean truyền thống và sử dụng mô hình SIM 2 để nâng cao chất lƣợng phân cụm cho bài toán..
- Các kết quả cho thấy thuật toán KMIPFGWC cho thấy chất lƣợng phân cụm tốt hơn so với các thuật toán phân cụm dữ liệu địa lý đƣợc sử dụng phổ biến nhất hiện nay và thời gian thực hiện thuật toán là có thể chấp nhận đƣợc.