« Home « Kết quả tìm kiếm

Phân cụm mờ với đại số gia tử và ứng dụng


Tóm tắt Xem thử

- TÓM TẮT LUẬN VĂN THẠC SĨĐề tài: Phân cụm mờ với Đại số gia tử và ứng dụng.Tác giả luận văn: Đinh Khắc Đông – Khóa: 2009.Người hướng dẫn: PGS.
- Trần Đình Khang.Nội dung tóm tắt:a) Lý do chọn đề tàiCác phương pháp phân cụm từ khi ra đời đã được nghiên cứu rộng rãi và thu được nhiềuthành tựu trong rất nhiều lĩnh vực như bài toán ra quyết định, học máy, khai phá dữ liệu.Tuy vậy, quá trình nghiên cứu chỉ ra nhiều hạn chế của thuật toán ảnh hưởng đến chất lượngphân cụm.Bên cạnh đó, những nghiên cứu về cấu trúc tự nhiên của miền ngôn ngữ của nhóm tácgiả mà đứng đầu là GS.
- Nguyễn Cát Hồ với những đề xuất về hàm độ đo tính mờ và hàmđịnh lượng ngữ nghĩa đã trở nên đủ mạnh để cung cấp một metric cho bài toán phân cụmmờ và hứa hẹn mang lại những cải tiến cho thuật toán FCM truyền thống.Dưới sự tìm tòi nghiên cứu của tác giả và tính khả thi của đề tài dưới sự hướng dẫn củaPGS.
- Trần Đình Khang – Viện Công nghệ thông tin và Truyền thông, Đại học BáchKhoa Hà Nội, tôi quyết định nghiên cứu vấn đề “Phân cụm mờ với Đại số gia tử và ứngdụng” trong luận văn Cao học này.b) Mục đích nghiên cứu, đối tượng và phạm vi nghiên cứuTrong số hơn 60.000 nghiên cứu về bài toán phân cụm, lớp thuật toán được chú ý hơncả là phân cụm mờ cho phép một dữ liệu bất kỳ thuộc vào nhiều cụm với những độ thuộctương ứng khác nhau.
- Tuy vậy, các nghiên cứu sau đó chỉ ra những khó khăn gặp phải khiáp dụng thuật toán phân cụm mờ - Fuzzy C-Means trong các bài toán thực tế.
- Từ nhữngphân tích về hạn chế của FCM truyền thống, luận văn đề xuất hướng cải tiến bằng cách sửdụng cấu trúc ĐSGT.
- Trong khuôn khổ luận văn Cao học này, lớp ĐSGT được nghiên cứulà ĐSGT đối xứng và tuyến tính.c) Các nội dung chính và đóng góp mớiSau khi nghiên cứu về thuật toán FCM truyền thống và phân tích các hạn chế, luận vănđề xuất hướng cải tiến bằng cách sử dụng cấu trúc ngôn ngữ của ĐSGT.
- Với phương phápnày, luận văn có những đóng góp mới như sau:• Đầu tiên, cấu trúc ngôn ngữ của biến chân lý được sử dụng để thay đổi khoảng cáchgiữa các dữ liệu đến tâm cụm.
- Cụ thể là độ đo tính mờ của các giá trị ngôn ngữ trong cấu trúc ĐSGT đóng vai trò là các trọng số khi tính toán khoảng cách giữa dữ liệu vàcác tâm cụm tương ứng.
- Do đó, khi dữliệu có nhiễu hay các điểm ngoại lai thì ảnh hưởng đến tâm cụm được giảm thiểu.• Cuối cùng, các tham số của ĐSGT được sử dụng làm tham số huấn luyện trong phươngpháp học có giám sát để thu được kết quả phân cụm tốt hơn.d) Phương pháp nghiên cứuĐầu tiên, thuật toán Fuzzy C-means truyền thống được nghiên cứu để tìm ra những vấnđề gặp phải về mặt lý thuyết cũng như triển khai.
- Sau đó, cấu trúc ngôn ngữ của biến chânlý được nghiên cứu trên ĐSGT tuyến tính và đối xứng.
- Từ đó đưa ra đề xuất cải tiến thuật toánFCM để khắc phục các nhược điểm.Sau khi đưa ra thuật toán cải tiến: Phân cụm mờ với Đại số gia tử, các mệnh đề về tínhduy nhất của trọng số gán cho các mẫu và mệnh đề về tính tổng quát của thuật toán đượctrình bày, khẳng định tính giá trị về mặt lý thuyết của thuật toán.Cuối cùng, thuật toán Phân cụm mờ với Đại số gia tử được thử nghiệm trên bài toánPhân cụm với dữ liệu nhân tạo và Phân cụm với dữ liệu thực đa chiều để khẳng định tínhthực tiễn của thuật toán khi áp dụng trong các bài toán thực tế.e) Kết luậnLuận văn đã tìm hiểu thuật toán FCM để tìm ra những hạn chế khi áp dụng trong cácbài toán phân cụm.
- Ngoài ra, với những nghiên cứu về ĐSGT đối xứng và tuyến tính, luậnvăn đề xuất thuật toán cải tiến FCM bằng cách gán trọng số cho mỗi mẫu trong không gianđầu vào.
- Luận văn cũng chỉ ra thuật toán đề xuất là tổng quátcủa thuật toán FCM truyền thống trong trường hợp đặc biệt.
- Một số ứng dụng thử nghiệmđã cho thấy khả năng ứng dụng của thuật toán cải tiến.2

Xem thử không khả dụng, vui lòng xem tại trang nguồn
hoặc xem Tóm tắt