Tìm thấy 19+ kết quả cho từ khóa "giải thuật phân lớp dữ liệu"
ctujsvn.ctu.edu.vn Xem trực tuyến Tải xuống
Do đó, nếu số chiều dữ liệu n trong bậc nhỏ hơn 100 thì thậm chí số phần tử dữ liệu m lên đến hàng triệu, giải thuật lặp NSVM có thể phân lớp chúng trong vài giây trên một máy tính cá nhân.. Bảng 1: Giải thuật lặp NSVM. 3 GIẢI THUẬT ARC-X4-NSVM CHO PHÂN LỚP TẬP DỮ LIỆU LỚN. 3.1 Giải thuật NSVM cho dữ liệu có số chiều lớn nhưng ít phần tử.
ctujsvn.ctu.edu.vn Xem trực tuyến Tải xuống
Với các kết quả phân lớp này, chúng tôi có thể tin rằng mô hình SVM sử dụng hàm xấp xỉ khả vi của hinge loss cho phép cải thiện hiệu quả phân lớp tập dữ liệu lớn khi giải trực tiếp bằng giải thuật SGD.. Hình 4: Tỷ lệ lỗi phân lớp trên tập RCV1 của các mô hình theo số lượng epochs. 4 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN Để máy học SVM có thể phân lớp nhanh, chính xác các tập dữ liệu lớn, giải pháp hiệu quả là sử dụng giải thuật SGD để giải trực tiếp vấn đề tối ưu của mô hình SVM.
ctujsvn.ctu.edu.vn Xem trực tuyến Tải xuống
Phần tiếp theo của bài báo được tổ chức như sau: Trong phần 2, chúng tôi sẽ trình bày ý tưởng chính của giải thuật RB Bagging và giải thuật cải tiến cho phân lớp dữ liệu không cân bằng. 2 GIẢI THUẬT RB BAGGING CẢI TIẾN. Giải thuật RB Bagging của (Hido &. Kashima, 2008) cho vấn đề phân lớp dữ liệu không cân bằng với chiến lược thay đổi phân bố của tập dữ liệu. RB Bagging tập trung cải thiện hiệu quả dự báo cho lớp thiểu số, bên cạnh đó cố gắng đảm bảo sử dụng hầu hết thông tin cho lớp đa số.
repository.vnu.edu.vn Xem trực tuyến Tải xuống
Phân lớp dữ liệu trên các cơ sở dữ liệu này là một bài toán hết sức quan trọng và được áp dụng để giải quyết nhiều bài toán thực tế như phát hiện dự đoán lỗi, đánh giá thị trường...Để giải quyết bài toán phân lớp, nhiều giải thuật đã được phát triển như giải thuật SVM ([26], [27. mô hình Naïve Bayes . Tuy nhiên phần lớn các giải thuật này đều nhằm xử lý dữ liệu ở dạng phẳng hay dạng bảng đơn trong mô hình cơ sở dữ liệu.
310126-TT.pdf
dlib.hust.edu.vn Xem trực tuyến Tải xuống
Chính vì vậy, ngân hàng có nhu cầu cấp thiết sử dụng các kỹ thuật phân lớp dữ liệu để giải quyết bài toán dự đoán rủi ro tín dụng b) Mục đích nghiên cứu của luận văn, đối tượng, phạm vi nghiên cứu Luận văn tiến hành nghiên cứu các tổng quan phương pháp phân lớp dữ liệu và đi sâu vào phương pháp phân lớp sử dụng mạng nơ ron phân lớp mờ min max. 2 Luân văn nghiên cứu vấn đề cải tiến mạng nơ ron phân lớp mờ min max để áp dụng giải quyết bài toán thực tiễn: dự đoán rủi ro tín dụng trong ngân hàng
000000208339.pdf
dlib.hust.edu.vn Xem trực tuyến Tải xuống
Phân loại là một dạng của phân tích dữ liệu, nó dùng để trích ra các mô hình mô tả các lớp dữ liệu quan trọng hay để dự đoán các khuynh hướng dữ liệu tương lai. Hầu hết các giải thuật dùng với giả thiết kích thước dữ liệu nhỏ. Các nghiên cứu khai phá cơ sở dữ liệu gần đây đã phát triển, xây dựng mở rộng các kỹ thuật phân loại có khả năng sử dụng dữ liệu thường trú trên đĩa lớn.
312598.pdf
dlib.hust.edu.vn Xem trực tuyến Tải xuống
Chương này trình bày tổng quan về phân lớp dữ liệu và giải thuật CMAR. Chương này mô tả về dữ liệu thử nghiệm và phân tích chức năng của Chương trình. 16 2.1 Tổng quan về phân lớp dữ liệu. 16 2.1.1 Bài toán phân lớp dữ liệu. 16 2.1.2 Quá trình phân lớp dữ liệu. Bộ dữ liệu cài đặt thử nghiệm. Mở file dữ liệu và hiện thị trong Weka Hình 14. Kết quả chạy của thuật toán J48 với bộ dữ liệu vô sinh trong Weka…………65 Hình 16.
chiasemoi.com Xem trực tuyến Tải xuống
Tránh “quá vừa” dữ liệu ...26. C4.5 là một thuật toán hiệu quả cho những tập dữ liệu vừa và nhỏ ...27. Cấu trúc dữ liệu trong SPRINT ...29. SPRINT là thuật toán hiệu quả với những tập dữ liệu quá lớn so với các thuật toán. Cấu trúc dữ liệu sử dụng trong C4.5 ...39. Hình 1 - Quá trình phân lớp dữ liệu - (a) Bước xây dựng mô hình phân lớp ...4. Hình 2 - Quá trình phân lớp dữ liệu - (b1)Ước lượng độ chính xác của mô hình...5. Hình 3 - Quá trình phân lớp dữ liệu - (b2) Phân lớp dữ liệu mới ...5.
ctujsvn.ctu.edu.vn Xem trực tuyến Tải xuống
Boussquet, 08) dựa trên phương pháp giảm gradient ngẫu nhiên, có độ phức tạp tuyến tính với số phần tử dữ liệu. Giải thuật SGD có độ phức tạp tuyến tính với số phần tử của tập dữ liệu học, phân lớp dữ liệu có số phần tử và số chiều lớn rất hiệu quả (Bottou &. 3.3 Giải thuật giảm gradient ngẫu nhiên cho phân lớp đa lớp (MC-SGD). SGD cũng như hầu hết các giải thuật SVM đều xuất phát từ vấn đề phân lớp nhị phân (2 lớp:.
ctujsvn.ctu.edu.vn Xem trực tuyến Tải xuống
Những kết quả đạt được cho phép chúng tơi tin rằng giải thuật ArcX4 cây quyết định ngẫu nhiên xiên phân của chúng tơi đề nghị phân lớp hiệu quả trên dữ liệu gien cĩ số chiều rất lớn.. Đồ thị 2: So sánh tiêu chí accuracy của 3 giải thuật trên 10 tập dữ liệu. Chúng tơi vừa trình bày giải thuật máy học mới ArcX4 của cây quyết định ngẫu nhiên xiên phân (ArcX4-rODT) cho phép phân lớp hiệu quả dữ liệu gien cĩ số chiều lớn và nhiễu.
download.vn Xem trực tuyến Tải xuống
Giáo trình: Cấu Trúc Dữ Liệu và Giải Thuật f. Giáo trình: Cấu Trúc Dữ Liệu và Giải Thuật B8: Kết thúc. Giáo trình: Cấu Trúc Dữ Liệu và Giải Thuật 2.3.3. Cấu trúc dữ liệu của các phần tử trong tập tin chỉ mục như sau:. Giáo trình: Cấu Trúc Dữ Liệu và Giải Thuật long IndexSearch (char * IdxFileName, T X). Giáo trình: Cấu Trúc Dữ Liệu và Giải Thuật Lần 7: First = 7. Giáo trình: Cấu Trúc Dữ Liệu và Giải Thuật Phân hoạch:. Giáo trình: Cấu Trúc Dữ Liệu và Giải Thuật X = 30.
312598-tt.pdf
dlib.hust.edu.vn Xem trực tuyến Tải xuống
Một vấn đề được đặt ra là làm sao trích chọn được thông tin có ý nghĩa từ tập dữ liệu lớn để giải quyết các bài toán thực tế như trợ giúp ra quyết định và dự đoán. Bài toán phân lớp có nhiều giải thuật được đưa ra, phân lớp dựa vào luật phân lớp kết hợp đã được chứng minh là tốt hơn các phương pháp phân lớp dựa vào luật hiện có như cây quyết định, ILA… b) Mục đích nghiên cứu của luận văn, đối tượng, phạm vi nghiên cứu.
vndoc.com Xem trực tuyến Tải xuống
Giáo trình: Cấu Trúc Dữ Liệu và Giải Thuật f. Giáo trình: Cấu Trúc Dữ Liệu và Giải Thuật B8: Kết thúc. Giáo trình: Cấu Trúc Dữ Liệu và Giải Thuật 2.3.3. Cấu trúc dữ liệu của các phần tử trong tập tin chỉ mục như sau:. Giáo trình: Cấu Trúc Dữ Liệu và Giải Thuật long IndexSearch (char * IdxFileName, T X). Giáo trình: Cấu Trúc Dữ Liệu và Giải Thuật Lần 7: First = 7. Giáo trình: Cấu Trúc Dữ Liệu và Giải Thuật Phân hoạch:. Giáo trình: Cấu Trúc Dữ Liệu và Giải Thuật X = 30.
ctujsvn.ctu.edu.vn Xem trực tuyến Tải xuống
RỪNG NGẪU NHIÊN CẢI TIẾN CHO PHÂN LOẠI DỮ LIỆU GIEN. Trong bài viết này, chúng tôi đề xuất giải thuật rừng ngẫu nhiên cải tiến cho phân lớp dữ liệu gien thường có rất ít các phần tử dữ liệu nhưng số chiều rất lớn và có nhiễu. Trong thực tế, giải thuật rừng ngẫu nhiên của Breiman thường được sử dụng cho phân lớp kiểu dữ liệu như dữ liệu gien. Tuy nhiên, do sử dụng luật bình chọn số đông ở nút lá của cây quyết định làm dự báo của rừng ngẫu nhiên bị giảm.
repository.vnu.edu.vn Xem trực tuyến Tải xuống
Nghiên cứu các kỹ thuật phân cụm dữ liệu và ứng dụng. ngành: Hệ thống thông tin. Tổng quan về khai phá tri thức, khai phá dữ liệu. qui trình khai phá tri thức, khai phá dữ liệu … Trình bày tổng quan về phân cụm dữ liệu, một số phương pháp phân cụm dữ liệu dữ liệu phổ biến như phân cụm phân hoạch, phân cụm phân cấp, phân cụm dựa trên mật độ, phân cụm dựa trên lưới. trình bày một số giải thuật điển hình của mỗi phương pháp phân cụm. Hệ thống thông tin. Dữ liệu. Công nghệ thông tin.
repository.vnu.edu.vn Xem trực tuyến Tải xuống
Luận văn tập trung nghiên cứu kỹ thuật phân lớp không gian sử dụng cây quyết định và phân cụm dữ liệu nhằm trích rút ra các dữ liệu địa lý có ích tiềm ẩn bên trong. Thu thập một số lớp dữ liệu bản đồ (bao gồm cả dữ liệu hình học và dữ liệu thuộc tính) để thử nghiệm với thuật toán phân lớp dữ liệu không gian sử dụng cây quyết định.. Nghiên cứu một số thuật toán phân lớp dữ liệu quan hệ dựa trên cây quyết định đối với cơ sở dữ liệu truyền thống, đề xuất mở rộng áp dụng trên dữ liệu địa lý..
vndoc.com Xem trực tuyến Tải xuống
Giải thuật tiệm cận - Asymptotic Algorithms Phân tích tiệm cận trong Cấu trúc dữ liệu và Giải thuật Phân tích tiệm cận là gì?. Phân tích tiệm cận của một giải thuật là khái niệm giúp chúng ta ước lượng được thời gian chạy (Running Time) của một giải thuật. Sử dụng phân tích tiệm cận, chúng ta có thể đưa ra kết luận tốt nhất về các tình huống trường hợp tốt nhất, trường hợp trung bình, trường hợp xấu nhất của một giải thuật.
000000104521.pdf
dlib.hust.edu.vn Xem trực tuyến Tải xuống
Phân lớp (clasification): Phân lớp t−ơng ứng với việc xác lập một ánh xạ (hay phân loại) một tập dữ liệu vào một trong số các lớp đã xác định. Phân cụm (Clustering): Phân cụm nhằm ghép nhóm các đối t−ợng dữ liệu. Nghĩa là một đối t−ợng dữ liệu có thể vừa thuộc cụm này, vừa thuộc cụm kia. Quá trình nhóm các đối t−ợng thành các cụm đ−ợc gọi là Kỹ thuật mạng nơron và giải thuật di truyền trong khai phá dữ liệu và thử nghiệm ứng dụng D−ơng Thị Hiền Thanh – CNTT 2006 18phân cụm hay phân nhóm.
ctujsvn.ctu.edu.vn Xem trực tuyến Tải xuống
Việc kết hợp nhiều thuộc tính để tạo phân hoạch xiên phân giúp phân lớp hiệu quả dữ liệu cĩ số chiều lớn.. Hình 3: Cây ngẫu nhiên xiên phân đơn giản. 3.2 Giải thuật Boosting cây ngẫu nhiên xiên phân đơn giản (BRODS). Tuy nhiên, để cải thiện hơn hiệu quả phân lớp dữ liệu thư rác, chúng tơi tiếp tục áp dụng kỹ thuật boosting dựa trên bộ phân lớp yếu là cây ngẫu nhiên xiên phân đơn giản..
repository.vnu.edu.vn Xem trực tuyến Tải xuống
Thiết kế và phân tích giải thuật duy trì dữ liệu chung phân tán.