« Home « Kết quả tìm kiếm

giải thuật học Boosting cây quyết định ngẫu nhiên xiên phân đơn giản


Tìm thấy 11+ kết quả cho từ khóa "giải thuật học Boosting cây quyết định ngẫu nhiên xiên phân đơn giản"

PHÂN LOẠI THƯ RÁC VỚI GIẢI THUẬT BOOSTING CÂY QUYẾT ĐỊNH NGẪU NHIÊN XIÊN PHÂN ĐƠN GIẢN

ctujsvn.ctu.edu.vn

Để cĩ thể phân lớp hiệu quả tập dữ liệu thư này, chúng tơi đã đề xuất giải thuật Boosting cây quyết định ngẫu nhiên xiên phân đơn giản (BRODS) được kết hợp từ cây ngẫu nhiên xiên phân (Do et al., 2009) với kỹ thuật Boosting (Freund and Schapire, 1995).. 3 BOOSTING CÂY NGẪU NHIÊN XIÊN PHÂN ĐƠN GIẢN (BRODS) Giải thuật boosting cây quyết định ngẫu nhiên xiên phân đơn giản (BRODS) là xây dựng tập các bộ phân lớp yếu là cây ngẫu nhiên xiên phân đơn giản sao cho mỗi bước xây dựng cây tập trung vào khắc

PHÂN LOẠI DẤU VÂN TAY VỚI RỪNG NGẪU NHIÊN XIÊN PHÂN VÀ PHƯƠNG PHÁP BIỂU DIỄN ĐẶC TRƯNG KHÔNG ĐỔI

ctujsvn.ctu.edu.vn

Xét một tác vụ phân loại với m phần tử dữ liệu x i (i = 1,m) và n chiều (thuộc tính), một cây quyết định (ký hiệu là DT) trong rừng ngẫu nhiên gồm k cây (ký hiệu RF = {DT i } i=1,k ) được xây dựng như sau. Rừng ngẫu nhiên RF-CART cho độ chính xác cao so với các giải thuật phân lớp tốt nhất hiện nay bao gồm Boosting [8] và SVM [21]. Để khắc phục nhược điểm trên, nhiều giải thuật xây dựng cây quyết định sử dụng phân hoạch đa thuộc tính (xiên phân) tại các nút được đề nghị.

PHÂN LOẠI DỮ LIỆU GIEN VỚI GIẢI THUẬT MÁY HỌC ARCX4-RODT

ctujsvn.ctu.edu.vn

PHÂN LOẠI DỮ LIỆU GIEN VỚI GIẢI THUẬT MÁY HỌC ARCX4-RODT. Trong bài viết này, chúng tơi trình bày giải thuật máy học mới ArcX4 của cây quyết định ngẫu nhiên xiên phân (ArcX4-rODT). Giải thuật ArcX4-rODT xây dựng tuần tự tập hợp cây xiên phân ngẫu nhiên, cây xây dựng sau sẽ tập trung lên các mẫu bị phân lớp sai bởi các cây trước, mỗi cây thành viên sử dụng siêu phẳng phân chia dữ liệu hiệu quả tại mỗi nút của cây dựa trên phân tích biệt lập tuyến tính.

PHÂN LOẠI VĂN BẢN: MÔ HÌNH TÚI TỪ VÀ TẬP HỢP MÔ HÌNH MÁY HỌC TỰ ĐỘNG

ctujsvn.ctu.edu.vn

Chúng tôi đề xuất giải thuật học boosting của Bayes thơ ngây ngẫu nhiên (rMNB) và cây xiên phân ngẫu nhiên đơn giản (rODS) cho phân lớp hiệu quả dữ liệu có số chiều lớn thu được từ biểu diễn văn bản với mô hình túi từ.. 3 GIẢI THUẬT BOOSTING CỦA RMNB VÀ RODS. Tập dữ liệu văn bản được biểu diễn theo mô hình túi từ.

Giải thuật rừng ngẫu nhiên giải bài toán phân đoạn ảnh theo đối tượng.

000000296126.pdf

dlib.hust.edu.vn

Ứng dụng. 18 Giải thuật rừng ngẫu nhiên giải bài toán phân đoạn ảnh theo đối tượng. ix 3.1 Giải thuật rừng ngẫu nhiên xiên phân RF-ODT trong bài toán nhận dạng dấu vân tay. 18 3.2 Giải thuật rừng ngẫu nhiên trong bài toán phân loại dữ liệu gen. 21 CHƢƠNG III: GIẢI THUẬT RỪNG NGẪU NHIÊN TRONG BÀI TOÁN ĐOẠN ẢNH THEO ĐỐI TƢỢNG. BÀI TOÁN PHÂN ĐOẠN ẢNH THEO ĐỐI TƯỢNG. Giới thiệu bài toán. Các ứng dụng của bài toán phân đoạn ảnh theo đối tượng. Các nghiên cứu liên quan.

Ra quyết định với thông tin không chắc chắn bằng việc ứng dụng mô hình cây quyết định

repository.vnu.edu.vn

Một cây quyết định có thể được học bằng cách chia tập hợp nguồn thành các tập con dựa theo một kiểm tra giá trị thuộc tính. Giải thuật học cây quyết định gồm 2 bước lớn: xây dựng cây (Top-down), cắt nhánh (Bottom-up) để tránh học vẹt. 1.1.2 Các kiểu cây quyết định. Theo tiêu chí phân loại dựa vào giá trị thuộc tính của cây, cây quyết định được chia thành 2 loại chính:. Giá trị thuộc tính liên tục A cần được rời rạc hóa trong cây quyết định.

NHậN DạNG Ký Tự Số VIếT TAY BằNG GIảI THUậT MáY HọC

ctujsvn.ctu.edu.vn

Tiếp theo, chúng tôi đề xuất giải thuật học tự động rừng xiên phân ngẫu đa lớp, mỗi cây thành viên sử dụng siêu phẳng phân chia dữ liệu hiệu quả tại mỗi nút của cây dựa trên phân tích biệt lập tuyến tính (LDA). Việc xây dựng cây xiên phân ngẫu nhiên vì thế tạo cho giải thuật có khả năng làm việc tốt trên dữ liệu có số chiều lớn sinh ra từ bước tiền xử lý.

RỪNG NGẪU NHIÊN CẢI TIẾN CHO PHÂN LOẠI DỮ LIỆU GIEN

ctujsvn.ctu.edu.vn

Kết quả thử nghiệm trên các tập dữ liệu gien (Jinyan and Huiqing, 2002) cho thấy rằng giải thuật rừng ngẫu nhiên cải tiến do chúng tôi đề xuất cho kết quả phân loại tốt khi so sánh với rừng ngẫu nhiên của cây quyết định C4.5 và máy học véctơ hỗ trợ dựa trên các tiêu chí Precision, Recall, F1, Accuracy.. Trong phần 2, chúng tôi sẽ trình bày tóm tắt giải thuật rừng ngẫu nhiêngiải thuật cải tiến cho phân lớp.

Nhận dạng hành vi của bò sử dụng gia tốc kế và giải thuật máy học rừng ngẫu nhiên

ctujsvn.ctu.edu.vn

Giải thuật dùng để xây dựng mô hình phân loại hành vi là giải thuật cây quyết định (decision tree). Các hành vi được phân loại trong mô hình này bao gồm nằm (77,42% sensitivity, 98,63% precision), ăn (98,78% sensitivity, 93,10%. Ngoài ra, mô hình nhận dạng trong nghiên cứu này còn cho phép phát hiện sự thay đổi hành vi từ đứng sang nằm với 96,45% sensitivity và 87,5% precision. (2009) sử dụng gia tốc kế để phân biệt các hành vi nằm, đứng và đi.

PHÂN LOẠI VĂN BẢN VỚI MÁY HỌC VECTOR HỖ TRỢ VÀ CÂY QUYẾT ĐỊNH

ctujsvn.ctu.edu.vn

Bài viết này so sánh hiệu quả của hai cách tiếp cận phân loại văn bản: phân loại với giải thuật cây quyết địnhphân loại với máy học vector hỗ trợ kết hợp với phân tích giá trị đơn (SVD).. Theo cả hai cách tiếp cận này, trước hết, văn bản được coi như là một tập hợp các từ. Phần tiếp theo sẽ trình bày cụ thể mô hình hóa văn bản trước khi áp dụng phân lớp theo giải thuật cây quyết địnhphân lớp theo SVM..

Tiếp cận tập thô xây dựng cây quyết định đa trị trong khai phá dữ liệu

dlib.hust.edu.vn

Từ đó ta thấy được những khó khăn trong việc quản lý dữ liệu đa trị bằng các phương pháp phân lớp truyền thống như cây quyết định đơn trị. Chương này giới thiệu về mô hình tập thô có độ chính xác thay đổi và đưa ra giải thuật xây dựng cây quyết định dựa trên tập thô có độ chính xác thay đổi nhằm khai phá dữ liệu. 9 Chương 1 Tổng quan về phát hiện tri thức trong cơ sở dữ liệu Knowledge Discovery and Data mining (KDD) là lĩnh vực nghiên cứu đang phát triển mạnh mẽ.

GIẢI THUẬT GIẢM GRADIENT NGẪU NHIÊN CHO PHÂN LỚP DỮ LIỆU LỚN

ctujsvn.ctu.edu.vn

Trong bài viết, chúng tôi trình bày giải thuật giảm gradient ngẫu nhiên sử dụng trong máy học véc-tơ hỗ trợ cho phân lớp dữ liệu lớn. Máy học véc- tơ hỗ trợ sử dụng hàm hinge loss trong phân lớp nhằm đạt được tính chất thưa trong lời giải. Tuy nhiên, do hàm hinge loss không khả vi là nguyên nhân làm chậm hội tụ đến lời giải khi áp dụng giải thuật giảm gradient ngẫu nhiên.

PHÂN LỚP ẢNH VỚI GIẢI THUẬT GIẢM GRADIENT NGẪU NHIÊN ĐA LỚP

ctujsvn.ctu.edu.vn

Chúng tôi mở rộng giải thuật SGD để có thể giải quyết vấn đề phân lớp tập dữ liệu có c lớp (c ≥ 3) hay còn gọi là đa lớp.. Hình 5: Phân lớp đa lớp, 1-vs-all (trái), 1-vs-1 (phải) Để giải quyết phân lớp tập dữ liệu đa lớp,. giải thuật SVM thường dựa trên 2 phương pháp đơn giản là 1-vs-all (Vapnik, 95) và 1-vs-1 (Krebel, 99).. Phương pháp 1-vs-all xây dựng c mô hình SVM nhị phân, mô hình thứ t tách lớp t (lớp dương) ra khỏi các lớp khác (âm)..

Giải thuật rừng ngẫu nhiên giải bài toán phân đoạn ảnh theo đối tượng.

000000296126-tt.pdf

dlib.hust.edu.vn

Tên đề tài (tiếng Việt): Giải thuật rừng ngẫu nhiên giải bài toán phân đoạn ảnh theo đối tượng. Chương 2 trình bày tổng quan về giải thuật rừng ngẫu nhiên và ứng dụng

LỌC MÔ HÌNH ẢNH HƯỞNG TÚI TỪ TRỰC QUAN VÀ THUẬT TOÁN ARCX4-RMNB

ctujsvn.ctu.edu.vn

ArcX4 thường dùng giải thuật cơ sở là cây quyết định C4.5 [15]. Chúng tơi đã đề xuất xây dựng giải thuật Bayes thơ ngây ngẫu nhiên. Thay vì giải thuật MNB sử dụng tồn bộ tập các thuộc tính (chiều) để dự báo nhãn thì Bayes thơ ngây ngẫu nhiên (rMNB) chỉ sử dụng tập con các thuộc tính được lấy ngẫu nhiên từ tập thuộc tính ban đầu..

Ứng dụng các kỹ thuật học máy trong chẩn đoán bệnh

312538.pdf

dlib.hust.edu.vn

Sơ đồ bên dưới là một dạng cây quyết định 2.1.2/ Xây dựng cây quyết định Gender =F =M Height Height 1.6m short Tall Medium 1.8m short Tall Medium Nút gốc Nút nội bộ Nút lá Hình 5: Ví dụ về cây quyết định Ứng dụng các kỹ thuật học máy trong chẩn đoán bệnh 22 Quá trình xây dựng cây quyết định gồm hai giai đoạn: Giai đoạn 1: Phát triển cây quyết định bằng phương pháp đệ quy. 2.1.3/ Cách phân chia mẫu Ứng dụng các kỹ thuật học máy trong chẩn đoán bệnh 23 - Tiêu chuẩn phân chia: tạo ra các nhóm sao cho

PHÂN LỚP DỮ LIỆU KHÔNG CÂN BẰNG VỚI ROUGHLY BALANCED BAGGING

ctujsvn.ctu.edu.vn

Trong đó, cột DT0 là kết quả thu được khi chạy giải thuật RB Bagging gốc với việc dùng cây quyết định C4.5 như là mô. tương ứng với ba mô hình học cơ sở dùng cây quyết định C4.5, rừng ngẫu nhiên và AdaBoost.M1. Khi thực thi, các giải thuật RB Bagging gốc và cải tiến đều xây dựng 200 mô hình học cơ sở. Bảng 2: Kết quả phân lớp của RB Bagging gốc và RB Bagging cải tiến.

GIẢI THUẬT ĐƠN GIẢN ĐỂ PHÁT HIỆN LÀN ĐƯỜNG VÀ ĐIỀU KHIỂN LÁI CHO ÔTÔ TỰ HÀNH

ctujsvn.ctu.edu.vn

Trong bài báo này, chúng tôi trình bày một giải thuật xử lý ảnh đơn giản giúp ôtô tự di chuyển trong giới hạn làn đường của mình. Giải thuật sẽ tiến hành phát hiện là đường sử dụng khái niệm vectơ-làn đường và ước lượng độ cong của làn đường. Nhiều dạng khác nhau của ảnh làn đường đã được sử dụng để minh họa cho tính hiệu quả của giải thuật được đề nghị. Đa phần các hệ thống đều nhận dạng làn đường dựa trên các giả thuyết định trước về mô hình toán học biểu diễn cho làn đường.

Luận án: Nghiên cứu các thuật toán phân lớp dữ liệu dựa trên cây quyết định

chiasemoi.com

Các thuật toán xây dựng cây quyết định đưa ra thuộc tính mà phân chia tốt nhất tập dữ liệu đào tạo bắt đầu từ node gốc của cây. Phần lớn các thuật toán phân lớp dữ liệu dựa trên cây quyết định có mã giả như sau:. Các thuật toán phân lớp dữ liệu dựa trên cây quyết định đều có tư tưởng chủ đạo là phương pháp Hunt đã trình bày ở trên. Luôn có 2 câu hỏi lớn cần phải được trả lời trong các thuật toán phân lớp dữ liệu dựa trên cây quyết định là:.

Một số vấn đề trong lý thuyết toán tử ngẫu nhiên tuyến tính

01050002725(1).pdf

repository.vnu.edu.vn

Hàm thực X = X(ω) xác định trên Ω, lấy giá trị trên R gọi là hàm F− đo được hay biến ngẫu nhiên nếu. gọi là biến ngẫu nhiên rời rạc. Khi I hữu hạn thì X được gọi là biến ngẫu nhiên đơn giản.. Giả sử X là biến ngẫu nhiên xác định trên (Ω, F , P. x), x ∈ R được gọi là hàm phân phối của biến ngẫu nhiên X.. Cho X là biến ngẫu nhiên đơn giản có dạng X. Với mỗi biến ngẫu nhiên X như trên, kí hiệu EX là một số được xác định bởi. Số này được gọi là kỳ vọng của biến ngẫu nhiên X..