« Home « Kết quả tìm kiếm

Trích rút thông tin từ dữ liệu WEB cá nhân


Tóm tắt Xem thử

- TÓM TẮT LUẬN VĂN Luận văn này chú trọng vào những nội dung sau đây.
- Nghiên cứu lý thuyết về trích rút thông tin từ tài liệu bán cấu trúc bao gồm các khái niệm liên quan, các bước để thực hiện trích rút thông tin cho đề tài này, cũng như một số cách tiếp cận để giải quyết bài toán đặt ra như phương pháp học máy với cách tiếp cận dựa trên đồ thị với hai mô hình trích rút thông tin phổ biến nhất là HMM và CRF.
- So sánh, phân tích các ưu nhược điểm của từng phương pháp, và chỉ ra phương pháp CRF mang lại kết quả tốt hơn và là cách tiếp cận chính của luận văn.
- Luận văn cũng nêu ra một số bài toán trích rút thông tin con từ dữ liệu web cá nhân với các cách tiếp cận phổ biến như xây dựng mâu, dựa trên luật, dựa trên phân loại và gán nhãn tuần tự.
- Luận văn cũng mô tả một số module chính cho mô hình bài toán trích rút thông tin đề ra nhằm xử lý để giải quyết các vấn đề mà đề tài đặt ra.
- Luận văn cũng thử nghiệm một vài ứng dụng trích rút thông tin để thực hiện đánh giá kết quả với phương pháp đã đề ra.
- Một số thử nghiệm được thực hiện với 2 bước huấn luyện và kiểm thử.
- Các kết quả thử nghiệm đạt được sẽ dùng để đánh giá hiệu năng hệ thống.
- Cuối cùng, luận văn đưa ra các kết luận, đánh giá hiệu quả của phương pháp đề xuất cũng như hướng phát triển của luận văn trong tương lai.

Xem thử không khả dụng, vui lòng xem tại trang nguồn
hoặc xem Tóm tắt