« Home « Kết quả tìm kiếm

Học chuyển đổi cho bài toán khai phá quan điểm đa miền trong tiếng Việt


Tóm tắt Xem thử

- HỌC CHUYỂN ĐỔI CHO BÀI TOÁN KHAI PHÁ QUAN ĐIỂM ĐA MIỀN TRONG TIẾNG VIỆT.
- Tôi muốn gửi lời cảm ơn tới các thầy, anh chị và các bạn trong Phòng thí nghiệm Khoa học dữ liệu và Công nghệ Tri thức đã chia sẻ cho tôi nhiều kiến thức bổ ích cũng nhƣ giúp đỡ tôi những lúc khó khăn khi thực hiện đề tài này..
- TỔNG QUAN VỀ KHAI PHÁ QUAN ĐIỂM.
- Bài toán khai phá quan điểm.
- Các nhiệm vụ trong khai phá quan điểm.
- Các mức khai phá quan điểm.
- Khai phá quan điểm mức câu.
- Khai phá quan điểm mức tài liệu.
- Khai phá quan điểm mức thực thể và khía cạnh.
- Các phƣơng pháp phân lớp quan điểm.
- Phân lớp sử dụng Naïve Bayes.
- Phân lớp sử dụng SVM.
- HỌC CHUYỂN ĐỔI VÀ VẤN ĐỀ CHUYỂN ĐỔI MIỀN TRONG KHAI PHÁ QUAN ĐIỂM.
- Tổng quan về học chuyển đổi.
- Phân loại học chuyển đổi.
- Học chuyển đổi quy nạp.
- Học chuyển đổi truyền dẫn.
- Học chuyển đổi không giám sát.
- Một số phƣơng pháp tiếp cận trong học chuyển đổi.
- Một số ứng dụng của học chuyển đổi.
- Khai phá quan điểm.
- Vấn đề chuyển đổi miền trong khai phá quan điểm.
- Mô hình giám sát.
- Mô hình phân biệt tuyến tính.
- Chuyển đổi mô hình giám sát sang miền mới.
- Bài toán chuyển đổi miền.
- Mô hình chính xác về chuyển đổi miền.
- CÁC PHƢƠNG PHÁP CHUYỂN ĐỔI MIỀN CHO BÀI TOÁN KHAI PHÁ QUAN ĐIỂM ĐA MIỀN.
- Chuyển đổi đặc trƣng (feature-based domain adaptation.
- Bài toán lựa chọn đặc trƣng.
- Các chiến lƣợc lựa chọn đặc trƣng.
- Phƣơng pháp lựa chọn đặc trƣng dựa vào độ tƣơng hỗ (MI.
- Mô hình chuyển đổi miền sử dụng SCL.
- Giới thiệu về thuật toán SCL.
- Nội dung thuật toán.
- Mô hình cho bài toán chuyển đổi miền sử dụng SCL.
- Tiền xử lý dữ liệu.
- Huấn luyện và test mô hình.
- Chuyển đổi đối tƣợng (instance-based domain adaptation.
- Giới thiệu về thuật toán TransferBoost.
- Nội dung thuật toán TransferBoost.
- Mô hình cho bài toán chuyển đổi miền sử dụng TransferBoot.
- THỰC NGHIỆM.
- Các phần mềm và công cụ sử dụng.
- Dữ liệu thực nghiệm.
- Kết quả thực nghiệm.
- Lựa chọn đặc trƣng thông tin tƣơng hỗ.
- Bảng 2.1: Các nhóm khác nhau của học chuyển đổi.
- Bảng 2.2: Một số phƣơng pháp thực hiện học chuyển đổi.
- Bảng 2.3: Các phƣơng pháp sử dụng trong các cách cài đặt khác nhau.
- Bảng 4.1: Cấu hình phần cứng.
- Bảng 4.2: Các phần mềm và công cụ sử dụng.
- Bảng 4.3: Dữ liệu thu thập cho thực nghiệm.
- Bảng 4.4: Kết quả thực nghiệm đánh giá hiệu quả học chuyển đổi.
- Hình 2.1: Sự khác nhau giữa học chuyển đổi và học truyền thống.
- Hình 2.2: Ví dụ về mô hình giám sát đánh giá sản phẩm sách.
- Hình 2.3: Ví dụ về việc gán nhãn PoS cho các câu đƣợc lấy từ 2 miền WSJ-miền nguồn và MEDLINE-miền đích.
- Hình 3.1: Các đánh giá trên 2 miền dữ liệu liên quan.
- Hình 3.2: Minh họa mối liên hệ giữa các entropy và độ đo tƣơng hỗ.
- Hình 3.3: Thuật toán MIFS.
- Hình 3.4: Thuật toán SCL.
- Hình 3.5: Mô hình bài toán chuyển đổi miền sử dụng SCL.
- Hình 3.6: Ví dụ về biểu diễn văn bản dƣới dạng TF.
- Hình 3.7: Minh họa ý tƣởng thuật toán TransferBoost.
- Hình 3.8: Thuật toán TransferBoost.
- Hình 3.9: Một ví dụ về thuật toán TransferBoost với ba lần lặp.
- Hình 3.10: Mô hình bài toán chuyển đổi miền sử dụng TransferBoost.
- Hình 3.11: Ví dụ về biểu diễn văn bản dƣới dạng file.arff.
- Hình 4.1: Kết quả thực nghiệm đánh giá hiệu quả học chuyển đổi.
- Hiện nay, bài toán khai phá quan điểm không những giành đƣợc sự quan tâm của các nhà nghiên cứu, mà còn giữ vai trò quan trọng trong nhiều lĩnh vực khác nhau nhƣ thƣơng mại, chính trị, văn hóa,… Bài toán này thƣờng đƣợc giải quyết nhờ phƣơng pháp học máy có giám sát với yêu cầu lớn về dữ liệu có nhãn.
- Nhƣ ta biết, kỹ thuật học máy thì huấn luyện trên một tập dữ liệu và kiểm tra trên một tập dữ liệu khác, nếu hai tập này cùng miền thì kết quả khá tốt.
- Tuy nhiên, với khối lƣợng dữ liệu khổng lồ từ các miền, việc xây dựng lại dữ liệu học trên mỗi miền ứng dụng mới là tốn thời gian và lãng phí..
- Vấn đề đặt ra đối với khai phá quan điểm đa miền là một số đặc trƣng có thể đƣợc chia sẻ giữa các miền, nếu có thể khai thác mối liên hệ này thì ta có thể dựa vào một miền nguồn giảm bớt đáng kể việc xây dựng bộ học cho miền đích.
- Vì vậy, học máy trên 2 miền dữ liệu khác nhau chính là một trong những thách thức hiện nay.
- Để làm đƣợc điều đó ta cần phải xây dựng một bộ phân lớp quan điểm có thể áp dụng đƣợc trên nhiều miền dữ liệu.
- Đây là một trong những động lực chính để nghiên cứu các phƣơng pháp chuyển đổi miền để tận dụng dữ liệu đã gán nhãn từ những miền áp dụng trong quá khứ..
- Ý thức đƣợc tầm quan trọng của bài toán khai phá quan điểm đa miền cũng nhƣ ý nghĩa của học chuyển đổi, tôi đã chọn đề tài Học chuyền đổi cho bài toán khai phá quan điểm đa miền trong Tiếng Việt.
- Trong luận văn này, tôi đã nghiên cứu hai hƣớng tiếp cận học chuyển đổi điển hình: chuyển đổi đặc trƣng (phƣơng pháp SCL) và chuyển đổi đối tƣợng (phƣơng pháp TransferBoost) đồng thời áp dụng vào học chuyển đổi đa miền trong Tiếng Việt..
-  Chƣơng 1: Tổng quan về khai phá quan điểm.
- Giới thiệu khái quát về bài toán khai phá phá quan điểm và các khái niệm trong lĩnh vực này..
-  Chƣơng 2: Học chuyển đổi và vấn đề chuyển đổi miền trong khai phá quan điểm.
- Giới thiệu khái quát về học chuyển đổi, bài toán chuyển đổi miền trong khai phá quan điểm và những nội dung cơ bản của chuyển đổi miền..
-  Chƣơng 3: Các phƣơng pháp chuyển đổi miền cho bài toán khai phá quan điểm đa miền.
- [6] Gao S., Li H., (2011, October), A cross-domain adaptation method for sentiment classification using probabilistic latent analysis.
- McDonald, Fernando Pereira, (2006), Domain Adaptation with Structural Correspondence Learning.
- [8] John Blitzer, Mark Dredze, Fernando Pereira, (2007), Biographies, Bollywood, Boom-boxes and Blenders: Domain Adaptation for Sentiment Classification..
- Domain Adaptation of Natural Language Processing Systems, PhD Thesis, The University of Pennsylvania..
- [11] Patricia N., Caputo, B., (2014), Learning to learn, from transfer learning to domain adaptation: a unifying perspective, Proc.
- [14] Rui Xia , Jianfei Yu , Feng Xu , and Shumei Wang, (2014), Instance-Based Domain Adaptation in NLP via In-Target-Domain Logistic Approximation, 28 th AAAI..
- [21] Daume III H, (2007), Frustratingly Easy Domain Adaptation