« Home « Kết quả tìm kiếm

Tóm tắt văn bản tiếng Việt sử dụng phương pháp Textrank


Tóm tắt Xem thử

- TÓM TẮT VĂN BẢN TIẾNG VIỆT SỬ DỤNG PHƯƠNG PHÁP TEXTRANK.
- Tôi xin cam đoan luận văn này được hoàn thành trên cơ sở nghiên cứu, tổng hợp và phát triển các nghiên cứu tóm tăt văn bản trong nước và trên thế giới do tôi thực hiện..
- Hình 2 Đồ thị thể hiện mối quan hệ giữa các đơn vị từ vựng trong văn bản.
- Hình 3 Đồ thị mô phỏng các kết nối giữa các cập câu trong văn bản.
- Hình 4 Mô hình tóm tắt văn bản Tiếng Việt sử dụng TextRank.
- Hình 5 Mô hình tóm tắt văn bản Tiếng Việt sử dụng Cosine.
- Hình 6 Đồ thị mô phỏng quan hệ giữa các câu trong văn bản mẫu sử dụng TextRank.
- Hình 7 Đồ thị mô phỏng quan hệ giữa các câu trong văn bản mẫu sử dụng Cosine.
- Hình 8 Biểu đồ phân bố điểm đánh giá văn bản tóm tắt 6 tập mẫu.
- Hình 9 Biểu đồ phân bố điểm đánh giá văn bản tóm tắt của 13 tập dữ liệu.
- Hình 10 Giao diện chương trình tóm tắt văn bản tự động.
- Hình 11 Giao diện hiển thị đồ thị quan hệ giữa các câu trong văn bản.
- Bảng 2 Kết quả so sánh tóm tắt đơn giữa TextRank và các hệ thống khác.
- Bảng 3 Danh sách chủ đề và số lượng văn bản tương ứng.
- Bảng 4 Kết quả đánh giá hệ thống tóm tắt tự động sử dụng độ đo Cosine.
- Bảng 5 Thời gian tóm tắt và đánh giá các bộ dữ liệu dùng Cosine.
- Bảng 6 Kết quả đánh giá hệ thống tóm tắt tự động sử dụng TextRank.
- Bảng 7 Thời gian tóm tắt và đánh giá các bộ dữ liệu dùng TextRank.
- Bảng 8 Kết quả đánh giá 13 bộ dữ liệu sau khi đã phân tích.
- Chương 1 Tổng quan bài toán tóm tắt văn bản.
- Tổng quan tóm tắt văn bản.
- Phân loại bài toán tóm tắt.
- Tóm tắt đơn văn bản.
- Tóm tắt theo trích xuất.
- Tóm tắt theo tóm lược.
- Đánh giá văn bản tóm tắt.
- Chương 2 Tóm tắt văn bản sử dụng TextRank.
- Đồ thị vô hướng.
- Đồ thị có trọng số.
- Đồ thị hoá văn bản.
- Sử dụng TextRank trích xuất từ khoá.
- Sử dụng TextRank trích rút câu.
- Tóm tắt văn bản Tiếng Việt sử dụng TextRank.
- Một số đặc trưng của Tiếng Việt.
- Xây dựng hệ thống tóm tắt tự động văn bản Tiếng Việt.
- Chương 3 Thực nghiệm và đánh giá kết quả.
- Dữ liệu thực nghiệm.
- Thực nghiệm và đánh giá với độ đo Cosine.
- Khuyến nghị tăng cường độ chất lượng văn bản tóm tắt.
- Khuyến nghị tăng cường chất lượng văn bản tóm tắt.
- Rất nhiều người có nhu cầu tổng hợp và tóm tắt lại các thông tin để thuận lợi cho việc tổng hợp các thông tin đó.
- Xuất phát từ nhu cầu đó, các phương pháp tóm tắt tự động được nghiên cứu và phát triển.
- Tóm tắt dữ liệu tự động là một lĩnh vực rất quan trọng, nó bao gồm trong đó là học máy và khai phá dữ liệu..
- Bài toán tóm tắt dữ liệu tự động không chỉ dừng lại ở tóm tắt văn bản mà nó còn mở rộng ra các loại dữ liệu đa phương tiện như hình ảnh, âm thanh và video..
- Một ví dụ điển hình cho việc ứng dụng của tóm tắt dữ liệu tự động là các máy tìm kiếm, trong đó nổi bật nhất là bộ máy tìm kiếm Google..
- Hiện nay trên thế giới, nhiều nhà khoa học và các công ty tỏ ra rất quan tâm đến bài toán tóm tắt văn bản tự động.
- Tại các hội nghị nổi tiếng như: DUC TAC ACL tóm tắt văn bản tự động đã được đề cập đến nhiều trong các bài báo.
- Ngoài ra, có nhiều hệ thống tóm tắt văn bản độc lập hoặc tích hợp được phát triển như: MEAD, LexRank, chức năng tự động tóm tắt trong Microsoft Word..
- Trên thế giới có hai cách tiếp cận bài toán tóm tắt: Tóm tắt trích rút và tóm tắt rút gọn.
- Đối với tóm tắt trích rút, chương trình tóm tắt tự động sẽ trích rút ra các thành phần của văn bản mà không chỉnh sửa nội dung của nó rồi ghép lại thành một văn bản hoàn chỉnh.
- Loại tóm tắt này bao gồm trích rút câu và trích rút cụm từ.
- Như vậy, tóm tắt trích rút chỉ sử dụng các thông tin có sẵn trong văn bản như: từ, cụm từ, câu để tạo ra văn bản tóm tắt.
- Đối với tóm tắt rút gọn, cách tiếp cận này sử dụng ngữ nghĩa của các thành phần trong văn bản, các kỹ thuật trong xử lý ngôn ngữ tự nhiên để tạo ra văn bản tóm tắt gần giống với văn bản được tóm tắt bởi con người..
- Tiếng Việt.
- Hoàng Văn Thung (1996), Ngữ pháp tiếng Việt T1 - T2, NXB Giáo dục, Hà Nội..
- Lê Biên (1993), Từ loại tiếng Việt hiện đại, ĐH Sư phạm I Hà Nội..
- Đinh Văn Đức (1986), Ngữ pháp tiếng Việt: Từ loại, NXB Đại học và trung học chuyên nghiệp..
- Lê Thanh Hương, Hà Quang Thụy, Trần Mai Vũ, Vũ Đức Thi, Nguyễn Thị Thu Trang, Hoàng Anh Việt và Đỗ Bá Lâm (2014), Báo cáo tổng kết đề tài B Nghiên cứu một số phương pháp tóm tắt văn bản tự động trên máy tính áp dụng cho Tiếng Việt”, Trường Đại học Bách Khoa Hà Nội, 2014..
- Báo cáo Tổng kết đề tài KC Nghiên cứu phát triển một số sản phẩm thiết yếu về xử lý tiếng nói và văn bản tiếng Việt".
- và Về xử lý tiếng Việt trong công nghệ thông tin (2006), Viện Công nghệ Thông tin, Viện Khoa học và Công nghệ Việt Nam, 2009..
- tiếng Việt", Tạp chí Ngôn ngữ và đời sống số 9 (95)..
- Trần Mai Vũ (2009), Tóm tắt đa văn bản dựa vào trích xuất câu, Luận văn thạc sĩ, Trường Đại học Công nghệ, Đại học Quốc gia Hà Nội, 2009