« Home « Kết quả tìm kiếm

Xây dựng kho ngữ liệu song ngữ


Tìm thấy 12+ kết quả cho từ khóa "Xây dựng kho ngữ liệu song ngữ"

Một phương pháp xây dựng ngữ liệu song ngữ Anh-Việt từ nguồn tài nguyên internet

tailieu.vn

Trên thế giới, ngƣời ta đã xây dựng đƣợc khá nhiều các kho ngữ liệu song ngữ lớn, chẳng hạn kho ngữ liệu song ngữ HKUST và PKU863 của cặp Anh - Hoa, kho ngữ liệu Europarl đƣợc trích từ văn bản Nghị Viện Châu Âu và văn bản chính phủ của một số nƣớc, kho ngữ liệu song ngữ JENAAD cho cặp ngôn ngữ Anh - Nhật,… Đối với tiếng Việt, số lƣợng các bộ ngữ liệu chƣa đƣợc quan tâm nghiên cứu nhiều. Việc xây dựng các bộ dữ liệu song ngữ lớn và có chất lƣợng tốt là rất bức thiết.

Các tiêu chí ngôn ngữ trong việc xây dựng kho ngữ liệu tiếng Việt

tailieu.vn

Chúng tôi áp dụng các tiêu chí này vào việc xây dựng kho ngữ liệu tiếng Việt (Vietnamese Corpus 1.0 – VnC 1.0) với kích thước 100 triệu từ bao gồm 10 % văn bản nói và 90 % văn bản viết được thu thập chủ yếu từ năm 2000 đến nay.. Từ khóa: Kho ngữ liệu, xây dựng kho ngữ liệu, thu thập ngữ liệu, ngôn ngữ học ngữ liệu..

Đề tài khoa học và công nghệ cấp cơ sở: Nghiên cứu xây dựng cơ sở dữ liệu từ điển bằng phương pháp trích rút từ kho ngữ liệu

tailieu.vn

Xây dựng cơ sở dữ liệu từ điển dựa trên kho ngữ liệu song song [6],[9]: xây dựng cơ sở từ điển dựa trên kho song ngữ Hungarian và Lithuanian [6], dựa trên kho song ngữ English-Germa, English-French,… [9]. Chương 1 là cơ sở lý thuyết tổng quan cho sự nghiên cứu và đề xuất giải pháp xây dựng cơ sở dữ liệu bằng phương pháp trích rút từ kho ngữ liệu. Trong chương tiếp theo báo cáo đề xuất các giải pháp cũng như lựa chọn về kỹ thuật xây dựng cơ sở dữ liệu từ điển..

Phát triển bộ công cụ hỗ trợ xây dựng kho ngữ liệu cho phân tích văn bản tiếng Việt

tainguyenso.vnu.edu.vn

Trong đó kho dữ liệu về các câu được gán nhãn cú pháp là đầy đủ nhất, từ đây có thể đễ dàng rút được các dữ liệu mẫu về câu, từ hay từ được gán nhãn. Các kho ngữ liệu này ngoài việc dùng để làm dữ liệu huấn luyện các mô hình xử lý ngôn ngữ tự động, nó còn có một vai trò quan trọng khác là để đánh giá, kiểm chứng hiệu quả của các mô hình.. Bộ công cụ trong đề tài nghiên cứu luận văn này chính là để hỗ trợ xây dựng kho ngữ liệu câu tiếng Việt có chú giải cú pháp (gán nhãn cú pháp).

Khảo sát thuật ngữ Tiếng Anh và Tiếng Việt trong ngữ liệu hợp đồng kinh tế

tailieu.vn

Từ điển thuật ngữ ngôn ngữ học đối chiếu Anh- Việt/Việt-Anh. Khoa học Xã hội.. Bước đầu xây dựng kho ngữ liệu song ngữ Anh-Việt điện tử.. Luận văn thạc sĩ Ngôn ngữ học so sánh, Trường Đại học Khoa học Xã hội và Nhân văn, Đại học Quốc gia TPHCM.. Dịch tự động Anh-Việt dựa trên việc học luật chuyển đổi từ ngữ liệu song ngữ. Luận án tiến sĩ Toán-Tin học, Trường Đại học Khoa học Tự nhiên, Đại học Quốc gia TPHCM.. Ứng dụng ngữ liệu song ngữ Anh-Việt điện tử trong ngành ngôn ngữ học so sánh.

Xây dựng tự động từ điển Việt - Anh và ứng dụng trong lĩnh vực du lịch

tailieu.vn

Từ điển song ngữ. Trích rút cụm từ song ngữ. Xây dựng kho ngữ liệu song ngữ. Kho ngữ liệu song ngữ.. Từ điển song ngữ là một dạng tài nguyên ngơn ngữ quan trọng được sử dụng trong nhiều lĩnh vực của xử lý ngơn ngữ tự nhiên. Hiện nay các phương pháp xây dựng từ điển song ngữ đều là thủ cơng hoặc bán tự động và chưa khai thác được kho ngữ liệu song ngữ giĩng hàng mức câu được cập nhật, bổ sung mở rộng từng ngày..

Luận án Tiến sĩ Kỹ thuật: Nghiên cứu giải pháp cải tiến chất lượng dịch tự động tiếng Việt

tailieu.vn

Kho ngữ liệu trong dịch tự động. Đánh giá chất lượng hệ thống dịch tự động. Nghiên cứu xây dựng hệ thống dịch và đánh giá chất lượng dịch . Đánh giá chất lượng các hệ thống dịch tự động tiếng Việt. Giải pháp nâng cao chất lượng kho ngữ liệu. Đánh giá vai trò của kho ngữ liệu đối với kết quả hệ thống dịch. Kết quả xây dựng hệ thống dịch. Giải pháp xây dựng hệ thống dịch ngữ nghĩa. HỆ THỐNG DỊCH TỰ ĐỘNG ANH-VIỆT VIKI TRANSLATOR. Xây dựng kho ngữ liệu. Xây dựng kho ngữ liệu song ngữ số lượng lớn.

Luận văn Thạc sĩ Công nghệ thông tin: Xây dựng ontology từ kho ngữ liệu dạng văn bản

tailieu.vn

Vì nhu cầu xây dựng bản thể học cho các lĩnh vực kiến thức cụ thể dựa trên kho ngữ liệu văn bản có sẵn, đề tài thực hiện “ XÂY DỰNG BẢN THỂ HỌC TỪ KHO NGỮ LIỆU DẠNG VĂN BẢN. 2.1 Gi ới thiệu bản thể học. 2.1.1 Khái ni ệm Bản thể học. 2.1.2 Ứng dụng của bản thể học hiện nay. 2.1.3 Hi ệu quả mang lại từ việc sử dụng bản thể học. 2.1.4 Cách t ổ chức dữ liệu trong một bản thể học. 2.2.1 H ọc từ bản thể học. 2.2.2 T ạo bản thể học bán tự động từ kho ngữ liệu văn bản. 2.2.3 K ỹ thuật tạo bản thể học bán

Luận văn Thạc sĩ Khoa học: Phát triển công cụ gióng hàng văn bản song ngữ

tailieu.vn

Sau khi thu thập được kho ngữ liệu ấy, cần phải tiến hành gióng hàng nó. Gióng hàng có nghĩa là đặt tương ứng một khối văn bản với bản dịch của nó ở ngôn ngữ khác. Trong đó gióng hàng mức câu đóng vai trò rất quan trọng. Đó là lý do tác giả chọn đề tài "Phát triển công cụ gióng hàng văn bản song ngữ".. Khảo sát các hướng nghiên cứu và các công trình sẵn có về gióng hàng văn bản song ngữ mức câu trên thế giới và Việt Nam. Xây dựng một kho ngữ liệu song ngữ Anh - Việt gióng hàng mức câu.

Cải Tiến Chất Lượng Dịch Tự Động Bằng Giải Pháp Mở Rộng Kho Ngữ Liệu

www.academia.edu

Mở rộng kho ngữ liệu theo hướng xây dựng/bổ sung dữ liệu Liên quan đến vấn đề xây dựng/bổ sung dữ liệu mới vào kho ngữ liệu, chúng ta có thể kể đến các phương pháp xây dựng dữ liệu mới [2][4][5]. Ngoài ra, chúng ta phải kể đến đề xuất tại [6], công trình này đưa ra đề xuất xây dựng nội dung mới cho kho ngữ liệu bằng cách thu thập, trích lọc các câu song song từ các trang website đa ngữ.

Cải tiến mô hình gióng hàng trong dịch máy thống kê cặp ngôn ngữ Việt-Anh với kỹ thuật chia nhỏ từ

tailieu.vn

Trong bài báo này, chúng tôi đề xuất một phương pháp cải tiến mô hình gióng hàng từ sử dụng các kỹ thuật chia nhỏ từ trong hệ thống dịch máy thống kê cho cặp ngôn ngữ Việt-Anh nhằm giải quyết vấn đề từ hiếm và khác biệt về hình thái giữa hai ngôn ngữ. Đầu tiên, các kỹ thuật chia nhỏ từ (ví dụ như BPE [4], unigram [5. được sử dụng để chia nhỏ từ trong các câu phía tiếng Anh của kho ngữ liệu song ngữ, sau đó thực hiện gióng hàng từ và xây dựng bảng gióng hàng từ Việt-Anh.

Xây dựng môi trường khai thác chữ viết tắt tiếng Việt

tailieu.vn

Một số kết quả thực nghiệm đã xây dựng và công bố:. 1) Xây dựng kho ngữ liệu CVT tiếng Việt, bao gồm phân tích thiết kế CSDL, triển khai cài đặt để thu thập dữ liệu CVT thủ công và từ môi trường Internet.

Giải pháp sắp xếp mục từ trong kho dữ liệu từ vựng song ngữ Việt-Ê Đê

tailieu.vn

Giải pháp sắp xếp mục từ trong kho dữ liệu từ vựng song ngữ Việt-Ê Đê. Quá trình truy vấn dữ liệu trong kho dữ liệu từ vựng, công việc thực hiện sắp xếp dữ liệu theo thứ tự tăng dần hoặc giảm dần theo thứ tự ABC của mỗi ngôn ngữ là tiêu chí cần được quan tâm trong nghiên cứu xây dựng kho dữ liệu từ vựng. Việc thực hiện sắp xếp một bảng dữ liệu tiếng Anh theo thứ tự ABC với mệnh đề Order by trong câu lệnh SQL là đơn giản.

Xây dựng mô hình và thuật toán hợp nhất dữ liệu từ điển phục vụ xử lý ngôn ngữ tự nhiên

tailieu.vn

Xây dựng từ điển và các kho ngữ liệu đa ngữ bằng cách trích rút dữ liệu từ các các nguồn tài nguyên đa ngữ như website đa ngữ, các văn bản đa ngữ . Các giải pháp trên đã cho phép tạo ra được các từ điển, các kho ngữ liệu tương đối lớn như các từ điển German dictionary Deutsches Wưrterbuch, Oxford English Dictionar, Gregg Cox;. 3 Giải pháp xây dựng từ điển lớn và đồng nhất. Như đề cập ở trên, hiện nay đã cĩ nhiều từ điển lớn đã được xây dựng và được sử dụng phổ biến.

Tóm tắt luận văn Thạc sĩ kỹ thuật: Nghiên cứu các phương pháp và xây dựng hệ thống đánh giá chất lượng dịch tự động song ngữ Anh – Việt

tailieu.vn

Như vậy sẽ gồm tính năng tiền xử lý dữ liệu đầu vào, gửi và lấy kết quả dịch trả về, tiến hành chỉnh sửa và bổ sung vào kho dữ liệu sau đó tiến hành đánh giá các kết quả này theo các phương pháp.. Biểu đồ ca sử dụng của hệ thống đánh giá a. Chức năng này cho phép người dùng có thể nạp dữ liệu đầu vào từ một file *.txt hay file *.xml là các kho dữ liệu song ngữ có sẵn, hoặc có thể nhập trực tiếp câu văn bản vào hệ thống để đánh giá.. Chức năng đánh giá chủ quan.

Xây dựng kho dữ liệu an toàn với mã Huffman

00050005727.pdf

repository.vnu.edu.vn

Mục tiêu của luận văn này nhằm nghiên cứu giải pháp xây dựng kho lƣu trữ dữ liệu hiệu quả và an toàn, bảo mật dữ liệu ngƣời dùng dựa trên việc xây dựng các thuật toán mã hóa phục vụ cho việc má hóa văn bản, nén và giải nén văn bản theo ngôn ngữ Tiếng Việt.. Thông qua việc phân tích từ (từ đơn, từ ghép) trong tiếng Việt và áp dụng vào các giải thuật mã hóa, qua đó nâng cao hiệu quả của việc mã hóa cũng nhƣ nén dữ liệu trong kho lƣu trữ an toàn.. Nén dữ liệu:

Xây dựng kho dữ liệu liên kết mở về địa điểm du lịch Việt Nam

312411.pdf

dlib.hust.edu.vn

LÊ ANH TIẾN TÊN ĐỀ TÀI LUẬN VĂN XÂY DỰNG KHO DỮ LIỆU LIÊN KẾT MỞ VỀ ĐỊA ĐIỂM DU LỊCH VIỆT NAM LUẬN VĂN THẠC SĨ KHOA HỌC HỆ THỐNG THÔNG TIN Hà Nội – Năm 2018 BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI. LÊ ANH TIẾN TÊN ĐỀ TÀI LUẬN VĂN XÂY DỰNG KHO DỮ LIỆU LIÊN KẾT MỞ VỀ ĐỊA ĐIỂM DU LỊCH VIỆT NAM Chuyên ngành : Hệ thống thông tin LUẬN VĂN THẠC SĨ KHOA HỌC HỆ THỐNG THÔNG TIN NGƯỜI HƯỚNG DẪN KHOA HỌC : 1. D liu liên kt m (Linked Open Data.

Xây dựng kho dữ liệu phục vụ quản lý và khai thác thông tin.

000000295984.pdf

dlib.hust.edu.vn

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI NGUYỄN THANH TÙNG XÂY DỰNG KHO DỮ LIỆU PHỤC VỤ QUẢN LÝ VÀ KHAI THÁC THÔNG TIN Chuyên ngành: Công nghệ thông tin LUẬN VĂN THẠC SĨ KỸ THUẬT CÔNG NGHỆ THÔNG TIN NGƯỜI HƯỚNG DẪN KHOA HỌC PGS. 8 CHƯƠNG I: KHO DỮ LIỆU. TỔNG QUAN VỀ KHO DỮ LIỆU. Các kiểu dữ liệu. Kiến trúc kho dữ liệu. XÂY DỰNG KHO DỮ LIỆU. Các thành phần của kho dữ liệu. Mô hình dữ liệu. Tạo lập các kho dữ liệu. XỬ LÝ VÀ KHAI THÁC DỮ LIỆU.

Đo độ tương tự ngữ nghĩa của cặp ngôn ngữ Anh-Việt theo mô hình phân phối ngữ nghĩa song ngữ

tailieu.vn

Trong bài viết này, chúng tôi trình bày một số kỹ thuật đo độ tương tự ngữ nghĩa song ngữ theo tiếp cận nhúng từ song ngữ. đề xuất một mô hình mạng nơron xây dựng không gian vector biểu diễn ngữ nghĩa song ngữ. xây dựng bộ dữ liệu chuẩn cho bài toán đo độ tương tự ngữ nghĩa song ngữ Việt-Anh. Cuối cùng, chúng tôi thực nghiệm và đánh giá các kỹ thuật trên bộ dữ liệu đã xây dựng.. Từ khóa: Xử lý ngôn ngữ tự nhiên, độ tương tự ngữ nghĩa song ngữ, nhúng từ song ngữ..