« Home « Kết quả tìm kiếm

Xây dựng cổng thông tin danh thắng và di sản văn hóa tại Nha Trang - Đà Lạt ứng dụng công nghệ ngữ nghĩa.


Tóm tắt Xem thử

- Luận văn thạc sĩ Học viên Nguyễn Phát ðạt Trang i LỜI CAM ðOAN Tôi xin cam ñoan ñây là công trình nghiên cứu của tôi dưới sự hướng dẫn của TS.Cao Tuấn Dũng.
- Cao Tuấn Dũng – Viện công nghệ Thông tin và Truyền thông - ðại học Bách Khoa Hà Nội, người ñã tận tình hướng dẫn và giúp ñỡ cùng với những lời ñộng viên, khích lệ em hoàn thành luận văn này.
- Em xin chân thành cảm ơn Quý Thầy, Cô nhân viên thuộc Viện Công nghệ Thông tin và Truyền thông, Viện Sau ðại học – Trường ðại học Bách Khoa Hà Nội, những người ñã dành nhiều quan tâm, giúp ñỡ em trong quá trình nghiên cứu và hoàn thành luận văn.
- cảm ơn các bạn học viên lớp Cao học Công nghệ thông tin khóa 2012A - Nha Trang, những người thân yêu ñã tạo ñiều kiện về mặt thời gian, công việc, ñộng viên, giúp ñỡ trong suốt quá trình học tập và thực hiện luận văn tốt nghiệp.
- Xin kính chúc sức khoẻ và thành công! Hà Nội, ngày 20 tháng 4 năm 2014 Nguyễn Phát ðạt Luận văn thạc sĩ Học viên Nguyễn Phát ðạt Trang iii MỤC LỤC MỤC LỤC.
- 1 Chương 1: TỔNG QUAN VỀ WEB NGỮ NGHĨA.
- Sự ra ñời của Web ngữ nghĩa.
- Web ngữ nghĩa là gì.
- Lợi ích của việc sử dụng Web ngữ nghĩa .
- Kiến trúc của Web ngữ nghĩa .
- Các hướng phát triển của Web ngữ nghĩa .
- Chuẩn hoá các ngôn ngữ biểu diễn dữ liệu trên Web.
- Phát triển nâng cao Web có ngữ nghĩa .
- Ứng dụng Web ngữ nghĩa trong lĩnh vực du lịch .
- Dự án IM@GINE IT Kết chương Chương 2: TÌM HIỂU PORTAL VÀ ỨNG DỤNG CÔNG NGHỆ NGỮ NGHĨA XÂY DỰNG PORTAL DU LỊCH.
- Các ñặc trưng cơ bản của Portal Luận văn thạc sĩ Học viên Nguyễn Phát ðạt Trang iv 2.2.1.
- Portal là một ñiểm tích hợp thông tin duy nhất .
- Portal ñóng vai trò là kênh thông tin .
- Khảo sát một số portal ngữ nghĩa trên thế giới .
- Phương thức ñánh giá Portal ngữ nghĩa .
- ðề xuất giải pháp xây dựng Cổng thông tin du lịch Chương 3: XÂY DỰNG CỔNG THÔNG TIN DANH THẮNG VÀ DI SẢN VĂN HOÁ TẠI NHA TRANG – ðÀ LẠT.
- ðịnh hướng sử dụng công nghệ xây dựng hệ thống .
- Cấu trúc dữ liệu thể hiện ñược các thuộc tính của một ñịa ñiểm .
- Hệ thống có khả năng tổng hợp ñược thông tin từ nhiều nguồn .
- Xây dựng cơ sở dữ liệu Ontology .
- Phương pháp xây dựng Ontology .
- Phân loại chủ ñề ñịa ñiểm theo cấu trúc dữ liệu .
- Tổng hợp và xử lý dữ liệu .
- Quá trình tổng hợp thông tin .
- Quá trình chuyển ñổi dữ liệu sang dạng RDF .
- Phân tích thiết kế hệ thống Luận văn thạc sĩ Học viên Nguyễn Phát ðạt Trang v 3.4.1.
- Thiết kế dữ liệu tầng Model .
- Chức năng hiển thị thông tin ñịa ñiểm .
- 86 Luận văn thạc sĩ Học viên Nguyễn Phát ðạt Trang vi DANH MỤC CÁC BẢNG Bảng 0-1.
- Bảng so sánh một số portal ngữ nghĩa trên thế giới Bảng 3-1.
- Một số thao tác với Apache Luận văn thạc sĩ Học viên Nguyễn Phát ðạt Trang vii DANH MỤC CÁC HÌNH Hình 0-1.
- Web ngữ nghĩa như một sự mở rộng của World Wide Web.
- Sự phát triển thông minh của dữ liệu Hình 1-4.
- Kiến trúc Web ngữ nghĩa (phiên bản Hình 2-1.
- Sơ ñồ các lớp của Cổng thông tin ngữ nghĩa Hình 3-1.
- Mô tả cách hiển thị chú thích ngữ nghĩa Hình 3-3.
- Mô tả cách hiển thị ñịa ñiểm có liên quan ngữ nghĩa Hình 3-4.
- Cấu trúc cây khái niệm về Lịch sử Luận văn thạc sĩ Học viên Nguyễn Phát ðạt Trang viii Hình 3-15.
- Quá trình xử lý truy vấn ngữ nghĩa Hình 3-21.
- Quá trình xử lý chỉnh sửa dữ liệu Hình 3-23.
- Quá trình hiển thị dữ liệu Hình 3-24.
- Quá trình lưu trữ dữ liệu Cookie Hình 3-25.
- Quá trình xác nhận quyền chỉnh sửa dữ liệu Hình 3-26.
- Giao diện trang Tìm kiếm ñịa ñiểm ngữ nghĩa Hình 3-32.
- Giao diện trang tạo mới và chỉnh sửa thông tin ñịa ñiểm Hình 4-1.
- Giao diện chức năng hiển thị thông tin ñịa ñiểm Hình 4-4.
- Giao diện chức năng tìm kiếm ñịa ñiểm Luận văn thạc sĩ Học viên Nguyễn Phát ðạt Trang ix DANH MỤC THUẬT NGỮ - TỪ VIẾT TẮT Thuật ngữ, từ viết tắt Giải thích ý nghĩa Ghi chú API Application Programming Interface HTML HyperText Markup Language HTTP HyperText Transfer Protocol Instance Thể hiện của một khái niệm trong mô hình hóa tri thức Ontology Là một mô hình hóa tri thức mô tả các khái niệm cũng như mối quan hệ giữa chúng trong một lĩnh vực nhất ñịnh OWL Web Ontology Language Property Thuộc tính trong mô hình hóa tri thức RDF Resource Description Framework Theo W3C RDFS RDF Schema Semantic Web Công nghệ Web ngữ nghĩa SPARQL SPARQL Protocol And RDF Query Language - ðây là ngôn ngữ dùng ñể truy vấn dữ liệu ngữ nghĩa ñược mô tả bằng RDF SWAD Semantic Web Advanced Development URI Uniform Resource Identifier URL Uniform Resource Locator URN Uniform Resource Name W3C World Wide Web Consortium Web services Các dịch vụ web WWW World Wide Web XML eXtensible Markup Language Bảng 0-1.
- Danh mục các thuật ngữ viết tắt Luận văn thạc sĩ Học viên Nguyễn Phát ðạt Trang 1 MỞ ðẦU Trong xã hội hiện ñại ngày nay, chúng ta ñang “chìm ngập” trong thông tin nhưng lại “khát khao” tri thức.
- Thật vậy, kho dữ liệu World Wide Web chứa một lượng thông tin khổng lồ, chúng ñược tạo ra từ nhiều tổ chức, cộng ñồng và nhiều cá nhân với những mục ñích khác nhau như: giáo dục, y tế, kinh doanh, thương mại, du lịch,… Người sử dụng Web có thể dễ dàng truy cập những thông tin này bằng cách chỉ ra ñịa chỉ URL – Uniform Resource Locator và theo các liên kết ñể tìm ra các tài nguyên liên quan khác.
- Các kĩ thuật Web hiện nay vẫn khó khăn trong việc tìm kiếm, rút trích và chọn lọc thông tin dẫn ñến dữ liệu kết quả bị dư thừa.Trong trường hợp này, máy tính chỉ ñược dùng như những thiết bị gửi và trả thông tin, chúng không thể truy xuất ñược những nội dung thật sự cần thiết và do ñó chỉ hỗ trợ ở một mức giới hạn nhất ñịnh trong việc truy xuất và xử lý thông tin.
- Kết quả tất yếu là con người (ở ñây là người sử dụng) phải “gánh” trên vai trách nhiệm không những truy cập và xử lý thông tin mà còn rút trích và thông dịch những thông tin tìm kiếm ñược.
- Khái niệm này ñã ñược Tim Berners-Lee ñịnh nghĩa như sau: “Web ngữ nghĩa như một sự mở rộng của web hiện tại mà trong ñó thông tin ñược xử lý một cách tự ñộng bằng máy tính, làm cho máy tính và con người có thể hợp tác với nhau”.
- Web ngữ nghĩa như một sự mở rộng của World Wide Web Luận văn thạc sĩ Học viên Nguyễn Phát ðạt Trang 2 Như vậy Web ngữ nghĩa là một mạng lưới các thông tin ñược liên kết theo cách thức ñể máy có thể dễ dàng xử lý thông tin ở mức ñộ toàn cầu.
- ðối với các website cung cấp thông tin du lịch thì hầu hết là rời rạc theo nội dung dữ liệu, thông tin bị tách rời.
- việc truy xuất, tìm kiếm dữ liệu trên các website này ña phần là tìm kiếm theo từ khóa nên hiệu quả không cao, kết quả những thông tin cần tìm kiếm bị dư thừa.
- Chính vì vậy mà sự ra ñời của Web ngữ nghĩa là một bước tiến vượt bậc so với kỹ thuật Web hiện tại dựa vào khả năng làm việc với thông tin của chúng thay vì chỉ ñơn thuần là lưu trữ thông tin.
- Với sự lớn mạnh và khả năng lưu trữ thông tin ngữ nghĩa, Web ngữ nghĩa sẽ trở thành một thế hệ Web cho tương lai, thế hệ Web mà chúng ta ñang chờ ñợi.
- Và ñó cũng là lý do ñề tài “Xây dựng cổng thông tin danh thắng và di sản văn hóa tại Nha Trang - ðà Lạt ứng dụng công nghệ ngữ nghĩa” ñược em quan tâm và chọn làm luận văn tốt nghiệp.
- Lý do chọn ñề tài Ngày nay, với sự bùng nổ về khoa học công nghệ, sự phát triển mạnh mẽ của công nghệ thông tin ñã và ñang thay ñổi diện mạo hầu hết các lĩnh vực của nền kinh tế trong mỗi quốc gia.
- Một nền kinh tế mạnh, một quốc gia mạnh ñi ñôi với việc quốc gia ñó ñã ñược ứng dụng và khai thác và ứng dụng một cách hiệu quả trong lĩnh vựa công nghệ thông tin.
- Trước ñây, việc lưu trữ các di sản văn hóa, việc quảng bá các danh thắng cho mỗi vùng, miền hay một quốc gia,… tất cả chỉ ñược biết ñến thông qua quá trình thăm quan thực tế hoặc thông qua các tư liệu bằng văn bản hay những lưu trữ dưới dạng hình ảnh, video,….Cho tới khi công nghệ thông tin phát triển, ñặc biệt là các ứng dụng trên Web, việc biết ñến các di tích, danh thắng hay các di sản văn hóa ở một vùng, miền nhất ñịnh ñã trở thành ñơn giản hơn rất nhiều chỉ với các thao tác trên giao diện Web.
- Bên cạnh ñó, vấn ñề trợ giúp người dùng có thể tra cứu thông tin trên website một cách thuận tiện và chính xác ñặt ra bài toán cần phải xây dựng một website có khả năng tìm kiếm và phân loại thông tin.
- Từ ñó, ý tưởng xây dựng một “website thông minh” hay “Cổng thông tin – Portal” ñược ñề xuất.
- Từ những lý Luận văn thạc sĩ Học viên Nguyễn Phát ðạt Trang 3 do ñó em lựa chọn ñề tài: “Xây dựng Cổng thông tin danh thắng và di sản văn hóa tại Nha Trang - ðà Lạt ứng dụng công nghệ ngữ nghĩa”.
- Mục ñích nghiên cứu Mục ñích của ñề tài là nghiên cứu, sử dụng các kỹ thuật dựa trên công nghệ Web ngữ nghĩañể xây dựng Cổng thông tin danh thắng và di sản văn hoá tại hai thành phố Nha Trang và ðà Lạt.
- Tìm hiểu lý thuyết tổng quát về Web ngữ nghĩa.
- ðề xuất giải pháp xây dựng “Cổng thông tin danh thắng và di sản văn hoá” tại hai Thành phố Nha Trang và ðà Lạt.
- tìm kiếm và khảo sát các tài liệu mô tả thông tin về di sản, di tích thắng cảnh tại Nha Trang và ðà Lạt.
- Luận văn thạc sĩ Học viên Nguyễn Phát ðạt Trang 4 b) Phạm vi nghiên cứu Trong phạm vi giới hạn của ñề tài, luận văn cố gắng ñảm bảo ñược một số yêu cầu ñặt ra như sau.
- thu thập thông tin về hai thành phố nổi tiếng Nha Trang – ðà Lạt thông qua việc khảo sát các tài liệu có liên quan.
- xây dựng tập từ vựng cơ bản về các ñịa ñiểm du lịch.
- Xây dựng một portal cung cấp thông tin về hai thành phố ñến người dùng áp dụng công nghệ ngữ nghĩa ñể người dùng có thể tìm kiếm, tra cứu thông tin theo cách thân thiện và chính xác.
- Khảo sát các tài liệu mô tả các thông tin về di sản, di tích thắng cảnh tại Nha Trang – ðà Lạt.
- Nghiên cứu và xây dựng cơ sở dữ liệu thông tin du lịch.
- Tìm hiểu các công nghệ xây dựng cổng thông tin ngữ nghĩa thông qua việc khảo sát các portal ngữ nghĩa trong nước và trên thế giới.
- Ứng dụng xây dựng Cổng thông tin ngữ nghĩa về du lịch cho hai ñịa ñiểm Nha Trang – ðà Lạt 5.
- Ý nghĩa khoa học và thực tiễn của luận văn a) Ý nghĩa khoa học • Nghiên cứu công nghệ web ngữ nghĩa (Semantic Web.
- Luận văn thạc sĩ Học viên Nguyễn Phát ðạt Trang 5 • Hiểu và vận dụng ñược các kiến thức về RDF, Ontology, RDF/XML, RDF Schema, OWL, SPARQL.
- Cung cấp giải pháp xây dựng Ontology du lịch.
- Xây dựng Cổng thông tin ngữ nghĩa có khả năng thích nghi với mối quan tâm của người dùng.
- Xây dựng “Cổng thông tin du lịch” ứng dụng công nghệ ngữ nghĩa trợ giúp cho người dùng (ñặc biệt là khách du lịch) có thể tra cứu thông tin một cách nhanh chóng, thuận tiện và chính xác.
- ðồng thời, kết quả nghiên cứu của ñề tài ñóng vai trò làm nền tảng ñể giải quyết các bài toán xử lý ngữ nghĩa khác trong thực tiễn.
- Cấu trúc luận văn Với mục tiêu nghiên cứu, tìm hiểu, và xây dựng cổng thông tin du lịch ứng dụng công nghệ ngữ nghĩa, luận văn bao gồm các chương sau: Chương 1: Tổng quan về Web ngữ nghĩa: Chương này ñề cập ñến những kiến thức nền tảng về Semantic Web bao gồm các kiến trúc, khái niệm, ứng dụng ñiển hình của công nghệ Semantic Web.
- Chương 2: Tìm hiểu Portal và ứng dụng Web ngữ nghĩa xây dựng Portal du lịch: Chương này ñi sâu khảo sát, tìm hiểu các công nghệ xây dựng Cổng thông tin trong nước và trên thế giới hiện nay và phân tích các tính năng và ích lợi của portal ngữa nghĩa trong các nghiên cứu này.
- Chương 3: Xây dựng Cổng thông tin danh thắng và di sản văn hoá tại Nha Trang – ðà Lạt: Chương này phân tích và ñưa ra các mục tiêu chức năng của Luận văn thạc sĩ Học viên Nguyễn Phát ðạt Trang 6 hệ thống.
- ñề xuất giải pháp xây dựng Cổng thông tin du lịch.
- ñưa ra một số hình ảnh minh hoạ quá trình vận hành của Portal ñã xây dựng và các kết quả do các tính năng ngữ nghĩa mang lại.
- Luận văn thạc sĩ Học viên Nguyễn Phát ðạt Trang 7 Chương 1: TỔNG QUAN VỀ WEB NGỮ NGHĨA 1.1.
- Worl Wide Web và những mặt hạn chế Ngày nay, hệ thống mạng toàn cầu (WWW) ñã phát triển rộng khắp và trở thành một kho tàng thông tin khổng lồ của nhân loại, một môi trường chuyển tải thông tin không thể thiếu ñược thông qua một loạt các tiêu chuẩn ñược thiết lập rộng rãi và ñảm bảo ñược các thành phần ở các mức ñộ khác nhau.
- Tương tự như vậy, HTTP và HTML ñã cung cấp các cách tiêu biểu ñể có thể nhận thông tin và trình diễn các tài liệu siêu văn bản trên giao diện web.
- Tuy nhiên, trước sự bùng nổ thông tin trên Web cũng ñặt ra một thách thức mới là làm thế nào ñể khai thác ñược thông tin này một cách hiệu quả, mà cụ thể là làm sao ñể máy tính có thể hiểu và suy diễn ñược chúng.
- Sự ra ñời của Web ngữ nghĩa Thế hệ web ñầu tiên bắt ñầu với những trang HTML thủ công, thế hệ thứ hai ñã cải thiện thêm một bước là làm cho máy thực hiện và thường là các trang HTML ñộng.
- Các thế hệ web này mang ý nghĩa cho con người thao tác trực tiếp thông qua việc tìm kiếm, ñọc, duyệt, nhập thông tin vào form.
- Thế hệ web thứ ba gọi là “Semantic Web” ñược xây dựng nhằm mục ñích là thông tin sẽ do máy xử lý.
- Ý tưởng Web ngữ nghĩa (Semantic Web), một thế hệ mới của Web ra ñời do chính cha ñẻ của World Wide Web là Tim Berners-Lee ñề xuất vào năm 1998.

Xem thử không khả dụng, vui lòng xem tại trang nguồn
hoặc xem Tóm tắt