« Home « Kết quả tìm kiếm

Tích hợp dữ liệu vào Semantic web


Tóm tắt Xem thử

- Nguyễn Công Nhật CÔNG NGHệ PHầN MềM TícH hợp dữ liệu vào Semantic Web luận văn thạc sĩ khoa học 2006-2008 Hà Nội – 2008 bộ giáo dục và đào tạo trờng đại học bách khoa hà nội.
- Nguyễn Công Nhật TícH hợp dữ liệu vào Semantic Web Chuyên ngành : Công Nghệ Phần Mềm luận văn thạc sĩ KHOA HọC ngời hớng dẫn khoa học : PSG.
- 7 CHƯƠNG I : GIỚI THIỆU SEMANTIC WEB.
- Sự ra đời của Semantic Web.
- Semantic Web là gỡ.
- Semantic Web mang lại những gỡ.
- Mỏy cú thể hiểu được thụng tin trờn Web.
- Thụng tin được tỡm kiếm nhanh chúng và chớnh xỏc hơn.
- Dữ liệu liờn kết động.
- Kiến trỳc Semantic Web.
- Giới thiệu.
- Vai trũ cỏc lớp trong kiến trỳc Semantic Web.
- Mục tiờu ra đời và lợi ớch khi sử dụng XML.
- Lợi ớch khi sử dụng XML.
- Một tài liệu XML thụng dụng.
- Tạo lập một tài liệu XML.
- Cỏc thành phần của một tài liệu XML.
- Một tài liệu XML hợp lệ.
- Cỏc kiểu dữ liệu trong lược đồ XML.
- Qualified name(QName) và cỏch sử dụng.
- Tripple và cỏch sử dụng namespace.
- Kiểu dữ liệu cú cấu trỳc và Blank node.
- Cỏch sử dụng rdfs:range.
- Cỏch sử dụng rdfs:domain.
- Truy vấn dữ liệu trong RDF.
- Ràng buộc dữ liệu.
- TÍCH HỢP DỮ LIỆU VÀO SEMANTIC WEB.
- Mụ hỡnh tớch hợp dữ liệu.
- Cỏc ngụn ngữ của Semantic Web.
- Chuyển dữ liệu từ Relational Database sang XML.
- Phương thức chuyển đổi cơ sỡ dữ liệu quan hệ sang XML.
- Chuyển đổi cỏc thành phần của cơ sở dữ liệu quan hệ sang XML.
- Chuyển dữ liệu từ cơ sở dữ liệu quan hệ sang RDF.
- Chuyển đổi cơ sở dữ liệu quan hệ RDF.
- 96 6 DANH MỤC CÁC TỪ VIẾT TẮT HTTP HTML XHTML RDF: Resource Description Framework FTP: File Transport Protocal XML URI: Uniform Resource Identifier URL: Unified Resource Locator OWL: Web Ontoloty Language WWW: World Wide Web 7 DANG MỤC HèNH VẼ Hỡnh 1-1 Kiến trỳc Semantic Web 13 Hỡnh 3-1: Đồ thị biểu diễn bộ ba 35 Hỡnh 3-2: Đồ thị biểu diễn nhúm bộ ba 36 Hỡnh 3-3 Mối quan hệ giữa cỏc thành phần trong triple.
- 41 Hỡnh 3-4 Mụ tả một phỏt biểu đơn giản bằng đồ thị 41 Hỡnh 3-5 Biểu diễn nhiều phỏt biểu cho cựng một subject 42 Hỡnh 3-6 Plain Literal biểu diễn cho tuổi của Mr John 43 Hỡnh 3-7 Kiểu Typed Literal biểu diễn cho tuổi của Mr John 44 Hỡnh 3-8 Tạo địa chỉ(address) cho Mr John 46 Hỡnh 3-9 Sử dụng một blank Node.
- Mụ hỡnh hệ thống tớch hợp dữ liệu 74 Hỡnh 4.2.
- Mụ hỡnh chuyển đổi cơ sở dữ liệu quan hệ sang XML 83 ABSTRACT TITLE: CONVERT RELATIONAL DATA INTO SEMANTIC WEB This thesis is devided into five chapters Chapter 1: Introduction about semantic web This chapter introduces generally about semantic web, gives out basic concepts as well as components of a Semantic Web structure.
- It also points out the role of the components in a Semantic Web structure and gives out some basic uses of semantic web.
- Chapter 2: Introduction about XML technology This chapter introduces generally about XML technology, points out the role and use of XML in practice, introduces establishing technology and data process in XML Chapter 3: Introduction about RDF This chapter inroduces generally about RDF, points out the role of RDF in Semantic Web and introduces technology to establish, process and query in RDF.
- Chapter 5: Data convert into Semantic Web This chapter introduces data convert technology into Semantic Web, does research on methodologies to convert components of data relation unit into XML and RDF, immitates implementation system of the convert procedure.
- Chapter 5: Conclusion and further developments Giving out conclusion of the thesis and some suggestions about further developments TểM TẮT LUẬN VĂN TấN ĐỀ TÀI LUẬN VĂN: “TÍCH HỢP DỮ LIỆU VÀO SEMANTIC WEB” Luận văn được chia làm 5 chương Chương I: GIỚI THIỆU VỀ SEMANTIC WEB Chương này giới thiệu tổng quan về Semantic Web, đưa ra cỏc khỏi niệm cơ bản cũng như cỏc thành phần trong kiến trỳc Semantic Web, chỉ ra vai trũ cỏc thành phần trong kiến trỳc Semanitic Web và đưa ra một số ứng dụng cơ bản trong lĩnh vực Semantic Web.
- Chương II: GIỚI THIỆU CễNG NGHỆ XML Chương này giới thiệu tổng quan cụng nghệ XML, chỉ ra cỏc vai trũ và ứng dụng của XML trong thực tế, giới thiệu cỏc kỹ thuật tạo lập cũng như xử lý dữ liệu trờn XML.
- Chương III: GIỚI THIỆU VỀ RDF Chương này giới thiệu tổng quan về RDF, chỉ ra vai trũ của RDF trong kiến trỳc Semantic Web đồng thời giới thiệu cỏc kỹ thuật tạo lập, xử lý và thực hiện truy vấn trờn RDF.
- Chương IV: TÍCH HỢP DỮ LIỆU VÀO SEMANTIC WEB Chương này giới thiệu cỏc kỹ thuật tớch hợp dữ liệu vào Semantic Web, nghiờn cứu cỏc phương phỏp chuyển đổi cỏc thành phần của một cơ sở dữ liệu quan hệ sang XML và RDF, mụ phỏng hệ thống thực hiện cỏc quỏ trỡnh chuyển đổi này.
- 8 CHƯƠNG I : GIỚI THIỆU SEMANTIC WEB 1.1.
- Worl wide web và những hạn chế của nú Cỏc kĩ thuật tạo lập Web hiện tại phần nào cản trở khả năng phỏt triển dịch vụ thụng tin trờn nú.
- Sự đơn giản trong cỏc kĩ thuật xõy dựng tạo ra hiện tượng thắt cổ chai, gõy khú khăn trong việc tỡm kiếm, rỳt trớch, bảo trỡ và phỏt sinh thụng tin.
- Do đú, chỳng chỉ hỗ trợ ở một giới hạn nào đú, việc truy xuất và xử lý thụng tin.
- Kết quả tất yếu là người sử dụng phải chịu trỏch nhiệm khụng chỉ truy cập và xử lý thụng tin mà cũn phải rỳt trớch và diễn giải thụng tin.
- Dữ liệu trong cỏc file HTML chỉ hữu ớch trong một vài ngữ cảnh nhưng cú thể khụng đem lại ngữ nghĩa trong ngữ cảnh khỏc.
- Thờm vào đú, HTML khụng thể mụ tả về dữ liệu đúng gúi trong đú.
- Trỏi lại, đối với Semantic Web, cú thể chỉ ra kiểu mối liờn hệ này, chẳng hạn, Zip Code tương đương với PostCode.
- Do vậy hoàn toàn cú thể tỡm được thụng tin mong muốn.
- Nếu như cỏc thành phần chớnh yếu của dữ liệu trong Web trỡnh bày theo dạng thức thụng thường, khú sử dụng dữ liệu này một cỏch phổ biến.
- Một thiếu sút của Web hiện nay là thiếu cơ cấu hiệu quả để chia sẻ dữ liệu khi ứng dụng được phỏt triển một cỏch độc lập.
- Do đú, cần phải mở rộng Web để mỏy cú thể hiểu, tớch hợp dữ liệu, cũng như tỏi sử dụng dữ liệu thụng qua cỏc ứng dụng khỏc nhau.
- Để khắc phục cỏc yếu điểm của Web hiện tại, khỏi niệm “Semantic Web” đó ra đời.
- Sự ra đời của Semantic Web Semantic Web (hay Web cú ngữ nghĩa) là thế hệ mở rộng của Web hiện tại được đưa ra bởi Tim Berners-Lee vào khoảng năm 1998.
- Mục tiờu ban đầu của Semantic Web là hỗ trợ người dựng tỡm kiếm thụng tin trờn mạng một cỏch nhanh chúng, chuẩn xỏc và thụng minh hơn so với cỏc cụng cụ tỡm kiếm truyền thống.
- Kể từ đú đến nay, cỏc kỹ thuật liờn quan đến Semantic Web khụng ngừng được hoàn thiện.
- Cỏc ứng dụng liờn quan đến Semantic Web cũng được mở rộng như: Phỏt triển cỏc chuẩn cụng nghệ chung để biểu diễn thụng tin và cho phộp mỏy tớnh cú thể hiểu được một số thụng tin trờn Web, hỗ trợ tỡm kiếm thụng minh, hỗ trợ việc khỏm phỏ, tỏch chiết thụng tin, tớch hợp dữ liệu và tự động húa một số cụng việc được thực hiện thủ cụng.
- Xột về mặt bản chất, Semantic Web chỉ là một cụng cụ để con người cũng như mỏy tớnh sử dụng để biểu diễn thụng tin, hay núi chớnh xỏc hơn Semantic Web là một dạng dữ liệu trờn Web.
- Khỏc với cỏc dạng thức dữ liệu được trỡnh bày trong HTML, dữ liệu trong Semantic Web được đỏnh dấu, phõn lớp, mụ hỡnh húa, được bổ sung thờm cỏc thuộc tớnh, cỏc mối liờn hệ… theo cỏc lĩnh vực cụ thể, qua đú giỳp cho cỏc phần mềm mỏy tớnh cú thể hiểu được dữ liệu và tự động xử lý được những dữ liệu đú.
- Semantic Web làm cho cỏc dịch vụ thụng minh hơn, vớ dụ như mụi giới thụng tin, tỏc nhõn tỡm kiếm, bộ lọc thụng tin v.v.
- Semantic Web là gỡ? Semantic Web khụng phải là Web chuyờn biệt, nhưng là một mở rộng của Web hiện tại, theo đú thụng tin được xỏc định ý nghĩa tốt hơn, cho phộp mỏy tớnh và người cộng tỏc với nhau tốt hơn.
- Semantic Web được hỡnh thành từ ý tưởng của Tim Berners-Lee, người phỏt minh ra WWW, URI, HTTP và HTML.
- 10 Semantic Web là một mạng lưới cỏc thụng tin, được liờn kết sao cho chỳng cú thể được xử lý dễ dàng bởi cỏc mỏy tớnh ở phạm vi toàn cầu.
- Nú được xem là cỏch mụ tả thụng tin rất hiệu quả trờn World Wide Web và cũng được xem là một cơ sở dữ liệu cú khả năng liờn kết toàn cầu.
- Semantic Web là một phương phỏp cho phộp định nghĩa và liờn kết dữ liệu một cỏch cú ngữ nghĩa, nhằm phục vụ cho mỏy tớnh cú thể “hiểu” được.
- Semantic Web cũn cung cấp một mụi trường chia sẻ và xử lý dữ liệu một cỏch tự động bằng mỏy tớnh.
- Thụng tin ta thu được trực tiếp trờn Web cú thể trả lời cỏc cõu hỏi này nhưng đũi hỏi người sử dụng phải tự phõn tớch ý nghĩa của dữ liệu và mối liờn quan của nú với yờu cầu đề ra, khụng thể xử lý tự động bằng mỏy tớnh.
- Với Semantic Web ta cú thể giải quyết vấn đề này theo 2 cỏch: o Thứ nhất, nú sẽ mụ tả chi tiết dữ liệu.
- Do đú, một chương trỡnh xử lý khụng cần quan tõm đến cỏc format, hỡnh ảnh, quảng cỏo trờn một trang Web để tỡm ra sự liờn quan của thụng tin.
- o Thứ hai, Semantic Web cho phộp chỳng ta tạo ra một file mụ tả mối liờn hệ giữa cỏc tập dữ liệu khỏc nhau.
- Vớ dụ, cú thể tạo một liờn kết semantic giữa một cột ‘zip-code’ trong database với trường ‘zip’ ở trờn form nhập liệu, nếu chỳng cú chung ý nghĩa.
- Điều này cho phộp mỏy tớnh theo cỏc link và tớch hợp dữ liệu từ nhiều nguồn khỏc nhau.
- Semantic Web mang lại những gỡ? 1.2.2.1.
- Mỏy cú thể hiểu được thụng tin trờn Web Internet ngày nay dựa hoàn toàn vào nội dung.
- Web hiện hành giỳp con người khai thỏc thụng tin nhưng mỏy tớnh thỡ rất khú để hiểu được thụng tin trờn nú.
- Semantic Web sẽ cung cấp ngữ nghĩa để mỏy tớnh cú thể hiểu được.
- Con người cú thể hiểu và suy luận được trờn cỏc cõu này nhưng làm cho mỏy tớnh hiểu được như vậy khụng hoàn toàn đơn giản.
- Về hỡnh thức người sử dụng mỏy tớnh vẫn cú được nội dung thụng tin như trước đõy, nhưng đối với mỏy tớnh Semantic Web nới rộng khả năng xử lý cho phộp, mỏy khụng phải suy luận dựa vào ngữ phỏp và cỏc ngụn ngữ đỏnh dấu (Markup Language), do cấu trỳc ngữ nghĩa của văn bản (text) khi đú hàm chứa những gỡ cần thiết cho xử lý.
- Thụng tin được tỡm kiếm nhanh chúng và chớnh xỏc hơn Với Semantic Web, việc tỡm kiếm sẽ trở nờn dễ dàng do mọi thứ đó được đặt trong ngữ cảnh.
- í tưởng chớnh yếu ở đõy là toàn bộ ngữ cảnh đều được người sử dụng mụ tả.
- Mục tiờu của Semantic Web là phỏt triển cỏc tiờu chuẩn và kĩ thuật để giỳp mỏy hiểu thụng tin trờn Web nhiều hơn, cho phộp tỡm ra cỏc thụng tin dồi dào hơn, tớch hợp, duyệt dữ liệu và tự động húa cỏc thao tỏc.
- Với Semantic Web khụng những chỉ nhận được những thụng tin chớnh xỏc hơn khi tỡm kiếm từ một mỏy tớnh, mà mỏy tớnh cũn cú thể tớch hợp thụng tin từ nhiều nguồn khỏc nhau, so sỏnh chỳng với nhau.
- Dữ liệu liờn kết động Với Semantic Web, cú thể gắn cỏc thụng tin mụ tả cú ngữ nghĩa với bất kỡ nguồn dữ liệu nào.
- 12 Vớ dụ, nhờ thờm cỏc metadata (siờu dữ liệu) cho cỏc tài liệu khi tạo lập ta cú thể tỡm kiếm cỏc tài liệu cú metadata về “tỏc giả của cỏc tài liệu là Eric Miller”.
- Tương tự, với metadata phối hợp cú thể tỡm kiếm cỏc tài liệu thuộc loại “tài liệu nghiờn cứu”.
- Như trong vớ dụ trờn, sử dụng định danh cho ‘tỏc giả’ và khỏi niệm ‘tài liệu nghiờn cứu’, ta đó làm rừ thờm đú là ai và mối quan hệ của người này với một tài liệu nào đú về mặt tỏc giả.
- Ngoài ra, ta cú thể phõn biệt những tài liệu của Eric Miller với những tài liệu của những người khỏc, cú thể kết hợp những thụng tin đó được mụ tả ở nhiều site khỏc nhau để biết thờm về người này ở những ngữ cảnh khỏc nhau vớ dụ như vai trũ khi là tỏc giả, nhà quản lý, nhà phỏt triển.
- Semantic Web cung cấp cỏc phương tiện để mụ tả cỏc thụng tin chi tiết trờn Web hỗ trợ việc tự động húa xử lý cỏc dịch vụ.
- Kiến trỳc Semantic Web 1.2.3.1.
- Giới thiệu : Xột từ gúc độ mụ tả, Semantic Web chứa đựng một tập hợp cỏc ngụn ngữ mụ tả.
- Cỏc lớp của Semantic Web được sử dụng để tạo ra cỏc giỏ trị thụng tin tốt nhất cho cỏc ứng dụng.
- 13 Hỡnh 1-1 Kiến trỳc Semantic Web o Lớp Unicode & URI cho phộp sử dụng tập kớ tự quốc tế và cung cấp phương tiện khi định danh cỏc đối tượng trong Semantic Web.
- o Lớp XML cựng với cỏc định nghĩa về namespace và schema (lược đồ) cho phộp cú thể tớch hợp cỏc định nghĩa Semantic Web với cỏc chuẩn dựa trờn XML khỏc.
- Cỏc đối tượng này được tham chiếu đến khi sử dụng từ vựng và định nghĩa của URI ở trờn.
- Đõy cũng là lớp cú thể gỏn cỏc kiểu (type) cho cỏc tài nguyờn liờn kết, cũng là lớp quan trọng nhất trong kiến trỳc Semantic Web

Xem thử không khả dụng, vui lòng xem tại trang nguồn
hoặc xem Tóm tắt