« Home « Kết quả tìm kiếm

Hệ thống gợi ý hỗ trợ tra cứu tài liệu


Tóm tắt Xem thử

- HỆ THỐNG GỢI Ý HỖ TRỢ TRA CỨU TÀI LIỆU Trần Nguyễn Minh Thư và Huỳnh Quang Nghi.
- Hệ thống gợi ý, lọc cộng tác, hệ thống gợi ý thư viện Keywords:.
- Để hỗ trợ tốt nhất cho độc giả tại các thư viện, trung tâm học liệu, nghiên cứu này đề xuất ứng dụng phương pháp lọc cộng tác của hệ thống gợi ý kết hợp với công cụ chỉ mục từ khoá tìm kiếm Elastic Search vào chức năng tìm kiếm tài liệu.
- Kết quả là một hệ thống gợi ý tài liệu – RecoLRC đảm bảo tìm kiếm tốt theo từ khoá đồng thời tạo ra danh sách các gợi ý dựa trên tên tài liệu, từ khoá và lịch sử mượn sách.
- Hệ thống RecoRLC giúp nâng cao hiệu quả của việc tra cứu tại Trung tâm Học liệu- Trường Đại học Cần Thơ..
- Hệ thống gợi ý hỗ trợ tra cứu tài liệu.
- thông tin so với không gian thực của nhà sách, thư viện, trung tâm thương mại,… Hệ thống gợi ý ra đời như là một công cụ hỗ trợ quyết định nhằm cung cấp cho người dùng những lựa chọn hữu ích và cá nhân hoá nhất.
- Hệ thống gợi ý được ứng dụng trong nhiều lĩnh vực như thương mại điện tử,.
- Trong lĩnh vực thương mại, người dùng sẽ được hệ thống gợi ý các sản phẩm phù hợp với nhu cầu của từng cá nhân.
- Ví dụ như hệ thống gợi ý bán hàng của Amazon, Ebay,… Trong lĩnh vực giải trí, người dùng có thể được gợi ý các bộ phim, bài hát phù hợp mà người sử dụng không phải mất nhiều công tìm kiếm như hệ thống gợi ý phim MovieLens 1 , last.fm, Film-Conseil.
- Trong lĩnh vực tin tức, người sử dụng được hệ thống hỗ trợ gợi ý các bài báo phù hợp với từng người riêng biệt ví dụ như netnews, yahoo news… Trong lĩnh vực khoa học và giáo dục, hệ thống gợi ý hỗ trợ người dùng tìm kiếm các bài báo khoa học như hệ thống tìm kiếm Citeseer 2 hay sinh viên tìm kiếm các tài liệu học tập phù hợp với cá nhân như hệ thống School e-Guide của tác giả M.
- Trong hội thảo quốc tế lần thứ V chuyên về lĩnh vực hệ thống gợi ý tổ chức hàng năm bởi ACM tại Chicago năm 2011, bài viết của tác giả S.
- Gottwald và ctv đã tóm lượt một số hệ thống gợi ý cho việc quản lý thư viện (S Gottwald, T Koch, 2011).
- Tác giả đã giới thiệu và phân tích đặc điểm của 6 hệ thống gợi ý áp dụng trong các thư viện như BibTip, ExLibris bX, Foxtrot, TechLens, Fab, LIBRA.
- Dựa trên những phân tích đó, tác giả đưa ra hướng phát triển tiếp theo của hệ thống gợi ý thư viện ZIB..
- Họ đã xây dựng được mô hình đồ thị các siêu dữ liệu (meta-data) biễu diễn mối tương quan giữa các bài báo dựa trên các thông tin:.
- Đây là cơ sở khoa học chắc chắn khẳng định một hướng mới cho khả năng nâng cao hiệu quả tìm kiếm của các thư viện điện tử.
- Hệ thống quản lý tài liệu của trung tâm học liệu trường Đại học Cần Thơ gồm 2 phần tách biệt mà mỗi phần được quản lý bởi một hệ quản trị cơ sở dữ liệu khác nhau với một số thông tin tương đối giống nhau.
- Cụ thể là các cơ sở dữ liệu của các loại sách in, sách tham khảo, giáo trình môn học….
- Việc lưu trữ cơ sở dữ liệu còn rời rạc như vậy dẫn đến việc tra cứu tài liệu của độc giả sẽ mất thời gian hơn.
- Thay vì độc giải chỉ tìm kiếm 1 lần thì với 2 cơ sở dữ liệu như hiện tại, độc giả cần phải thực hiện việc tìm kiếm hai lần để có đầy đủ các tài liệu cho nội dung cần nghiên cứu.
- Bên cạnh cách tổ chức thì chức năng tra cứu tài liệu hiện tại của Trung tâm Học liệu được xây dựng hiện nay là tìm kiếm chính xác từ khoá được.
- Vì vậy, kết quả tìm kiếm chưa đáp ứng tốt nhu cầu của độc giả..
- Hình 1: Giao diện tra cứu tài liệu trên cơ sở dữ liệu Oracle (bên trái) và MySql (bên phải) Dựa vào việc phân tích thực trạng của Trung.
- tâm Học liệu-Trường Đại học Cần Thơ, cũng như phân tích các hệ thống quản lý thư viện khác, chức năng tìm kiếm của Trung tâm Học liệu-Trường Đại học Cần Thơ cần phải cải tiến để phục vụ hiệu quả hơn cho độc giả.
- Để khắc phục vấn đề này, chúng tôi đề xuất sử dụng một kho dữ liệu (data warehouse) chung để xây dựng một hệ thống gợi ý hỗ trợ tra cứu tài liệu - RecoLRC.
- Trên hệ thống RecoRLC, độc giả không phải vào 2 địa chỉ url khác nhau để tìm kiếm tài liệu cùng một chủ đề nhưng khác thể loại như hình 1.
- Bên cạnh đó, chúng tôi cũng áp dụng hệ thống gợi ý vào chức năng tìm kiếm nhằm làm phong phú thêm kết quả tìm kiếm để hỗ trợ tốt nhất cho các độc giả trong quá trình tra cứu sách..
- Xuất phát từ nhu cầu thực tiễn trên, hệ thống gợi ý sách RecoRLC được đề xuất nhằm giải quyết những hạn chế của việc tìm kiếm chính xác theo từ khoá hiện nay.
- Nghiên cứu sử dụng MongoDB để tích hợp cơ cở dữ liệu MyQSL và Oracle đang áp dụng tại Trung tâm Học liệu.
- Dựa trên cơ sở dữ liệu chung này chúng tôi cài đặt công cụ tìm kiếm chỉ mục Elastic Search kết hợp với phương pháp lọc cộng tác dựa trên lịch sử mượn sách để góp phần làm phong phú kết quả tìm kiếm của độc giả..
- Trong phần hai, chúng tôi sẽ trình bày tổng quan về việc ứng dụng hệ thống gợi ý trong các thư viện điện tử.
- Các thông tin về Trung tâm Học liệu- Trường Đại học Cần Thơ cũng như giải pháp hệ thống gợi ý áp dụng tại Trung tâm Học liệu được trình bày chi tiết trong phần ba.
- 2 NỘI DUNG NGHIÊN CỨU 2.1 Giới thiệu về hệ thống gợi ý.
- Hệ thống gợi ý là hệ thống hỗ trợ ra quyết định nhằm gợi ý các thông tin liên quan đến người dùng một cách dễ dàng và nhanh chóng, phù hợp với từng người dùng (G.
- Ví dụ với trang web Amazon, một trong những trang web thương mại điện tử nổi tiếng nhất, khi người dùng truy cập vào trang web này họ sẽ được gợi ý những sản phẩm tiềm năng nhất từ hàng triệu sản phẩm trong hệ thống.
- Hệ thống gợi ý như một công cụ cung cấp những thông tin hữu ích và riêng biệt theo từng cá nhân trên một hệ thống chứa đựng một lượng lớn thông tin.
- Các hệ thống gợi ý được thiết kế nhằm cung cấp cho người dùng những đề nghị liên quan, những đề nghị hiệu quả nhất có thể từ thông tin của các mục dữ liệu, từ hồ sơ người sử dụng và từ mối liên hệ giữa những đối tượng này..
- Cấu trúc của một hệ thống gợi ý gồm có ba thành phần chính (G.
- Huỳnh Xuân Hiệp và ctv., 2014): tập hợp các người dùng U = {u 1 ,…,u p } bao gồm các thông tin của người dùng được lưu trên hệ thống.
- Dựa trên cách thức xây dựng hệ thống gợi ý, người ta chia hệ thống gợi ý thành 3 loại chính: hệ thống gợi ý dựa trên nội dung.
- hệ thống gợi ý dựa trên phương pháp lọc cộng tác.
- hệ thống gợi ý lai – kết hợp phương pháp lọc cộng tác và phương pháp dựa trên nội dung..
- 2.2 Hệ thống gợi ý áp dụng trong các hệ thống quản lý thư viện.
- Nội dung chính trong phần này là tham khảo tìm hiểu xem chức năng tìm kiếm của các hệ thống thư viện hay trung tâm học liệu hiện nay được thực hiện như thế nào..
- Hệ thống gợi ý Fab nằm trong dự án thư viện điện tử của trường đại học Stanford phát triển từ những năm 1997 (M.
- Hệ thống kết hợp giữa phương pháp lọc cộng tác và phương pháp dựa trên nội dung để xây dựng chức năng tìm kiếm tài liệu cho độc giả.
- Phương pháp lọc cộng tác của hệ thống gợi ý cũng ra đời từ nghiên cứu này, giúp hệ thống gợi ý trở thành một lĩnh vực nghiên cứu độc lập..
- Hệ thống gợi ý LIBRA viết tắt của từ “Learning Intelligent Book Recommending Agent” ra đời năm 2000 (E.Vozalis and K.
- Hệ thống gợi ý sách thay vì bài báo khoa học như hệ thống Fab.
- Hệ thống được xây dựng dựa trên phương pháp lọc cộng tác dựa trên người dùng.
- Nghiên cứu bắt đầu thực nghiệm trên cơ sở dữ liệu trích dẫn của CiteSeer.
- Hệ thống gợi ý được xây dựng dựa trên phương pháp lọc cộng tác sử dụng các thông tin trích dẫn, từ khóa và tóm tắt của mỗi tài liệu… và đồ thị của các trı́ch dẫn trong các tài liê ̣u khoa ho ̣c.
- Hệ thống gợi ý thư viện này được triển khai 2 giai đoạn: giai đoạn áp dụng trên cơ sở dữ liệu trích dẫn của CiteSeer và sử dụng thư viện số ACM là cốt lõi.
- Nhằm nâng cao hiệu quả của hệ thống TechLens, những nghiên cứu sâu hơn đã được thực hiện thông qua bài báo "Enhancing Digital Libraries with TechLens+” (Roberto Torres et al., 2004).
- Từ năm 2007, Stefan Pohl và ctv (Stefan Pohl et al., 2007) đã bắt đầu áp dụng hệ thống gợi ý cho lĩnh vực thư viện điện tử, tuy nhiên nó chỉ dừng lại ở mức gợi ý các bài báo liên quan thay vì toàn bộ dữ liệu của thư viện như bài báo khoa học, tạp chí, sách, tài liệu online.
- 5, số 11, tháng 11 năm 2015: vai trò ngữ cảnh đối với các hệ thống gợi ý thư viện kỹ thuật số đã được các tác giả Zohreh Dehghani Champiri và ctv thảo luận rất chi tiết (Zohreh Dehghani Champiri et al., 2015).
- nhấn mạnh tầm quan trọng của ngữ cảnh và sự cần thiết phải khai thác thông tin ngữ cảnh trong các hệ thống gợi ý để đưa ra được các khuyến nghị chính xác và phù hợp hơn cho người dùng.
- thư viện truyền thống, thủ thư chủ yếu là cố gắng tìm kiếm các tài liệu phù hợp với yêu cầu/nhu cầu của độc giả dựa trên kiến thức và sự am hiểu về thư viện mà họ đang quản lý.
- Đôi khi, họ phải có được nhiều thông tin về độc giả để việc tìm kiếm được chính xác hơn như hoạt động của họ, công việc, kiến thức nền tảng, kinh nghiệm, chủ đề và mục đích cũng như các điều kiện như thời gian, địa điểm, tình hình,… Trong tương tác giữa người dùng với thư viện kỹ thuật số, hệ thống gợi ý có thể đóng vai trò của thủ thư để giới thiệu tài nguyên đến độc giả vì thế hệ thống không chỉ cần phải nhận thức được ngữ cảnh của độc giả mà còn phải nhận thức các vấn đề mà người dùng đang tìm kiếm thông tin để giải quyết chúng..
- Qua những thông tin lược sử về quá trình phát triển của các hệ thống gợi ý áp dụng vào hệ thống quản lý thư viện, ta thấy được ứng dụng các giải thuật của hệ thống gợi ý vào trong chức năng tìm kiếm của hệ thống quản lý thư viện là vô cùng cần thiết và đem lại hiệu quả cao so với chức năng tìm kiếm thông thường..
- 2.3 Kho dữ liệu.
- Hình 2: Đặc điểm của kho dữ liệu.
- tính tích hợp (integrated) của kho dữ liệu thể hiện sự tập hợp dữ liệu từ nhiều nguồn khác nhau ví dụ như dữ liệu sách, giáo trình từ cơ sở dữ liệu Oracle và luận văn từ cơ sở dữ liệu MySQL của Trung tâm Học liệu-Trường Đại học Cần Thơ.
- Có hai phương pháp tiếp cận chính để xây dựng một kho dữ liệu: phương pháp Immon (từ trên xuống: Top-Down) và phương pháp tiếp cận Kimball (từ dưới lên: Bottom-up).
- 2.4 Công cụ tìm kiếm theo chỉ mục Elastic Search.
- Trong thời đại bùng nổ thông tin, việc tìm kiếm.
- Elasticsearch là một hệ thống hỗ trợ tạo chỉ mục và tìm kiếm riêng biệt, mạnh mẽ, thời gian đáp ứng và kết quả tìm kiếm phù hợp với yêu cầu..
- Chia dữ liệu hệ thống (sharding) phục vụ cho 2 ngôn ngữ khác nhau là Tiếng Anh và Tiếng Pháp..
- 3 ỨNG DỤNG HỆ THỐNG GỢI Ý TẠI TRUNG TÂM HỌC LIỆU-TRƯỜNG ĐẠI HỌC CẦN THƠ.
- “Hệ thống gợi ý hỗ trợ tra cứu tài liệu tại Trung tâm Học liệu Đại học Cần Thơ”, nhằm hỗ trợ tốt nhất cho các độc giả trong quá trình tra cứu sách..
- Với phương pháp tiếp cận Kimball, chúng tôi tích hợp cơ sở dữ liệu Oracle và MySQL hiện có của Trung tâm Học liệu thành một kho dữ liệu (data warehouse).
- Để hỗ trợ tích hợp các cơ sở dữ liệu khác nhau cho hệ thống RecoLRC, chúng tôi xây dựng các “DataReader” để đọc dữ liệu tương ứng từ các cơ sở dữ liệu khác nhau đưa vào cơ sở dữ liệu chung (Data Warehouse) được xây dựng bằng MongoDB.
- Lịch trình đọc dữ liệu bởi các.
- Với cơ sở dữ liệu chung, chúng tôi sử dụng các tiêu chí sau để xây dựng hệ thống gợi ý: tên tài liệu, từ khoá và lịch sử mượn sách của thư viện.
- Hệ thống RecoLRC được xây dựng kết hợp phương pháp lọc cộng tác (dựa vào lịch sử mượn sách của độc giả) và Elastic Search (dựa vào tên tài liệu, từ khoá, tóm tắt).
- Hình 3: Mô hình hệ thống hỗ trợ tìm kiếm tài liệu RecoLRC Để sử dụng phương pháp lọc cộng tác, chúng.
- “Nhan đề tài liệu”.
- Với thông tin này chúng tôi xây dựng phương pháp lọc cộng tác dựa trên item / tài liệu để tạo ra danh sách gợi ý.
- Bước 1: Tìm kiếm những tài liệu tương đồng với tài liệu “Kỹ thuật và thủ thuật lập trình PHP”.
- Với danh sách gợi ý được tạo ra từ phương pháp lọc cộng tác, chúng tôi kết hợp thêm thông tin năm xuất bản và kết quả tìm kiếm được từ Elastic Search để tạo ra một danh sách các gợi ý phong phú và hiệu quả cung cấp cho độc giả..
- Hê ̣ thống gợi hỗ trợ tra cứu tài liệu RecoLRC sẽ có liên kết với trang web hiện tại của Trung tâm Học liệu tại nút “Tìm kiếm”.
- Hình 4: Khung nhập từ khoá tìm kiếm tài liệu.
- Ví dụ người dùng gõ vào từ khoá tìm kiếm là.
- “Lập trình web bằng Php”, kết quả tìm kiếm hiển thị hai phần: tìm kiếm theo nội dung dựa vào công cụ tìm kiếm Elastic Search, kết quả tìm kiếm dựa trên phương pháp lọc cộng tác.
- Độc giả có thể chọn hoặc bỏ chọn các kết quả không đúng lĩnh vực mình đang tìm kiếm để có được danh sách tài liệu phù hợp nhất với yêu cầu.
- (2) Với nội dung lọc cộng tác, danh sách các tài liệu có được từ phương pháp lọc cộng tác với 3 tài liệu đầu tiên thu được từ công cụ tìm kiếm ElasticSearch được giới thiệu tới độc giả.
- Hình 5: Trang web hỗ trợ tìm kiếm tài liệu RecoLRC Khi độc giả muốn xem thông tin tài liệu của.
- quyển sách/ giáo trình nào đó thì hệ thống RecoLRC sẽ liên kết lại với trang web hiện tại của trung tâm học liệu dựa vào thông tin mã của tài liệu..
- Tóm lại, với hệ thống hỗ trợ tra cứu tài liệu RecoLRC, độc giả tại Trung tâm Học liệu-Trường Đại học Cần Thơ có thể rút ngắn thời gian tìm kiếm dữ liệu.
- Từ hai cơ sở dữ liệu khác nhau Oracle và MySQL, hệ thống RecoLRC đã tích hợp lại thành một kho dữ liệu chung (Data warehouse) sử dụng MongoDB.
- kết quả tìm kiếm sẽ tìm tất cả thông tin lưu trữ của tài liệu tại Trung.
- Đầu ra của hệ thống RecoLRC sẽ được tạo ra từ hai nguồn dữ liệu: danh sách các tài liệu tìm được từ kết quả của công cụ tìm kiếm Elasticsearch có tích hợp phân tích ngữ nghĩa tiếng Việt và danh sách các tài liệu tìm được từ phương pháp lọc cộng tác với 3 tài liệu đầu tiên trong danh sách tài liệu tìm được từ công cụ tìm kiếm Elasticsearch..
- 4 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN Chúng tôi vừa trình bày một hướng tiếp cận trong việc tìm kiếm tài liệu tại Trung tâm Học liệu- Trường Đại học Cần Thơ, sử dụng công cụ tìm kiếm chỉ mục Elastic Search kết hợp với phương pháp lọc cộng tác.
- Kho dữ liệu chung MongoDB được sử dụng để tích hợp cơ sở dữ liệu MySQL và Oracle vào cùng một cơ sở dữ liệu chung.
- cơ sở dữ liệu chung này, chúng tôi tích hợp vào chức năng tìm kiếm công cụ hỗ trợ tạo chỉ mục từ khoá tìm kiếm Elastic Search cũng như phương pháp lọc cộng tác dựa trên mục dữ liệu (tài liệu)..
- Trong tương lai, chúng tôi tiếp tục nghiên cứu để hệ thống RecoLRC phát triển được tốt hơn..
- Thông tin người dùng sẽ được thu thập để tạo ra những gợi ý theo hướng cá nhân hoá hơn, làm hài lòng hơn nữa cho độc giả sử dụng hệ thống.
- Bên cạnh thông tin người dùng, chúng tôi cũng sẽ tiếp cận thông tin đồ thị các trích dẫn của các tài liệu như giải pháp đã đề nghị trong hệ thống TechLens nhằm nâng cao hiệu quả của danh sách tài liệu gợi ý cho độc giả..
- Nhóm tác giả xin chân thành cảm ơn lãnh đạo và các thành viên tổ Công nghệ thông tin của Trung tâm Học liệu-Trường Đại học Cần Thơ đã hỗ trợ trong việc cung cấp cơ sở dữ liệu cũng như hỗ trợ trong công tác triển khai hệ thống RecoLRC.