« Home « Kết quả tìm kiếm

Một phương pháp lọc trước theo ngữ cảnh cho hệ tư vấn


Tóm tắt Xem thử

- MỘT PHƯƠNG PHÁP LỌC TRƯỚC THEO NGỮ CẢNH CHO HỆ TƯ VẤN.
- Trong bài báo này, tác giả đề xuất một phương pháp lọc trước theo ngữ cảnh cho hệ tư vấn cho phép tích hợp đầy đủ thông tin ngữ cảnh và giải quyết hiệu quả vấn đề dữ liệu thưa.
- Trong đó, việc tích hợp ngữ cảnh được thực hiện bằng thủ tục phân tách sản phẩm theo ngữ cảnh và vấn đề dữ liệu thưa được giải quyết qua quá trình huấn luyện theo mô hình đồng huấn luyện cho bài toán phân lớp của lọc cộng tác.
- Kết quả thực nghiệm trên một số bộ dữ liệu thực cho thấy phương pháp đề xuất cải thiện đáng kể chất lượng dự đoán so với các phương pháp tư vấn dựa vào ngữ cảnh cơ sở trước đây..
- Từ khóa: Hệ tư vấn dựa vào ngữ cảnh (Context-aware recommender system - CARS).
- Lọc cộng tác dựa vào ngữ cảnh (Context-aware collaborative filtering - CACF).
- Ngữ cảnh (Context).
- Lọc trước theo ngữ cảnh (Contextual pre-filtering);.
- Phân tách sản phẩm theo ngữ cảnh (Item splitting).
- Tuy nhiên trên thực tế, đánh giá của người dùng không cố định, mà thay đổi theo ngữ cảnh bên ngoài.
- Chẳng hạn đối với hệ tư vấn du lịch, yếu tố ngữ cảnh có thể là thời gian (buổi trong ngày, thời gian trong tuần, mùa), bạn đồng hành (một mình, gia đình, bạn bè).
- Hệ tư vấn sẽ đóng vai trò ghi nhớ lại sở thích của người dùng theo ngữ cảnh để đưa ra những gợi ý chính xác nhất.
- Đối với hai hướng tiếp cận lọc trước theo ngữ cảnh và lọc sau theo ngữ cảnh thì thông tin ngữ cảnh không được tích hợp trong quá trình huấn luyện.
- Một hướng tiếp cận thứ ba cho phép tích hợp trực tiếp ngữ cảnh vào quá trình huấn luyện và tư vấn đó là mô hình hóa ngữ cảnh.
- lọc trước ngữ cảnh và mô hình hóa ngữ cảnh là vấn đề dữ liệu thưa.
- Ngoài ra việc tích hợp các thông tin ngữ cảnh vào quá trình huấn luyện và tư vấn khiến cho các phương pháp mô hình hóa ngữ cảnh còn gặp phải vấn đề là tăng độ phức tạp tính toán khi số chiều dữ liệu tăng lên..
- Theo hướng này, có một số nghiên cứu điển hình như: phương pháp phân tách sản phẩm theo ngữ cảnh (Item splitting) được đề xuất bởi Baltrunas và Ricci[8], phương pháp phân cụm người dùng và sản phẩm dựa trên điều kiện ngữ cảnh [9], phương pháp thu giảm số chiều nhằm giữ lại trong tập giữ liệu một tập nhỏ hơn những ngữ cảnh quan trọng [10].
- Theo đó, phương pháp phân tách sản phẩm theo ngữ cảnh chỉ sử dụng một chiều ngữ cảnh để phân tách sản phẩm ban đầu thành các sản phẩm giả lập, khiến có khá nhiều thông tin từ các chiều ngữ cảnh khác không được khai thác triệt để vào quá trình tư vấn sau này..
- Phương pháp phân cụm theo ngữ cảnh cũng gặp vấn đề cần thay đổi theo mỗi tập dữ liệu khác nhau, dẫn tới khó khăn trong việc kết hợp kết quả tư vấn sau đó.
- Phương pháp thu giảm số chiều cũng gặp vấn đề có thể bỏ qua thông tin hữu ích từ những chiều ngữ cảnh khác phục vụ cho quá trình huấn luyện dữ liệu..
- Kết quả thực nghiệm trên một số bộ dữ liệu thực cho thấy phương pháp đề xuất cải thiện đáng kể chất lượng dự đoán so với các phương pháp tư vấn dựa vào ngữ cảnh cơ sở trước đây.
- Việc khai thác thông tin ngữ cảnh trong hệ tư vấn được đề cập đầu tiên trong nghiên cứu của Adomavicius and Tuzhilin [1], theo đó dữ liệu huấn luyện được biểu.
- diễn từ sự kết hợp của người dùng, sản phẩm và các chiều ngữ cảnh tương ứng.
- Các phương pháp đưa ra để giải quyết bài toán tư vấn theo ngữ cảnh thuộc ba hướng tiếp cận: (i) lọc trước ngữ cảnh, (ii) lọc sau ngữ cảnh và (iii) mô hình hóa ngữ cảnh [2][6]..
- Trong đó, mỗi sản phẩm giả lập được tạo ra từ sự kết hợp sản phẩm ban đầu với một tình huống ngữ cảnh cụ thể..
- Quá trình huấn luyện và tư vấn cho hệ tư vấn theo ngữ cảnh sau đó có thể sử dụng trực tiếp những phương pháp lọc thông tin đã được áp dụng cho các hệ tư vấn truyền thống.
- Ví dụ như một số phương pháp lọc cộng tác như UserKNN, ItemKNN, Matrix Factorization, SLIM…[2][6] sẽ được áp dụng trực tiếp sau bước lọc trước ngữ cảnh để sinh những sản phẩm dự đoán cho người dùng trong một tình huống ngữ cảnh cụ thể.
- Tương tự như thế, phân tách người dùng theo ngữ cảnh (User splitting), phân tách cả người dùng và sản phẩm theo ngữ cảnh (UI splitting) là các phương pháp được đưa ra thuộc hướng này có cơ chế hoạt động tương tự [11]..
- Trái ngược với hướng lọc trước ngữ cảnh, lọc sau ngữ cảnh sử dụng toàn bộ ma trận đánh giá đã loại bỏ đi các chiều ngữ cảnh để huấn luyện và tư vấn.
- Kết quả tư vấn sẽ được lọc lại một lần nữa để thu được kết quả tư vấn cuối cùng là những sản phẩm mới chưa được người dùng đánh giá trong một tình huống ngữ cảnh cụ thể.
- Như vậy các phương pháp tư vấn theo ngữ cảnh thuộc hướng lọc sau ngữ cảnh cũng có thể áp dụng các phương pháp tư vấn truyền thống như (i)..
- Hướng tiếp cận thứ ba là mô hình hóa ngữ cảnh.
- Với hướng tiếp cận này, một số phương pháp mô hình hóa ngữ cảnh được đưa ra như: Mô hình hóa ngữ cảnh độc lập Tensor Decomposition [12] và mô hình hóa ngữ cảnh phụ thuộc [13][14].
- Ngoài ra các phương pháp mô hình hóa ngữ cảnh cũng được đánh giá là có độ phức tạp lớn hơn các phương pháp thuộc hướng lọc trước và sau theo ngữ cảnh, đặc biệt khi số chiều ngữ cảnh tăng lên..
- Trong bài báo này, tác giả tiếp cận nghiên cứu đề xuất phương pháp tư vấn theo ngữ cảnh mới, cụ thể là một phương pháp tư vấn thuộc hướng lọc trước theo ngữ cảnh..
- Trong đề xuất của mình, tác giả tiếp cận kết hợp thủ tục phân tách sản phẩm theo ngữ cảnh cải tiến với mô hình đồng huấn luyện cho lọc cộng tác.
- Về cơ bản phương pháp đề xuất được thực hiện bằng cách kết hợp hai phương pháp: 1) Lọc trước theo ngữ cảnh.
- Sự kết hợp của hai phương pháp này trong phương pháp đề xuất được thể hiện qua ba bước: 1) Phân tách sản phẩm theo ngữ cảnh.
- Ba bước này kết hợp với nhau trong một bộ khung đề xuất về triển khai phương pháp lọc trước theo ngữ cảnh dựa vào đồng huấn luyện cho hệ tư vấn theo ngữ cảnh trong Hình 1 dưới đây..
- ngữ cảnh U.
- Bộ khung triển khai phương pháp lọc trước theo ngữ cảnh dựa vào đồng huấn luyện..
- Phân tách sản phẩm theo ngữ cảnh.
- Thông tin đầu vào cho bài toán tư vấn theo ngữ cảnh gồm có: Tập hợp hữu hạn gồm 𝑁 người dùng 𝑈 = {𝑢 1 , 𝑢 1.
- 𝑀 sản phẩm 𝑃 = {𝑝 1 , 𝑝 2.
- 𝑝 𝑀 } và K chiều ngữ cảnh 𝐶 1 , 𝐶 2.
- 𝐶 𝐾 , mỗi chiều ngữ cảnh có tương ứng 𝑁 𝑐 1 , 𝑁 𝑐 2.
- 𝑁 𝑐 𝐾 điều kiện ngữ cảnh.
- Từ thông tin đầu vào trên, việc phân tách sản phẩm theo ngữ cảnh sẽ chuyển hóa sản phẩm ban đầu theo ngữ cảnh thành các sản phẩm giả lập.
- kết hợp sản phẩm ban đầu với một tình huống ngữ cảnh cụ thể, thủ tục này gọi là “Item Splitting” [8]..
- Từ lập luận đưa ra ở trên, tác giả đề xuất phương pháp phân tách sản phẩm theo ngữ cảnh cải tiến nhằm khắc phục hạn chế nêu trên của phương pháp phân tách sản phẩm theo ngữ cảnh nguyên thủy.
- Phương pháp phân tách sản phẩm theo ngữ cảnh cải tiến cho phép tích hợp đầy đủ thông tin ngữ cảnh trong việc chuyển hóa sản phẩm ban đầu thành sản phẩm giả lập.
- Tạo ra 1 chiều ngữ cảnh mới 𝐶 đại diện cho 𝐾 chiều ngữ cảnh 𝐶 1 , 𝐶 2.
- 𝐶 𝐾 bằng cách lấy tích Đề-các của tất cả các chiều ngữ cảnh.
- Số lượng điều kiện ngữ cảnh của 𝐶 là 𝑁 𝑐 , với 𝑁 𝑐 = 𝑁 𝑐 1 ∗ 𝑁 𝑐 2.
- Tạo ra tập sản phẩm giả lập 𝑇 bằng cách lấy tích Đề-các của tập sản phẩm 𝑃 và chiều ngữ cảnh 𝐶.
- Khi đó, mỗi sản phẩm giả lập thuộc 𝑇 là sự kết hợp của một sản phẩm ban đầu thuộc 𝑃 với một điều kiện ngữ cảnh thuộc 𝐶.
- Ví dụ áp dụng phương pháp phân tách sản phẩm theo ngữ cảnh lên ma trận đánh giá đa chiều của lọc cộng tác theo ngữ cảnh (Bảng 1) ta thu được ma trận đánh giá hai chiều (Bảng 2), với 𝑡 1 là sản phẩm giả lập được tạo ra bởi sự kết hợp của sản phẩm 𝑝 1 và tình huống ngữ cảnh (“Cuối tuần”,”Tại nhà”,”Trẻ em.
- Với ví dụ được đưa ra trong Bảng 1, hệ tư vấn có 2 sản phẩm và 12 tình huống ngữ cảnh có thể có, do vậy số lượng sản phẩm giả lập được sinh ra theo phương pháp phân tách sản phẩm theo ngữ cảnh cải tiến là 24.
- Ma trận đánh giá đa chiều của lọc cộng tác theo ngữ cảnh.
- Sản phẩm.
- sản phẩm theo ngữ cảnh.
- Quá trình phân tách sản phẩm theo ngữ cảnh sẽ biến đổi ma trận đánh giá đa chiều 𝑅 1 (biểu diễn đánh giá của người dùng với sản phẩm trong các tình huống ngữ cảnh khác nhau) về ma trận đánh giá hai chiều 𝑅 𝑜 (biểu diễn đánh giá của người dùng với sản phẩm giả lập).
- Trên thực tế, số lượng các đánh giá ban đầu đưa ra bởi người dùng cho các sản phẩm trong các tình huống ngữ cảnh là rất ít, khiến cho ma trận 𝑅 1 rất thưa.
- Khi áp dụng thủ tục phân tách sản phẩm theo ngữ cảnh cải tiến lên 𝑅 1 , với việc giới thiệu các sản phẩm giả lập, sẽ càng khiến ma trận 𝑅 𝑜 thu được càng thưa thớt hơn nữa..
- Nội dung mục 1) và 2) dưới đây sẽ lần lượt trình bày các quá trình xây dựng mô hình học theo người dùng, xây dựng mô hình học theo sản phẩm từ ma trận đánh giá 𝑅 𝑜 nhận được theo thủ tục phân tách sản phẩm theo ngữ cảnh (Mục A).
- 𝐶 𝐾 ) là ngữ cảnh ứng với người dùng hiện thời..
- Danh sách 𝐾 2 sản phẩm tư vấn tới người dùng 𝑢 𝑎 trong tình huống ngữ cảnh 𝑐..
- Theo thủ tục phân tách sản phẩm theo ngữ cảnh (Mục A)..
- Sinh tư vấn cho người dùng hiện thời 𝑢 𝑎 trong ngữ cảnh 𝑐..
- trong tình huống ngữ cảnh 𝑐..
- Phương pháp lọc trước ngữ cảnh dựa vào sản phẩm đề xuất (IS-CoTraining-ItemUser) có cơ chế thực hiện tương tự phương pháp lọc trước ngữ cảnh dựa vào người dùng (IS-CoTraining-UserItem).
- Bộ dữ liệu DepaulMovie chứa 5043 đánh giá từ 97 người dùng cho 79 phim trong các tình huống ngữ cảnh khác nhau.
- Bộ dữ liệu này có 3 chiều ngữ cảnh là Time, Location, Companion.
- Chiều ngữ cảnh Time có 2 điều kiện ngữ cảnh (“Weekend”, “Weekday.
- chiều ngữ cảnh Location có 2 điều kiện ngữ cảnh (“Home”, “Cinema.
- chiều ngữ cảnh Companion có 3 điều kiện ngữ cảnh (“Alone”, “Family”, “Partner”)..
- Bộ dữ liệu InCarMusic chứa 3938 đánh giá từ 1042 người dùng, 139 album trong các tình huống ngữ cảnh khác nhau.
- Chiều ngữ cảnh Driving style có 2 điều kiện ngữ cảnh (“Relaxed driving”, “Sport driving.
- chiều ngữ cảnh Road type có 3 điều kiện ngữ cảnh (“City”, “Highway”, “Serpentine.
- chiều ngữ cảnh Landscape có 4 điều kiện ngữ cảnh (“Coast line”,.
- chiều ngữ cảnh Sleepiness có 2 điều kiện ngữ cảnh (“Awake”, “Sleepy.
- chiều ngữ cảnh Traffic conditions có 3 điều kiện ngữ cảnh (“Free road”,.
- chiều ngữ cảnh Mood có 4 điều kiện ngữ cảnh (“Active”, “Happy”, “Lazy”,.
- chiều ngữ cảnh Weather có 4 điều kiện ngữ cảnh (“Cloudy”, “Snowing”, “Sunny”, “Rainy.
- chiều ngữ cảnh Natural Phenomena có 4 điều kiện ngữ cảnh (“Day time”, “Morning”, “Night”,.
- Trong bài báo này, tác giả tập trung đánh giá hiệu quả tư vấn danh sách sản phẩm của phương pháp đề xuất trong sự so sánh với các phương pháp tư vấn theo ngữ cảnh cơ sở nên độ đo 𝑃𝑟𝑒𝑐𝑖𝑠𝑖𝑜𝑛@𝑁, 𝑀𝐴𝑃@𝑁 sẽ được lựa chọn để đánh giá kết quả.
- dựa vào ngữ cảnh, sử dụng phương pháp phân tách người dùng theo ngữ cảnh nguyên thủy, trong đó mỗi người dùng được tách thành hai người dùng giả lập tùy thuộc vào tình huống ngữ cảnh kết hợp với họ..
- ItemSplitting-BiasedMF [8][26]: Phương pháp tư vấn dựa vào ngữ cảnh, sử dụng phương pháp phân tách sản phẩm theo ngữ cảnh nguyên thủy, trong đó mỗi sản phẩm được tách thành hai sản phẩm giả lập tùy thuộc vào tình huống ngữ cảnh kết hợp với nó.
- ItemSplitting-CoTraining-UserItem: Phương pháp lọc trước ngữ cảnh dựa vào đồng huấn luyện theo người dùng,kết hợp hai phương pháp: 1) Lọc trước theo ngữ cảnh nguyên thủy.
- ItemSplitting-CoTraining-ItemUser: Phương pháp lọc trước ngữ cảnh dựa vào đồng huấn luyện theo sản phẩm,kết hợp hai phương pháp: 1) Lọc trước theo ngữ cảnh nguyên thủy.
- IS-CoTraining-UserItem: Phương pháp lọc trước ngữ cảnh dựa vào đồng huấn luyện theo người dùng đề xuất, kết hợp hai phương pháp: 1) Lọc trước theo ngữ cảnh cải tiến.
- IS-CoTraining-ItemUser: Phương pháp lọc trước ngữ cảnh dựa vào đồng huấn luyện theo sản phẩm đề xuất, kết hợp hai phương pháp: 1) Lọc trước theo ngữ cảnh cải tiến.
- So sánh ItemSplitting-CoTraining-UserItem, ItemSplitting-CoTraining-ItemUser với các phương pháp lọc trước sử dụng 1 chiều ngữ cảnh..
- 1) Các phương pháp lọc trước sử dụng 1 chiều ngữ cảnh ItemSplitting-CoTraining-UserItem, ItemSplitting-CoTraining-ItemUser cho lại Precision@10 tốt hơn, nhưng MAP@10 lại cho kết quả thấp hơn các phương pháp tư vấn theo ngữ cảnh cơ sở cùng hướng.
- Như vậy có thể khẳng định việc dùng 1 chiều ngữ cảnh trong phương pháp phân tách sản phẩm theo ngữ cảnh kết hợp với phương pháp đồng huấn luyện cho lọc cộng tác chưa hẳn là giải pháp tối ưu..
- 2) Kết hợp phương pháp phân tách sản phẩm theo ngữ cảnh cải tiến (sử dụng đồng thời nhiều chiều ngữ cảnh) và phương pháp CoTraining-UserItem, CoTraining-ItemUser để tạo thành phương pháp đề xuất IS-CoTraining-UserItem, IS-CoTraining- ItemUser.
- Bài báo đã trình bày đề xuất một phương pháp lọc trước theo ngữ cảnh mới cho hệ tư vấn, cho phép tích hợp đầy đủ thông tin ngữ cảnh và giải quyết hiệu quả vấn đề dữ liệu thưa.
- Trong đó, việc tích hợp ngữ cảnh được thực hiện bằng thủ tục phân tách sản phẩm theo ngữ cảnh cải tiến.
- Quá trình phân tách sản phẩm theo ngữ cảnh sẽ biến đổi ma trận đánh giá đa chiều vốn dĩ đã thưa về ma trận đánh giá hai chiều càng trở lên thưa thớt hơn nữa.
- Ngoài ra tác giả cũng có kế hoạch nghiên cứu phát triển các phương pháp mô hình hóa ngữ cảnh phụ thuộc áp dụng cho hệ tư vấn theo ngữ cảnh.

Xem thử không khả dụng, vui lòng xem tại trang nguồn
hoặc xem Tóm tắt