« Home « Kết quả tìm kiếm

Vers une approche personnalisée de la recherche d'informations


Tóm tắt Xem thử

- Institut de la Francophonie pour l'Informatique.
- Vers une approche personnalisée de la recherche d'informations.
- Revue de la bibliographie...4.
- Valeurs possibles de la corrélation Pearson...11.
- Modèle de la méthode de combinaison FC-FBC séparé...16.
- Modèle de la méthode de combinaison FC-FBC combiné...18.
- Modèle de la méthode de combinaison FBC ressources – FC...19.
- Modèle de la méthode de combinaison FBC utilisateurs – FC...21.
- Modèle de la méthode de combinaison Fusion...23.
- Exemple des données de la table Actors...28.
- Exemple des données de la table Countries...29.
- Exemple des données de la table Genres...30.
- Exemple des données de la table KeyWords...30.
- Exemple des données de la table Languages...31.
- Exemple des données de la table Movie_Actor...32.
- Exemple des données de la table Movie_Country...32.
- Exemple des données de la table Movie_Genre...33.
- Exemple des données de la table Movie_KeyWord...34.
- Exemple des données de la table Movie_Language...35.
- Exemple des données de la table Movie_Movie...36.
- Exemple des données de la table Movie_StemmerSummary...36.
- Exemple des données de la table Movie_StemmerTitle...37.
- Exemple des données de la table Movies...38.
- Exemple des données de la table StemmerSummaries...38.
- Exemple des données de la table StemmerTitles...39.
- Exemple des données de la table StopWords...40.
- Exemple des données de la table TrainingRatings...41.
- Exemple des données de la table User_Movie...41.
- Exemple des données de la table Users...42.
- Dans l'équipe MAIA, nous avons développé plusieurs approches permettant de traiter notamment le problème du passage à l'échelle et du respect de la vie privée [S.
- Ce mode du filtrage conserve une représentation interne des besoins d'un utilisateur à travers un profil principalement construit à partir de la description des documents qu'il a sélectionnés.
- Introduction Vers une approche personnalisée de la recherche d'informations.
- Revue de la bibliographie.
- L'approche de filtrage basé sur le contenu a généralement une limite que seule l'information de la ressource est prise en compte.
- À cause de la disponibilité croissante des informations en forme électronique, il est plus important et faisable d'avoir des méthodes automatiques pour le filtrage d'information.
- Avec l'arrivée de la présentation électronique de l'information, une partie de ce filtrage ne doit plus être faite par nous, mais pourrait être effectuée automatiquement par le système qui présente l'information..
- Filtrage basé sur le contenu (FBC) Vers une approche personnalisée de la recherche d'informations.
- Plus la valeur de la distance d(a,b) est petite, plus le vecteur a est semblable au vecteur b (donc plus le document représenté par a est plus semblable à celui représenté par b)..
- Filtrage collaboratif (FC) Vers une approche personnalisée de la recherche d'informations.
- On considère que le vote prédit de l'utilisateur actif pour la ressource j, p a,j , est calculée à partir de la somme des votes des autres utilisateurs.
- v i , j l'évaluation de la ressource j par l'utilisateur i;.
- Ce coefficient peuvent être définis à partir de la distance, de la corrélation ou de la similarité entre chaque utilisateur i et l'utilisateur actif..
- Valeurs possibles de la corrélation Pearson Pour le cas de la similarité, ces poids sont définis selon le formule suivant.
- Les méthodes de Clustering permettent de limiter le nombre d'individus considérés dans le calcul de la prédiction.
- Autrement dit, au lieu de consulter l'ensemble de la population, nous estimons la préférence d'un groupe de personnes ayant les mêmes goûts que l'utilisateur..
- Puis seulement les N premiers films de la liste sont retenus pour la recommandation, les autres sont rejetés..
- Combinaison du FBC et du FC Vers une approche personnalisée de la recherche d'informations.
- Modèle de la méthode de combinaison FC-FBC séparé.
- Pour chaque film de la liste de recommandation du filtrage collaboratif, nous créons une liste des N films les plus similaires en appliquant le filtrage par le contenu.
- En utilisant un paramètre de réduction r (r = 0,02 par exemple), nous pouvons diminuer l'importance du film chaque fois que nous descendons de la liste sortie du FC..
- Modèle de la méthode de combinaison FC-FBC combiné.
- Modèle de la méthode de combinaison FBC ressources – FC.
- à partir de la matrice des votes.
- Modèle de la méthode de combinaison FBC utilisateurs – FC.
- Modèle de la méthode de combinaison Fusion.
- Les fichiers principaux de la base MovieLens sont les suivants : u.data, u.item, u.genre, u.user..
- Implémentation Vers une approche personnalisée de la recherche d'informations.
- J'ai donc extrait d'autres informations des films (acteurs, actrices, pays, mots-clés, langues, résumés) à partir de la base GroupLens (http://www.grouplens.org)..
- Comme toutes les informations originales de la base sont contenues dans des fichiers textuels, j'ai développé des programmes pour les lire et les traiter, et puis pour sauvegarder les informations extraites à la base de données..
- La table Actors contient la liste des acteurs..
- Exemple des données de la table Actors Tableau 4.
- La table Countries contient la liste des pays..
- Exemple des données de la table Countries.
- La table Genres contient la liste des genres de film..
- Exemple des données de la table Genres Tableau 6.
- La table KeyWords contient la liste des mots-clés des films..
- Exemple des données de la table KeyWords.
- La table Languages contient la liste des langues..
- Exemple des données de la table Languages Tableau 8.
- La table Movie_Actor est la connexion entre deux tables Movies et Actors.
- Exemple des données de la table Movie_Actor Tableau 9.
- La table Movie_Country est la connexion entre deux tables Movies et Countries..
- Exemple des données de la table Movie_Country.
- La table Movie_Genre est la connexion entre deux tables Movies et Genres..
- Exemple des données de la table Movie_Genre Tableau 11.
- La table Movie_KeyWord est la connexion entre deux tables Movies et KeyWords.
- Exemple des données de la table Movie_KeyWord.
- Exemple des données de la table Movie_Language Tableau 13.
- La table Movie_Movie contient la liste des corrélations (ou similarités) cosinus des films.
- Exemple des données de la table Movie_Movie Tableau 14.
- La table Movie_StemmerSummary contient la liste des mots de « root » dans le résumé réduit de chaque film.
- Exemple des données de la table Movie_StemmerSummary.
- La table Movie_StemmerTitle contient la liste des mots de « root » dans le titre réduit de chaque film.
- Exemple des données de la table Movie_StemmerTitle Tableau 16.
- La table Movies contient la liste des films et leurs informations correspondantes..
- Exemple des données de la table Movies Tableau 17.
- Exemple des données de la table StemmerSummaries.
- Exemple des données de la table StemmerTitles Tableau 19.
- La table StopWords contient la liste des mots insignifiants (non importants).
- Exemple des données de la table StopWords.
- La table TrainingRatings est créée à partir de la table User_Movie en effaçant aléatoirement 20% des lignes (c'est à dire 20% des votes).
- Le champ « Timestamp » de la table User_Movie n'est pas important..
- Exemple des données de la table TrainingRatings Tableau 21.
- Exemple des données de la table User_Movie.
- Exemple des données de la table Users.
- Le résultat de la MAE change également quand on utilise une autre base de training.
- Cependant, avec les mêmes paramètres et les mêmes bases de training, l'ordre des valeurs de la MAE restent pareil comme le figure ci-dessus.
- Métriques d'évaluation Vers une approche personnalisée de la recherche d'informations.
- Quand la qualité de la liste est évaluée, on peut trouver des recommandations qui n'ont pas de votes réels.
- C'est normal car un demi des films recommandés dans le résultat de la Fusion est au résultat de recommandation du FC, donc il est facilement avoir un bon résultat avec le Rappel