Zugang zum Dokument

Gantner, Zeno:

Supervised Machine Learning Methods for Item Recommendation

Methoden des überwachten maschinellen Lernens für Item-Empfehlungen

Datei(en):

Download PDF 1.537kB  




Zitierfähiger Link: Bitte nutzen Sie diese URL, um auf das Dokument zu verlinken oder es zu zitieren:
http://nbn-resolving.de/urn:nbn:de:gbv:hil2-opus-1677
URL: http://opus.bsz-bw.de/ubhi/volltexte/2012/167/
Hauptberichter: Schmidt-Thieme, Lars (Prof. Dr. Dr.)
Fachbereich: Fachbereich IV
Institut: Informatik
Dokumentart: Dissertation
Sprache: Englisch
Erstellungsjahr: 2012
Publikationsdatum: 16.08.2012
Tag der mündlichen Prüfung: 22.06.2012
Kurze Inhaltszusammenfassung auf Englisch Recommender systems are personalized information systems that learn individual preferences from interacting with users. Recommender systems use machine learning techniques to compute suggestions for the users. Supervised machine learning relies on optimizing for a suitable objective function. Suitability means here that the function actually reflects what users and operators consider to be a good system performance.

Most of the academic literature on recommendation is about rating prediction. For two reasons, this is not the most practically relevant prediction task in the area of recommender systems: First, the important question is not how much a user will express to like a given item (by the rating), but rather which items a user will like. Second, obtaining explicit preference information like ratings requires additional actions from the side of the user, which always comes at a cost. Implicit feedback in the form of purchases, viewing times, clicks, etc., on the other hand, is abundant anyway. Very often, this implicit feedback is only present in the form of positive expressions of preference. In this work, we primarily consider item recommendation from positive-only feedback.

A particular problem is the suggestion of new items -- items that have no interaction data associated with them yet. This is an example of a cold-start scenario in recommender systems. Collaborative models like matrix factorization rely on interaction data to make predictions. We augment a matrix factorization model for item recommendation with a mechanism to estimate the latent factors of new items from their attributes (e.g. descriptive keywords). In particular, we demonstrate that optimizing the latent factor estimation with regard to the overall loss of the item recommendation task is superior to optimizing it with regard to the prediction error on the latent factors. The idea of estimating latent factors from attributes can be extended to other tasks (new users, rating prediction) and prediction models,
yielding a general framework to deal with cold-start scenarios.

We also adapt the Bayesian Personalized Ranking (BPR) framework, which is state of the art in item recommendation, to a setting where more popular items are more frequently encountered when making predictions. By generalizing even more, we get Weighted Bayesian Personalized Ranking, an extension of BPR that allows importance weights to be placed on specific users and items.

All method contributions are supported by experiments using large-scale real-life datasets from various application areas like movie recommendation and music recommendation. The software used for the experiments has been released as part of an efficient and scalable free software package.
Kurze Inhaltszusammenfassung auf Deutsch Empfehlungssysteme sind personalisierte Informationssysteme die individuelle Vorlieben anhand von Interaktionen mit dem Benutzer lernen.

Ein Großteil der Literatur zu Empfehlungssystemen bezieht sich auf die Vorhersage von Bewertungen.
Dies ist nicht das in der Praxis relevanteste Vorhersageproblem: Die entscheidende Frage ist nicht, wie sehr ein Benutzer ein gegebenes Item bewerten wird, sondern welche Items ein Benutzer mag. Des weiteren ist es nicht einfach, Benutzer zu zusätzlichen Handlungen -- wie etwa Bewertungen -- zu bewegen. Implizites Feedback in der Form von Kaufhandlungen, Betrachtungszeiten, Klicks, etc. hingegen ist oft in großen Mengen vorhanden. In der vorliegenden Dissertation betrachten wir primär Item-Empfehlungen auf der Basis von positivem impliziten Feedback.

Ein konkretes Problem ist das Vorschlagen neuer Items -- Items die bisher nicht an Interaktionen beteiligt waren. Wir erweitern ein Matrixfaktorisierungs-Modell für Item-Empfehlung mit einem Mechanismus, der die latenten Faktoren neuer Items auf Basis ihrer Attribute schätzt. Insbesondere zeigen wir, dass eine Optimierung des Schätzers auf die globale Verlustfunktion wesentlich besser funktioniert als eine Optimierung auf den Vorhersagefehler auf den latenten Faktoren. Das Prinzip der Faktorenschätzung auf Basis von Attributen kann auf weitere Probleme (neue Benutzer, Vorhersage von Bewertungen) ausgeweitet werden, was uns ein generisches Werkzeug zur Lösung von Kaltstart-Szenarien in Empfehlungssystemen an die Hand gibt.

Des weiteren modifizieren wir die Methode des Bayesschen Personalisierten Rankings (BPR) für ein Szenario in dem beliebte Items zur Vorhersagezeit häufiger vorkommen. Durch eine weitere Generalisierung erhalten wir die Methode des Gewichteten Bayesschen Personalisierten Rankings (Weighted Bayesian Personalized Ranking, WBPR), eine Erweiterung von BPR, welche die beliebige Gewichtung von Benutzern und Items erlaubt.

Alle methodischen Beiträge dieser Dissertation wurden durch Experimente auf umfangreichen Datensätzen aus unterschiedlichen Anwendungsbereichen untermauert. Die Software für diese Experimente wurde als Teil einer effizienten und skalierbaren Bibliothek unter einer freien Lizenz veröffentlicht.
Kontrollierte Schlagwörter (Deutsch): Maschinelles Lernen , Information Retrieval , Künstliche Intelligenz , Electronic Commerce , Open Source , Optimierung
Freie Schlagwörter (Englisch): Machine Learning, Information Retrieval, Artificial Intelligence, Electronic Commerce, Optimization
DDC-Sachgruppe: Informatik
Lizenz: Creative Commons - Namensnennung, Weitergabe unter gleichen Bedingungen