251-0526-00L  Statistical Learning Theory

SemesterFrühjahrssemester 2009
DozierendeJ. M. Buhmann
Periodizitätjährlich wiederkehrende Veranstaltung

KurzbeschreibungDie Vorlesung präsentiert fortgeschrittene Methoden des statistischen Lernens:
PAC Lernen und statistische Lerntheorie; Variationsmethoden und Optimierung, insb. Entropiemaximierung, der Informationsflaschenhals, deterministisches und simuliertes Abkühlen; Gruppierung von vektoriellen Daten, Histogrammdaten und Ähnlichkeitsdaten; Modellselektion; Graphische Modelle;
LernzielDie Studierenden erhalten Einblick in aktuelle Methoden des statistischen Lernens. Die Grundlagen des Maschinellen Lernens werden vertieft und insbesondere die Theorie des statistischen Lernens diskutiert.
Inhalt# Boosting: A state-of-the-art classification approach that is sometimes used as an alternative to SVMs in non-linear classification.
# Theory of estimators: How can we measure the quality of a statistical estimator? We already discussed bias and variance of estimators very briefly, but the interesting part is yet to come.
# Statistical learning theory: How can we measure the quality of a classifier? Can we give any guarantees for the prediction error?
# Variational methods and optimization: We consider optimization approaches for problems where the optimizer is a probability distribution. Concepts we will discuss in this context include:

* Maximum Entropy
* Information Bottleneck
* Deterministic Annealing

# Clustering: The problem of sorting data into groups without using training samples. This requires a definition of ``similarity'' between data points and adequate optimization procedures.
# Model selection: We have already discussed how to fit a model to a data set in ML I, which usually involved adjusting model parameters for a given type of model. Model selection refers to the question of how complex the chosen model should be. As we already know, simple and complex models both have advantages and drawbacks alike.
# Reinforcement learning: The problem of learning through interaction with an environment which changes. To achieve optimal behavior, we have to base decisions not only on the current state of the environment, but also on how we expect it to develop in the future.
Skriptkein Skript, Vorlesungsfolien werden bereitgestellt
LiteraturDuda, Hart, Stork: Pattern Classification, Wiley Interscience, 2000.

Hastie, Tibshirani, Friedman: The Elements of Statistical Learning, Springer, 2001.

L. Devroye, L. Gyorfi, and G. Lugosi: A probabilistic theory of pattern recognition. Springer, New York, 1996
Voraussetzungen / BesonderesVoraussetzung:

Statistik Grundkenntnisse, Interesse an statistischen Verfahren.

Es ist empfehlenswert, zuerst Maschinen Lernen I zu hören und dann die Vorlesung ML II zu besuchen. Mit etwas Zusatzaufwand können Sie aber auch ML II alleine hören.