Statistik - Analyse kategorialer Daten (1015704)
Druck-Ansicht
- Dauer: 2 Tage
- Zielgruppe: Programmierer, Softwarearchitekten, Manager (Einsteiger )
- Vorkenntnisse: Allgemeine Kenntnisse der Mathematik
- Methode: Vortrag mit Beispielen und Übungen.
- Typ: Öffentliches Seminar / Inhouse
- Download:Anmeldeformular | AGB | Hotels & Anfahrt | Info-Broschüre
- Inhalt: Die Seminarteilnehmer erhalten eine anwendungsorientierte Einführung in Logit-Modellierung und kategoriale Regression. Das Seminar behandelt Modelle zur Analyse kategorialer Daten. Kategoriale Daten sind Variablen, die eine begrenzte Anzahl von Ausprägungen (Kategorien) haben. Bei vielen der in Umfrageforschung und amtlicher Statistik erhobenen Merkmale handelt es sich um kategoriale Daten.
- Dozent: Dr. Ralf Klinkenberg studierte Informatik an der Universität Dortmund, war dort von 1998 bis 2003 wissenschaftlicher Mitarbeiter und dann Doktorand am Lehrstuhl für Künstliche Intelligenz. 1994/95 studierte er mit einem Stipendium der deutsch-amerikanischen Fulbright-Kommission für ein Jahr an der University of Missouri-Rolla (UMR) in Rolla, Missouri, USA. 1996 schloss er dieses Auslandsstudium mit dem Master of Science in Computer Science ab. Seine Interessen liegen im Bereich des maschinellen Lernens, des Data Mining und der Wissensentdeckung (Knowledge Discovery). Speziell interessieren ihn maschinelle Lernverfahren zum adaptiven Informationsfiltern bei sich verändernden Konzepten aus zeitlich veränderlichen Datenströmen. Seit 2007 ist er für die Comelio GmbH im Bereich Statistik und Data Mining tätig. Im Bereich Beratung und Implementierung unterstützt er Kunden bei der Einführung des Open Source Data Mining-Systems Rapid Miner (vormals Yale).
Zu seinen zahlreichen wissenchaftlichen Veröffentlichungen gehören (1) Scholz, Martin and Klinkenberg, Ralf. Boosting Classifiers for Drifting Concepts. In Intelligent Data Analysis (IDA), Special Issue on Knowledge Discovery from Data Streams, Vol. 11, No. 1, Seiten 3--28, 2007, (2) Mierswa, Ingo and Wurst, Michael and Klinkenberg, Ralf and Scholz, Martin and Euler, Timm. YALE: Rapid Prototyping for Complex Data Mining Tasks. In Proceedings of the 12th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (KDD 2006), ACM Press, 2006 und (3) Scholz, Martin and Klinkenberg, Ralf. An Ensemble Classifier for Drifting Concepts. In Gama, J. and Aguilar-Ruiz, J. S. (editors), Proceedings of the Second International Workshop on Knowledge Discovery in Data Streams, Seiten 53--64, Porto, Portugal, 2005.
Inhalte
A. Logistische Regression und Logit-Modell für binäre abhängige Größen
Logit-Modelle für eine metrische Einflussgröße - Modelle für linear spezifizierte Einflussgrößen - Logit-Modelle bei kategorialen Einflussgrößen - Das lineare Logit-Modell ohne Interaktion - Logit-Modell und Alternativen
B. Schätzung, Modellanpassung und Einflussgrößen
Parameterschätzung für Regressionsmodelle - Anpassungsgüte von Modellen - Residualanalyse - Überprüfung der Relevanz von Einflussgrößen - Devianz-Analyse - Erklärungswert von Modellen
C. Alternative Modellierung von Response und Einflussgrößen
Konzeptioneller Hintergrund binärer Regressionsmodelle - Modelltypen - Modellierung von Interaktionswirkungen - Abweichung von der Binomialverteilung
C. Multinominale Modelle für ungeordnete Kategorien
Modellbildung bei mehrkategorialer abhängiger Variable - Das multinominale Logit-Modell - Einfache Verzweigungsmodelle - Modellierung als Wahlmodell der Nutzenmaximierung - Schätzen und Testen
D. Regression mit ordinaler abhängiger Variable
Das Schwellenwert- oder kumulative Modell - Das sequenzielle Modell - Schätzen und Testen
E. Zähldaten und die Analyse von Kontingenztafeln: das loglineare Modell
Die Poisson-Verteilung - Poisson-Regression - Poisson-Regression mit Dispersion - Analyse von Kontingenztafeln
F. Nonparametrische Regression
Glättungsverfahren: Lokale Regression für binäre abhängige Variable, Ansätze mit Penalisierung, Semiparametrische Erweiterung durch das partiell lineare Modell, Generalisierte additive Modell, Schätzalgorithmen - Klassifikations- und Regressionsbäume: Verzweigungen und Verzweigungskriterien, Baumgröße
G. Kategoriale Prognose und Diskriminanzanalyse
Bayes-Zuordnung als diskriminanzanalytisches Verfahren: Bayes-Zuordnung und Fehlerraten, Fehlklassifikationswahrscheinlichkeiten, Bayes-Regel und Diskriminanzfunktionen, Logit-Modell und normalverteilte Merkmale, Logit-Modell und binäre Merkmale, Kostenoptimale Bayes-Zuordnung - Geschätze Zuordnungsregeln: Stichproben und geschätzte Zuordnungsregeln, Prognosefehler |
 |
Anmeldung
Wenn Sie sich für dieses Seminar interessieren, können Sie sich hier online Anmelden
Zur Seminar Anmeldung
|
Kontakt
PreiseWenn Sie mehrere Seminarplätze gleichzeitig buchen, erhalten Sie für jeden Teilnehmer einen Preisvorteil nach folgender Tabelle. Alle Preise zzgl. 19% MwSt. Enthalten: - Catering
- Mittagessen
- Literatur
| Ort |
TN1 | TN2 | TN3 |
Essen Berlin |
970,00 € |
921,50 € |
873,00 € |
| Sonst |
1120.00 € |
1071.50 € |
1023.00 € |
Termine
Berlin - 9.-10.7.09
- 20.-21.8.09
- 1.-2.10.09
- 12.-13.11.09
Essen - 6.-7.8.09
- 17.-18.9.09
- 29.-30.10.09
Frankfurt - 6.-7.8.09
- 17.-18.9.09
- 29.-30.10.09
Hamburg - 9.-10.7.09
- 20.-21.8.09
- 1.-2.10.09
- 12.-13.11.09
Hannover - 9.-10.7.09
- 20.-21.8.09
- 1.-2.10.09
- 12.-13.11.09
Köln - 6.-7.8.09
- 17.-18.9.09
- 29.-30.10.09
Leipzig - 9.-10.7.09
- 20.-21.8.09
- 1.-2.10.09
- 12.-13.11.09
|
München - 23.-24.7.09
- 3.-4.9.09
- 15.-16.10.09
- 26.-27.11.09
Nürnberg - 23.-24.7.09
- 3.-4.9.09
- 15.-16.10.09
- 26.-27.11.09
Stuttgart - 23.-24.7.09
- 3.-4.9.09
- 15.-16.10.09
- 26.-27.11.09
Wien - 23.-24.7.09
- 3.-4.9.09
- 15.-16.10.09
- 26.-27.11.09
Zürich - 23.-24.7.09
- 3.-4.9.09
- 15.-16.10.09
- 26.-27.11.09
|
9:00 - 16:30 Uhr | Inhouse-Termine auf Anfrage. Ähnliche Seminare |