Evaluate

Methoden und Metriken zur Bewertung und Evaluation von Machine Learning Modellen.

Die wichtigsten Aspekte der Modellbewertung:

  • Metriken - Bewertungsmaße für Klassifikation, Regression, Clustering
  • Cross-Validation - Robuste Modellbewertung durch Kreuzvalidierung
  • Hyperparameter-Tuning - Optimierung der Modellparameter
  • Overfitting vermeiden - Regularisierung und Generalisierung

Metriken (Klassifikation / Regression)

Bewertungsmetriken für verschiedene ML-Aufgaben.

AllgemeinWie wird die Grundlogik der Modellbewertung verstanden? Grundlagen der Modellbewertung: Trainings- vs. Testfehler, Bias-Variance-Tradeoff.

KlassifizierungWelche Metriken zeigen, ob ein Klassifikationsmodell wirklich taugt? Confusion Matrix, Precision, Recall, F1-Score und ROC-AUC.

RegressionWoran wird die Qualität eines Regressionsmodells gemessen? R², MSE, RMSE, MAE und Residuenanalyse.

ClusteringWie wird bewertet, ob eine Clusterstruktur sinnvoll ist? Silhouette-Koeffizient und weitere Cluster-Validierungsmetriken.

AnomalieWie wird die Güte eines Anomalie-Erkennungsmodells eingeschätzt? Anomalie-Scores und Methoden zur Ausreißer-Erkennung.

Cross-Validation

Robuste Modellbewertung durch wiederholte Aufteilung der Daten.

Cross-ValidationWie liefert Kreuzvalidierung eine robuste Schätzung der Modellgüte? K-Fold, Stratified K-Fold, Leave-One-Out und Time Series Split.

BootstrappingWie quantifiziert Resampling die Unsicherheit einer Schätzung? Resampling-Verfahren zur Berechnung von Konfidenzintervallen und Modellunsicherheit.

Hyperparameter-Tuning

Systematische Optimierung der Modellparameter.

Hyperparameter-TuningWie werden Modellparameter systematisch optimiert? Grid Search, Random Search und Bayesian Optimization im Vergleich.

Overfitting vermeiden

Strategien zur Verbesserung der Generalisierung.

OverfittingWoran wird Overfitting erkannt und wie wird es verhindert? Learning Curves, Bias-Variance Tradeoff und praktische Gegenmaßnahmen.

RegularisierungWie reduziert Regularisierung Overfitting ohne die Modellkomplexität zu opfern? L1 (Lasso), L2 (Ridge) und Elastic Net.


Table of contents