Die Statistics and Machine Learning Toolbox™ enthält Funktionen und Apps zur Beschreibung, Analyse und Modellierung von Daten. Für die explorative Datenanalyse stehen deskriptive Statistiken, Visualisierungen und Clustering zur Verfügung. Wahrscheinlichkeitsverteilungen können an Daten angepasst, Zufallszahlen für Monte-Carlo-Simulationen erzeugt und Hypothesentests durchgeführt werden. Regressions- und Klasseneinteilungsalgorithmen ermöglichen die Ableitung von Interferenzen aus den Daten und die Erstellung von Vorhersagemodellen. Sie können entweder interaktiv mithilfe der Classification und Regression Learner Apps oder programmgesteuert mit AutoML entwickelt werden.
Die Toolbox umfasst die Primärkomponentenanalyse (PCA), Regularisierung, Dimensionalitätsreduktion und Methoden für die Merkmalsauswahl für mehrdimensionale Datenanalysen und Merkmalsextraktionen, mit denen Variablen wie die beste Prognosefähigkeit identifiziert werden können.
Außerdem stehen überwachte, halb überwachte und nicht überwachte Machine-Learning-Algorithmen, einschließlich Support Vector Machines (SVMs), verstärkte Entscheidungsbäume und andere Clustering-Methoden zur Verfügung. Interpretationstechniken wie ein partielles Abhängigkeitsdiagramme und LIME können angewendet werden und C/C++ Code kann für den integrierten Einsatz automatisch generiert werden. Viele Toolbox-Algorithmen können auf Datensätze angewendet werden, die für den Speicher zu umfangreich sind.