Zum Inhalt springen

Seaborn

Zu Zen-Modus wechseln

Seaborn ist eine auf Matplotlib basierende Bibliothek, die speziell für statistische Visualisierungen entwickelt wurde. Sie bietet eine einfachere API und schönere Standardstile.

Um Seaborn zu installieren, kann man pip verwenden:

Terminal-Fenster
pip install seaborn

Hier ist ein einfaches Beispiel, das zeigt, wie man mit Seaborn ein Histogramm erstellt:

import seaborn as sns
import matplotlib.pyplot as plt
# Daten
data = np.random.randn(1000)
# Histogramm erstellen
sns.histplot(data, bins=30, kde=True)
plt.xlabel('Werte')
plt.ylabel('Häufigkeit')
plt.title('Seaborn Histogramm mit KDE')
plt.show()
Histogramm und Liniendiagramm

Ein Paarplot ist nützlich, um die Beziehungen zwischen mehreren Variablen in einem Datensatz darzustellen.

import seaborn as sns
import pandas as pd
# Beispieldatensatz laden
df = sns.load_dataset('iris')
# Paarplot erstellen
sns.pairplot(df, hue='species')
plt.show()
Paarplot

Eine Heatmap ist nützlich, um Korrelationen zwischen verschiedenen Variablen zu visualisieren.

import seaborn as sns
import numpy as np
# Zufallsdaten generieren
data = np.random.rand(10, 12)
# Heatmap erstellen
sns.heatmap(data, annot=True, fmt=".1f")
plt.xlabel('Spalten')
plt.ylabel('Zeilen')
plt.title('Heatmap')
plt.show()
Heatmap

Ein Violinplot kombiniert Aspekte von Boxplots und Dichteplots.

import seaborn as sns
import matplotlib.pyplot as plt
# Beispieldatensatz laden
df = sns.load_dataset('iris')
# Violinplot erstellen
sns.violinplot(x='species', y='sepal_length', data=df)
plt.xlabel('Spezies')
plt.ylabel('Sepal Länge')
plt.title('Violinplot der Sepal Länge nach Spezies')
plt.show()
Violinplot

Ein Relplot (relationship plot) ist nützlich, um die Beziehung zwischen verschiedenen Variablen zu visualisieren, insbesondere in großen Datensätzen, die in KI-Anwendungen häufig vorkommen.

import seaborn as sns
import matplotlib.pyplot as plt
# Beispieldatensatz laden
df = sns.load_dataset('tips')
# Relplot erstellen
sns.relplot(x='total_bill', y='tip', hue='time', size='size', data=df)
plt.xlabel('Rechnungsbetrag')
plt.ylabel('Trinkgeld')
plt.title('Relplot der Rechnungsbeträge und Trinkgelder')
plt.show()
Relplot