Boxplot verstehen und interpretieren (inkl. Beispiel) (2024)

Einleitung

Der Boxplot ist eine grafische Darstellungsform in der Statistik, die alle robusten Lage- und Streumaße in einer Abbildung veranschaulicht. In diesem Artikel wird erklärt, was ein Boxplot ist, aus welchen Elementen er besteht sowie diese jeweils zu interpretieren sind

Bringe deine Noten auf das nächste Level!

Lass deine Arbeit von Lektorat Plus verbessern und sichere dir den Schlüssel zu akademischem Erfolg. 🎓

Mehr erfahren

Boxplot verstehen und interpretieren (inkl. Beispiel) (1)

Definition Boxplot

Boxplot einfach erklärt

Der Boxplot veranschaulicht in einem Diagramm mit dem Median und dem ersten sowie dritten Quartil alle robusten Lage- und Streumaße.

Im Boxplot wird grafisch die Datenverteilung eines mindestens ordinal skalierten Merkmals dargestellt. Der Boxplot kann schnell einen Eindruck darüber vermitteln, in welchem Bereich die untersuchten Daten liegen und wie sie sich über diesen verteilen. Veranschaulicht man mehrere Boxplots nebeneinander, eignet er sich auch zum Vergleich der jeweiligen Verteilungen.

Der Boxplot wird häufig auch als Kastengrafik, Kastendiagramm, oder nach seinen Bestandteilen, als Box-Whisker-Plot bezeichnet.

Ein Boxplot besteht aus einem Rechteck, der sogenannten Box und zwei Linien, die das Rechteck verlängern und als Antennen bezeichnet werden. Innerhalb der Box findet man den Median in Form eines Strichs und außerhalb manchmal noch Ausreißer und extreme Ausreißer. Die Darstellungsform mit dem Median, zwei Quartilen, welche die Box begrenzen, und den beiden Extremwerten wird auch als Fünf-Punkte-Zusammenfassung bezeichnet. Der Boxplot kann entweder vertikal oder horizontal dargestellt werden.

Boxplot verstehen und interpretieren (inkl. Beispiel) (2)

Die Box

Interquartilsabstand

Die Box spannt den Interquartilsabstand auf, also den Abstand zwischen dem dritten bzw. oberen Quartil und dem ersten bzw. unteren Quartil und repräsentiert somit immer die mittleren 50% der Daten

Die Länge der Box entspricht also der Differenz der beiden Quartile und ist ein Maß für die Streuung der Daten. Der Interquartilsabstand wird auch als Zwischenquartilsspanne bezeichnet und häufig als IQR abgekürzt, nach dem englischen Begriff interquartile range.

Das dritte Quartil wird auch als 75%-Quartil bezeichnet, da 75% der Werte kleiner bzw. gleich dem Quartil sind und 25% größer oder gleich. Im Umkehrschluss wird das erste Quartil als 25% Quartil bezeichnet.

Der Querstrich – der Median

Median

Der Median wird in einem Boxplot durch einen Strich bzw. eine Linie innerhalb der Box dargestellt und teilt die gesamte Verteilung in zwei gleich große Hälften.

Der Median, oder zweites Quartil, ist der Mittelpunkt (siehe Artikel zu den Lageparametern) der Verteilung. 50% der Werte sind kleiner oder gleich dem Median, 50% größer oder gleich. Er ist besonders robust gegenüber Ausreißern und stellt somit eine realistische und ungewichtete Mitte der Werte dar. Durch seine Lage innerhalb der Box bekommt man einen Eindruck, ob und wie schief die Verteilung ist, die den Daten zugrunde liegt. Ist der Median im linken (unteren) Teil der Box, ist die Verteilung rechtsschief, liegt er im rechten (oberen) Teil, ist sie linksschief.

Antennen (Whisker)

Whisker

Oben und unten wird die Box durch zwei Linien verlängert, die jeweils mit einem Strich begrenzt sind. Diese Linien werden auch als Antennen, Fühler oder Whisker bezeichnet. Sie repräsentieren die Werte außerhalb der mittleren 50% der Daten und erstrecken sich oft – aber nicht immer – über einen größeren Bereich als die Box.

Je nach Definition sind die Antennen die Minimalwerte (untere Antenne) bzw. die Maximalwerte (obere Antenne) des Datensatzes oder repräsentieren alle Werte, die innerhalb eines Bereichs des 1,5-fachen Interquartilsabstandes (1,5xIQR) liegen. In der Definition nach John W. Tukes sind die Antennen auf maximal 1,5xIQR beschränkt. Sie enden jedoch nicht zwangsläufig erst bei 1,5xIQR, sondern bei jeweils dem Wert, der noch innerhalb dieses Bereichs liegt.

Dies wird anhand des später beschriebenen Beispiels noch einmal deutlich. Die Antennen sind somit nicht allein durch den IQR, sondern durch die Datenwerte bestimmt. Daher müssen sie auch nicht zwingend gleich lang sein. Gibt es keine Werte außerhalb der Grenze von 1,5xIQR, reichen die Antennen nur bis zu den Minimal- und Maximalwerten.

Ausreißer

Ausreißer

Ausreißer sind die Werte, die außerhalb der Antennen liegen. Je nach Definition der Antennen sind diese mindestens 1,5xIQR von der Box entfernt. Was außerhalb der Box zwischen 1,5xIQR und 3xIQR liegt, wird als einfacher oder milder Ausreißer, bei mehr als 3xIQR als extremer Ausreißer bezeichnet.

Je nach Definition werden alle Ausreißer als Kreise dargestellt, oder einfache Ausreißer als Kreise und extreme Ausreißer als Sterne. Je weiter die Werte von den Antennen entfernt sind, desto mehr müssen sie hinterfragt werden, ob ihnen nicht Messfehler o.ä. zugrunde liegen und sie aus der Auswertung ausgeschlossen werden.

Beispiel

Die bisher erläuterten Begriffe sollen nun anhand eines Beispiels veranschaulicht werden. Wir nehmen den folgenden Datensatz, der die in einem Test erreichten Punkte bei zehn Personen darstellt:

Boxplot verstehen und interpretieren (inkl. Beispiel) (3)

Die Daten werden im ersten Schritt nach der Größe sortiert und Median sowie Quartile berechnet. Die genauen Formeln für die Berechnung können in den Artikeln zu den Lage- und Streuungsparametern nachgelesen werden. In diesem Fall wurden die Werte von einem Statistikprogramm errechnet. Die Einheiten werden im Folgenden weggelassen:

Boxplot verstehen und interpretieren (inkl. Beispiel) (4)

Es ergeben sich folgende Werte:

Boxplot verstehen und interpretieren (inkl. Beispiel) (5)

Die Boxlänge bzw. der Interquartilsabstand IQR ergibt sich aus der Differenz der Quartile:

Boxplot verstehen und interpretieren (inkl. Beispiel) (6)

Die Antennen reichen vom jeweiligen Quartil aus bis zu maximal 1,5xIQR, also je:

Boxplot verstehen und interpretieren (inkl. Beispiel) (7)

Einheiten nach oben und unten. Daraus ergeben sich für die Antennen:

Boxplot verstehen und interpretieren (inkl. Beispiel) (8)

Da die Antennen nur bei im Datensatz enthaltenen Werten enden, die noch innerhalb dieses Bereiches liegen, ergibt sich:

  • Antenne oben: 87,875 – der nächst kleinere Wert ist 82 und somit das obere Ende der Antenne – der Wert 88 ist als einfacher Ausreißer zu identifizieren, da er zwischen 1,5xIQR und 3xIQR liegt
  • Antenne unten: 68,875 – der nächst größere ist Werte 73 und somit das untere Ende der Antenne

Mit den eben errechneten Werten ergibt sich folgender Boxplot:

Boxplot verstehen und interpretieren (inkl. Beispiel) (9)

Zusammenfassung

Ein Boxplot zeigt alle wichtigen robusten Lage- und Streumaße sowie die Spannweite eines Datensatzes in einer Grafik. Stellt man mehrere Boxplots gegenüber, kann man Muster und Unterschiede zwischen den Stichproben erkennen. Boxplots geben jedoch keinen Aufschluss über die Art der Verteilung und über Häufigkeiten, dafür müsste man ein Histogramm verwenden. Bei bi- und multimodalen Verteilungen liefert der Boxplot keine sinnvollen Ergebnisse.

Boxplot verstehen und interpretieren (inkl. Beispiel) (2024)
Top Articles
2023 PRI Show kicks off in Indianapolis
Top Tips + The Hottest Happenings At The 2023 PRI Show
Toa Guide Osrs
Radikale Landküche am Landgut Schönwalde
Ghosted Imdb Parents Guide
Jailbase Orlando
Here are all the MTV VMA winners, even the awards they announced during the ads
Wannaseemypixels
Caroline Cps.powerschool.com
7543460065
King Fields Mortuary
Optum Medicare Support
Horned Stone Skull Cozy Grove
Boat Jumping Female Otezla Commercial Actress
Osrs Blessed Axe
What Was D-Day Weegy
The Binding of Isaac
Animal Eye Clinic Huntersville Nc
Gon Deer Forum
5 high school volleyball stars of the week: Sept. 17 edition
National Weather Service Denver Co Forecast
Billionaire Ken Griffin Doesn’t Like His Portrayal In GameStop Movie ‘Dumb Money,’ So He’s Throwing A Tantrum: Report
Spectrum Field Tech Salary
Walmart stores in 6 states no longer provide single-use bags at checkout: Which states are next?
V-Pay: Sicherheit, Kosten und Alternativen - BankingGeek
Busted Newspaper Fauquier County Va
Providence Medical Group-West Hills Primary Care
How Long After Dayquil Can I Take Benadryl
Inbanithi Age
Fiona Shaw on Ireland: ‘It is one of the most successful countries in the world. It wasn’t when I left it’
Truck from Finland, used truck for sale from Finland
Mini-Mental State Examination (MMSE) – Strokengine
Evil Dead Rise Showtimes Near Regal Sawgrass & Imax
Opsahl Kostel Funeral Home & Crematory Yankton
Poster & 1600 Autocollants créatifs | Activité facile et ludique | Poppik Stickers
Σινεμά - Τι Ταινίες Παίζουν οι Κινηματογράφοι Σήμερα - Πρόγραμμα 2024 | iathens.gr
Daily Jail Count - Harrison County Sheriff's Office - Mississippi
Merge Dragons Totem Grid
Kazwire
Wal-Mart 2516 Directory
The Thing About ‘Dateline’
Scarlet Maiden F95Zone
The Conners Season 5 Wiki
Courtney Roberson Rob Dyrdek
Avance Primary Care Morrisville
Swsnj Warehousing Inc
From Grindr to Scruff: The best dating apps for gay, bi, and queer men in 2024
Tyco Forums
Nurses May Be Entitled to Overtime Despite Yearly Salary
6463896344
Poster & 1600 Autocollants créatifs | Activité facile et ludique | Poppik Stickers
Mkvcinemas Movies Free Download
Latest Posts
Article information

Author: Kieth Sipes

Last Updated:

Views: 5529

Rating: 4.7 / 5 (47 voted)

Reviews: 86% of readers found this page helpful

Author information

Name: Kieth Sipes

Birthday: 2001-04-14

Address: Suite 492 62479 Champlin Loop, South Catrice, MS 57271

Phone: +9663362133320

Job: District Sales Analyst

Hobby: Digital arts, Dance, Ghost hunting, Worldbuilding, Kayaking, Table tennis, 3D printing

Introduction: My name is Kieth Sipes, I am a zany, rich, courageous, powerful, faithful, jolly, excited person who loves writing and wants to share my knowledge and understanding with you.