Der Korrelationskoeffizient, bezeichnet als r oder ρ, ist das Maß für die lineare Korrelation (die Beziehung, sowohl in Stärke als auch in Richtung) zwischen zwei Variablen. Sie reicht von -1 bis +1, wobei Plus- und Minuszeichen verwendet werden, um die positive und negative Korrelation darzustellen. Wenn der Korrelationskoeffizient genau -1 beträgt, ist die Beziehung zwischen den beiden Variablen vollständig negativ; ist der Korrelationskoeffizient genau +1, dann ist die Beziehung vollständig positiv. Zwei Variablen können eine positive Korrelation, eine negative Korrelation oder gar keine Korrelation aufweisen. Sie können die Korrelation von Hand berechnen, indem Sie einige kostenlose online verfügbare Korrelationsrechner verwenden oder die statistischen Funktionen eines guten Grafikrechners verwenden.
Schritte
Methode 1 von 4: Korrelationskoeffizienten von Hand berechnen
1.
Sammeln Sie zuerst Ihre Daten. Um mit der Berechnung einer effizienten Korrelation zu beginnen, untersuchen Sie zunächst die Datenpaare. Es ist nützlich, sie sowohl vertikal als auch horizontal in eine Tabelle zu legen. Beschriften Sie jede Zeile oder Spalte mit x und y.
- Beispiel: Angenommen, Sie haben vier Datenpaare für x und ja. Die Tabelle könnte dann so aussehen:
- x || ja
- 1 || 1
- 2 || 3
- 4 || 5
- 5 || 7
2. Berechnen Sie den Mittelwert von x. Um den Mittelwert zu berechnen, müssen Sie alle Werte von addieren x addiere und dividiere dann durch die Anzahl der Werte.
Beachten Sie ausgehend vom obigen Beispiel, dass Sie vier Werte für haben x. Um den Mittelwert zu berechnen, zählen Sie alle Werte für x und dividiere es durch 4. Die Berechnung sieht dann so aus:


3. Finden Sie den Mittelwert von ja. Um den Durchschnitt von zu erhalten ja Um es zu finden, befolgen Sie die gleichen Schritte, addieren Sie alle Werte von y zusammen und dividieren Sie dann durch die Anzahl der Werte.
Im obigen Beispiel haben Sie auch vier Werte für ja. Addiere all diese Werte zusammen und dividiere dann durch 4. Die Berechnungen sehen dann so aus:


4. Bestimmen Sie die Standardabweichung von x. Sobald Sie Ihre Mittelwerte haben, können Sie die Standardabweichung berechnen. Verwenden Sie dazu die Formel:
Mit den Beispieldaten sehen Ihre Berechnungen so aus:




5. Berechnen Sie die Standardabweichung von ja. Bestimmen Sie mit denselben grundlegenden Schritten die Standardabweichung von ja. Sie verwenden die gleiche Formel mit den Datenpunkten für y.
Mit den Beispieldaten sehen Ihre Berechnungen so aus:




6. Sehen Sie sich die grundlegende Formel zur Bestimmung eines Korrelationskoeffizienten an. Die Formel zur Berechnung eines Korrelationskoeffizienten verwendet Mittelwerte, Standardabweichungen und die Anzahl der Paare in einem Datensatz (dargestellt durch n). Der Korrelationskoeffizient selbst wird durch den Kleinbuchstaben r oder den griechischen Buchstaben ρ (rho) dargestellt. Für diesen Artikel verwenden wir die Formel, die als Pearson-Korrelationskoeffizient bekannt ist, wie unten gezeigt:
Möglicherweise bemerken Sie leichte Abweichungen in der Formel, hier oder in anderen Erklärungen. Einige verwenden beispielsweise die griechische Notation mit rho und sigma, während andere r und s . verwenden. Einige Erklärungen können leicht abweichende Formeln verwenden, aber sie werden dieser mathematisch äquivalent sein.7. Bestimmen Sie den Korrelationskoeffizienten. Sie haben jetzt die Mittelwerte und Standardabweichungen für Ihre Variablen, sodass Sie mit der Formel für den Korrelationskoeffizienten fortfahren können. Erinnere dich daran n stellt die Anzahl der Werte dar, die Sie haben. Die anderen relevanten Informationen haben Sie in den obigen Schritten bereits erarbeitet.
Mit den Beispieldaten könnten Sie die Daten in die Korrelationskoeffizientenformel eingeben und wie folgt berechnen:
[
]



8. Interpretiere das Ergebnis. Für diesen Datensatz beträgt der Korrelationskoeffizient 0,988. Diese Zahl sagt Ihnen zwei Dinge über die Daten aus. Schau dir das Vorzeichen der Zahl und die Größe der Zahl an.
Da der Korrelationskoeffizient positiv ist, kann man sagen, dass zwischen den x-Daten und den y-Daten eine positive Korrelation besteht. Dies bedeutet, dass Sie mit steigenden x-Werten auch mit steigenden y-Werten rechnen.Da der Korrelationskoeffizient sehr nahe bei +1 liegt, sind die x-Daten und y-Daten sehr eng miteinander verbunden. Wenn Sie diese Punkte grafisch darstellen würden, würden Sie sehen, dass sie eine sehr gute Annäherung an eine Gerade sind.Methode 2 von 4: Verwenden von Online-Korrelationsrechnern
1. Online nach Korrelationsrechnern suchen. Die Messung der Korrelation ist eine ziemlich Standardberechnung für Statistiker. Bei großen Datensätzen kann die Berechnung per Hand sehr mühsam werden. Daher haben viele Quellen gängige Korrelationsberechnungen online zur Verfügung gestellt. Verwenden Sie eine beliebige Suchmaschine und geben Sie den Suchbegriff "Korrelationsrechner" ein.
2. Für die Daten in. Bitte lesen Sie die Hinweise auf der Website sorgfältig durch, damit Sie die Daten richtig eingeben können. Es ist wichtig, dass die Datenpaare in Ordnung gehalten werden, sonst erhalten Sie ein falsches Korrelationsergebnis. Verschiedene Websites verwenden unterschiedliche Formatierungen, um Daten einzugeben.
Zum Beispiel: auf der Website http://nrechner.com/statistics/correlation-coefficient-calculator.htm finde ein horizontales Kästchen zum Eingeben von x-Werten und ein zweites horizontales Kästchen zum Eingeben von y-Werten. Sie geben die Begriffe nur durch Kommas getrennt ein. Daher sollte der zuvor in diesem Artikel berechnete x-Datensatz als 1,2,4,5 . eingegeben werden. Der y-Datensatz wird als 1,3,5,7 . eingegeben.Auf einer anderen Seite, http://www.Alkohol.com/Rechner/Statistik/Korrelationskoeffizient/, Sie können Daten sowohl horizontal als auch vertikal eingeben, solange Sie die Datenpunkte in Ordnung halten.3. Berechnen Sie die Ergebnisse. Diese Berechnungsseiten sind beliebt, da Sie nach der Eingabe der Daten im Allgemeinen nur auf die Schaltfläche "Berechnen" klicken müssen - das Ergebnis wird automatisch angezeigt.
Methode 3 von 4: Verwenden eines Grafikrechners
1.
Geben Sie ihre Details ein. Schalten Sie auf Ihrem Grafikrechner die Statistikfunktion ein und wählen Sie dann den Befehl `Bearbeiten`.
- Jeder Rechner hat leicht unterschiedliche Tastenbefehle. Dieser Artikel enthält spezifische Anweisungen für den Texas Instruments TI-86.
- Rufen Sie die Stat-Funktion auf, indem Sie [2nd]-Stat (über der `+`-Taste) und dann F2-Edit drücken.
2. Alle alten gespeicherten Daten löschen. Die meisten Rechner behalten die statistischen Daten, bis sie gelöscht werden. Um sicherzustellen, dass Sie alte Daten nicht mit neuen Daten verwechseln, müssen Sie zuerst alle zuvor gespeicherten Informationen löschen.
Verwenden Sie die Pfeiltasten, um den Cursor zu bewegen, um die Kategorie `xStat` zu markieren. Drücken Sie dann `Löschen` und `Enter. Dies sollte alle Werte in der xStat-Spalte löschen.Verwenden Sie die Pfeiltasten, um die Kategorie „yStat“ zu markieren. Drücken Sie `Clear` und `Enter`, um die Daten auch aus dieser Spalte zu löschen.3. Geben Sie Ihre Datenwerte ein. Verwenden Sie die Pfeiltasten, um den Cursor an die erste Stelle unter der xStat-Überschrift zu bewegen. Geben Sie Ihren ersten Datenwert ein und drücken Sie dann die Eingabetaste. Sie sollten das Leerzeichen am unteren Rand des Bildschirms `xStat(1)=__` sehen, wo Ihr Wert den leeren Raum ausfüllt. Wenn Sie die Eingabetaste drücken, füllen die Daten die Tabelle, der Cursor springt in die nächste Zeile und die Zeile am unteren Bildschirmrand sollte jetzt `xStat(2)=__` lauten.
Fahre mit der Eingabe aller x-Werte fort.Nachdem Sie die x-Werte eingegeben haben, gehen Sie mit den Pfeiltasten in die Spalte yStat und geben die y-Werte ein.Wenn alle Daten eingegeben wurden, drücken Sie Beenden, um den Bildschirm zu löschen und das Statistikmenü zu verlassen.4. Berechnen Sie die lineare Regressionsstatistik. Der Korrelationskoeffizient ist ein Maß dafür, wie gut sich die Daten einer geraden Linie annähern. Ein Grafikrechner mit statistischen Funktionen kann sehr schnell die beste Anpassungslinie und den Korrelationskoeffizienten berechnen.
Rufen Sie die Statistikfunktion auf und drücken Sie dann die Calc-Taste. Auf dem TI-86 ist dies [2nd][Stat][F1].Wählen Sie die linearen Regressionsberechnungen. Auf dem TI-86 ist es [F3], beschriftet mit "LinR.` Der grafische Bildschirm zeigt dann die Zeile `LinR _` mit einem blinkenden Cursor.Sie müssen nun die Namen der beiden Variablen eingeben, die Sie berechnen möchten. Dies sind xStat und yStat.Wählen Sie auf dem TI-86 die Liste der Namen (`Names`) aus, indem Sie [2nd][List][F3] drücken.Die untere Zeile Ihres Bildschirms sollte jetzt die verfügbaren Variablen anzeigen. Wählen Sie [xStat] (dies ist wahrscheinlich die Taste F1 oder F2), geben Sie dann ein Komma ein und dann [yStat].Drücken Sie die Eingabetaste, um die Daten zu berechnen5. Interpretieren Sie die Ergebnisse. Wenn Sie die Eingabetaste drücken, berechnet der Taschenrechner sofort die folgenden Informationen für die von Ihnen eingegebenen Daten:
: Dies ist die allgemeine Formel für eine Gerade. Anstelle des bekannten `y=mx+b` wird dies jedoch in umgekehrter Reihenfolge dargestellt.
. Dies ist der Wert des Schnittpunkts mit der y-Achse der Linie, der am besten passt.
. Dies ist die Steigung der Linie, die am besten passt.
. Dies ist der Korrelationskoeffizient.
. Dies ist die Anzahl der Datenpaare, die in der Berechnung verwendet werden.Methode 4 von 4: Wiederholung der Grundlagen
1.
Verstehen Sie das Konzept der Korrelation. Korrelation bezieht sich auf die statistische Beziehung zwischen zwei Größen. Der Korrelationskoeffizient ist eine einzelne Zahl, die Sie für zwei Sätze von Datenpunkten berechnen können. Die Zahl liegt immer zwischen -1 und +1 und gibt an, wie eng die beiden Datensätze verbunden sind.
- Wenn Sie beispielsweise die Größe und das Alter von Kindern bis zu einem Alter von etwa 12 Jahren gemessen haben, würden Sie eine starke positive Korrelation erwarten. Wenn Kinder älter werden, neigen sie dazu, größer zu werden.
- Ein Beispiel für eine negative Korrelation ist der Vergleich der Zeit, die jemand mit Golfspielen verbringt, und dem Golfergebnis dieser Person. Mit fortschreitender Übung sollte die Punktzahl sinken.
- Letztlich würden Sie nur eine geringe positive oder negative Korrelation zwischen der Schuhgröße einer Person und ihren Prüfungsnoten erwarten.

2. Berechnen Sie den Durchschnitt. Das arithmetische Mittel oder "Mittel" eines Datensatzes wird berechnet, indem alle Werte der Daten zusammengezählt und dann durch die Anzahl der Werte im Datensatz geteilt werden. Wenn Sie den Korrelationskoeffizienten für Ihre Daten bestimmen möchten, müssen Sie den Durchschnitt jedes Datensatzes berechnen.
Der Mittelwert einer Variablen wird durch die Variable mit einer horizontalen Linie darüber angezeigt. Dies wird für die Datensätze von x und y oft als "x-bar" oder "y-bar" bezeichnet. Alternativ kann der Mittelwert durch den griechischen Kleinbuchstaben μ (mu) angegeben werden. Um beispielsweise den Mittelwert der Datenpunkte von x darzustellen, können Sie μ . verwendenx oder μ(x).Wenn Sie beispielsweise einen Satz von x (1,2,5,6,9,10) haben, wird der Durchschnitt dieser Daten wie folgt berechnet:


3. Kennen Sie die Bedeutung der Standardabweichung. In der Statistik misst die Standardabweichung die Streuung und zeigt die Streuung der Zahlen relativ zum Mittelwert an. Eine Gruppe von Zahlen mit einer geringen Standardabweichung liegen ziemlich nah beieinander. Eine Gruppe von Zahlen mit einer hohen Standardabweichung ist stärker gestreut.
Als Symbol wird die Standardabweichung mit dem Kleinbuchstaben s oder dem griechischen Buchstaben σ (Sigma) ausgedrückt. Die Standardabweichung der x-Daten wird also geschrieben als Sx oderx.4. Erkennen Sie die Summennotation. Der Summenoperator ist einer der gebräuchlichsten Operatoren in der Mathematik und repräsentiert eine Summe von Werten. Es wird durch den griechischen Großbuchstaben Sigma oder ∑ . dargestellt.
Wenn Sie beispielsweise einen Satz von Datenpunkten x (1,2,5,6,9,10) haben, dann bedeutet ∑x:1+2+5+6+9+10 = 33Tipps
- Der Korrelationskoeffizient wird manchmal zu Ehren von Karl Pearson, seinem Entwickler, als "Pearson-Produkt-Moment-Korrelationskoeffizient" bezeichnet.
- Im Allgemeinen bedeutet ein Korrelationskoeffizient von mehr als 0,8 (positiv oder negativ) eine starke Korrelation; ein Korrelationskoeffizient kleiner als 0,5 (wieder positiv oder negativ) stellt einen schwachen Korrelationskoeffizienten dar.
Warnungen
- Korrelation zeigt, dass zwei Datensätze irgendwie verbunden sind. Achten Sie jedoch darauf, dies nicht als kausalen Zusammenhang zu interpretieren. Wenn Sie beispielsweise die Schuhgrößen und die Körpergröße von Personen vergleichen, werden Sie wahrscheinlich eine starke positive Korrelation feststellen. Größere Menschen haben in der Regel größere Füße. Dies bedeutet jedoch nicht, dass Ihre Füße wachsen werden, wenn Sie groß werden, oder dass große Füße Sie groß machen. Sie passieren einfach zusammen.
"Bestimmung des korrelationskoeffizienten"