Startseite > Methoden zur Datenanalyse > T-Tests und Chi-Quadrat-Test

T-Tests und Chi-Quadrat-Test

27. Juli 2011 durch joegh Nachricht »

Lange nicht Blog-Update aktualisieren heute einen Artikel über die Methoden der Datenanalyse basiert hauptsächlich auf statistischen Hypothesentest von Prinzip, ob es sich um T-Test oder Chi-Quadrat-Test in realen Arbeitssituationen eingesetzt werden kann, sondern auch mit Excel kombiniert sehr einfach zu bedienen, bezogen auf die Art der statistischen Test von Bedeutung können die Daten überzeugender. Oder um ein einheitliches Prinzip über die Methodik und dann auf den Anwendungsbeispielen zu erhalten, dieser Artikel stellt die Methode, dann wird es ein weiterer Artikel widmet sich der praktischen Anwendung der Fall sein.

Testen von Hypothesen

Testen von Hypothesen (Humaniy Testen von Hypothesen), oder als ein Test für die Signifikanz (Signifikanztests) von der Probe wird auf der Grundlage bestimmter Annahmen in den mathematischen Statistik insgesamt eine abgeleitete. Das Grundprinzip besteht darin, bestimmte Annahmen über die allgemeinen Merkmale machen, und dann durch eine Probe Studie der schließenden Statistik, diese Annahme zu verwerfen oder angenommen werden, zu extrapolieren. Da auf die Prämisse, dann bei der Inspektion vor den entsprechenden Annahmen:

H0: die Nullhypothese oder die Nullhypothese (Nullhypothese), die Notwendigkeit, Annahmen zu überprüfen; in der Regel zuerst die ursprüngliche Hypothese identifiziert richtig ist, dann das Signifikanzniveau gewählt werden, ob die Annahme oder Ablehnung der Nullhypothese.

H1: Die alternative Hypothese (Alternativhypothese) ist in der Regel die Null-Hypothese, ob der Satz,, Standard, die alternative Hypothese, wenn die Nullhypothese abgelehnt wird, akzeptieren.

Wenn die Null-Hypothese auf der Annahme, dass der Mittelwert der Grundgesamtheit μ = μ 0, dann ist die alternative Hypothese für die Bevölkerung μ ≠ μ 0 bedeuten basiert, ist der Prüfprozess, um die entsprechende statistische Signifikanz Wahrscheinlichkeit zu berechnen, zu überprüfen, die Nullhypothese akzeptiert oder abgelehnt werden.

T-Test

T-Test (T-Test) ist die häufigste Form einer Hypothese zu testen, vor allem, um zu überprüfen, ob es einen signifikanten Unterschied zwischen der Population. T-Test eine parametrische Hypothesentests, so dass es gilt für den Bereich von numerischen Daten, Anzahl der Besuche auf der Website-Analyse, die Anzahl der eindeutigen Besucher, Verweildauer und die Zahl der Auftragseingänge, Umsätze von E-Commerce. T-Test müssen auch mit einer Bedingung - die allgemeine Passform der Normalverteilung.

Hier führt keine t-Statistik ist, wie Berechnung, auf der t-Statistik basiert bemerkenswerte probabilistische ist, wie die Abfrage der Tat, diese Algorithmen zu entwickeln, kann uns helfen, zu ergänzen, wenn es Interessenten können die Statistik-Klasse Bücher, die die entsprechende Präsentation sein wird, zugänglich sind. Hier ist die T-Test unter Verwendung von Excel-Daten-Analyse-Tools:

Excel standardmäßig nicht geladen die Daten-Analyse-Tool, so dass wir zusätzlich ihre eigenen Add-Ins, Datei - Optionen - Add-ons - überprüfen Sie die "Analyse-Funktionen" Fertigstellen des Add, und dann in den Reiter "Daten" auf der rechten Seite, um Daten auf diese Schaltfläche Analyse zu finden, dann können Sie beginnen, den T-Test, wo die häufigsten gepaarte Stichproben t-Test, zum Beispiel zu vergleichen, eine E-Commerce-Seite wurde erstellt einen signifikanten Unterschied in der Anzahl der Bestellungen in der überarbeiteten Vorder-und Hinterachse zu tun in Tagen, bis 10 Tage von Daten vor und nach der Revision der Probe zu vergleichen:

  Vor der Revision Zahl der Aufträge Die überarbeiteten Bestellungen
Ein 1032 1187
2 1178 1245
3 1098 1379
4 1045 1094
5 976 1173
6 1101 1364
7 1276 1119
8 1215 1268
9 987 1303
10 1065 1274

Zunächst etablierte Annahmen:

H0: μ 1 = μ 2, vor und nach der Revision der täglichen Bestellungen gleich der Anzahl von bedeuten;
H1: μ 1 ≠ μ 2, dann meinen wir nicht gleich die täglichen Bestellungen, die vor und nach der Überarbeitung.

Um Daten in Excel eingeben, verwenden Sie die Excel-Daten-Analyse-Tools, t-Test: Das Durchschnittsalter der gekoppelten Zwei-Stichproben-Analyse, die Ausgabe der Testergebnisse:

t-test-sample

Siehe die rechte Seite des Displays ist ein wenig schwindlig, und sehen ein bisschen professioneller, in der Tat nicht schwer, solange das Anliegen einer numerischen Größe - one-tailed p-Wert ist 0,00565, wenn Sie überprüfen müssen, dass die 95%-Vertrauensbereich signifikantes Niveau, dann 0,00565 offensichtlich weniger als 0,05 (1-95%) die Nullhypothese, dass die Revision Zahl der Aufträge vor und nach der es einen signifikanten Unterschied war. Einfach ausgedrückt: Warum sollten Sie ein-tailed Bedeutung Wahrscheinlichkeit P, anstatt eine two-tailed, für die meisten der Web-Analyse-Anwendungsumgebung, wir müssen in der Regel die Änderungen vor und nach dem Wert überprüfen, ob es deutlich angehoben oder abgesenkt werden, so dass im Allgemeinen gibt es nur eine Klasse sein kann - oder zu verstärken oder zu verringern, so lange die Prüfung der Wahrscheinlichkeit des einseitigen kann, wie die durchschnittliche Anzahl der Bestellungen in dem obigen Beispiel die überarbeitete 1240,6 als vor der Revision 1097,3, müssen wir diese "größer als" zu überprüfen ist ein bedeutender wird einseitige Test, in welchem ​​Fall betreffen die einseitigen Bedeutung Wahrscheinlichkeit P kann links.

Chi-Quadrat-Test

Chi-Quadrat-Test (Chi-Quadrat-Test), das heißt, χ 2-Test, ein Verhältnis zwischen den beiden Populationen verwendet, um die Existenz von signifikanten Unterschiede zwischen verifizieren Chi-Quadrat-Test ist nicht-parametrische Hypothesentests, Boolean oder Binomial-Daten, auf Anfang für die Produktion von Unternehmen zwischen den beiden Wahrscheinlichkeit von qualifizierten Produkten, wie Ort-Analyse basieren, können für die Conversion-Rate verwendet werden, Bounce Rate in alle Verhältnisse messen die vergleichende Analyse, in der Tat, im vorherigen Artikel - Ausstiegsrate Einfluss von Faktoren Anwendungen. Auch hier nicht um die χ 2 einzuführen ist, wie man berechnen, sowie eine signifikante Wahrscheinlichkeit der Anfrage zu dem χ 2-Statistik beruht, hier direkt auf die Conversion-Rate, zum Beispiel, um die Website Conversion-Rate vor und nach dem Auftreten eines signifikanten Unterschied, eine Probe Revision vergleichen vor und nach drei Tagen der Webanalyse-Daten - die Anzahl der Besuche der Gesamtzahl der Besuche und Conversion ", die Umsetzung der Anzahl der Besuche / Gesamtzahl der Besuche, um die Conversion-Rate berechnen:

  Vor der Revision Der überarbeitete
Gesamtzahl der Besuche 30567 33651
Umwandlung von Zugangsnummer 2976 3698
Die Conversion-Rate 9,74% 10,99%

Zunächst etablierte Annahmen:

H0: R 1 = R 2, überarbeitete Vorder-und Hinterachse Umrechnungskurs gleich;
H1: R 1 ≠ R 2, überarbeitete Vorder-und Hinterachse Conversion-Rate ist nicht gleich.

In der Tat, dies eines der einfachsten Beispiel von vier der Niyitegeka Quadrat-Test ist, ohne die Verwendung von SPSS (natürlich hinreichend vertraut sind mit SPSS können auch eine ähnliche statistische Analyse-Tools), um die Berechnung Schritten von der Mitte zu vereinfachen, benutze ich Excel direkt erzeugt ein einfache Chi-Quadrat-Test der Vorlage, solange die entsprechende Zelle Eintrag Statistiken in der Lage, automatisch die Testergebnisse:

chi-square-test-sample

Hier klicken zum Download: Chi-Quadrat-Test Probe

Excel hellblauen Zellen unterstützen die Eingabe, die Gesamtzahl der Besuche sowie Konvertierungs-und Test-Programme einschließlich der ursprünglichen Anzahl der Besuche, ist das Konfidenzniveau von 95% die Unterstützung der Änderungen, wenn Sie das Konfidenzniveau von 99%, so lange zu ändern, müssen die Die Zelle kann.

Wie die Testergebnisse zu sehen? In der Tat sehr einfach, nur an der roten "Existenz" der Zelle schauen, um Ergebnisse zu dem obigen Fall anzuzeigen, der Umrechnungskurs zwischen den beiden "gibt es" signifikante Unterschiede, wenn es nicht existiert, dann wird die Zelle zeigt " existiert nicht "Mit dieser Vorlage für den A / B-Tests und andere ähnliche Daten ist sehr einfach und leicht, oder ist diese Tatsache, maßgeschneiderte diese Excel-Vorlage an den A / B, Testing und Schneider. ;)

Schön, hier in der Tat, dieser Artikel wird nicht versucht, die T-Tests und Chi-Quadrat-Test aus dem statistischer Sicht des professionellen einführen, nur möchten, dass Sie die Grundsätze und die anwendbaren Bedingungen dieser beiden Methoden zu verstehen, mit den einfachsten Weg, um solche Methoden zu verwenden, um die Daten noch überzeugender, fahren Sie bitte darauf zu achten, um die Anwendung beispielsweise zu umschließen.


»In diesem Papier, die BY-NC-SA Vereinbarung, reproduziert bitte angeben Quelle: Die Datenanalyse » T-Test und Chi-Quadrat-Test

Weitere Artikel:

  1. Vergleich Test-Setup und-analyse
  2. Steigerung der Kundenzufriedenheit
  3. Geheimnis hinter der Schlüsselindikatoren
  4. Die Website KPIs Qualitätskontrolle
  5. Die Standardisierung der Daten

20 Kommentare

  1. Zitan sagte:

    Sehr professionell, direkte Anwendung der statistischen Theorie. Um die Last zu Excel vervollständigen "- Option - Add-ons - Datei überprüfen Sie die" Analyse-Funktionen "add" schwach und schwach fragen, "Dokument", in dem zu finden?

    Antworten Antworten
  2. joegh sagte:

    Zitan : Entschuldigen Sie mich, für meinen eigenen Gebrauch Excel2010 direkt in Übereinstimmung mit der 2010-Schnittstelle zu schreiben, gerade gelesen das Jahr 2007 ist die linke obere Ecke des Logos in die "Excel-Optionen", nachdem die Schritte ähnlich sind.

    Antworten Antworten
  3. Justin sagte:

    Lernen, um die Sammlung Haupt-Website, langfristige Lernen vorzubereiten.

    Antworten Antworten
  4. janessi sagte:

    Zeitvariable und Umsetzung: Es gibt ein Problem, die Testergebnisse in der Tat erklären die überarbeitete Front und Heck, xx-Werte deutlich vorhanden, mit dem Unterschied, aber xx-Wert in der Existenz der deutlich mit dem Unterschied, und kann nicht erklären, die Gründe überarbeitet wird, kann der Einsatz von Chi-Quadrat-Test aus dem Blogger-Prinzip nur so verstehen, Variable Rate war signifikant im Zusammenhang, nach dem Prinzip der kausalen chronologischen denke, die Zeit ändern Sie die Conversion-Rate der Veränderung. Der Umrechnungskurs der Zeit eine signifikante Veränderung können sein: Marketing-Aktivitäten, Änderungen im jahreszeitlichen Zyklus, Revision, etc ... An dieser Stelle, wie der Ausschluss anderer Gründe, die Revision bestätigen führten zu dieser Veränderung?

    Antworten Antworten
  5. joegh sagte:

    _AT_ janessi : Endlich mal jemand hat diese Frage in der Tat, die Beispiele in diesem Artikel die Existenz dieses Problems, in der Nicht-Einmischung Faktoren auf die Ergebnisse des Vergleichs, der Text der Fall, nachdem detaillierte Erklärung der warten Sie ein paar Tage ist die Zeit, sich zu organisieren und zu schreiben ;)

    Antworten Antworten
  6. Zitan sagte:

    Vielen Dank ......

    Antworten Antworten
  7. Justin ist Lee sagte:

    Hallo Blogger, ich Ihre Methode zur Analyse der verwendeten Daten vor und nach einer Veranstaltung, fand aber einige Probleme, ist Konfidenzniveau von 95% offensichtlich sehr signifikante Datenänderungen durch den T-Test zeigt, dass bedeutende. Also habe ich das Konfidenzniveau ausgewählten Rationalität denken, habe ich gelernt, Statistiken, um die Standardabweichung und Stichprobengröße ist eng mit der Größe des Konfidenzintervalls und allgemeine Daten im Zusammenhang kennen. Ich möchte fragen, Blogger zu untersuchen, wie vergangene historische Daten, um zu einem vernünftigen Maß an Vertrauen zu erreichen? Thank you ~

    Antworten Antworten
  8. joegh sagte:

    Justin Lee ist : Hallo, "das Konfidenzniveau von 95% ist offensichtlich sehr signifikante Datenänderungen durch den T-Test zeigen signifikant" ist nicht sehr verständnisvoll, signifikante ursprünglich aus Hypothesentests basierend auf einem bestimmten Konfidenzniveau abgeleitet , wenn nicht durch Testen von Hypothesen, wie man "offensichtlich nicht sehr bedeutsam zu bestimmen. Darüber hinaus ist Konfidenzniveau von 95% die Wahl unter den gegebenen Umständen, wird im Allgemeinen verwendet, um festzustellen, ob sie wesentlich kritischer zu haben; die Nullhypothese auf dieser Ebene zu begehen Typ I Irrtumswahrscheinlichkeit von 5%, wenn die Stichprobengröße wird festgesetzt, um zu verringern Typ I-Fehler auftritt, wird der entsprechende erweitern die Möglichkeit des zweiten Typs von Fehler auftritt, so das Auftreten des ersten und zweiten Art von Fehler, die Notwendigkeit, die Kapazität der Probe zu verbessern reduzieren.

    Antworten Antworten
  9. Justin ist Lee sagte:

    Joegh : Haha, ich verstehe. Vor der Veranstaltung Indikatoren für die sieben Tage der Daten: 110.110.134.123.123.111.109,; für sieben Tage nach der Veranstaltung: 130.123.181.158.117.128.112, der T-Test p-Wert = 0,018 <0,05 signifikant ändern, aber das bloße Auge nur "181.158" Diese beiden Daten signifikant ändert, haben andere Daten nicht wesentlich ändern. Ich nehme die Stichprobengröße ist zu klein, um auf einzelne Ausreißer führen großen Einfluss auf die Genauigkeit des Tests von Bedeutung. Ich hätte zu analysieren, was bewirkt, dass die krankhaften Veränderungen der vergangenen zwei Tage Datenverfügbarkeit. Vielen Dank, Bo Haupt ~

    Antworten Antworten
  10. Feather sagte:

    T-Test für diejenigen, die nicht verstehen, Statistiken gründlich zu verstehen, von einem Experten. Wir freuen uns auf weitere gute Werke haben, dank der selbstlosen Hingabe des Autors.

    Antworten Antworten
  11. Don sagte:

    T-Test sollte das falsche Werkzeug. Gemäß den Bedingungen der Bedeutung der Fragen und Vermutungen, sollte auf die beiden normalen Gesamtdurchschnitt Unterschied zwischen den Voraussetzungen gehören, sollten Sie die EXCEL-t-Test verwenden: Zwei-Stichproben unter Annahme gleicher Varianzen ", ist das Ergebnis nicht dasselbe wie" t Stat "sollte -3,29 sein, ist der kritische Wert nicht gleich.
    Darüber hinaus ist die Formulierung des Chi-Quadrat-Test nicht-parametrischen Tests sind nicht ganz korrekt.

    Antworten Antworten
  12. joegh sagte:

    Don : Vielen Dank Ihre Kommentare und Korrekturen. Es kann vor und nach als "gepaarte Stichproben" ist ein bisschen unpassend überarbeitet werden, weil die Nutzer der Website stets verändert, "Varianz-Hypothese" wird das richtige Alter sein; Chi-Quadrat-Test wird allgemein angenommen, dass die globale Verteilung und Parameter unbekannt sind, im Finale nicht-parametrischen Test kein großes Problem.

    Antworten Antworten
  13. Don sagte:

    Joegh : Chi-Quadrat-Test für die folgende Situation: ein einziger normaler Varianz der Grundgesamtheit für die Inspektion von der bekannten Menge, ein parametrischer Test.

    Antworten Antworten
  14. joegh sagte:

    Don : lehrte :)

    Antworten Antworten

Leave a Comment