全くブログの更新が今日のデータ解析の方法についての記事を更新しない長い時間は、主にそれはt検定またはカイ二乗検定は、実際の作業で使用することができているかどうかは、原則として統計的仮説検定に基づいていますが、また、Excelと組み合わせて重要な統計的検定の種類に基づいて、非常に使いやすいデータがより説得力にすることができます。 や方法論にして、アプリケーションの例に一貫した原則を維持するために、この記事は、方法を紹介し、例の実用化に専念し、別の記事が存在します。
仮説検定
仮説検定(Humaniy仮説検定)、または(有意性検定)有意差検定と呼ばれるが、全体的な数理統計学では一定の前提に基づいて、サンプルによって推測されます。 基本原理は、全体的な特性に一定の仮定をすることですし、統計的推論のサンプル調査を通じて、この仮定は、推定するために拒否または受け入れられるべきである。 ので、対応する仮定する前に、点検時にして、仮定を前提とした。
H0:帰無仮説や帰無仮説(帰無仮説)、前提条件を確認する必要があります。元の仮説が正しいか、一般的に最初に同定し、有意水準は、帰無仮説を受け入れるか拒否するかを選択します。
H1:対立仮説(対立仮説)が一般的かどうかを命題の帰無仮説である。、帰無仮説が棄却される仮説を受け入れるようにデフォルト。
帰無仮説は母集団の平均μは=μ0の場合、人口の代替仮説がμ≠μ0を意味するという仮定に基づいてされている場合は、検査工程では、帰無仮説を受け入れるか拒否すべきであることを確認するには、対応する統計量の有意確率を計算することです。
T-テスト
T検定(t検定)は、主に人口の平均の間に有意差があったかどうかを確認するために、仮説検定の最も一般的なタイプです。 パラメトリック仮説検定をTは、テストするので、数値データ、サイトの分析での訪問数、ユニークビジター数、滞留時間と注文数の数、電子商取引の売上高の範囲に適用されます。 全体的なフィット正規分布 - T-テストでは、条件を遵守する必要があります。
ここで、t統計量を導入しないと、t-統計量に基づいての計算は、確率的顕著である方法で対応するプレゼンテーションとなり統計クラスの書籍にアクセスすることができますが興味があれば、実際のクエリは、これらの計算ツールは、私たちは完成を助けることができる方法です。 ここでExcelのデータ分析ツールを使用してT検定は、次のとおりです。
オプション - - アドオン - の追加の完了 "分析ツール"をチェックし、 "データ"タブで、Excelのデフォルトでは、私たちは、独自のアドインファイルを追加し、データ分析ツールをロードしませんこのボタンを分析するデータを見つけることが一番右に、あなたは最も一般的なペアのサンプルt-検定は、例えば、eコマースサイトを比較して改訂されたフロントとリアの注文数に有意な差を生み出しT-テストを行うために開始できます。日で、サンプルの改正前と後のデータの10日は、比較する:
| 注文のリビジョン番号の前に | 改訂された注文 | |
| A | 1032 | 1187 |
| 2 | 1178 | 1245 |
| 3 | 1098 | 1379 |
| 4 | 1045 | 1094 |
| 5 | 976 | 1173 |
| 6 | 1101 | 1364 |
| 7 | 1276 | 1119 |
| 8 | 1215 | 1268 |
| 9 | 987 | 1303 |
| 10 | 1065 | 1274 |
最初に確立の前提条件:
H0:μ1、平均値の数に等しい毎日の受注の改正前後=μ2;
H1:μ1≠μ2、我々は改正前と後の毎日の注文に等しくないを意味します。
ペアの2サンプルの分析、テスト結果の出力の平均:Excelにデータを入力するには、Excelのデータ分析ツール、t-検定を使用します。
ディスプレイの右側には少しめまいがわかり、数値の大きさの問題に限り、難しいことではありません、実際には、ビットプロフェッショナルに見える - あなたはその95%の信頼性を検証する必要がある場合は、片側P値は0.00565です。有意水準は、その後明らかに0.00565 0.05未満(1から95パーセント)は有意差があった注文のリビジョン番号の前と後という帰無仮説を棄却。 片側有意確率Pを選択するのではなく、かなりそこに上昇あるいは下降している場合は両側、ウェブ分析アプリケーション環境のほとんどのために、我々は一般的には値の前と後の変化を確認する必要がありますので、一般的には一つしかクラスが存在しますなぜ単に置くことができる - または増強または減少するので、長い片側確率の検査ができるように、リビジョン1097.3以前よりも上記の例では、受注の平均数は、改訂された1240.6のように、我々はこの "より大きい"かどうかを確認する必要が重要です。片側有意確率Pができる場合の懸念で、一方的なテストを残されます。
カイ二乗検定
、χ2検定であるカイ二乗検定(カイ二乗検定)、の間に有意差の有無を確認するために使用される2つの集団間の比 カイ二乗検定は、このようなサイト分析などの修飾された製品の2つの確率率との間に企業の生産のための早期に基づくノンパラメトリック仮説検定、ブール値または二項のデータは、コンバージョン率のために使用することができる率のバウンスです。 -すべての比率は前回の記事の比較分析、実際には、測定要因の放棄率の影響に関連するアプリケーションを。 ここでは、あまりにも、有意差の発生前と後のウェブサイトのコンバージョン率を比較するたとえば、コンバージョン率に直接ここで、χ2も同様にχ2統計量に基づいて、照会の重要な確率として計算する方法であるサンプルのリビジョンを導入しない :訪問や変換の合計数の訪問数、 "コンバージョン率を計算するために訪問/訪問数の合計数の変換 - ウェブ解析データの3日前後
| 改正前の | 改訂された | |
| 訪問数の合計 | 30567 | 33651 |
| アクセス番号への変換 | 2976 | 3698 |
| コンバージョン率 | 9.74パーセント | 10.99パーセント |
最初に確立の前提条件:
H0:R 1 = R 2、改正フロントとリアの変換速度に等しい。
H1:R 1≠R 2は、改正フロントとリアの変換レートは同じではありません。
実際に、これは4つの最も単純な例の一つNiyitegeka二乗検定は、SPSSを使用せずに(もちろん、SPSSで十分精通しても同様の統計解析ツールを使用することができます)の中間の計算手順を簡素化するために、私はExcelが直接生産に使用対応するセルのエントリの統計情報が自動的にテスト結果を表示することができます限り、テンプレートの単純なカイ二乗検定:
クリックしてダウンロードしてください: カイ二乗検定のサンプル
あなたは99%の信頼レベルを必要とする場合にExcelの水色のセルが入力をサポートし、訪問の元の数を含む訪問し、変換プログラムとテストプログラムの合計数は、95%の信頼レベルは、改正のサポートがある限り、変更するセルは、することができます。
テスト結果を参照してくださいするには? それが存在しない場合は、実際には、非常に単純な、ただ上記の場合に結果を表示するセルの赤色の "存在"を見て、二つの間の変換レートは、有意差 "があります"、その後セルは "と表示されます。カスタマイズ/ Bテストおよび調整するためにこのExcelテンプレートは、A / Bテストのためにこのテンプレートを使用する "が存在し、他の同様のデータは非常にシンプルかつ簡単に、またはその事実ではありません。 ![]()
ここに良い、実際には、この資料では、専門家の統計的な視点から、T-テストおよびカイ二乗検定を導入しようとされていない場合は、単に最も単純で、あなたは、これら2つの方法の原理と適用条件を理解したいデータをより説得力のあるように、このようなメソッドを使用する方法は、アプリケーションのインスタンスを囲むように注意を払うように続けてください。
»この論文では、 BY-NC-SAの :複製合意、ソースを指定してくださいデータ分析 » T-テスト、およびカイ二乗検定を
関連記事:









統計理論の非常に専門的、直接的なアプリケーションです。 についてEXCEL負荷 " - オプション - アドオン - ファイルのチェック"を完了するために分析ツールアドインは、見つけるための "ドキュメント"を求める弱いと弱い "追加"?
Zitan :手順は似ていた後だけで2007を読んで、直接書き込みをするために2010インターフェイスに従って、私自身の使用のExcel2010の場合、すみませんが、 "Excelのオプション"にロゴの左上隅です。
コレクションのメイン·サイトは、長期の学習を準備する学習。
時間変数と変換:問題があり、改訂されたフロントとリアの説明、実際のテスト結果は、xxの値は差がかなり存在しますが、違いはかなりの存在とxxの値は理由が改訂される説明することはできませんが、ブロガーの原理からカイ二乗検定を使用すると、としてのみ理解することができます率変数は、因果系列の原理に従って、著しく関連していたことは、時間変化の変換レートを変更すると思います。 時間に有意な変化への変換率が含まれる場合があります。マーケティング活動、季節サイクル、リビジョンなどの変更...この時点で、どのリビジョンを確認するために他の理由での除外は、この変更につながった?
_at_ janessi :最後に誰かがこの問題が、実際には、比較の結果についての非干渉要因は、この資料の例ではこの問題の存在、の詳細な説明の後に例のテキストを提起数日待って整理し、記述する時間です。
ありがとうございます......
ブロガーこんにちは、私はイベントの前と後のデータの分析のあなたの方法を使用しましたが、いくつかの問題を発見し、95%の信頼レベルは、その重要なT-テストのショーを通じて明らかに非常に重要なデータの変更です。 だから私は、信頼水準、選択した合理性を考え、私は標準偏差、サンプルサイズが密接に信頼区間と全体的なデータのサイズに関連しているを知って、統計を学んだ。 私は過去の歴史的データがあるために信頼性の合理的なレベルに到達する方法を勉強するためにブロガーをお願いしたいですか? ありがとうございます〜
ジャスティンは風下である :こんにちは、 "95%の信頼レベルは、有意なT-テスト番組を通じて明らかに非常に重要なデータの変更は、"特定の信頼レベルに基づいて、当初の仮説テストから派生した重要な非常に理解できません、そうでない場合の仮説が "明らかに非常に重要ではありませんを決定する方法をテストを通して。 加えて、95%の信頼レベルは、現行の状況での選択肢であり、一般的には重要なクリティカルを持っているかどうかを判断するために使用されます。そのレベルで帰無仮説を棄却サンプルサイズが低減するために固定されている場合には、5%のI誤り確率を入力してコミットエラーが発生したI型、対応するエラーの第一および第二のタイプは、サンプルの容量を強化する必要性の発生を低減するため、発生したエラーの2番目のタイプの可能性を向上させます。
Joegh :母は、私が理解しています。 110,110,134,123,123,111,109、、イベント後の7日間:7日分のデータのためのイベント·インディケーターの前に130,123,181,158,117,128,112、T検定のP値の= 0.018 <0.05有意な変化が、唯一肉眼で、 "181158"大幅にこれらの2つのデータの変更、その他のデータは有意な変化は認められなかった。 私はサンプルサイズが重要なテストの精度上の個々の外れ値に大きな影響をリードするには小さすぎる取る。 私は、過去2日間のデータの異常な変化を引き起こすかを分析する必要があります。 ボー主に感謝〜
専門家から、徹底的に理解して統計を理解していない人にはT-テスト。 作者の無私の献身のおかげで、より良い作品を持っていたいと思っています。
T-テストでは、間違ったツールを使用する必要があります。 トンスタット "など、結果は同じではありません、"分散が等しいと仮定した2 - サンプル:質問と仮定の意味を状況に応じて、テストの間に2つの通常の全体的な平均値の差に属している必要があり、あなたはEXCEL t-検定を使用する必要があります"-3.29である必要があり、臨界値は同じではありません。
さらに、カイ二乗検定の定式化は、非パラメトリックテストが完全に正しくないです。
ドン :あなたのコメントと訂正ありがとうございました。 ウェブサイトのユーザーは常に変化しているため、として、 "ペアのサンプル"ビットは不適切である前と後が改定されることがあり、 "分散の仮説は"右の時代になり、カイ二乗検定は、一般的に全体的な分布やパラメータは、最終的には、未知であると信じられているノンパラメトリックテストではありません大きな問題。
Joegh :既知の量の検査のために、単一の正規母集団の分散は、パラメトリックテスト:次のような状況のためのカイ二乗検定。
ドン :教えて