Давно не блог изменение сегодня обновлять статью о методах анализа данных в основном базируется на статистических тестов гипотезы принципе, будь то T-тест или тест хи-квадрат может быть использован в реальной работе, но и в сочетании с Excel очень проста в использовании, в зависимости от типа статистических испытаний значение может сделать данные более убедительны. Или обеспечить единый принцип методологии, а затем на примеры применения, эта статья представляет метод, то будет еще одна статья, посвященная практическому применению случае.
Проверка гипотезы
Проверка гипотезы (Humaniy гипотез), или называют тест значимости (значение тестирования) выводится на выборку, основанную на определенных допущениях в математической статистике общее. Основной принцип, чтобы сделать некоторые предположения об общих характеристиках, а затем через образец исследования статистического вывода, это предположение должно быть отклонено или принято экстраполировать. С основывается на предположении, то во время осмотра перед соответствующим предположения:
H0: нулевая гипотеза или нулевой гипотезы (нулевая гипотеза), необходимо проверить предположения, вообще впервые выявлен оригинальная гипотеза верна, то уровень значимости, чтобы выбрать, следует ли принять или отклонить нулевую гипотезу.
H1: альтернативная гипотеза (альтернативная гипотеза), как правило, нулевой гипотезы о том предложении, по умолчанию, чтобы принять альтернативную гипотезу, когда нулевая гипотеза отвергается.
Если нулевая гипотеза основана на предположении, что μ населения средняя = μ 0, то альтернативная гипотеза для населения означает μ ≠ μ 0, проверка процесса для расчета соответствующей вероятности значение статистики для проверки нулевой гипотезы должны быть приняты или отвергнуты.
T-тест
T-тест (Т-тест) является наиболее распространенным типом гипотеза тест, в основном, чтобы проверить, есть ли существенная разница между совокупности. T-тестирования параметрическое тестирование гипотез, поэтому он относится к диапазону числовых данных, количество посещений на сайте анализа, количество уникальных посетителей, время пребывания и количество заказов, продаж электронной коммерции. T-тест также необходимо соблюдать условие - общая подходит нормальному распределению.
Здесь не вносит т статистика, как расчет на основе Т-статистика отличается вероятностным, как запрос самом деле, эти вычислительные средства могут помочь нам завершить, если есть желающие могут получить доступ к статистике класс книги, которая будет соответствующее представление. Вот Т-тест с использованием инструментов Excel, анализ данных:
Excel по умолчанию не загружает инструмент анализа данных, так что добавлять свои собственные надстройки, файл - Параметры - Дополнения - проверка "Пакет анализа" Завершение Add, а затем в "Data" на вкладке на правой, чтобы найти данные, чтобы проанализировать эту кнопку, то вы можете начать делать Т-тест, где наиболее часто парные образцы Т-тест, например, сравнить сайта электронной коммерции производится значительная разница в количестве заказов в пересмотренном передние и задние В дни, 10 дней данные до и после пересмотра образца для сравнения:
| До пересмотра количества заказов | Пересмотренный заказов | |
| 1032 | 1187 | |
| 2 | 1178 | 1245 |
| 3 | 1098 | 1379 |
| 4 | 1045 | 1094 |
| 5 | 976 | 1173 |
| 6 | 1101 | 1364 |
| 7 | 1276 | 1119 |
| 8 | 1215 | 1268 |
| 9 | 987 | 1303 |
| 10 | 1065 | 1274 |
Первый создан предположения:
H0: μ 1 = μ 2, до и после пересмотра ежедневных заказов равно количеству виду;
H1: μ 1 ≠ μ 2, мы имеем в виду не равна ежедневных заказов до и после изменения.
Для ввода данных в Excel, использовать в Excel данные инструменты анализа, т-тест: среднее парных две анализа проб, вывод результатов тестирования:
Смотрите с правой стороны дисплея немного кружилась голова, и выглядят немного профессиональных, по сути, не сложно, поскольку озабоченность численный размер - одностороннее P значения 0,00565, если вам нужно убедиться, что 95% значительный уровень, то 0,00565 явно меньше, чем 0,05 (1-95%) отвергнуть нулевую гипотезу, что пересмотр количества заказов до и после было существенное различие. Проще говоря Почему одностороннее значение вероятности Р, а не двусторонний, для большинства из среды приложений веб-аналитики, в целом мы должны проверить изменения до и после значения, если там значительно повышена или понижена, так что в целом будет только один класс может - а также для усиления или уменьшения тех пор, пока проверка вероятность одностороннего может, как среднее число заказов в приведенном выше примере, пересмотренный 1240,6 чем до пересмотра 1097,3, мы должны убедиться в этом "больше" является важным , остается односторонним тест, в этом случае озабоченность одностороннее значение вероятности Р может быть.
Хи-квадрат
Хи-квадрат (хи-квадрат), то есть, χ 2 теста, отношения между двумя популяциями используется для проверки наличия существенных различий между Хи-квадрат тест непараметрической гипотезы, логические или биномиальное данные, основанные на ранних по производству предприятия между двумя вероятностью ставка квалифицированного продуктов, таких как анализ сайта могут быть использованы для конверсии, отказов в скорости Все отношения измерить сравнительный анализ, по сути, в предыдущей статье - отказ Оценить влияние факторов, связанных с ней приложениях. Здесь также не вводить χ 2, как рассчитать, а также значительная вероятность запроса на основе χ 2 статистики, здесь прямо на обменный курс, например, сравнить скорость сайте преобразования до и после наступления существенной разницы, пример пересмотр до и после трех дней работы веб-анализа данных - количество посещений от общего числа посещений и конверсии ", преобразование числа посещений / общее число посещений рассчитать обменный курс:
| До пересмотра | Пересмотренные | |
| Общее количество посещений | 30567 | 33651 |
| Преобразование номера доступа | 2976 | 3698 |
| Обменный курс | 9,74% | 10,99% |
Первый создан предположения:
H0: R 1 = R 2, пересмотрена передняя и задняя скорость преобразования равны;
H1: R 1 ≠ R 2, пересмотрена передняя и задняя скорость преобразования не равны.
На самом деле, это один из самых простых примера из четырех тестов Нийитегеки площади, без использования SPSS (конечно, достаточно знакомы с SPSS также можете использовать аналогичные статистического анализа), в целях упрощения расчетов шаги середине, я использую Excel непосредственно производства простой тест хи-квадрат с шаблоном, если соответствующая статистика вступление клетки смогут автоматически отображает результаты теста:
Нажмите, чтобы скачать: хи-квадрат образца
Excel ячейки голубого цвета поддерживают вход, общее количество посещений и конверсионных программ и тестовых программ, включая исходное число посещений, уровень доверия 95% поддержки поправки, если вам нужно 99%-ном уровне, до тех пор, как изменить Ячейка может быть.
Как посмотреть результаты тестов? На самом деле, очень просто, достаточно взглянуть на красный "существование" ячейки для отображения результатов в предыдущем случае, обменный курс между двумя "есть" существенная разница, если она не существует, то ячейка будет отображать " не существует "С помощью этого шаблона для A / B тестирование и другие подобные данные очень просто и легко, и тот факт, этот шаблон Excel для A / B, тестирование и специально настроили под себя. ![]()
Хорошо, чтобы здесь, в самом деле, эта статья не пытается ввести Т-тестов и хи-квадрат со статистической точки зрения профессиональной, просто хочу, чтобы вы поняли принципы и соответствующие условия этих двух методов, с самого простого способ использовать такие методы, чтобы сделать данные более убедительны, пожалуйста, продолжать уделять внимание приложить экземпляр приложения.
»В этой статье BY-NC-SA соглашение, воспроизводить пожалуйста, укажите источник: анализ данных » T-тест и тест хи-квадрат
Статьи по теме:









Очень профессионально, непосредственное применение статистической теории. Для завершения О EXCEL нагрузки "Файл - Опции - Дополнения - проверка" Пакет анализа "добавить" слабый и слабый спросить, "документ", в котором найти?
Zitan : Простите меня, для моей собственной Excel2010 использования непосредственно в соответствии с 2010 интерфейс писать, только что прочитали 2007 верхнем левом углу логотип в "Параметры Excel", после того как шаги аналогичны.
Научиться готовить сбор основного сайта, долгосрочные обучения.
Существует проблема, результаты тестирования на самом деле объясняют пересмотренной спереди и сзади, хх ценности существуют значительно, с той разницей, но хх значение в существовании значительной с той разницей, и не может объяснить причины пересматривается, использование критерия хи-квадрат с принципом блоггера могут понимать только как переменная времени и преобразование Скорость переменная была в значительной степени связано, в соответствии с принципом причинно хронологическом думаю, что время изменить обменный курс перемен. Обменный курс времени значительные изменения могут включать в себя: маркетинговые мероприятия, изменения в сезонном цикле, пересмотра, и т.д. ... В этот момент, как исключение других причин, чтобы подтвердить изменение привело к этим изменениям?
_at_ janessi : наконец кто-то поднял этот вопрос, на самом деле, примеров в этой статье, существование этой проблемы, в которых невмешательства факторов на результаты сравнения, текст случае после подробного объяснения Подождите несколько дней, это время, чтобы организовать и писать
Спасибо ......
Привет блоггерам, я использовал свой метод анализа данных до и после события, но столкнулась с проблемами при 95% доверительном уровне, очевидно, очень значительные изменения данных через T-тест показывает, что значительная. Так что я думаю, что уровень достоверности выбранных рациональности, я узнал статистику, чтобы знать, стандартное отклонение и размер выборки тесно связан с размером доверительного интервала и общие данные. Я хотел бы попросить блогеров чтобы изучить, как прошлые исторические данные, чтобы прийти к разумным уровнем доверия может быть? Спасибо ~
Джастин Ли : Здравствуйте, "95%-ном уровне, очевидно, очень значительные изменения данных через T-тест шоу значительный" не очень пониманию, значительный первоначально полученных из гипотез на основе определенного уровня доверия , если не через гипотезы, как определить "явно не очень значительным. Кроме того, 95% доверительный уровень выбор в сложившихся условиях, как правило, используется, чтобы определить, имеют ли они значение критической; отвергнуть нулевую гипотезу на этом уровне совершить I типа вероятность ошибки 5%, если размер выборки крепится к сокращению Тип I ошибки, соответствующие повысит шансы второго типа возникает ошибка, поэтому для уменьшения появления первого и второго типа ошибки, необходимо укрепить потенциал образца.
Joegh : Ха-ха, я понимаю. До начала мероприятия показателей в течение семи дней данные: 110.110.134.123.123.111.109,, в течение семи дней после этого события: 130.123.181.158.117.128.112, Т значения тест P = 0,018 <0,05 изменение значительно, но невооруженным глазом только, "181158" Эти два изменения данных значительно, другие данные существенно не изменились. Я беру выборка слишком мала, чтобы привести к отдельным выбросам большое влияние на точность теста значимости. Я должен был анализировать то, что вызывает патологические изменения в последние два дня данные. Спасибо, Бо основной ~
T-тест для тех, кто не понимает статистику полностью понимаю, эксперт. Надеюсь, больше добрых дел, благодаря самоотверженной преданности автора.
T-тест следует использовать тот инструмент. В соответствии с условиями смысла вопросов и предположений, должны принадлежать к двум нормальным общая разница в среднем от теста, вы должны использовать EXCEL т-тест: Два примера Предполагая одинаковыми дисперсиями ", результат не то же самое, таких как" т Stat "должны быть -3,29, критическое значение не то же самое.
Кроме того, формулировка критерия хи-квадрат не является параметрические тесты не совсем правильно.
Дон : Большое спасибо ваши комментарии и исправления. Там может быть пересмотрен до и после, как "парные образцы" немного неуместно, потому что пользователь веб-сайта постоянно меняется, "отклонение гипотезы" будет соответствующий пункт, хи-квадрат, как правило, считается, что общее распределение и параметры неизвестны, в конечном непараметрический тест не является большой проблемой.
Joegh : хи-квадрат для следующей ситуации: одна нормальная дисперсия населения для проверки известного количества, параметрические испытания.
Дон : учить