Muito tempo sem atualizar o blog de hoje atualizar um artigo sobre os métodos de análise de dados baseia-se principalmente o teste de hipótese estatística de princípio, se é T-teste do qui-quadrado ou teste pode ser usado no trabalho real, mas também combinado com Excel muito fácil de usar, com base no tipo de ensaio de significância estatística pode tornar os dados mais convincente. Ou para manter um princípio consistente sobre a metodologia e, em seguida, os exemplos de aplicação, introduz-se o método, então haverá um outro artigo dedicado para a aplicação prática do processo.
Testes de Hipóteses
Testes de hipótese (Humaniy teste de hipótese), ou chamado de teste de significância (teste de significância) é inferida pela amostra baseadas em certas suposições nas estatísticas matemáticas geral um. O princípio básico é fazer certas suposições sobre as características gerais, e, em seguida, através de um estudo da amostra de inferência estatística, esta hipótese deve ser rejeitada ou aceita a extrapolar. Como premissa a suposição, então, durante a inspeção antes de os pressupostos correspondentes:
H0: a hipótese nula ou a hipótese nula (hipótese nula), a necessidade de verificar os pressupostos, geralmente identificado pela primeira vez a hipótese original está correto, então o nível de significância para optar por aceitar ou rejeitar a hipótese nula.
H1: A hipótese alternativa (hipótese alternativa) é, geralmente, se a proposição dos pressupostos originais;, padrão para aceitar a hipótese alternativa quando a hipótese nula é rejeitada.
Se a hipótese nula baseia-se na suposição de que o μ média da população = μ 0, então a hipótese alternativa para a média da população μ ≠ μ 0, o processo de inspecção é calcular a probabilidade de significância correspondente estatística, a fim de verificar a hipótese nula deverá ser aceite ou rejeitado.
T-teste
T-teste (T-Test) é o tipo mais comum de um teste de hipótese, principalmente para verificar se havia diferença significativa entre a média da população. T-testar um teste de hipóteses paramétrico, por isso aplica-se o intervalo de dados numéricos, número de visitas no site análise, o número de visitantes únicos, tempo de residência eo número de pedidos, vendas de e-commerce. T-teste também precisam cumprir com uma condição - o ajuste global da distribuição normal.
Aqui não introduzir estatística t é como cálculo, com base na estatística t é notável probabilístico é a forma como a consulta de fato, essas ferramentas computacionais podem nos ajudar a completar, se houver interessados podem acessar os livros de estatísticas de classe, que será a apresentação correspondente. Aqui é o T-teste utilizando ferramentas de análise de dados do Excel:
Padrão do Excel não carrega a ferramenta de análise de dados, de modo que adicionar os seus próprios add-ins de arquivo, - Opções - Extras - marque a opção "Ferramentas de Análise" Concluindo o Adicionar e, em seguida, na "Data" guia na extrema direita para encontrar dados para analisar este botão, então você pode começar a fazer o teste-T, onde as amostras mais comuns teste t pareado, por exemplo, comparar um site de comércio eletrônico produzido uma diferença significativa no número de pedidos na frente revista e traseira em dias, 10 dias de dados, antes e depois a revisão da amostra de comparação:
| Antes de o número de revisão de ordens | As ordens revistas | |
| A | 1032 | 1187 |
| 2 | 1178 | 1245 |
| 3 | 1098 | 1379 |
| 4 | 1045 | 1094 |
| 5 | 976 | 1173 |
| 6 | 1101 | 1364 |
| 7 | 1276 | 1119 |
| 8 | 1215 | 1268 |
| 9 | 987 | 1303 |
| 10 | 1065 | 1274 |
Primeiras hipóteses estabelecidas:
H0: μ 1 = μ 2, antes e depois a revisão de ordens diárias igual ao número de média;
H1: μ 1 ≠ μ 2, não significa igual às ordens diárias antes e depois da revisão.
Para inserir dados em Excel, utilizar ferramentas do Excel de análise de dados, t-teste: a média de emparelhado análise de duas amostras, a saída dos resultados dos testes:
Veja o lado direito da tela é um pouco tonto, e olhar um pouco profissional, na verdade, não é difícil, desde que a preocupação de um tamanho numérico - unicaudal valor P é 0,00565, se você precisa verificar se a confiança de 95% nível significativo, então 0,00565 obviamente menor que 0,05 (1-95%) rejeitam a hipótese nula de que o número de revisão de ordens, antes e depois houve uma diferença significativa. Simples de dizer Por que você escolheu o one-tailed P probabilidade de significância, ao invés de um bicaudal, para a maior parte do ambiente de aplicação web analytics, que geralmente precisam verificar as mudanças antes e após o valor se não são significativamente aumentados ou reduzidos, de modo em geral, haverá apenas uma classe pode - ou para aumentar ou diminuir, contanto que a inspecção da probabilidade de lata unilateral, como o número médio de encomendas no exemplo acima, a 1240,6 revisto do que antes da revisão 1097,3, é necessário verificar esta "maior que" significativa , é deixado de teste unilateral, em que um processo diz respeito ao P-tailed probabilidade de significância pode ser.
Qui-quadrado
Qui-quadrado (teste qui-quadrado), ou seja, χ teste 2, a relação entre as duas populações utilizadas para verificar a existência de diferenças significativas entre Qui-quadrado é não-paramétrico de testes de hipóteses, os dados booleanas ou binomial, com base no início para a produção de empresas entre a taxa de probabilidade dois dos produtos qualificadas, tais como análise de local podem ser utilizados para a taxa de conversão, de rejeição em Taxa todos os índices medem a análise comparativa, de fato, no artigo anterior - Taxa de abandono da influência de fatores de aplicações relacionadas. Aqui, também, a não introduzir o χ 2 é a forma de calcular, bem como uma probabilidade significativa de inquérito com base na 2 χ estatística, aqui directamente para a taxa de conversão, por exemplo, para comparar a taxa de conversão do site antes e após a ocorrência de uma diferença significativa, uma revisão amostra antes e depois de três dias dos dados de análise da web - o número de visitas do número total de visitas e de conversão ", a conversão do número de visitas / número total de visitas calculados taxa de conversão:
| Antes da revisão | A revista | |
| Número total de visitas | 30567 | 33651 |
| Conversão de número de acesso | 2976 | 3698 |
| A taxa de conversão | 9,74% | 10,99% |
Primeiras hipóteses estabelecidas:
H0: r 1 = r 2, frente revisto e taxa de conversão traseira igual;
H1: r ≠ 1 r 2, frente revisto e taxa de conversão traseiro não é igual.
De facto, este é um dos exemplo mais simples de quatro a quadrado Niyitegeka, sem a utilização de SPSS (claro, ser suficientemente familiarizados com SPSS também pode usar um semelhantes ferramentas de análise estatística), a fim de simplificar as etapas de cálculo da média, eu usar o Excel produzido directamente uma teste de qui-quadrado simples do molde, enquanto as estatísticas de entrada correspondentes de células será capaz de exibir automaticamente os resultados do teste:
Clique para baixar: Qui-quadrado amostra de teste
Excel luz de entrada suporte azul celular, incluindo o número original de visitas pelo número total de visitas e de conversão do programa programa e teste, o nível de confiança de 95% é o apoio das alterações, se você precisa do nível de confiança de 99%, enquanto para modificar o A célula pode ser.
Como ver os resultados dos testes? Na verdade, muito simples, basta olhar para a "existência" vermelho da célula para exibir os resultados para o caso acima, a taxa de conversão entre os dois "há" diferença significativa, se ele não existir, então a célula exibirá " não existe "Com este modelo para o Teste A / B e outros dados semelhantes é muito simples e fácil, ou que verdade, este modelo do Excel para o A / B Testing, e adequar personalizada. ![]()
É bom aqui, na verdade, este artigo não está tentando introduzir as T-testes e teste qui-quadrado a partir do ponto de vista estatístico do profissional, apenas quero que você entenda os princípios e as condições aplicáveis destes dois métodos, com o mais simples maneira de usar esses métodos para tornar os dados mais convincente, por favor, continue a prestar atenção para incluir a instância do aplicativo.
»Neste artigo, o BY-NC-SA acordo, reproduzido por favor especificar fonte: A análise dos dados » T-teste e teste qui-quadrado
Artigos relacionados:









Muito profissional aplicação direta da teoria estatística. Para completar a carga Sobre EXCEL "arquivo - Opção - Add-ons - marque a opção" Ferramentas de Análise "adicionar" fracos e fraco perguntar, "documento" em que a encontrar?
Zitan : Desculpe-me, para meu próprio uso Excel2010 diretamente, em conformidade com a interface de 2010 para escrever, basta ler o 2007 é o canto superior esquerdo do Logo nas "Opções do Excel", após as etapas são semelhantes.
Aprender a preparar a coleção site principal, a aprendizagem de longo prazo.
Há um problema, os resultados do teste, na verdade, explicar a frente revista e traseira, os valores xx existe significativamente com a diferença, mas o valor xx na existência de forma significativa com a diferença e não pode explicar as razões é revista, o teste do qui-quadrado de princípio, o blogger só pode entender como: variável tempo e conversão de taxa variável foi significativamente relacionado, de acordo com o princípio da cronológica causal penso que o tempo alterar a taxa de conversão de mudança. A taxa de conversão do tempo de uma mudança significativa podem incluir: atividades de marketing, mudanças no ciclo sazonal, revisão, etc ... Neste ponto, como a exclusão de outras razões para confirmar a revisão levou a essa mudança?
_at_ janessi : Finalmente alguém levantou esta questão, na verdade, os exemplos neste artigo, a existência deste problema, em que fatores não-interferência nos resultados da comparação, o texto do processo após a explicação detalhada de esperar alguns dias é o tempo para organizar e escrever
Obrigado ......
Olá blogueiros, eu usei o método de análise dos dados antes e depois de um evento, mas encontrou alguns problemas, nível de confiança de 95% é, obviamente, mudanças muito significativas de dados através do T-teste mostra que significativa. Então eu acho que a racionalidade nível de confiança selecionado, eu aprendi as estatísticas, para saber o desvio padrão e tamanho da amostra está intimamente relacionado com o tamanho do intervalo de confiança e dados gerais. Eu gostaria de pedir a blogueiros para estudar como últimos dados históricos para se chegar a um nível razoável de confiança para ser? Obrigado ~
Justin é lee : Olá, "o nível de confiança de 95% é, obviamente, mudanças muito significativas de dados através do programa T-teste significativo" não é muito significativa compreensão, originalmente derivadas de testes de hipóteses com base em um certo nível de confiança , se não por meio de teste de hipóteses como determinar "claramente não muito significativo. Além disso, o nível de confiança de 95% é a escolha nas circunstâncias prevalecentes, é geralmente utilizado para determinar se têm significativa crítica; culpados a esse nível para rejeição da hipótese nula a probabilidade de erro de Tipo I de 5%, se o tamanho da amostra é fixada para reduzir Tipo I erro ocorre, o correspondente irá aumentar a probabilidade de o segundo tipo de erro ocorre, de modo a reduzir a ocorrência do primeiro tipo e segundo de erro, a necessidade de aumentar a capacidade da amostra.
Joegh : Haha, eu entendo. Antes que os indicadores de eventos para sete dias de dados: 110,110,134,123,123,111,109 e, durante sete dias após o evento: 130,123,181,158,117,128,112, de valor de teste T = P 0,018 <0,05 variação significativa, mas a olho nu, apenas "181.158" Estas duas alterações de dados de forma significativa, outros dados não se alteraram significativamente. Tomo do tamanho da amostra é demasiado pequena para levar a outliers individuais grande influência na precisão do teste de significância. Eu deveria ter que analisar o que faz com que as mudanças anormais dos últimos dois dias de dados. Obrigado Bo principal ~
T-teste para aqueles que não entendem estatísticas entender completamente, de um perito. Espero ter mais boas obras, graças à abnegada dedicação do autor.
T-teste deve estar usando a ferramenta errada. De acordo com as condições do significado das perguntas e hipóteses, deveria pertencer à diferença média duas normais global entre o teste, você deve usar o EXCEL t-teste: Duas Amostras Assumindo Variâncias igual ", o resultado não é o mesmo, como" t Stat "deve ser -3,29, o valor crítico não é o mesmo.
Além disso, a formulação do teste de qui-quadrado é não-paramétrico de testes não são inteiramente correcto.
Don : Muito obrigado por seus comentários e correções. Não pode ser revista antes e depois como "amostras pareadas" é um pouco inadequado, porque o usuário do site está sempre mudando ", hipótese variância" será o ponto adequado; teste qui-quadrado que geralmente se acredita que a distribuição geral e os parâmetros são desconhecidos, na final teste não-paramétrico não um grande problema.
Joegh : qui-quadrado para a seguinte situação: uma variação única população normal para a inspeção da quantidade conhecida, um teste paramétrico.
Don : ensinou