AVISO: O grupo de consultoria estatística IDRE estará migrando o site para o WordPress CMS em fevereiro para facilitar a manutenção e criação de novos conteúdos. Algumas de nossas páginas antigas serão removidas ou arquivadas de modo que elas não serão mais mantidas. Vamos tentar manter os redirecionamentos para que os URLs antigos continuem a funcionar da melhor maneira possível. Bem-vindo ao Instituto de Pesquisa e Educação Digital Ajuda ao Grupo de Consultoria Estatística dando um presente FAQ da Stata Como posso obter estatísticas descritivas e o resumo de cinco números em uma linha O Stata fornece o comando de resumo que permite que você veja a média e o desvio padrão , Mas não fornece o resumo de cinco números (min, q25, mediana, q75, max). Você pode usar a opção de detalhes, mas você obtém uma página de saída para cada variável. Se você quiser obter a média, o desvio padrão e o resumo de cinco números em uma linha, então você deseja obter o comando univar. O comando univar foi escrito por John R. Gleason e aparece no Stata Technical Bulletin 51. Você pode baixar o univar dentro do Stata, digitando findit univar (veja Como eu usei o comando findit para procurar programas e obter ajuda adicional para obter mais informações Sobre o uso de findit). Vamos ilustrar o uso do comando univar usando o ensino médio e além do arquivo de dados que usamos em nossas Classes Stata. Aqui você vê a saída que você obtém de resumir. Aqui está o resultado que você pode obter do univar. Se você incluir a opção vlabel, ele também inclui os rótulos variáveis na tabela. A opção boxplot exibe um mini boxplot acima de cada variável. Aqui, usamos a opção (feminino) para exibir tabelas separadamente para machos e fêmeas. Podemos usar as opções by (female) e onehdr para obter uma tabela com um cabeçalho que pode ser um pouco mais fácil de ler. Aqui, pedimos um boxplot para a variável escrevendo e pedimos que os quadros sejam traçados usando a mesma escala (via onescal) para que possamos comparar significativamente o boxplot dos machos e fêmeas. Você pode ver que a mediana do boxplot é maior para as fêmeas. (Se tivéssemos omitido a opção unscal, cada boxplot seria em sua própria escala). Para obter mais informações Para obter mais informações, consulte a ajuda ou o manual de referência sobre resumir. O conteúdo deste site não deve ser interpretado como um endosso de qualquer site, livro ou produto de software da Universidade da Califórnia. NOTICE: O grupo de consultoria estatística IDRE estará migrando o site para o WordPress CMS em fevereiro para facilitar Manutenção e criação de novos conteúdos. Algumas de nossas páginas antigas serão removidas ou arquivadas de modo que elas não serão mais mantidas. Vamos tentar manter os redirecionamentos para que os URLs antigos continuem a funcionar da melhor maneira possível. Bem-vindo ao Instituto de Pesquisas Digitais e Educação Ajude o Grupo de Consultoria Estatal, dando um presente Notas da Classe Stata Contagem de n para N Introdução A Stata possui duas variáveis incorporadas chamadas n e N. N é a notação Stata para o número de observação atual. N é 1 na primeira observação, 2 no segundo, 3 no terceiro e assim por diante. N é a notação de Stata para o número total de observações. Vamos ver como n e N funcionam. Como você pode ver, o ID da variável contém o número de observação que corre de 1 a 7 e nt é o número total de observações, que é 7. Contar com o uso de n e N em conjunto com o comando pode produzir alguns resultados muito úteis. É claro que, para usar o comando por nós, primeiro devemos classificar nossos dados na variável por. Agora n1 é o número de observação dentro de cada grupo e n2 é o número total de observações para cada grupo. Para listar a pontuação mais baixa para cada grupo, use o seguinte: Para listar a pontuação mais alta para cada grupo, use o seguinte: Outro uso de n Permite usar n para descobrir se existem números de identificação duplicados nos seguintes dados: As observações 6 e 7 têm os mesmos números de identificação e valores de pontuação diferentes. Encontrando Duplicados Agora, use N para encontrar observações duplicadas. Neste exemplo, classificamos as observações por todas as variáveis. Em seguida, usamos toda a variável na instrução by e configuramos set n igual ao número total de observações que são idênticas. Finalmente, listamos as observações para as quais N é maior que 1, identificando as observações duplicadas. Se você tem muitas variáveis no conjunto de dados, pode demorar muito tempo para digitá-las duas vezes. Podemos fazer uso do curinga para indicar que desejamos usar todas as variáveis. Além disso, nas versões mais recentes do Stata, podemos combinar classificar e em uma única declaração. Abaixo está uma versão simplificada do código que renderá exatamente os mesmos resultados acima. O conteúdo deste site não deve ser interpretado como um endosso de qualquer site, livro ou produto de software específico da Universidade da Califórnia.
No comments:
Post a Comment