You are on page 1of 10
CAPITULO 1 Introdugio 23, O QUEE ANALISE MULTIVARIADA? Hoje em dia negécios devem ser mais lucrativos, reagir ‘mais rapidamente e oferecer produtos e servigos de maior qualidade, ¢ ainda fazer tudo isso com menos pessoas € a um menor custo. Uma exigéncia essencial nesse proces- so € a criagao e o gerenciamento de conhecimento eficar. Nao hé falta de informagao, mas escassez de conhiecimen- to. Como disse Tom Peters em seu livro Thriving on Cha: 0s, “Estamos nos afogando em informagdes e famintos por conhecimento” [7] A informagio disponivel na tomada de decisées ex plodiu nos itimos anos ¢ ir continuar assim no futuro, provavelmente até mais rapidamente. Até recentemente, muito dessa informagao simplesmente desaparecia. Ou nfo era coletada, ou era descartada. Hoje, essa informa- go est sendo coletada e armazenada em bancos de da. dos e esté disponivel para ser feita a “garimpagem” para fins de methoria na tomada de decisdes. Parte dessa infor- magao pode ser analisada e compreendida com estatistica simples, mas uma grande porgdo demanda técnicas esta- Uisticas multivariadas mais complexas para converter tais dads em conhecimento. Diversos avangos tecnol6gicos nos ajudam a aplicar téenicas multivariadas. Entre os mais importantes esto os desenvolvimentos de hardware e software. A veloci- dade ¢ 0 custo de equipamento computacional tém do- brado a cada 18 meses, enquanto os pregos despencam, Pacotes computacionais amigaveis trouxeram a andlise de dados para a era do aponte-e-clique, e podemos rapida- mente analisar montanhas de dados complexos com rela- tiva facilidade. De fato, a indistria, governos e centros de pesquisa ligados a universidades por todo o mundo esto fazendo amplo uso dessas técnicas. Ao longo do texto, usamos 0 termo genérico pesquisa- dor quando nos referimos @ um analista de dados no am- bito das comunidades académica ou profissional. Acha- mos inadequado fazer qualquer distingéo entre essas duas 4ireas, pois a pesquisa em ambas se sustenta em bases tan- to tedricas quanto quantitativas. A despeito dos objetivos da pesquisa ¢ a énfase em interpretagdo poderem variar, tum pesquisador de qualquer érea deve abordar todas as questoes conceituais e empiticas levantadas nas discus- ses dos métodos estatisticos. ANALISE MULTIVARIADA EM TERMOS ESTATISTICOS ‘Técnicas de andlise multivariada so populares porque clas permitem que organizagécs cricm conhecimento, me- Ihorando assim suas tomadas de decisoes. Andlise multi- varinda se refere a todas as técnicas estatisticas que simul- taneamente analisam miltiplas medidas sobre individuos ou objetos sob investigagao. Assim, qualquer andlise si- ‘multénca de mais do que duas variéveis pode ser conside- rada, a principio, como multivariada “Muitas téenicas multivariadas sto extensbes da andlise univariada (andlises de distribuigdes de uma nica varié vel) e da andlise bivariada (classificagao eruzada, correla Ho, andlise de varidincia, ¢ regressio simples usadas para analisar duas varidveis). Por exemplo, regressao simples (com uma varisvel preditora) é estendida no caso multiva- riado para incluir diversas variéveis preditoras. Analog: mente, de variincia éestendida para inclur miiltiplas variaveis d pendentes em andlise multivariada de variéncia. Algumas téenicas multivariadas (por exemplo, regressio multipla ou andlise multivariada de variancia) fornecem um meio de executar em uma inica andlise aquilo que antes exigia :miltiplas andlises univariadas para ser realizado. Outras técnicas multivariadas, nao obstante, sio exclusivamente planojadas para lidar com aspectos multivariados, como a anilise fatorial, que identifica a estrutura inerente @ um conjunto de varidveis, ou a andlise discriminante, que dis tingue entre grupos baseada em um conjunto de varidveis. "As vezes ocorrem confus6es sobre o que é antlise ‘multivariada porque o termo nao é empregado consisten- temente na literatura, Alguns pesquisadores usam multi- vvariada simplesmente para se referirem ao exame de rela- «es entre mais de duas varidveis. Outros utiliza o termo para problemas nos quais todas as miltiplas varidveis sio assumidas como tendo uma distribuigo normal mult variada, Porém, para ser considerada verdadeiramente rmultivariada, todas as variveis devem ser aleatérias € inter-relacionadas de tal maneira que seus diferentes efei- tos nao podem ser significativamente interpretados em separado, Alguns autores estabelecem que o objetivo da andlise multivariada é medir, explicar e prever o grau de relagio entre variveis estatisticas (combinagdes pondera- das de varidveis). Assim, o caréter multivariado reside nas miltiplas varidveis estatisticas (combinagSes miitiplas de variaveis), ¢ ndo somente no ntimero de varidveis ou ob- servag6es. Para os propésitos deste livro, nao insistimos em uma definiglo rfgida para anélise multivariada. No lugar disso, a andlise multivariada incluiré tanto técnicas com muitas variéveis quanto tcnicas verdadciramente multivariadas, pois acreditamos que 0 conhecimento de {Genicas com muitas variaveis é um primeiro passo essen- cial no entendimento da andlise multivariada varidvel dependente nica encontrada na anslise ALGUNS CONCEITOS BASICOS DE ANALISE MULTIVARIADA Apesar de a anélise multivariada ter suas raizes nas estatis- ticas univariada e bivariada, a extensdo para o dominio mul- tivariado introduz conceitos adicionais e questoes que particular relevancia, Esses conceitos variam da necessida. de de uma compreensio conceitual do constructo da analise 24 Anzlise Multvariada de Dados multivariada ~ a varidvel estatistica ~ até pontos especificos, que lidam com os tipos de escalas de medida empregadas & as quest&es estatisticas de testes de significdncia e niveis de confianga. Cada conceito tem um papel significativo na apli cago bem-sucedida de qualquer técnica multivariada, A varivel estatistica Como anteriormente mencionado, o constructo da anéli- se multivariada é a varidvel estatistica, uma combinagao linear de varidveis com pesos empiricamente determina- dos. As variaveis sio especificadas pelo pesquisador, sen- do os pesos determinados pela técnica multivariada para atingit um objetivo espectfico. Uma varivel estatistica de n variaveis ponderadas (X, até X,) pode ser enunciada matematicamente como: Valor da variavel estatistics Xt iak twiXy to emake onde X, éa varidvel observada e w, 6 0 peso determinado pela t6enica multivariada. ‘O resultado é um tinico valor que representa uma com binagdo do conjunto inteiro de varidveis que methor atinge 6 objetivo da anélise multivariada especifica. Em regres sao miltipla, a variével estatistiea é determinada de modo amaximizar a correlaglo entre as varidveis independentes| riltiplas ¢ a tinica varidvel dependente. Em anélise dis- criminante, a varidvel estatistica € formada de maneira a criar escores para cada observagio que diferencie de for- ma maxima entre grupos de observagbes. Em anélise fato- rial, varsveis estatisticas so formadas para melhor repre sontarem a estrutura subjacente ou padres das variéveis conforme representadas por suas intercorrelagoes. Em cada caso, a varitvel estatistica captura 0 caréter multivariado da andlise. Assim, em nossa discussio de cada téenica, a varidvel estatistica é o ponto focal da and- lise em muitos aspectos. Devemos compreender no ape- nas seu impacto coletivo em satisfazer o objetivo da téeni- ca, mas também a contribuigio de cada varidvel separada para o efeito geral da varidvel estat Escalas de medida A andlise de dados envolve a identificagio e a medida de variagdo em um conjunto de varisveis, seja entre elas mesmas ou entre uma varidvel dependente e uma ou mais varidveis independentes. A palavra-chave aqui é medida, pois o pesquisador nao pode identificar variagdo a menos que ela possa ser medida. A mensuragio importante para representar com precisao o conceito de interesse, ¢ & ins- trumental na selegao do método multivariado apropriado para andlise, Dados podem ser classificados em uma entre duas categorias ~ nio-métricos (qualitativos) ¢ métricos (quantitativos) ~ bascadas no tipo de atributos ou caracte- risticas que os dados representam. F importante observar que é responsabilidade do pesquisedor definir o tipo de medida para cada varidvel. Para o computador, os valores sdo apenas mimeros, mas, como perceberemos na préxima segio, definir dados como métricos ou néo-métricos tem substancial impacto sobre o que os dados podem represen- tare como eles podem ser analisados. Escalas de medida ndo-métrica Medidas que deserevem diferengas em tipo ou naturcza, [Propriedade, so chamadas de dados niio-métricos. Essas propriedades sio discretas no sentido de que, tendo uma caracteristica particular, todas as demais caracteristicas sdo excluidas; por exemplo, se uma pessoa é do sexo mas- culino, nao pode ser do sexo feminino. Uma “quantia” de sexo nao é vidvel, mas apenas o estado de ser do sexo masculino ou feminino, Medidas nao-métricas podem ser feitas com uma escala nominal ou ordinal Ercalasnominais, Uma cscala nonin para rotular ou idenifcarindividuos ou objets. Os né- tmeros designados aos objetos nao tém significado quant {ative além da indicagdo da presenga ou auséncia do at buto ou caracterstica sob investigagdo, Portanto,escalas nominas, também conecidas como escalascategorics, 6 podem fornecero nimero de ocorréncias em cada clas- se ou categoria da varivel sob estudo Por exemplo, ao representar sexo (masculino ou femini- 1no), 0 pesquisador pode designar ntimeros para cada ca- tegoria (por exemplo, 2 para mulheres e I para homens), Com esses valores, contudo, podemos apenas tabular © riimero de homens ¢ de mulheres; carece de sentido © célculo de valor médio de sexo. Dados nominais representam somente categorias ou classes, e nao implicam quantias de um atributo ou ca- racteristica. Exemplos freqlientemente usados de dados nominalmente escalonados incluem diversos atributos de- ‘mogrficos (como sexo, religido, ocupagao ou filiago par- tidaria), muitas formas de comportamento (como com- portamento de voto ou atividade de compra), ou qualquer ‘outra ago que seja discreta (que acontece ou nao). Escalas ordinais. Escalas ordinais sto o préximo nivel “superior” de preciso em medida, No caso de escalas or- inais, varidveis podem ser ordenadas ou ranqueadas em relagdo a quantia do atributo possufda. Todo individuo ou objeto pode ser comparado com outro em termos de uma relagdo da forma “maior que” ou “menor que. Os nd- meros empregados em escalas ordinais, contudo, slo real- ‘mente no-quantitatives porque eles indicam apenas po: sigdes relatives em uma série ordenada. Escalas ordinais nio fornecem qualquer medida da quantia ou magnitude real em termos absolutos, mas apenas a ordem dos valo- res, O pesquisador conhece a ordem, mas nao a quantia de diferenca entre os valores. CAPITULO 1 Introdugio 25 Por exemplo, diferentes niveis de satisfago de um con: sumidor em relagio a diversos novos produtos podem ser ilustrados primeiramente usando-se uma escala or- dinal. A escala a seguir mostra a opinido de um respon: dente sobre trés produtos, Quando medimos essa varidvel com uma escala or: dinal, “ranqueamos a ordem" dos produtos baseados no nivel de satisfagao. Queremos uma medida que reflta que o respondente esta mais satisfeito com o produto A. do que com o produto B e mais satisfeito com 0 produto B do que com 0 produto C, baseados apenas em suas po- sigdes na escala. Poderfamos designar valores de “ordem de ranqueamento” (1 = mais satisfeito, 2 = 0 préximo mais satisfeito etc.) de 1 para o produto A (maior satis- fac30), 2 para o produto B, e 3 para o produto C. Quando vistos como dados ordinais, sabemos que 0 produto A tem a maior satisfagio, seguido pelo produto B c entdo pelo produto C. No entanto, nao podemos fa: zer qualquer declarago quantitativa sobre as diferengas entre produtos (p. ex., mio podemos responder se a dife ronga entre produtos A e B é maior do que a diferenga entre os produtos B e C). Temos que usar uma escala intervalar (ver préxima segdo) para avaliar qual é a mag: nitude de diferengas entre produtos. Em muitos casos, um pesquisador pode achar atraente 6 uso de medidas ordinais, mas as implicagGes Sobre os ti- pos de andlises que podem ser executadas sao substanciais, analista nfo pode realizar nenhuma oper: ca (somas, médias, multiplicagdes, divisGes ete.), tornan- do assim todos os dados nio-métricos bastante limitados em seu uso na estimagéo de coeficientes do modelo. Por esse motivo, muitas técnicas multivariadas sao desenvol- vidas apenas para lidar com dados nio-métricos (p. cx., anilise de correspondéncia) ou para empregar dados nao- ‘métricos como uma varivel independente* (p. ex., andlise discriminante com uma varidvel dependente nao-métrica, ou anslise multivariada de variancia com variéveis inde- pendentes nio-métricas). Logo, o analista deve identificar ‘todos os dados nao-métricos para garantir que eles sejam utilizados adequadamente nas técnicas multivariadas. Escalas de medida métrica Em contraste com dados ndo-métricos, dados métricos so utilizados quando individuos diferem em quantia ou grau em relagdo a um atributo em particular. Varidveis "Node RTs A rave ceria sea "como uma varivel dependente ou independents metricamente medidas reflctem quantidade ou grau rela- tivo e so apropriadas para atributos envolvendo quantia ‘ou magnitude, como o nivel de satisfagdo ou compromisso com um emprogo. As duas escalas de medida métrica so as escalas intervalares ¢ de razio. Escalas intervalares, As escalas intervalares e escalas de razio (ambas métricas) fornecem o mais alto nivel de preciso de medida, permitindo que quase todas as ope- rages matemiticas sejam executadas, Essas duas escalas tém unidades constantes de medida, e, portanto, diferen- «gas entre quaisquer dois pontos adjacentes em qualquer parte da escala so iguais. No exemplo anterior de medida de satisfagdo, dados mé- tricos poderiam ser obtidos medindo-se a distancia de um cxtremo da escala até a posigio de cada produto, Consi- dere que 0 produto A estava a 25 unidades do extremo esquerdo, que o produto B estava a 6,0 unidades, e que 0 produto C estava a 12 unidades, Usando esses valores como medida de satisfagio, poderiamos no apenas fazer as mesmas declaragées que fizemos com os dados ordi- nais (p.ex.,a ordem de ranqueamento dos produtos), mas poderfamos também perceber que a diferenga entre os produtos A eB era muito menor (6,0~2,5 =3.5) do que a diferenga entre os produtos B e C (12,0 -60= 6.0) A tinica diferenga real entre escalas intervalares ¢ es- calas de razao é que as primeiras tém um ponto zero arbi- tario, enquanto as escalas de razao incluem um ponto de zero absoluto. As escalas intervalares mais familiares 40 as escalas de temperatura Fahrenheit e Celsius. Cada uma tem um ponto zero arbitrério diferente, e nenhuma indica ‘uma quantia nula ou auséncia de temperatura, jé que pode- mos registrar temperaturas abaixo do ponto zero em ambas. Logo, nao é possivel dizer que qualquer valor em uma esca- laintervalar é um méltiplo de algum outro ponto da escala or exemplo, nfo se pode considerar que um dia de 80°F tem o dobro de temperatura de um dia de 40°F, pois sa- bbemos que 80°F, em uma escala diferente, como Celsius, 6 26,7°C. Do mesmo modo, 40°F em Colsius € 4,4°C. Apesar de 80°F ser de fato 0 dobro de 40°F, néo pode- ‘mos afitmar que 0 calor de 80°F € o dobro do calor de 40°F, jd que, usando diferentes escalas,o calor néo temo dobro da intensidade, isto &, 44°C x24 26,7C scalsde raaio, As escalas de rato representam a mais clevada forma de precisao de medida, pois POSUERE (Eien he ta ss cada in feriores oumaidas AemiteaIa S| ‘um ponto zero absoluto, Todas as operagdes matemétias silo possveis com medidas de escala de tazdo. As bslangss de banheiros ou outros parelhos comans para medir pesos sao exemplos dessas escals, pos tém um ponto zr0 abso 26 Anilise Mullvariada de Dados Ito, ¢ assim podemos falar em termos de miltiplos quando relacionamos um ponto da escala com outro; por exemplo, 100 libras € duas vezes o peso de 50 libras. O impacto na escotha da escala de medida Compreender os diferentes tipos de escalas de medida & importante por duas razies. 1. O pesquisador deve identifiear a escala de medida de cada ‘varigvel useda, de forma que dados nfo-métricos nao sejam incorretamente usados como dados métricas e vice-versa (como em nosso exemplo anterior de representagio de sexo como I para homem e 2 para mulher). Se o pesquisadorin- corretamente define essa medida como mélrica, enti ela pode ser empregada inadequadamente (p. ex, encontrar 0 valor médio de sexo). 2, A-escala de medida é também critica a0 determinar quais téenicas multivariadas s20 as mais aplicéveis aos dados, com consideragbes feitas tanto para as variéveis independentes quanto para as dependentes. Na discussio sobre as téeni- cas ¢ sua elassificagdo em segdes apresentadas mais adiante neste capitulo, as propriedades métricas e nfo-métricas de varidveis independentes e dependentes sio os fatores deter sminantes na escolha da técnica apropriada, Erro de medida e medida multiyariada uso de variéveis miiltiplas e a confianga em sua com: binagao (a varidivel estaistica) em téenicas multivariadas também concentra a atencio em uma questo comple: mentar~o erro de medida. Erro de medida é 0 grauem que os valores observados nao sio representativos dos va- lores “verdadeiros”. Ha muitas fontes para erros de medi- da, que variam desde os erros na entrada de dados devido A imprecisio da medida (p. ex., impor escalas com sete pontos para medida de atitude quando o pesquisador sabe que os respondentes podem responder precisamente ape- nas em escalas de trés pontos) até a falta de habilidade dos respondentes em fornecerem informagdes precisas (p.cx., respostas como a renda familiar podem ser razoavelmente corretas, mas raramente exatas). Assim, todas as variéveis uusadas em técnicas multivariadas devem ser consideradas como tendo um certo grau de erro de medida, O erro de medida acrescenta “ruido” as varidveis observadas ou me- didas. Logo, o valor observado obtido representa tanto 0 nivel “verdadeiro” quanto 0 “ruido”. Quando usado para computar correlagbes ou médias, 0 efeito “verdadeiro” ¢ parcialmente mascarado pelo erro de medida, causando lum enfraquecimento nas correlagdes e menor precisio nas médias. O impacto especifico de erro de medida e sua acomodagao em relacionamentos de dependéncia ¢ abor- dado mais detalhadamente no Capitulo 10. Validade e confiabilidade 0 objetivo do pesquisador de reduzir 0 erro de medida pode seguir diversos caminhos. Ao avaliar o grau de erro presente em qualquer medida, o pesquisador deve levar em conta duas importantes caracteristicas de uma medida: ‘+ Validade é o grau em que uma medida representa preci samente aquilo que se espera. Por exemplo, se queremos ‘medi renda discriciondria, no devemos perguntar aren. da familiar total. A garantia da validade comega com uma ‘compreensio direta do que deve ser medida e entéo realizar ‘a medida tao “correta” e precisa quanto possivel, No entan: to, valores exalos nao garantem validade, Em nosso exem: plo de renda, 0 pesquisador poderia definir com grande cexalido 0 que ¢ renda familiar, mas ainda ter ums medida “errada” (isto 6, invélida) de renda discricionéria, porque a pergunta “eorreta” nao foi formulada, ‘+ Sea validade esta garamtida, o pesquisador deve ainda cons: derar a confiabilidade das medidas. Contfiabilidade & 0 grau fem que a variével observada mede o valor “verdadeiro” e esté “livre de erro”; assim, € 0 oposto de erro de medida, ‘Se a mesma medida for feita repetidamente, por exemplo, ‘medidas mais confiéveis mostrario maior comsisténcia do {que medidas menos confidveis. O pesquisador sempre deve avaliar as varidveis empregadas e, se medidas alternativas vvdlidas estao disponfveis, escolher a variével eom a maior confiabilidade, Emprego de medida multivariada Além de reduzir o erro de medida methorando variéveis individuais, 0 pesquisador pode também escother o de senvolvimento de medidas multivariadas, também conhe- cidas como escalas mltiplas, nas quais diversas varidveis sdo reunidas em uma medida composta para representar ‘um coneeito (p. ex., escalas de personalidade com miilti- plos itens, ou escalas miiltiplas de satisfagéo com um pro- Guto). O objetivo é evitar 0 uso de apenas uma varivel para representar um conceito e, ao invés disso, usar varias variaveis como indieadores, todos representando dileren- tes facetas do conceito para se obter uma perspectiva mais “ampla”. O uso de multiplos indicadores permite ao pes- quisador especificar mais precisamente as respostas de: jadas. Nao deposita total confianga em uma tinica respos- ta, mas na resposta “média” ou “tipica” de um conjunto de respostas relacionadas. Por exemplo, ao medir satisagto, poder-se-ia perguntar simplesmente “Quao satisfeito vocé esta?” e basear a andlise nesta tnica resposta. Ou uma escala milipla po- deria ser desenvolvida combinando varias respostas de satisfagdo (p. ex, achar 0 escore médio entre trés medi das ~satisfacdo geral, a possibilidade de recomendacio, ea probabilidade de novamente comprar). As diferentes medidas podem estar em diferentes formatos de respos- ta ou em diferentes areas de interesse assumidas como abrangendo satisfagio geral, ‘A premissa guia é que respostas miltiplas refletem a resposta “verdadeira” com maior precisio do que uma “nica resposta, Avaliagio de confiabilidade e incorpora- glo de escalas na andlise sio métodos que o pesquisador deve empregar. Para uma introdugao mais detalhada a ‘modelos de miltiplas medidas ¢ construgio de escalas, ver CAPITULO 1 Introdugio 27 discussio suplementar no Capitulo 3 (Anédlise Fatorial) 1no Capitulo 10 (Modelagem de Equagdes Estruturais) ou textos adicionais [8]. Além disso, compilagdes de escalas que podem fornecer ao pesquisador uma escala “pronta para usar” com confiabilidade demonstrada foram publi- cadas recentemente [1,4]. impacto do erro de medida © impacto de erro de medida e a confiabilidade ruim no podem ser diretamente percebidos, uma vez que estio em- butidos nas variéveis observadas, Portanto, o pesquisador sempre deve trabalhar para aumentar a confiabilidade e a validade, que em contrapartida resultardo em uma des- crigio mais precisa das varidveis de interesse, Resultados pobres nio sio sempre por causa de erro de medida, mas a presenga de erro de medida certamente distorce as rela- ges observadas e torna as téenicas multivariadas menos poderosas. Reduzir erro de medida, apesar de demandar esforgo, tempo e recursos adicionais, pode melhorar re sultados fracos ou marginais, bem como fortalecer resul- tados demonstrados. Significdncia estatistica versus poder estatistico ‘Todas as técnicas multivariadas, exceto anélise de agra pamentos e mapeamento perceptual, sio baseadas na in- feréncia estaistica dos valores ou relagées entre varidveis de uma populagdo a partir de uma amostra aleat6ria ex trafda daquela populacao. Um censo da populagao inteira torna a inferéncia estatstica desnecesséria, pois qualquer diferenga ou relagio, ndo importa quo pequena, é “ver dadeira” e existe. Entretanto, raramente, ou nunca, um censo € realizado. Logo, o pesquisador é obrigado a fazer inferéncias a partir de uma amostra Tipos de erro estatistico e poder estatistico Interpretar inferéncias estatisticas requer que 0 pesqui- sador especifique os niveis de erro estatistico accitéveis devido ao uso de uma amostra (conhecidos como erro amostral). A abordagem mais comum é especificar 0 ni- vel do erro Tipo I, também conhecido como alfa (1). O erro Tipo I é a probabilidade de rejeitar a hipdtese nula quando a mesma é verdadeira, ou, em termos simples, a chance de o teste exibir signficancia estatistica quando na verdade esta nao esta presente - 0 caso de um “positivo falso”. Ao especificar um nivel alfa, pesquisador estabe- lece os limites permitidos para erro, especificando a pro- babilidade de se concluir que a significdncia existe quando na realidade esta nao ocorre Quando especifica o nivel de erro Tipo I, o pesquisa- dor também determina um erro associado, chamado de erro Tipo Ii ou beta (8). O erro Tipo IL é a probabilidade de nao rejcitar a hipétese nula quando na realidade esta é falsa, Uma probabilidade ainda mais interessante é 1 ~ B, chamada de poder do teste de inferéncia estatistica, Poder 6 aprobabilidade de rejeitar corretamente a hipétese nula quando esta deve ser rejeitada. Logo, poder ¢ a probabi- lidade de a significdncia estatistica ser indicada se estiver presente, A relacio das diferentes probabilidades de erro na situagio hipotética de teste para a diferenga em duas ‘médias € mostrada aqui: ta ® Apesar de a especificagdo de alfa estabelecer 0 nivel de significancia estatistica aceitavel, é 0 nivel de poder que determina a probabilidade de “sucesso” em encontrar as diferengas se clas realmente existirem. Entdo por que no fixar ambos alfa e beta em niveis aceitaveis? Porque 6s erros Tipo I ¢ Tipo II sao inversamente relacionados, ¢,& medida que 0 erro Tipo I se torna mais restritivo (se aproxima de zero), a probabilidade de um erro Tipo IT aumenta. Reduzir erros Tipo I, portanto, reduz.0 poder do teste estatistico, Assim, o pesquisador deve jogar com © equilfbrio entre o nivel alfa eo poder resultante. Impactos sobre poder estatistico Mas por que niveis elevados de poder nao podem ser al- cangados sempre? O poder nao é apenas uma funcio de (alfa 0). E, na verdade, determinado por trés fatores: 1. Tamanho do efeito ~ A probabilidade de atingirsignitican- cia estatistica € baseada no apenas em consideragdes esta tisticas, mas também na verdadeira magnitude do efeito de interesse (p.ex., uma diferenga de médias entre dois grupos ‘ow a correlagdo entre varisveis) na populaedo, denominado tamanho do efeito, Como era de se esperar, um efeito maior mais facilmente encontrado do que um efeito menor, © {que causa impacto no poder do teste estaistico, Para avaliar © poder de qualquer teste estatistio, o pesquisador deve primeiro compreender o efeito sendo examinado, Os tama inhos de efeito sio definidos em termos padronizados para facilitar a comparagio, As diferengas de média so dadas| «em termos de desvios-padrio, de modo que um tamanho de feito de 0.5 indica que a diferenga de média é metade de uum desvio-padrao Para correlagies, o tamanho do eleito bbaseado na real correlagio entre as varies, Alfa (a) - Como jé fo discutido, quando alfa se torna mais restritivo, o poder diminui. Portanto, quando o pesquisador reduza chance de incorretamente dizer que um efeito & sig nificante quando nfo o é, a probabilidade de corretamente ‘encontrar um efeito também diminui, Diretrizes convencio: nis sugerem niveis de alfa de 0,05 ou 0,01. Entretanto, 0 Pesquisador deve considerar o impacto dessa decisao sobre ‘0 poder antes de selecionar o nivel alfa. A relagio dessas

You might also like