You are on page 1of 52

UNIVERSIDADE ESTADUAL DE SANTA CRUZ PROGRAM DE PS-GRADUAO EM FSICA PROFSICA

Flvio Santos Sampaio

ESTUDO DA DISTRIBUIO DE VELOCIDADES EM AGLOMERADOS DE GALXIAS TESTES DE NORMALIDADE E METANLISE DE FISHER

DISERTAO

Ilhus, BA, Brasil 2013

ESTUDO DA DISTRIBUIO DE VELOCIDADES EM AGLOMERADOS DE GALXIAS TESTES DE NORMALIDADE E METANLISE DE FISHER

por

Flvio S. Sampaio

Disertao apresentada, para obteno do grau de Mestre em Fsica, Universidade Estadual de Santa Cruz. rea de Concentrao: Fsica

Orientador: Andr Lus Batista Ribeiro

Ilhus, BA, Brasil 2010

UNIVERSIDADE ESTADUAL DE SANTA CRUZ PROFSICA PROGRAMA DE PS-GRADUAO EM FSICA


A Comisso Examinadora, abaixo assinada, aprova a Disertao

ESTUDO DA DISTRIBUIO DE VELOCIDADES EM AGLOMERADOS DE GALXIAS TESTES DE NORMALIDADE E METANLISE DE FISHER Flvio Santos Sampaio
como requisito parcial para obteno do grau de elaborada por

Mestre em Fsica

COMISSO EXAMINADORA: ANDR L. B. RIBEIRO, Dr.


(Orientador)

(UESC)

xxxxxxxxxxx xxxxx xxxxxxxxxxx, Dr.

(UESC)

Ilhus, 11 de Junho 2013.

dedicatria Aos meus pais, famlia e a minha ndia.

AGRADECIMENTOS

Agradeo a todos que, de formas diversas, colaboraram para a realizao deste trabalho. Em particular:  Ao meu pai Nailton Sampaio (Tito) pelo seu exemplo, fora e sucesso representa para mim uma meta a ser atingida.  A minha me Elisia que com muito carinho e abnegao fez de minha felicidade uma extenso da sua vida.  A Edna (Jana) que esteve sempre ao meu lado me incentivando a no desistir diante dos obstculos.  Aos familiares, amigos e professores que sempre acreditaram em mim. E durante toda essa jornada acadmica, que tem sido a vida, me proporcionaram valiosas contribuies na minha formao pessoal.  A minha namorada Marluzia de Souza (ndia) que com carinho, amor e pacincia faz meus dias mais felizes.  Aos professores Zolacir T. O. Jr., Alejandro J. D. e Arturo R. S. pela pacincia, solicitude e disponibilidade com que sempre me atenderam. O que fez deles, professores com os quais sempre pude contar. Ao meu orientador Andr Ribeiro por ter rolado essa bola para mim, na cara do gol e nos acrscimos do segundo tempo da prorrogao.

Se me fosse dado tempo para pensar eu possivelmente faria uma poesia. mas, s me resta tempo para rimar com muito esforo e pouca imaginao, deixo apenas uma Disertao. Sampaio, F.

RESUMO DISTRIBUIO DE MATRIA EM TORNO DE GRUPOS E AGLOMERADOS DE GALXIAS


Autor: Flvio Santos Sampaio Orientador: Andr L. B. Ribeiro

Data e Local da Defesa: Ilhus, 03 de Dezembro de 2010. Estudamos 416 sistemas de galxias contendo pelo menos 7 galxias, selecionados do catlogo do
Two Micron All Sky Redshift Survey

(2MASS). Aplicamos cinco testes de

normalidade s distribuies de velocidades desses sistemas para distingui-los em gaussianos e no-gaussianos. Usando amostras controladas, estimamos os erros de tipo I e II para cada teste e vericamos que testes individualmente minimizam as chances de classicar um sistemas gaussiano como no-gaussiano. Introduzimos tambm a metanlise de Fisher para combinar os valores-p dos testes estatsticos, visando a minimizar as chances de classicar um sistema no-gaussiano como gaussiano. Levando em conta os aspectos positivos de cada mtodo, assim como o fato de que a principal causa de no-gaussianidade devida multimodalidade no espao de velocidades, denimos um critrio objetivo e estatisticamente robusto para separar aglomerados de acordo com suas distribuies de velocidades. Nossa anlise indica que 5058% dos sistemas so gaussianos, uma frao signicativamente mais baixa do que aquela que encontramos usando os testes de normalidade individualmente, 71-87%. Encontramos tambm que algumas das propriedades dos aglomerados so distintas entre sistemas gaussianos e no-gaussianos. Por exemplo, grupos gaussianos so mais densos e apresentam maiores valores de m12 . Finalmente, discutimos a importncia da escolha do mtodo quando se deseja classicar aglomerados de acordo com suas distribuies de velocidades. Ressaltamos ainda o fato de que diferentes critrios para denio dos aglomerados podem tambm levar a diferentes resultados do ponto de vista estatstico. Palavras-chaves: Aglomerados de galxias;

Meta-anlise de Fisher;Estagio de evolutivo.

LISTA DE FIGURAS

5.1 5.2 5.3 5.4 5.5

Figura 1: Amostra BCD amotra dividida em G (salmo) e NG (azul). . . . . . Figura 2: Amostra BCD amotra dividida em G (salmo) e NG (azul). . . . . . Figura 3: Amostra BCD amotra dividida em unimodais (salmo) e multimodais (azul). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Figura 3: Amostra BCD amotra dividida em unimodais (salmo) e multimodais (azul). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Amostra ACD dividida em unimodal UM (salmo) e multimodal  MM (azul). O topo do diagrama mostra o diagnstico do teste dip. O meio do diagrama mostra o diagnstico da tcnica MA, mantendo o nmero de sistemas NG encontrados pelo teste DP. A parte de baixo do diagrama mostra o uso da combinao da anlise conjunta DP + MA + Dip. O nmero de galxias aparesentado ao lado de cada diagrama. . . . . . . . . . . . . . . . . . . . . .

39 39 40 40

41 42

5.6

Distribution of mass for the LDC (white) and HDC (gray) samples. The vertical red line marks the mean mass for the mock SDSS sample. . . . . . . . . .

LISTA DE TABELAS

4.1 5.1

Tabela 1: Comparao de testes de normalidade. . . . . . . . . . . . . . . . . . comparao de sistemas G e NG . . . . . . . . . . . . . . . . . . . . . . . . . .

36 44

SUMRIO

1 INTRODUO 2 EVOLUO DOS AGLOMERADOS DE GALXIAS


2.1 2.2

11 15
15 16 18 19 20 21 22 23

Dinmica dos aglomerados .


2.2.1 2.2.2

. . . . . . . . . . . . . . . . . . . . . . .

Equao de Boltzmann acolisional . . . . . . . . . . . . . . . . . . . . . . . . . Modelo matemtico para aglomerados no estado estacionrio . . . . . . Modelo de King . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Relaxao de dois corpos . . . . . . . . . . . . . . . . . . . . . . . . . . Relaxao violenta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Teorema do Virial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

2.3

Modlos de Relaxao de um Aglomerado . . . . . . . . . . . . . . . . . . . . . 2.3.1 2.3.2 2.3.3

3 DESCRIO DOS CONCEITOS E FERRAMENTAS ESTATSITICAS UTILIZADAS 26


3.1 3.2 3.3 Testes de Hiptese . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.1.1 Abordagem Estsitica Utilizada . . . . . . . . . . . . . . . . . . . . . . Testes de Normalidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Testes Utilizados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3.1 3.3.2 3.3.3 3.3.4 3.3.5 3.4 3.4.1 3.4.2 3.5 26 27 27 27 27 28 28 29 29 30 30 31 32

Teste de Anderson-Darling (AD) . D'Agostino-Pearson (DP) . . . . . Robust Jarque-Bera . . . . . . . . . Kolmogorov-Smirnov . . . . . . . . Shapiro-Wilk . . . . . . . . . . . . . Teste dip . . . Meta-Anlise

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Teste de Multimodalidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Aplicao dos testes: o ambiente R . . . . . . . . . . . . . . . . . . . . . . . .

4 DADOS E METODOLOGIA
4.1 4.2 4.3 Catlogo Utilizado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Comarao dos testes estatsticos . . . . . . . . . . . . . . . . . . . . . . . . . Mtodo de separao de Gaussianos e No Gaussianos . . . . . . . . . . . . .

33
33 34 35

4.3.1 4.3.2

Processo I . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Processo II . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

36 37

5 Anlise
5.1 5.2 5.3 Usando processo I . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Usando processo II . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Comparando sistemas G e NG . . . . . . . . . . . . . . . . . . . . . . . . . . .

38
38 38 41

6 CONCLUSES E PERSPECTIVAS
6.1 Perspectivas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

45
46

7 REFERNCIAS BIBLIOGRFICAS

47

INTRODUO

O estudo do estgio evolucionrio de aglomerados de galxias tem se tornado um proeminete campo de pesquisa nas ltimas dcadas. Atravs desse estudo possivel obeter informaes sobre a formao de estruturas no universo o que faz dos aglomerados de galxias uma pedra angular na cosmologia moderna. Historicamente, a primeira meno do que seria um aglomerado de galxias foi feita por Charles Messier, em seu trabalho
Connaissance des Temps,

de 1784, contendo a primeira

identicao e catalogao de objetos no estelares. Nesse catlogo enstava descrito o Aglomerado de Virgo (de Souza, 2004). Podemos entender um aglomerado de galxias como um complexo sistema denido basicamente por trs components: galxias, meio intraglomerado aquecido e matria escura. Eles formam os maiores sistemas gravitacionalmente ligados do universo com massa total ao redor de 1014 1015 M , onde M = 1.989 1030 kg equivale a uma massa solar e um raio de 1.5M pc, onde pc = 3.261 anos-luz =3.086 1016 m. A maior parte da massa do aglomerado, cerca de 80% a 90% do total, composta de matria escura (no barinica), que no emite luz e interage apenas gravitacionalmente. O restante da matria, na forma barinica, est quase que totalmente presente no meio intraglomerado, sob a forma de gs aquecido, e nas galxias. As estrelas das galxias contribuem com apenas cerca 20% da matria barinica, 5% da massa total. O gs quente emite raios-X por efeito
bremmstrahlung,

de onde vem a quase totalidade da luminosidade do aglomerado, 95%,

porm a obteno de dados em raio-x provindo de sistemas espaciais iniciou-se somente a partir dos anos 1970, por questes que envolviam aprimoramentos tecnolgicos. Apesar de emitirem apenas 5% da emisso luminosa de um aglomerado, as galxias emitem em uma ampla faixa da do espectro incluindo a luz visvel. Por esssa razo, as pesquisas, os catlogos e as metodologias para envolvendo aglomerados de galxias foram inicialmente feitas a partir de luz visvel proveniente das galxias (Kaastra, 2008). Com base na proporo de massas, ca claro que a dinmica dos aglomerados basicamente governada pela matria escura. Porm como todos os componentes do aglomerado respondem a um mesmo potencial gravitacional, cada uma a sua maneira, podemos fazer algumas inferncias sobre a dinmica do aglomerado com base em qualquer uma de suas componentes. O fato de possuirmos uma maior quantidade de informaes disponveis em forma luz visvel faz das galxias candidatas naturais ao estudo da dinmica de aglomerados. Em particular, as leis de distribuio de velocidades formam a base de nosso entendimento terico

12 sobre a dinmica de aglomerado de galxias (Yahil & Vidal, 1977). A determinao da forma como est distribuda a velocidade radial das galxia pode ser um importante traador da dinmica do aglomerado e prover infomaes sobre o estado evolutivo desses aglomerados. A normalidade na distribuio de velocidades radiais das galxia est relacionada com equilbrio dinmico do aglomerado. Tornar-se "evoludo", que nesse contexto, signica alcanar o equilbrio dinmico, um estado estacionrio do sistema em que vlido o teorema do virial. Uma consequncia importante de se determinar se um sistema se encontra em equilbrio que nesse estado pode-se determinar a sua massa. Por exemplo, assumindo que o aglomerado de Coma era um sistema em equilbrio, Zwicky foi o primeiro a medir a massa de um aglomerado (Zwicky, 1933). O fato de Possuirmos uma maior quantidade de informaes disponveis em forma luz proveniente das galxias faz delas candidatas naturais ao estudo da dinmica de aglomerados. Em particular, a espectroscopia das galxias pode, via redshift, determinar a velocidade radial das galxia cuja distribuio um importante traador da dinmica do aglomerado e prover infomaes sobre o estado evolutivo desses aglomerados. Dado que modelos de modelos mecnico estatsticos de evoluo dinmica de aglomerados de galxias predizem que, num estado relaxado, as galxias de uma glomerado apresentam uma distribuio maxweliana de velocidade no espao, e uma distribuio guassiana para uma componete de velocidades radiais esperada (Ueda,Ioto & suto, 1993). Como o objetivo de saber se a distribuio de velocidades radiais das galxias so consistentes com uma normal Yahil & Vidal (Yahil & Vidal, 1977) realizaram extensa anlise estatstica, fazendo uso dos seguintes testes: a-test, u-test e Shapito-Wilks. A partir desses testes estatsticos de normalidade concluram que a distribuio de velocidade radial observadas em aglomerados de galxias com entre 10 e 122 membros so sempre consistentes com gaussianas, exceto, segundo eles, por contaminao do campos de galxias, que poderiam ser removidas atravs do critrio da excluso sucessiva de objetos com velocidades discrepantes por mais de 3 que a mdia em mdulo, que foram considerados com
outliers.

Logo, segundo

Yahil & Vidal (1977) todas as amostras tinham evoluido dinmicamente. Tornar-se "evoludo", que nesse contexto, signica alcanar o equilbrio dinmico, e um estado estacionrio do sistema em que vlido o teorema do virial Uma importnte consequncia desse fato que a massa do aglomerado pode ser facilmente determinada pelo teorema virial em sua forma escalar U = 2T que implica em M = GR , onde M a massa do aglomerado, um fator geomtrico, a disperso de velocidades, G a constante gravitacional e R o raio do aglomerado.
2

13 Nesse estado, as galxias possuem rbitas isotrpicas com fases aleatrias. H dois modelos de evoluo dinmica via potencial gravitacional para aglomerados de galxias: a interao binria e relaxao violenta. No primeiro modelo uma anlise terica indica que o tempo de relaxao excederia a idade do universo (e.g. Binney & Tremaine 1987). Simulaes numricas para o segundo modelo (Lynden-Bell, 1967) permitem que, dentro da idade do universo, aglomerados alcancem equilbrio dinmico. Se o sistema sofreu um colapso violento, as rbitas das galxias no so deetidas de suas trajetrias radiais at que o sistema atinja uma densidade em torno de 200 vezes a densidade mdia do Universo. Neste caso, o grau de interao com a sua vizinhana deve ser menor. Entretanto, aps um colapso suave, as rbitas das galxias sofrem deexo em contrastes de densidade menores e o grau de interao com a vizinhana se torna ainda maior. Os modelos de estado estacionrio de distribuio de galxias no aglomerado so consistentes com a soluo da equao de Boltzmann no colisional. O modelo de esfera isotrmica de King (King, 1967) fornece uma boa descrio e consistente com as simulaes numricas. Nesse modelo, que parte da hiptese de equilbrio, a distribuio das velocidades radiais obtidas aproximadamente normal. Portanto, desse conjunto de hipteses e modelos, assumimos que, se a distribuio de velocidades for normal, o sistema considerado dinamicamente evoludo. Prem, evidncias tericas e observacionais sugerem que muitos aglomerados ainda no alcanaram o equilbrio dinmico (Fitchett 1988; Sazarin 1987). Alm disso, Beers et al. (1990) apontam para a diculdade em determinar se uma dada distribuio de velocidades difere signicativamente de uma gaussiana. Essas diculdades cam mais severas medida que diminuimos o tamanho das amostras (Beers er al. 1990). Surge ento o problema um problema metodolgico: qual teste (e em que condies) apropriado para realizao inferncia estatstica? Dado que diferentes testes de normalidade, quando aplicados a uma mesma amostra, podem gerar resultados diferentes, no sentido de que podem rejeitar ou no a hiptese de normalidade da amostra, dentro de um determinado nvel de signicncia () estabelecido. Assim, um sistema pode ser classicado tanto como gaussiano quanto no-gaussiano dependendo do teste de normalidade utilizado. Nesse contexto, torna-se preponderante a determinao de critrios objetivos para a escolha do mtodo apropriado para testar a normalidade em aglomerados. Diante desta diculdade, surge, como um ponto central deste trabalho, a ideia de combinar o valor-p de diferentes testes de normalidade para gerar um resultado mais convel. Com este propsito, realizamos uma combinao de testes de normalidade conhecida como metanlise de Fisher (Fisher 1925). Esta tcnica de meta-anlise depende apenas do valor-p

14 dos testes individuais que foram aplicados sobre a amostra e gera um resultado global mais seguro. Esta tcnica de meta-anlise depende apenas dos valores-p dos testes individuais de normalidade e encontra resultados mais seguros que das anlises individuais (e.g. Hedges & Olkin 1985). O mesmo tempo tratamos resumidamente a dependencia dos resultados sobre o critrio usado para identicar grupos de galxias. Ns escolhemos grupos em
All Sky Redshift Survey Two Micron

(2MASS) para entender o efeito dos criterios de seleo de caltlogos.

15

EVOLUO DOS AGLOMERADOS DE GALXIAS

Este captulo prove uma introduo, dentro do panorama terico atual, de modelos fsicos de evoluo dos aglomerados de galxias. A descrio que utiliza-se para esses sistemas baseada na mecnica estatstica, considerando as galxias como partculas. Apresentamos dois modelos de evoluo do sistema relaxao de dois corpos e relaxao violenta, tendo em vista que o tema ainda continua em aberto do ponto de vista terico.

2.1 Dinmica dos aglomerados


Existe uma diferena fundamental entre galxias e sistemas com os quais normalmente lida a mecnica estatstica, como molculas connadas. A diferena est na natureza das foras que atuam nas partculas constituintes. As foras entre duas molculas no gs so muito pequenas a menos que as distncias entre elas seja muito curta, neste caso as partculas so violentamente repelidas. As foras gravitacionais que atuam sobre as galxias tm natureza inteiramente diferente, ela atua a longa distncia sendo sempre atrativa. As foras que atuam em galxias situadas a uma distncia r caem com r2 , mas, se a densidade de galxias for uniforme, o nmero de galxias interagindo gravitacionalmente com uma determinada galxia em uma unidade de rea do cone a que est submetido aumenta com

r2 . Portanto, se a densidade de galxias constante atravs do cone, iguais comprimentos do


cone iro atrair a galxia do vrtice do cone com igual fora, anulando o efeito gravitacional global. Uma densidade inomognea de galxias provoca uma direo preferencial da fora resultante sobre os componentes do aglomerado. Uma outra diferena a fora sobre os constituintes do aglomerado, que variam de modo muito mais lento do que sobre as partculas do gs, as foras so geradas por uma variao do campo provocadas pelo aglomerado com um todo. Imagine um grade nmero de galxias movendo-se sob inuncia de um potencial

(x, t). Num tempo t qualquer, uma descrio completa do estado de qualquer sistema
acolisional dado pelo nmero especco de componentes f (x, v, t)d3 xd3 v tendo posio em um pequeno volume d3 x centrado em x e velocidade em um pequena taxa d3 v centrada em v. A quantidade f (x, v, t) chamada de

Funo de distribuio ou densidade do espao

de fase do sistema.

As coordenadas no espao de fase so (2.1)

(x, v) W (w1 , . . . , w6 )

16 A velocidade desse uxo pode ser escrita como:

= (x W ,v ) = (v, ) :

(2.2)

A densidade f (w, t) de galxias deve satisfazer a equao de continuidade anloga qual satisfeita pela densidade (x, t) de um uxo de uido arbitrrio.

f (f w ) + =0 t =1 w
volume no espao de fase.
6

(2.3)

O conceito fsico contido nesta equao pode ser entendido pela interao sobre o

=1

w = w

(
i=1

vi v i + )= xi vi

i=1

( ) = 0. vi xi

(2.4)

Aqui

vi xi

= 0 porque xi e vi so variaveis independentes, e no depende das

velocidades. Combinando as duas ltimas equaes temos:

f f + w =0 t =1 w
i.e.,

(2.5)

f + t
ou em notao vetorial:

(vi
i=1

f f ) = 0. xi xi vi

(2.6)

f f + v f =0 t v

(2.7)

2.2 Equao de Boltzmann acolisional


. Uma completa soluo da equao de Boltzmann usualmente muito difcil. Contudo, ns podemos tomar os momentos da equao acolisional de Boltzmann. Por exemplo, se tomarmos a equao de Boltzmann sobre todas as velocidades, obtemos

f 3 d v= t

vi

f 3 d v xi xi

f 3 d v = 0, t

(2.8)

Como a gama de velocidades sobre as quais ns estamos integrando no depende do tempo, ento a derivada parcial /t pode ser tomada fora da integral no primeiro termo da

17 equao. De forma similar, desde que vi nao depende de xi , a derivada parcial /xi pode ser tirada da integral no segundo termo da equao e o ltimo termo da equao zera com a aplicao do teorema da divergncia e usando o fato de que f (x, v, t) = 0 para sucientemente grande v |v|, i.e., no existem galxias que se movem innitamente rpidas. Portanto, se ns denimos a densidade espacial de galxias (x) e a mdia de velocidades v (x) por

f d3 v

vi

f vi d3 v

(2.9)

lembrando que da equao de continuidade,

( vi ) + =0 t xi

(2.10)

Se ns agora multiplicarmos a equao por vi e integramos sobre todas as velocidades e obtemos

f vj d3 v +

vi vj

f 3 d v xi xi

vi

f 3 d v=0 vi

(2.11)

Usando o teorema da divergncia e o fato de que f zera para v grande temos

vj

f 3 d v= vi

vj 3 fd v = vi

ij d3 v = ij ,

(2.12)

Ento a (eq.2.11) pode ser escrita como

( v ) ( vi vj ) + + = 0, t xi xi
onde

(2.13)

vi vj

vi vj f d3 v.
j

(2.14) para obter (2.15)

a (eq.2.13) pode ser posta numa forma mais familiar subtraindo-lhe v

v ( vi ) ( vi vj ) vj + = = 0, t xi xi xj

ento notando que o valor mdio de vi vj pode ser divido em partes vi vj que se deve ao movimento e a parte
2 ij ( vi vi )(vj vj ) = vi vj vi vj

(2.16)

18 que surge porque as galxias prximas ao ponto x no tm a mesma velocidade. Ento, usando a (eq.2.16) na (eq.2.15 ns obtemos a equao de uxo:
2 ) (ij v vj vi = ,. t xi xj xi

(2.17)

A Eq.2.17 chamada de equao de Jeans. 2.2.1 Modelo matemtico para aglomerados no estado estacionrio Os modelos matemticos para descrio de aglomerados no estado estacionrio so consistentes com a soluo da equao acolisional de Boltzmann ( as Eq. 2.5). A densidade de galxias num ponto x qualquer ser

(x, t) = m
Do potencial gravitacional (x, t), onde

f (x, v, t)d3 v

(2.18)

2 = 4G.

(2.19)

Ns podemos assumir que cada estrela se move nesse potencial gravitacional suave em alguma orbita especica. Para esferas isotrmicas, este modelo correspondente funo de distribuio

f( ) =

0 exp 2 (2 2 )3/2

(2.20)

parametrizada por duas constantes e . Podemos facilmente vericar que a media quadrada da velocidade v 2 3 2 e que a distribuio de densidade (r) = o exp(/ 2 ). A densidade central c = o exp[ (0)/ 2 ]. convencional denir o raio do ncleo e um conjunto de variaveis adimensionais por

r0 =

9 2 4Gc

1/2

l=

r , r0

. c

(2.21)

Ento a equao de Poisson pode ser reescrita na forma

1 d l2 dl

l2 d dl

= 9.

(2.22)

Essa equao deve ser integrada numericamente [com as condies de contorno (0) = 1

19 e (0) = 0] para determinar o perl de densidade. A soluo tem limite assinttico de

(2/9l2 ). Consequentemente, a soluo exata tem perl de massa com M (r) r para r
Para l

grande; o modelo deve ser cortado em algum raio para prover uma massa nita ao sistema.

2, a soluo numerica bem aproximada pela funo (l) = (l + 12 )3/2 . A

densidade supercial, bidimensional, projetada pela funo (l) S (R) = 2(1 + R2 )1 , onde

R a distncia radial projetada. Em outras palavras, a (verdadeira) densidade central de


superfcie (0) =

2c r0 , onde c a densidade central do volume e r0 o raio do ncleo. O

fato da densidade de massa de um esfera isotrmica variar com r2 leva o potencial a variar com ln r as galxias embebidas no disco tero velocidades rotacionais constantes. 2.2.2 Modelo de King Est baseado na funo de distribuio com

f( ) =
e f ( ) = 0 para

c 2 (e / 1), 2 3 / 2 (2 )

0,

(2.23)

< 0. porque f ( ) zera para < 0, este modelo pode ser pensado como uma

esfera isotrmica truncada. A densidade, quando integrada

1 ( ) = 2 8

f( )
0

(2.24)

e diferenciando os dois lados da equao com respeito a , temos

1 d = 8 d

f ( )d .

(2.25)

Esta equao (chamada equao integral de Abel) tem como soluo a equao

f( ) =
a qual determina f ( ).

1 d 8 2 d

d d

(2.26)

Este processo leva a uma disperso de velocidades isotrpicas para as galxias do aglomerado. Isto segue-se do fato de que, na aproximao, (r) foi usado para determinar um

f ( ) que depende apenas de v 2 . J2 Q= , 2 2R0


(2.27)

R0 = cte.

20 Podemos facilmente integrar a varivel angular no espao de velocidade e obter a distribuio de densidade

2 8 (r) = 2 ) (1 + r2 /R0
que nos leva a

2 8 f (Q) QdQ ( ). 2 1 + r2 /R0

(2.28)

1 d f (Q) = 2 8 dQ

Q 0

dQ d

d Q

(2.29)

2.3 Modlos de Relaxao de um Aglomerado


A natureza da distribuio pode ser examinada atravs da distribuio de velocidades e posies. Os redshifts so determinados a partir da mdia das velocidades radiais das galxias no aglomerado. De fato, as velocidades radiais das galxias se distribuem ao redor desta mdia, o que permite caracterizar essa distribuio pela disperso r das velocidades radiais em torno da mdia.

r = (vr vr )2

1/2

(2.30)

onde vr a velocidade radial, a qual a componente da velocidade da galxias ao longo da linha de visada. Quando a distribuio de velocidades guassiana a funo que a caracteriza completamente :

1 2 exp((vr vr )2 /2r )dvr r 2

(2.31)

onde, p(vr )dvr a probabilidade de que uma galxia tenha uma velocidade radial com variao

vr + dvr .
A adoo da distribuio gaussiana uma simples convenincia, porm testes estatsticos revelam que ela consistente com as distribuies de velocidades observadas excluindo galxias com (|vr vr | > 3r ) (Yahil, 1977). Uma distribuio gaussiana para uma nica componente de velocidade obtida para um sistema de partculas no idnticas em equilbrio termodinmico, tem disperso de velocidades dada por r (KT /m)1/2 , onde T a temperatura e m a massa da galxia. Uma gaussiana distribuio de velocidades sugere que o sistema est pelo menos parcialmente relaxado em estado estacionrio, ela no indica que ele est completamente relaxado (em equilbrio termodinmico). Se um aglomerado resulta do crescimento de interaes gravitacionais inicialmente

21 pequenas, esperamos que em seu estado inicial os aglomerados sejam irregulares. O tempo de relaxao de um aglomerado envolve o movimento espacial de galxias, e tem como limite inferior o tempo de relaxao, que o tempo de travessia de uma galxia pelo aglomerado,dado por:

v Tcr 109 vr

r M pc

r 3 10 km/s

(2.32)

onde, a disperso de velocidade radial r substituida pela velocidade radial vr . Um limite superior para a idade do aglomerado o tempo e Hublbe (idade do universo).
1 10 tH (1.3 2.0)h 50 10 yr,

(2.33)

onde o coeciente numrico depende do modelo cosmolgico. Assim em sistemas como aglomerados ou superaglomerados, para os quais r 1.0Mpc no possvel haver tempo para relaxao e esperamos que o eles seja todos irregulares. Dois tipos de relaxao so propostos para explicar a formao e aglomerados regulares. 2.3.1 Relaxao de dois corpos A distribuio de galxias no espao de fase na parte central de um aglomerado regular
2 ), onde esfrico pode ser representado como f (r, v) exp( /r

1/2v 2 + (r) a energia

por unidade de massa no aglomerado, o que muito semelhante distribuio de MaxwellBoltzmann. Consideremos a possibilidade de que o aglomerado esteja relaxado. O equilbrio termodinmico pode resultar de colises elsticas entre galxias. Espera-se que a energia transferida nas colises seja menor que a idade do aglomerado ou a escala de tempo para a perda da energia cintica atravs de processos dissipativos. A mais importante coliso elstica entre dois corpos num aglomerado a interao gravitacional. Uma escala de tempo caracterstica :

3 3 trel = 2 r 4 G mmf nf ln
Para a relaxao das galxias de massa m em um
background

(2.34) campo de galxias de

massa mf e densidade nf . o raio de mximo a mnimo parmetro de impacto de coliso; o parmetro de mximo impacto da ordem da metade do raio gravitacional do aglomerado

RG , enquanto o parmetro de mnimo impacto e aproximadamente o maior raio da galxia rg


2 ou o raio de retorno Gmf /3r . Assim,

22
2 3RG r 2Gmf

RG 2rg

(2.35)

Objetivando dar um limite inferior ao tempo de relaxao, assumimos que todas as massas no aglomerado esto ligadas a uma galxia individal. Ento ns denimos a densidade
3 mdia 3Mtot /(4RG ), onde Mtot a massa total do aglomerado. Se assumimos a funo

de luminosidade de Schechter (eq.2.36), e uma razo massa-luminosidade xa, encontramos

n(L)dL N (L/L)1 exp L/Ld(l/L)


onde L luminosidade caracteristica.

(2.36)

trel (m, r)

0.24tcr (RG )N

m m

(r)

ln

(2.37)

onde m8 a massa caracterstica da galxia, N o nmero de galxias caracterstico (riqueza),

tcr o tempo de travessia e (r) a densidade total do aglomerado. A equao um limite


inferior porque assume que todo aglomerado est ligado a uma massa individual. Tipicamente

RG 1M pc, r 1000Km/s, N 1000, e ln 3, dado tcr (RG ) 109 yr e trel (m , RG ) 3X 1011 yr. O que muito maior que a idade do universo.
2.3.2 Relaxao violenta O fato dos aglomerados exibirem uma disperso de velocidades aproximadamente constante sugere que a relaxao um processo dado por um efeito gravitacional coletivo. Lynden-Bell(1967) mostrou que um efeito de relaxao coletivo pode resultar em uma rpida quase-relaxao ('relaxao violenta'). A existncia desse efeito envolve um ponto sutil; a relaxao coletiva acontee atravs de interaes no-colisionais, e assim o espao de fase detalhado('ne-grain') da distribuio de galxias conservado. entretanto, se a relaxao sucientemente violenta ento as unidades inicialmente adjacentes do espao de fase sero amplamente separadas no estado nal ('phase mixing'). Assim se a densidade mdia do espao de fase ne-grain de qualquer volume observavel dara uma distribuio 'coarse grain' est distribuio pode ser equilibrada independentemente das condies iniciais. Se o aglomerado for formado a partir de um colapso de perturbaes iniciais, entao durante o colapso o potencial gravitacional utua violentamente. Isso pode causar uma mudana de em (2.38)

D Dt t

23 Por exemplo, se o aglomerado colapsa de um estado estacionrio (v = 0) para um estado nal virializado, ento . A escala de tempo para o colapso tcol uma escala de tempo dinmica ou tempo de travessia.

tcol (G )1/2 tcr (RG ).

(2.39)

Como a energia de um aglomerado muda 100% durante o tempo de colapso, relaxao violenta pode ser completada durante o colapso do aglomerado, depois desse tempo o potencial constante e a distribuio de galxias permanee em equilbrio virial estacionrio. Aglomerados regulares so aqueles que so sucientemente velhos para ter colapsado e relaxado, enquanto os irregulares so aqueles em no tiveram tempo para isso. Como o tempo de colapso :
3 tcol (Rh /GMtot )1/2 (Gi )1/2 , onde i a densidade inicial do aglomerado, den-

sidade mais altas faro com que o colapso acontea mais rapidamente. Desde que a idade do aglomerado limitada pelo tempo de Hubble tH , aglomerados regulares sero produzidos por densidades mais altas que os protoaglomerados e aglomerados irregulares, o que tem sido observado. Contudo, relaxao violenta e fase eliminam subaglomerados e produzem uma distribuio centralmente condensada, o que observado em aglomerados regulares 2.3.3 Teorema do Virial Considere um sistema com massa pontuais com posies bf ri sobre as quais est sendo aplicada uma fora Fi ( incluindo as foras de vinculo). As equaes fundamentais de movimento so (2.40)

p i = Fi .
Dada a quantidade

G=
i

p i Fi ,

(2.41)

Cuja derivada total em relao ao tempo

dG = dt

i pi = r
i i

i ri p

(2.42)

O primeiro termo pode ser transformado para

24

G=
i

r i pi = G =
i

i r mi r i +
i

2 mi vi = 2T

(2.43)

enquanto que o segundo termo igual a (2.44)

G=
i

p i ri =
i

Fi ri

o que leva

d dt

p i ri = 2T +
i i

Fi ri

(2.45)

A mdia temporal da equao 2.44 sobre o intervalo de tempo obtido pela integrao de ambos os lados com respeito ao tempo no intervalo de 0 a , dividindo por

1
ou

dG dG dt = 2T + dt dt

Fi ri
i

(2.46)

2T +
i

1 Fi ri = [G( ) G(0)] t

(2.47)

Se o movimento peridico, i.e., todas as cordenadas repetidas depois de um certo tempo, e se escolhido com periodico ento o lado direito da equao 2.47 pode ser feito to pequeno quanto desejado. portanto temos

T =
a equao 2.48 conhecida como o
de Claussius.

1 2

Fi ri
i

(2.48) e o lado direito e chamado de


virial

teorema virial

Se as foras Fi so foras conservativas o teorema torna-se

T =

1 2

i V ri ,
i

(2.49)

que para uma unica particula movendo-se em um potencial central ela se reduz a

T =

1 V . 2 r

(2.50)

se V dada por uma lei de potencia funo de r

V = arn+1 ,

(2.51)

25 onde o expoente e escolhido para que a lei de foras v com e rn , ento

V r = (n + 1)V, r
a equao 2.50 torna-se

(2.52)

T =

n+1 V. 2

(2.53)

Pela equao de Euler para funes homogeneas, ca claro que 2.53 .para o caso especial em que a lei de foras r2 temos n = 2 e o teorema do virial toma a forma bem conhecida. A equao 2.48 tem relao com a teoria cintica dos gases e dela pode-se derivar a lei dos gases ideais. Consideremos um gs constitudo de N tomos connados mum volume V e temperatura . Pelo teorema de equipartio de energia, a energia cintica mdia de cada tomo dada por 3 N kb , onde kb a constante de Boltzmann 2

1 = V 2 3 N kb 2

(2.54)

(2.55)

No lado direito de 2.48, as foras Fi incluem foras de interao entre as molculas e de vinculo sobre o sistema. Um gs ideal aquele no qual foras de interao so desprezveis. Se o gs tem uma densidade sucientemente baixa para que colises entre tomos aconteam raramente comparadas com as colises entre as paredes do sistema. Podemos portanto na equao 2.48 mudar a mdia pela integral sobre a superfcie das paredes do sistema. Podemos portanto escrever (2.56)

dFi = P ndA
ou

1 2
Pelo teorema da Divergncia

Fi ri =
i

P 2

n rdA

(2.57)

n rdA =
On obtemos a equao dos gases ideiais

rdv = 3V

(2.58)

3 3 N kb = P V 2 2

(2.59)

26

DESCRIO DOS CONCEITOS E FERRAMENTAS ESTATSITICAS UTILIZADAS

Este captulo prove o aporte estatsitco necessrio ao desenvolvimento desse trabalho, apresentando os conceitos utilizados e descrevendo e testes estatsticos utilizados ao longo do texto.

3.1 Teste de Hiptese


O principal objetivo da anlise estatstica fazer inferncia sobre uma populao a partir a da anlise de uma amostra desta populao. Enfatize-se que a hiptese estatstica estabelecida antes da coleo de dados. Caso o exame dos dados rejeite a uma

hiptese nula

(H0 ) uma nova hiptese pode ser formulada. Este procedimento em que pode ou no haver

hiptese alternativa (H1 ) e denominado teste de Hiotese.


necessrio estabelecer um critrio objetivo para rejeitar ou no a H0 para um teste

estatstico. O que nos leva a perguntar o quo pequena deve ser a probabilidade de que H0 seja verdadeira para que possamos rejeita-la? Esta resposta ca a cargo do pesquisador. Uma probabilidade de 5% comumente usada como critrio de rejeio. A probabilidade usada como critrio de rejeio chamada de

nvel de signicncia denotada por

evidente

que existe a possibilidade de que uma verdadeira H0 seja rejeitada. Este erro ser cometido com uma frequncia . A rejeio da H0 quando ela de fato verdadeira conhecida como

Erro do tipo I. Por outro lado H0 II

pode ser de fato falsa e este fato no ser detectado por

um teste estatstico. Esse erro de no rejeio da H0 este erro denominado partir disso deni-se o poder

erro do tipo

representado pela letra probabilidade de no rejeio de H0 quando ela falsa. A

de um teste estatstico 1- como a probabilidade de rejeitar

a H0 quando ela de fato falsa. Enquanto a probabilidade de cometer um erro do tipo I , que ns especicamos. A probabilidade de cometer um erro do tipo II um valor que no sabemos e nem especicamos. O que ns sabemos que para uma dada amostra de tamanho n, o valor de inversamente relacionado com o valor de . Quanto mais baixa a probabilidade de cometer um erro do tipo I mais alta a probabilidade de cometer um erro do tipo II. Os erro podem ser reduzidos simultaneamente com o aumento de n. Desde que para um determinado n os dois valores no podem ser simultaneamente minimizados, o pesquisador deve estabelecer um procedimento adequado.

27 O problema do teste de hiptese estatstica pode ser exposto simplesmente assim: Uma dada observao ou descoberta compatvel ou no com alguma hiptese formulada? A palavra compatvel, aqui, signica sucientemente prxima do valor admitido por uma hiptese para que no rejeitemos a hiptese formulada. A teoria do teste de hiptese se preocupa em desenvolver regras ou procedimentos para decidir se uma hiptese nula deve ser rejeitada ou no. H duas abordagens, o intervalo de conana e o teste de signicncia. Ambas pressupem que a varivel (estatstica ou estimador) que esta sendo considerada tenha alguma distribuio de probabilidade e que o teste de hiptese faa declaraes ou armaes sobre o valor do parmetro dessa distribuio. A abordagem do teste de signicncia foi desenvolvida independentemente por R.A Fisher e conjuntamente por Pearson e Neyman. Ela consiste em um procedimento pelo qual os resultados de uma amostra so usados para vericar a validade ou falsidade de uma H0 . A ideia chave por trs do teste de uma estatstica de teste (estimador) e a distribuio de amostragem dessa estatstica conforme a H0 . A deciso de aceitar ou rejeitar H0 tomada com base no valor da estatstica do teste obtida com os dados disponveis. 3.1.1 Abordagem Estsitica Utilizada H trs possveis abordagens estatsticas para um determinado teste Dentre as possveis abordagem estatsticas Fisheriana, Neymann-Pearson, e Baeysiana consideramos a abordagem Fisheriana onde no temos um hiptese altenativa explicita dada natureza dos nosso trabalho Neste trabalho utilizamos uma

abordagem sheriana

3.2 Testes de Normalidade


Em estatstica, os testes de normalidade so usados para determinar se um conjunto de dados de uma dada varivel aleatria, bem modelada por uma distribuio normal ou no, ou para calcular a probabilidade da varivel aleatria subjacente estar normalmente distribuda. Mais precisamente, os testes so uma forma de seleo de modelos. Filosoa dos testes estatsticos sugere maior complacncia com erros do tipo I

28

3.3 Testes Utilizados


Para avaliar a suposio de normalidade em amostras aleatrias de dados X1 , X2 , . . . , Xn , utilizamos cinco testes de normalidade: o Anderson-Darling (Anderson & Darling, 1952); D'Agostino-Pearson (D'Agostino, 1970); Jarque-Bera robusto (RJB) (Gaswirth, 2006); KolmogorovSmirnov (Stephens,1986); Shapiro-Wilk (Shapiro & Wilk, 1965). A seguir, apresentamos uma descrio do algortmo de cada teste utilizado em nosso trabalho. 3.3.1

Teste de Anderson-Darling (AD)


Proposto por Anderson e Darling (1952) o teste especialmente ecaz quando temos

amostras de tamanho pequeno hou et al. (2009). O teste (AD) baseado na Funo de Distribuio Emprica (FDE), tratando-se de um teste global para comparar a hiptese de normalidade. O teste estatstico robusto recomendado por Stephens (1987) denido como:

A 2 = n

1 n

[2i 1][ln(p(i) ) + ln(1 p(ni+1) )],


i=1

(3.1)

onde p(i) = ([x( i) x ]/ ) e xi x < xi+1 . Aqui, a Funo de Distribuio Cumulativa (FDC) da hipottica distribuio normal pardro, e x e representam a mdia e o desvio padro respectivamente. O valor p obtido da estatstica modicada de

Z = A2 (1.0 + 0.75/n + 2.25/n2 )A,


, caso os parmetros da distribuio no sejam conhecidos a priori (Stephens, 1987). 3.3.2

(3.2)

D'Agostino-Pearson (DP)
Tambm conhecido como teste D foi proposto por D'Agostino (1970) Verica a hiptese

de normalidade como medida de assimetria dos dados utiliza como hiptese nula assimetria nula. A estatstica DP dada por:

DP =
Onde,

T , n2 n+1 2

(3.3)

T =
i=1

x(i)

(3.4)

29 Se a amostra da distribuio normal, temos


1 (n 1) n 2 1 2 E {D } = 0.28209479 n 2 2 2n ( 2 )

(3.5)

o valor-p obtido de

D =
Com, (D) = 0.02998598 3.3.3

D E (D) . (D)

(3.6)

Robust Jarque-Bera
O RJB uma verso robusta do teste estatstico de normalidade Jarque-Bera (JB). O

RJB utiliza os coecientes de assimetria e curtose dos dados empricos. Ele estatsticamente mais robusto que o JB por incorporar medidas robustas de varincia chamadas
solute Deviation from the Median (MAAD) Average Ab-

as medidas de assimetria e curtose tornando o

teste menos sensvel a

outliers.

Descrito da seguinte forma.

Seja X1 , X2 , . . . , Xn uma sequncia de n variveis independentes identicamente dis-

, tribudas. seja , v e a mdia, mediana e desvio padro da populao. Fazendo X


M e Sn ser os estimadores ,v e correspondente a amostra. Para qualquer inteiro positivo k o k -simo momento central k e denido por k = E (X )k e sua estimativa por
n i1 (Xi

k =

). Utilizando um estimador robusto (MAAD)-avarage X


denido por

absolute deviation

from the median

Jn =

C n

|Xi M |,
i 1

C=

/2

(3.7)

3 4 obtemos estimadores robustos de assimetria = 3 /Jn e curtose = 4 /Jn que levam ao

teste RJB dado por.

RJB =

n C1

3 3 Jn

n C2

4 3 4 Jn

(3.8)

onde C1 e C2 so constantes positivas. Para um nvel de signicncia = 5% indica-se C1 = 6 e C2 = 64 (Gel & Gastwirth, 2006). O valor p obtido pela soluo da (eq.3.8).

30 3.3.4

Kolmogorov-Smirnov
uma verso modicada do teste estatstico Kolmogorov-Smirnov, baseado na difer-

ena mxima entre a FDE e a FDA. A estatstica do teste dada por

D = max{D+ , D },
onde D+ = maxi=1,...,n {i/n p(i) }, D = maxi=1,...,n {p(i)
i1 } n

(3.9) e p(i) = P hi(|x(i) x | .

a FDA normal padro com x e sendo mdia e desvio padro respectivamente. O valor p calculado por Se D 0, 1 O valor-p obtido de: (Stephens,1986)

Z=D

0, 85 n 0, 01 + n

(3.10)

Lilliefors (1967) foi o primeiro a usar EDF para testar hiptese composta, quando ele investigou a distribuio nula de D sobre a normal composta da hiptese nula e compara com o teste 2 em termos de potncia (vide Thode Jr., 2002). 3.3.5

Shapiro-Wilk
O teste Shapiro-wilk um reconhecido eeciente tese de desvio de normalidade, publi-

cado em 1965 por Samuel Shapiro e Martin wilk, a estatistica-w onde w interpretado como a linearidade do graco de probabilidade quantil-qualtil (QQ). Royston (1995) A estatstica do teste dada por:
n

( W =
i=1 n

ai x(x) )2
(3.11)
2

(xi x )
i=1

onde

a = (a1 , . . . , an ) = m V 1 [(m V 1 )V 1 m)]1/2 .

(3.12)

com m = (m1 , . . . , mn ) o vetor de valores esperados da normal padro e seja V = (vij ) a corresponde matrix de covarina; ou

E (xi ) = mi (i = 1, . . . , n)

cov(xi , xj ) = Vij (i, j = 1, . . . , n),

(3.13)

onde x1 < x2 < . . . < xn uma amostra aleatria ordenada de uma uma distribuio normal

31 padro N (0, 1). Suponha x = (x1 , . . . , xn ) uma amostra aleatria sobre a qual O tese W de normalidade aplicado, ordenado x(1) < x(2) < . . . < x(n) . ento Os coecintes {ai } so valores normalizados tabelados para n < 20.

3.4 Teste de Multimodalidade


Dado que a multimodalidade uma causa frequente de no gaussianidade (Ribeiro et al. 2011) e (Einasto et al 2012) Aplicamos o teste Dip (Hartingan e Hartingan 1985) 3.4.1

Teste dip
Autor If `simulate.p.value' is `FALSE', the p-value is computed via linear interpolation (of

sqrt(n) * Dn) in the `qDiptab' table. Otherwise the p-value is computed from a Monte Carlo simulation of a uniform distribution (`runif(n)') with `B' replicates. A estatstica dip a diferena mxima entre a funo de distribuio emprica e funo de distribuio unimodal que minimiza a mxima diferena. uma medida proposta por Hartigan (1985) para testar o desvio da unimodalidade de um amostra. A hipese nula para o teste dip que os dados esto distribuidos uniformemente, assume que a distribuio unimodal como caso menos provvel. Assintoticamente n(dip) positivo par uma distribuio uniforme e 0 para uma distribuio unimodal. Seja x1 , x2 , . . . , xn obsevaes ordenadas. O nico ponto nal possvel para o intervalo modal estimado (xL , xU ) so pares dessas observaes. 3.4.2

Meta-Anlise
Em muitas situaes a quantidade de dados insucinte, bem como o enviesamento da

cada teste estatstico, podem impedir uma resposta segura para as questes de interesse sobre um determinado estudo, por exemplo, podendo levar a aceitao ou regeio prematura de uma hiptese sobre a natureza do sistema em estudo. Uma aproximao alternativa que tem sido populariazada nas ltimas dcadas a reviso sistemtica. A qual tem essencialmente duas componetes: Qualitativa A descrio dos ensaios realizados, em termos de sua relevncia, metodologia, foras e fraquezas Quantitativa Uma medida matemtica dos resultados dos diferntes estudos, mesmo quando

32 esses estudos tenham usado medidas diferentes para acessar a varivel dependente. A componente quantitativa da reviso sistemtica conhecida como
meta-anlise

que

denida como uma coleo de tcnicas pelas quais o resultado de dois ou mais estudos estatsticos independentes so combinados para obteno de um resultado global para questo de interesse. A combinao de valores p provindo de mltiplos testes estatsticos tem uma longa histria em cincia (e.g. Hedges & Olkin 1985). H duas vantagens principais: Simplicidade e extensibilidade para diferentes espcies de resultados variveis. O mtodo de Fisher pode se usado para combinar resultados de diversos testes independentes relacionados a mesma hiptese nula. O mtodo combina valores extremos de cada teste comumente conhecidos como valor-p, gerando um nico teste estatstico S dado pela formula:
k

S = 2
i=1

ln Pi ,

(3.14)

Onde pi o valor-p do iesimo teste a quantidade S comparada a distribuio-2 com 2K graus de liberdade (gl). Este mtodo e baseado na aditividade dos 2 independentes, e no fato de que quando a hiptese nula verdadeira 2 ln Pi distribuda com uma distribuio-2 com 2K gl(e.g. Hedges & Olkin 1985). Teste de Tukey-Kramer Um

post hoc ou teste de comparao mltipla usado para

determinar se trs ou mais mdias diferem signicativamente entre se em uma anlise de variana. Ele no assume igualdade no tamanho das amostras uma modicao do teste Tukey ou HSD

3.5 Aplicao dos testes: o ambiente R


Os testes foram aplicados utilizando o ambiente estatstico R, ao mesmo tempo uma ferramenta estatstica e uma linguagem de programao, voltado para anlise de dados. O R mantido e atualizado por estatsticos e colaboradores de diversas reas do conhecimento. um sistema gratuito disponvel para os sistemas operacionais Linux e Windows. Ao conjunto de pacotes operacionais originais do R inclumos os seguintes pacotes:
diptest

onde realizamos o teste dip de anlise de multimodalidade Autor: Martin O pacote nortest abilita a funo com a qual realizamos o teste de

Maechler
nortest ad.test

normalidade de AD. Kolmogorov-smirnov ( Juergen Gross). Thode Jr., H.C. (2002): Testing

33 for Normality. Marcel Dekker, New York.


lawstat

O pacote nortest abilita a funo

rjb.test

com a qual realizamos o teste de normalidade de RJB que esto disponveis gratuitamente na rede e podem ser baixados do prprio R.

4
4.1 Catlogo Utilizado

DADOS E METODOLOGIA

Nossa amostra foi retirada do catlogo Two Micorn ALl Sky Survey Source Catalog (2MASS), o 2MASS projetado para preencher a lacuna entre nossa capacidade tcnica e nosso conhecimento do cu no infravermelho prximo. Para alcanar esse objetivo o 2MASS tem escanheado uniformemente o cu em trs bandas no infravermelho prximo, J (1.25 microns), H (1.65 microns), e Ks (2.17 microns) e tem o primeiro censo fotomtrico da esfera celeste para galxias mais brilhantes que Ks = 13.5mag. O catlogo tem mais de 1 000 000 de galxias provendo uma rica base de dados estatsiticos. Com a proposta de mapear a Via Lctea e regies prximas do cu, amostrando uniformemente a esfera celestial completa nas bandas J,H e K o 2MASS foi desenvolvido para produzir o mais completo catlogo de regies prximas. Dentro do catlogo do 2MASS ns estudamos 416 grupos de galxias selecionados do trabalho de Crook et al. (2007), na banda

K (2.16m) < 11.25 mag, completo para latitudes galticas |b| > 10 entre longitudes
Galticas 330 e 30 e |b| > 5 para longitudes, limitado a um tendo medidas em o
redshifts redshift

de 14 km/s1 . Ob-

para quase totalidade das galxias com K < 11.25 mag. dos objetos

O catlogo do Crook et al. (2007) utiliza como algortimo de seleo dos aglomerados
Friends to friends

cuja identicao dos grupos se baseia na posio e


Friends to friends

redshift

(e.g., Huchra & Geller 1982). O

um algortmo de percolao largamente como critrio de seleo.

aceito que utiliza parmetros de vinculo

linking-lenght

Os grupos do 2MASS so denidos por dois mnimos contrastes de densidades /

12 ( 274 grupos com 8 ou mais membros indicado como Baixo Contraste de Densidade - BCD
e / 12 (142 grupos com 8 ou mais membros indicado com Alto contraste de densidade - ACD). A diferena nos catlogos est na escolha dos parmetros de vnculo Crook et al. 2007). O catlogo BCD produzido usando os parmetros (D0 , V0 )=(1.04 Mpc, 399Km/s), enquanto que o ACD usa (D0 , V0 )=(0.89 Mpc, 350Km/s). Utilizamos apenas grupos com mais de 7 membros Crook et al. (2007) considera grupos apartir de 5 galxias. essa seleo visa diminuir os efeitos estatsiticos do tamanho da amostra, aumentando a ecincia dos estimadores e testes estatsticos. Indicamos as propriedades gerais e mdias dos grupos BCD e ACD nas tabelas 1 e 2 respectivamente. Para anlise que pretendemos fazer, o ponto importante : Os grupos indicados como

35 Propriedade / D0 (Mpc) V0 (Km/s Desvio Padro Catlog BCD 12 1.63 399 12 catlogo ACD 80 0.89 350 80

BCD so signicativamente mais largos e mais massivos que os grupos ACD. Isto nos permite discutir a dependncia da segregao de gaussianos e no gaussianos em um critrio particular usado para identicar grupos de galxias em um determinado catlogo.

4.2 Comarao dos testes estatsticos


O poder do teste estatstico a probabilidade de que o teste rejeite a hiptese nula quando ele falsa. Isto o poder do teste reete a probabilidade do teste no cometer um erro do tipo II. Teste de normalidade so baseados em diferentes caractersticas da distribuio normal e a ecincia de cada teste varia dependendo da natureza da no normalidade apresentada pela amostra assim como pelo tamanho da amostra (Sier, 2011). Neste trabalho, nos comparamos a ecincia de cinco testes de normalidade comumente utilizados na literatura Anderson-Darling (AD), D'Agostino-Pearson (DP), Jarque-Bera (JB), Kolmogorov-Smirnov (KS) e Shapiro-Wilks (SW) com a mtodo de meta-analise de Fisher. Devemos ento escolher um procedimento capaz de, baseados em critrios objetivos, quanticar a robustez de um teste estatstico. Isto equivale a denir a "ecincia"do teste, ou seja, desejamos investigar a percentagem de veses que um teste aceita a Hiptese nula quando est e verdadeira. Isso pode ser feito criando uma amostra de controle, em que a frao de elementos amostrais que desviam da normalidade conhecida e aplicando os testes de normalidade para avaliar a ecincia do teste. Ns realizamos simulaes de Monte Carlo em diferentes distribuies no normais tomadas de uma distribuio -estvel, que classe de distribuies de probabilidade caracterizadas por Levy em 1920. Uma distribuio X dita estvel se dadas X1 e X2 cpias de

X temos:aX1 + bX2 tem mesma distribuio que cX + d, ou seja X1 + X2 = cX + d para a,


b e c positivos, a funo dita estritamente estvel quando d = 0. Exceto em casos especcos, a funo de densidade de uma varivel aleatria -estvel no pode ser dada de forma fechada. Contudo, sua funo caracterstica sempre pode ser dada por

36

(x) =

exp {ix |x| [1 i sgn(x) tan( )]}, if = 1 2 exp {ix |x|[1 + i sgn(x) 2 ln |x|},
if = 1

(4.1)

A funo -estvel permite uma gama de variaes de assimetria e kurtose, de acordo a escolha de seus 4 parmetros (Nolan 1998). O parmetro de estabilidade descreve o peso da calda da distribuio: 0 < 2. Quanto menor o valor de mais pesada a calda da distribuio. O parmetro de simetria beta controla a assimetria da distribuio: 1 1. Se = 0 a distribuio simtrica, ou enviesada. O parmetro de curtose similar a varinca da distribui normal: > 0. Finalmente, existe um parmetro de localizao:: < <

. A distribuio -estvel a normal quando = 2. Neste caso o parmetro redundante,


com e correspondendo respectivamente a varina e mdia da distribuio, (ver e.g. Nolan 1998). Para comparar a ecincia dos diferentes testes ns criamos distribuies -estveis com (0, 2), (1, 1) (exceto zero), (0, 2] e = 0 Para encontrar erros do tipo I ( aqueles que ocorrem quando a hiptese nula rejeitada quando ela verdadeira) os dados foram gerados da seguinte forma: (i) geramos um ocnjunto de dados de tamanho N de uma distribuio normal ( = 2 em uma distribuio

-estvel); (ii) repetimos o procedimento (i) 1000 vezes para cada amostra de tamanho N (iii)
a cada replicao aplicamos todos os testes descritos na seo ...; (iv) contamos percentual de vezes que os testes falharam na identicao de guassianidade para cada N. ... variao dos parmetros beta e gama O nvel de signicncia de um teste estatstico a probabilidade de cometer um erro do tipo I. Dois processo para encontrar sistemas G e NG. Podemos resolver essa diculdade explorando a vantagem de cada mtodo. Na primeira etapa, tem sido demonstrado que o teste DP a melhor escolha para no cometer um erro do tipo I. Assim quando o teste DP rejeita a normalidade de uma amostra, ns conclumos h realmente um desvio de gaussianidade na amostra. Por outro lado a tcnica MA desenvolvida para minimizar erros de tipo II. Assim, quando a tcnica MA no rejeita a normalidade porque a amostra

4.3 Mtodo de separao de Gaussianos e No Gaussianos


Visto que cada teste estatstico tem suas peculiaridades ns resolvemos combinar vrios testes em pocedimento que valorize os pontos fortes de cada teste. Tambm lemvamos em

37 Erros do tipo I N 8 15 20 30 40 50 80 100 Erros do tipo II N 8 15 20 30 40 50 80 100 AD 3% 3% 8% 8% 8% 2% 6% 6% AD 35% 24% 17% 17% 12% 10% 4% 1% DP 3% 4% 3% 5% 3% 3% 2% 1% DP 66% 25% 19% 19% 14% 10% 4% 2% JB 5% 8% 7% 6% 7% 9% 7% 4% JB 41% 30% 17% 13% 6% 5% 3% 2% KS 5% 3% 7% 6% 4% 5% 6% 6% KS 45% 28% 22% 20% 15% 15% 10% 5% SW 4% 5% 6% 8% 8% 3% 7% 4% SW 37% 40% 26% 16% 8% 6% 3% 2% MA 27% 24% 26% 23% 20% 22% 25% 23% MA 27% 16% 8% 4% 2% 2% 1% 0%

Tabela 4.1: Tabela 1: Comparao de testes de normalidade.

conta que recentes trabalhos indicam que distribuies de velocidades multimodais podem ser comuns em muitos sistemas de galxias (e.g. Ribeiro et al. 2013). Objetos multimodais podem ser classicados como NG pela maioria dos testes de normalidade, por outro lado os testes so propensos a cometer erros do tipo II. 4.3.1 Processo I Desta forma introduzimos o seguinte processo: 1. Um sistema de galxias tem distribuio NG de velocidades se o teste DP rejeita a normalidade da a mostra com valor 95% no nvel de conana. 2. Um sistema de galxias tem G distribuio de velocidades se a tcnica MA no rejeita a normalidade da a mostra com valor 95% no nvel de conana. 3. Grupos na interseco entre o teste DP e a tcnica MA podem ser diagnosticados atravs de anlise multimodal. 4. O nmeros nal de sistemas G denido como soma daquele identicados em (2) e dos unimodais identicados em (3).

38 5. O nmero nal de sistemas NG denido como a soma daqueles identicados em (1) e dos objetos multimodais identicados em (3). 4.3.2 Processo II Alternativamente, ns podemos aplicar uma anlise modalidade como primeiro passo, e ento aplicar os testes de normalidade para identicar sistemas com G e NG. Por denio, todos os grupos identicados com multimodais so NG . Para os sistemas unimodais restantes aplicamos a tcnica MA e o teste DP. Nesse caso: 1. Todos os grupos passam por uma anlise do modalidade. Sistemas multimodais so classicados com NG. 2. Sistemas de galxias unimodais tem G distribuio de velocidades se a tcnica MA no rejeita a normalidade da a mostra com valor 95% no nvel de conana. 3. Sistemas de galxias unimodais tem distribuio NG de velocidades se o teste DP rejeita a normalidade da a mostra com valor 95% no nvel de conana. 4. Se existir interseco entre os resultados de (2) e (3) a amostra considerada como G (um critrio mais conservativo). Para sondar a modalidade, ns usamos o teste Dip. O mtodo baseado na distribuio cumulativa da varivel de interesse (Hartigan & Hartigan 1985). A estatsitca Dip a distncia mxima entre a distribuio cumulativa dada e a melhor distribuio unimodal tada. Em algum sentido este teste similar ao Kolmogorov-Smirnov, mas o teste Dip procura especicamente por uma
at step

na funo de dsitribuio cumulativa, a qual corresponde a

dip

na representao do histograma. O teste Dip tem o benefcio de ser insensvel a assuno da gaussianidade e portanto um verdadeiro teste de modalidade (e.g. Pinkey et al 1996; Muratov & Gnedin 2010). O teste Dip apresentado como convel.

39

Anlise

Ns aplicamos o processo denido em ... para as amostras identicadas como BCD e o ACD. Neste trabalho, adotamos a cosmologia m = 0.3, = 0.7 e H0 = 100hkms1 M pc1 . A anlise virial feita seguindo (Carlberg et al. 1997), onde R200 = 3/[10H (z )] e M200 =

3R200 2 /G. O estudo da distribuio de velocidades toma em conta somente galxias dentro
de R200 .

5.1 Usando processo I


Na amostra BCD, nos encontramos 85 grupos de galxias classicadas como NG pelo teste DP, e 111 grupos classicados com G pela tcnica MA. dos 78 grupos na zona de interseco 27 foram classicados com unimodais e 51 como multimodais pelo teste Dip.A gura 1 apresenta o total de G e NG 138 e 136 respectivamente. Assim, aproximadamente 50% dos grupos tem distribuio de velocidades gaussianas na amostra BCD. Na amostra ACD, nos encontramos 50 grupos de galxias classicadas como NG pelo teste DP, e 78 grupos classicados com G pela tcnica MA. Dos 14 grupos na zona de interseco 4 foram classicados com unimodais e 10 como multimodais pelo teste Dip. A gura 2 apresenta o total de G e NG 138 e 136 respectivamente. Assim, aproximadamente 58% dos grupos tem distribuio de velocidades gaussianas na amostra BCD. Note que a frao de grupos G mais baixo no BCD, o que um resultado esperado, desde que o BCD composto por grupos mais massivos se comparados com os ACD na maioria dos casos (veja Crook et al. 2007). Este resultado indica que alm da escolha dos mtodos e critrios usados para segregar os grupos como G e NG, Importante averiguar os parmetros de vnculos utilizados na classicao dos grupos de um determinado catlogo. Esta discusso deveria vir depois do segundo processo.

5.2 Usando processo II


Para os grupos BCD, ns encontramos 131 sistemas multimodais, diretamente classicados como NG. Para os 143 sistemas unimodais restantes ns palicamos a tcnica MA e encontramos 111 sistemas G. Aplicando o teste DP nos encontramos 32 sistemas NG. Na zona de interseco nos encontramos 27 objetos que foram classicados diretamente como G, com 5 grupos no gaussianos restantes. (no entendi o processo) Os nmeros nais so: 138 G e 136 NG veja gura 3. Consequentemente 50% das amostras tem distribuio gaussiana de

40
low density contrast

NG

85

189

NG

85

78

111

NG

136

138

Figura 5.1: Figura 1: Amostra BCD amotra dividida em G (salmo) e NG (azul).

high density contrast

NG

50

92

NG

50

14

78

NG

60

82

Figura 5.2: Figura 2: Amostra BCD amotra dividida em G (salmo) e NG (azul).

velocidades na amostra BCD, aplicando o processo II para a amostra ACD ns encontramos 61 sistemas multimodais, diretamente classicadas como NG. Para os 81 sistemas unimodais restantes 78 grupos foram classicados com G pela tcnica MA e aplicando o teste DP classicamos 3 grupos unimodais como G, dois deles estavam na zona de interseco e foram diretamente classicados G. Os nmeros nais so: 80 sistemas Ge 62 NG veja gura 4. Consequentemente, aproximadamente 56% dos grupos tem distribuio de velocidades gaussianas de acordo com o processo II.

41 Portanto, as duas aproximaes segregar as amostras ACD e BCD em grupos G e NG so consistentes e revelam uma alta frao mais de sistemas com distribuio gaussiana de velocidades usando alto contraste de densidades. Este um resultado esperado desde que a amostra ACD , por denio, restrita a galxias mais centrais, as quais tem maior frao virializada.
low density contrast

MM

UM

131

143

NG

27

111

NG

136

138

Figura 5.3: Figura 3: Amostra BCD amotra dividida em unimodais (salmo) e multimodais (azul).

high density contrast

MM

UM

61

81

NG

78

NG

62

80

Figura 5.4: Figura 3: Amostra BCD amotra dividida em unimodais (salmo) e multimodais (azul).

42 !htb
high density contrast

MM

UM

61

81

NG

78

NG

62

80

Figura 5.5: Amostra ACD dividida em unimodal UM (salmo) e multimodal  MM (azul). O topo do diagrama mostra o diagnstico do teste dip. O meio do diagrama mostra o diagnstico da tcnica MA, mantendo o nmero de sistemas NG encontrados pelo teste DP. A parte de baixo do diagrama mostra o uso da combinao da anlise conjunta DP + MA + Dip. O nmero de galxias aparesentado ao lado de cada diagrama.

5.3 Comparando sistemas G e NG


Depois de dividir os grupos em G e NG, ns podemos comparar suas propriedades de acordo com nossa classicao em ... ou .... A ideia aqui apenas comparar as mdias e distribuies das seguintes propriedades: O raio projetado -RP (Mpc); a massa projetada - MP (M ); a relao projetada de massa luminosidade - MP /LP (M /L ); a diferena de magnitude entre as duas galxias mais brilhantes - M12 na banda k; e o nmero de densidade das galxias - (Ngals M pc3 ) nos catlogos ACD e BCD. Para comparar mdias ns usamos uma verso modicadas do teste de comparao mltipla de Tukey-Kramer (Dunnett 1980). Este teste conduz a um teste de comparao mltipla emparelhada para as diferentes mdias com amostras de tamanhos diferentes e sem assumo de igualdade na varina das populaes. Para comparar a distribuio das propriedades escolhidas, ns usamos o teste de KolmogorovSmirnov, um teste no paramtrico para determinar se duas amostras independentes so provenientes de uma mesma distribuio (e.g. Conover 1971). O valor-p derivado desta anlise estatstica resumido na tabela . A anlise inclui a comparao dos tipos NN G (comparando ACD e BCD, mutuamente). Alguns resultados importantes podem ser vistos na tabela Note que a primeira difer-

43 !htb

N
5 10

15

20

25

SDSS

0 12

13

14

15

16

log MP (M )

Figura 5.6: Distribution of mass for the LDC (white) and HDC (gray) samples. The vertical red line marks the mean mass for the mock SDSS sample.

ena signicante entre sistemas G e NG para objetos da amostra ACD acontece na massa projetada, a qual apresenta mdias diferentes [ MP de serem tiradas de uma mesma populao. mdia e distribuio diferentes para [mG 12
NG G

(1.54 0.52) MP

NG

e so improvveis

Sistemas gaussianos tambm apresentam

G (1.32 0.24)mNG 12 e

(1.29 0.23) NG ].
G

Encontramos diferenas, para amostras ACD e BCD, na massa e raio projetados [ MP

(1.54 0.52) MP

e RP

(1.35 0.36) RP

NG

], sendo ambos improvveis de serem

obtidos de uma mesma populao, com [mG 12

G (1.32 0.24)mNG 12 e

(1.29 0.23) NG ].

Assim, G so mais densos que NG e tem valores maiores de have larger values of m12 . Quando comparamos mutuamente as amostras ACD e BCD, ns encontramos que a massa projetada, raio projetado e razo massa-luminosidade tem valores sistematicamente mais elevados nos grupos BCD, como esperado, independentemente da classicao G ou NG. Note, contudo, que a comparao de m12 e para sistemas gaussianos indicam diferenas signicantes nas mdias e distribuies [mG 12
G (1.32 0.24)mNG 12 e

(1.29 0.23) NG ]. Assim,

grupos gaussianos indenticados em ACD so mais densos e tem valores mais altos de m12 do que grupos gaussianos identicados em BCD. Curiosamente, ns no encontramos diferenas signicantes entre essas propriedades para sistemas NG quando mutuamente testadas para amostras ACD e BCD. Para interpretar esses resultados precisamos entender por qu G so mais massivos

Nos encontramos aproximadamente os mesmo resultados com estimativa de massa usando o teorema do virial
1

44 que grupos NG tanto nas amostras ACD como BCD. O que no consistente com resultados previos (Ribeiro et al. 2011) e (Krause et al. 2013), cujos resultado indicam que NG so maiores e mais massivos que G. Sistuao exatamente oposta encontrada nesse trabalho. Uma possvel explicao a estimao de massa usando o teorema do virial em objetos novirializados uma outra proposta para explicar a discrepncia nos resultados a distribuio de massa dos grupos, se existe uma correlao entre massa e gaussianidade levando a resultados enviesados. Para sondar esses efeitos ns aplicamos nosso algortmo para separar grupos G e NG sobre uma amostra do et al. 2006) Primeiro ns apllicamos nosso algortmo sobre a amostra selecionando apenas grupos com mais de 7 galxias N > 7, onde encontramos que 47% sistemas so G. Dividimos a amostra em grupos mais e menos massivos do que a massa mdia para o catlogo
mock Sloan Digital Sky survey-SDSS

retirada do catlogo

mock

do (Berlind

log M 13.55 M . Para subamostra mais massiva ns encontramos 69% dos sistemas como
G, enquanto para amostra menos massivas ns encontramos 25% dos sistemas como G. Estes resultados contem mis de uma srie de resultados do SDSS que usa diferentes resceitas para popular halos com galxias (Berlind et al. 2006). Consequentemente, paree haver correlao entre a distribuio de massa de um dado grupo de galxia em uma amostra e a frao de sistemas gaussianos encontrados nela. Na gura ns plotamos o histograma de massa para aomostras ACD e BCD. Note que em ambos contm objetos mais massivos (em mdia) do que a amostra mock do SDSS. Para amostras do ACD, tomando grupos mais massivos do que a mdia, log M 13.88 M , ns encontramos 65% de G, enquanto tomando grupos menos massivos que a mmdia ns encontramos 46% calssicados como G. Para amostras BCD, com massa mdia log M 14.05 M , ns encontramos 60% e 44% dos sistemas classicados como G para grupos mais e menos massivos que a mdia respectivamente. Agora, tomando raio e massa mdios para grupos menos massivos da amostra ACD, ns encontramos que Rp
NG

(1.21 0.43) RP
NG

, e log MP

NG G

(1.18 0.34) log MP


, e log MP
NG

O mesmo acontece para amostra BCD, Rp

(1.27 0.33) RP

(1.32

0.44) log MP

. sto , NG so maiores e mais massivos que G, para grupos menos massivos.


G G

Fazendo o mesmo para grupos mais massivos encontramos, encontramos Rp

(1.17 (1.28

0.35) RP 0.37) RP

NG NG

, e log MP e log MP

G G

(1.36 0.24) log MP (1.46 0.41) log MP

NG NG

, para amostra ACD; e Rp

, para amostra BCD. Consequentemente,

para grupos menos massivos ns temos NG como objetos maiores e mais massivos do que G. Enquanto para grupos mais massivos, ns temos G como objetos maiores e mais massivos que

45
Tabela 5.1: comparao de TK test (A,A) (B,B) G NG G NG RP 0.2979 0.0620 MP 0.0238 0.0319 MP /LP 0.0761 0.4265 m12 0.0449 0.0763 0.0115 0.0463 KS test (H,H) (L,L) G NG G NG RP 0.0960 0.0159 MP 0.0079 0.0179 MP /LP 0.0659 0.1758 m12 0.0385 0.0383 0.0241 0.0236 sistemas G e NG (A,B) (A,B) G G NG NG 0.0000 0.0000 0.0045 0.0039 0.0048 0.0000 0.0240 0.1569 0.0071 0.2671 (H,L) (H,L) G G NG NG 0.0000 0.0000 0.0019 0.0059 0.0009 0.0000 0.0239 0.0609 0.0219 0.0729

sistemas NG.

CONCLUSES E PERSPECTIVAS

Simulaes numricas para modelos de N-corpos tem mostrado que a relaxao de sistemas acolisionais isolados levam uma distribuio gaussiana de velocidades dentre de um esperado tempo de travessia do sistema, . Este fato leva a expectativa terica de que a distribuio de velocidades seja normal para um sistema em equilbrio dinmico. Neste trabaho, ns usamos a tcnica de metanlise Fihser conbinando cinco testes de normalidade, um teste multimodalidade e o mais eciente dentre os cinco testes que combinados em um procedimento para separar sistemas G e NG de acordo com suas distribuies de velocidades. Mostramos que o teste DP a melhor escolha para evitar erros do tipo I, enquanto a tcnica MA a melhor escolha para evitar erros do tipo II. Ns introduzimos dois processos que se mostraram consistentes entre se. Aplicando ocritrio denido no captulo 4, seco 2, ns encontramos que 50% e

56 58% dos grupos so classicados como G, para as mamostras BCD e ACD, respectivamente. Comparando algumas propriedades desses sistemas, ns encontramos que G so mais densos que NG e tem maior valor de m12 . Alm de que grupos G identicados na amostra ACD so mais mais densos e tem valor mais alto de m12 que grupos G identicados na amostra BCD. Explorando o resultado de que G so mais massivos que NG em ambos sistemas, ns encontramos que em mdia grupos pequenos tem sistemas NG maiores e mais massivos que sistemas G, enquanto que grupos grandes tem objetos G maiores e mais massivos que NG. Isto adequa os resultados encontrados nesse trabalho com estudos prvios de distribuio de velocidades em sistemas de galxias (ex Ribeiro et al.; Drause et al 2013). Corroborando com trabalho anteriores (ex. Hou et al.2009) ns enfatizamos a importncia da escolha do mtodo ara dividir sistemas em G e NG. Usando o procedimento desenvolvido neste trabalho nos encotramos 50-58% de sistemas G no catlogo 2MASSS Se utilizassemos testes individuais teramos encontrado uma frao muito maior de sistemas G (72-78%) AD teste, (74-83%) DP test, (75-80%) JB test, (71-84%) KS test, and (73-82%) SW. Finalmente, ns obtemos diferenas signicativas quando comparamos as propriendades das amostras ACD e BCD, indicando que a maneira especca de catalogao das amostras pode levar a concluses diferentes quando tentamos sondar as propriedades dinmicas dos aglomerados utilizando suas distribuies de velocidades. O estudo de parmetros fsicos caractersticos em aglomerados de galxias classicados como gaussianos ou no gaussianos est intimamente relacionada com a implementao de um

47 teste robusto e eciente. A grande discrepncia nos resultados das medies feitas nos grupos classicados como gaussianos e no gaussianos nos testes que utilizamos, fortalece nossa ideia da necessidade de produzir ou encontrar testes mais ecientes.

6.1 Perspectivas
Nossos resultados com metanlise se restringem apenas a cinco testes de normalidade. Alm disso, no vericamos se combinaes de diferentes testes podem produzir uma metanlise mais efeiciente. No desenvolvimento subsequente deste trabalho, pretendemos estender nossa anlise da seguinte maneira:

Dentro de amostras controladas, selecionar testes de normalidade mais ecientes para


serem combinados na MA.

Aplicar a nossa metodologia a reviso de outros trabalhos. Estudar amostras maiores e em


redshift

mais altos.

Alicar a amostras mais numerosas melhorando a estatstica dos testes. Finalmente, aps chegarmos a um diagnstico mais completo, determinaremos as propriedades fsicas dos grupos gaussianos e no-gaussianos.

REFERNCIAS BIBLIOGRFICAS

Referncias Bibliogrcas

[1] ABELL, G.

Entopy Dierence Between the Face-centred Cubic and Hexagonal Close-

packed Crystal Strutures.

Astrophys. J, Suppl. Ser. 3, p 211-288 (1958)

[2] BEERS et al.

Measures Of Location And Scale For Velocities In Clusters Of Galaxies:

A Robust Approach

AJ,N 1 Vol 100 p 32-46 1990.


Fisher, Jereys and Neyman Have Agreed on Testing?

[3] BERGER, J. O. Could

Statistical

Science vol 18, N 1, p 1-32 2003 [4] BERLINGER et al.


Percolation Galaxy Groups And Cluster in the SDSS Redshift Sur-

vey: Identication, Catalogs, And The Multiplicity Function

The Astrophysical Journal

Supplement Series Vol 167, p 1-25, 2006 [5] BINNEY, J.; & TREMAINE, S.
Galactic Dynamics.

New Jersey: Princeton University

Press, 1987. 773 p. (Princeton Series Astrophysics) [6] Bird et al. Astronomical
applications of distribution shape estimators

Astronomical Jour-

nal (ISSN 0004-6256), Aj, N 4 , Vol 105 p 1596 - 1606 1993. [7] Carlberg et al.
The Average Mass and Light Proles of Galaxy Clusters

Astrophysical

Journal, Apj, N 1 , Vol 478 p 462- 475 1997. [8] Crook et al.
Groups of Galaxies in the Two Micron All Sky Redshift Survey

The Astro-

physical Journal Apj. N 1 , Vol 655 p 790- 813 2007. [9] de Lucia et al.
The formation history of elliptical galaxies

Monthly Notices of the Royal

Astronomical Society, MNRAS, N 2 , Vol 366 p 499-509 2006. [10] Dunnett, C.W.
Pairwise Multiple Comparisons in the Unequal Variance Case

Journal of

the American Statistical Association, N 1 , Vol 75 p 796-800 1980. [11] Einasto et al, C.W. N 1 , Vol 540 p 123 2012. [12] Einasto et al, C.W. N 1 , Vol 542 p 36 2012.

49 [13] Faraggi, D.; & Reiser, B.


 Estimation of the area under the ROC curve

Statistics in

Medicine, N 21, p 3093-3106 2002 [14] Fisher, R.A.; & Reiser, B. Statistical methods for research workers Statistics in Medicine,

N 21, p 3093-3106 1925


[15] FITCHETT, M. J.; & MERRITT, D.
Dynamics OF The Hydra I Galaxy Cluster

Ap. J

N 18 p 355-343 1988
[16] GEL, Y. R. & GASTWIRTH, J. L.
normality A robust modication of the JarqueBera test of

Economics Letters, N 99 p 3032 2006


A robust modication of the JarqueBera test of normality

[17] Geller, J. E & GOTT, J. R.

Economics Letters, N 99 p 3032 2006 [18] GUNN,J E. et al. 2332 [19] HARTIGAN, J. A. & HARTIGAN, P.M. [20] HAZELTON, M. L.
The Annals of Statistics The Fifth Data Release of the Sloan Digital Sky Survey

2006, AJ. 131,

vol 13, p 70 1985

a graphical tool for assessing normality

Americam Statistician, vol

57, N 4 p 285-288 2003 [21] HEDGES, L. V. & OLKIN, I. Statistical Methods for Meta-Analysis New York: Academic Press, 1985 [22] HOGG, D. W. et al.A
servatory. Photometricity and Extinction Monitor at the Apache Point Ob-

AJ, vol 122,N 4 2129-2138 2001

[23] HOU, A. et al. APJ, vol 702, 1199 2009 [24] HOU, A. et al. MNRAS, vol 421, 3594 2012 [25] HOW, A. et al. Statistical Tools For Classifying Galaxy Dynamics Encontrado em: arXiv: 0908.0938 [26] HUCHRA, J.P & and Geller, M.J.
Groups of galaxies. I - Nearby groups

Astrophysical

Journal, APJ, vol 257, p 423- 437 1982 [27] JARQUE, C.M & BERA, A.K.
International Statistical Review

Bulletin of the Interna-

tional Statistical Institute, vol 55, p 163- 172 1987

50 [28] DIAFERIO, A.; SCHINDLER, S.; DOLAG, K Clusters of Galaxies: Setting the Stage. In: KAASTRA, J. (Ed) 2008. p 7-24. [29] KAZANTZIDIS, S. et al Generating
Equilibrium Dark Matter Halos: Inadequacies of the Clusters of Galaxies Beyond the Thermal View

Utrecht: Springer,

Local Maxwellian ApproximationThe

Astrophysical Journal, APJ, vol 601, p 37-46 2004. A. J, vol.

[30] KING, I. R

The structure of star clusters. III. Some simple dynamical models,

71, p 64. 1966 [31] KISH, L., 1965 [32] KRAUSE, M.O. et al 2013 [33] LYNDEN-BELL, D. Statistical mechanics of violent relaxation in stellar systems A.J, N 76 p 4611 1967 [34] LUPTON, R. H. et al 2001 in ASP conf. Ser. 238:
and Systems Astronomical Data Analysis Software

X, 269-+

[35] MAHDAVI, A. et al , APJ, vol 518, p 69 1999 [36] PADMANABHAN, T. (2002). Vol III [37] PIER, J. R. et al.
Astrometric Calibration of the Sloan Digital Sky Survey Tehoretical Astrophysics.

Pune: Cambridge University Press,

A.J,vol. N

125, 1559-1579 2003 [38] RANA, S. et al.


A Robust Rescaled Moment Test for Normality in Regression

journal of

Mathematics and Statistics, N 51, p 54-62 2009 [39] SCHOLZ, F. W., STEPHENS, M. A. K-Sample Anderson-Darling Tests American Statistician Association, vol. 82, N . 399, p 918-924 1987 [40] YAHIL,A & VIDAL, N. V 214, 347-350 1997 [41] SOUZA, R.
Introduo Cosmologia The Velocity Distribution Of Galaxies In Clusters

Ap. J. N

So Paulo: edusp, 2004. 320 p. Helvetica Physica, N 6.

[42] ZWICKY, F

Die Rotverschiebung von extragalaktischen Nebeln

p. 110-127 1933

51 [43] ROYSTON, P.
A remark on Algorithm AS 181: The W test for normality.

Applied

Statistics, No 44, 547-551 1995:

You might also like