Professional Documents
Culture Documents
Leis de Potncia
Distribuies de probabilidade
Leis de potncia e escalas logartmicas
Interpretando as leis de potncia
Parte 1: Introduo
A lei do 80/20
Vilfredo Pareto, importante economista italiano
Durante sua jardinagem:
80% das peras produzidas por 20% das rvores
20% da populao
A lei do 80/20
Existem outros cenrios em que a lei 80/20 no
diretamente aplicvel, mas temos algo prximo:
80% dos hyperlinks 15% das pginas
80% das citaes
Parte 2: Distribuies de
probabilidade
O Andar do Bbado
Descreve como a
aleatoriedade afeta as
nossas vidas e como as
pessoas costumam
ignor-la e mesmo
interpret-la
erroneamente (como
sorte ou azar, por
exemplo)
Varivel Aleatria
Mapeamento de um evento (resultado de um
experimento aleatrio) em um nmero
Exemplos:
X = estado do servidor: 1 ativo, 0 inativo
Y = nmero de pacotes IP por intervalo de tempo
Z = atraso estabelecimento conexo TELNET
Experimento: lanar um dado
A = valor facial
B = 0 valor 3 1 valor 4
C = 0 valor par 1 valor mpar
10
-1
Eventos independentes
Dois eventos so independentes a ocorrncia de
um no afeta a probabilidade do outro
A existncia ou no de relao de dependncia
pode modificar concluses de uma simulao
Eventos dependentes
Nmero de pacotes que chegam em um roteador
Nmero de pacotes descartados
Eventos independentes
Nmero de chamadas que chegam a um central telefnica
Durao das chamadas
12
Distribuio de probabilidade
Descreve a chance que uma varivel pode assumir
ao longo de um espao de valores
A soma de todas as probabilidades deve ser 1
Varivel discreta
Tabela especificando a probabilidade de que a
varivel assuma cada um dos valores possveis
Varivel contnua
Funo especificando a probabilidade de que a
varivel assuma um valor em cada um dos intervalos
possveis
13
Distribuio discreta de
probabilidade
Determina o comportamento de uma varivel
aleatria discreta,
discreta atribuindo probabilidades a
todos os possveis valores
Exemplo: varivel X (estado do servidor)
P[X=1] = p1
P[X=0] = p2
O conjunto {p1, p2} a distribuio de probabilidade
da varivel aleatria discreta X
14
FX ( x) P ( X x) f X (u )du
15
Distribuio de Poisson
Parmetro: (mdia)
e x
P[ x]
, 0
x!
Utilizao:
Exemplo:
Distribuio de Poisson
0.25
Histogram of y
0.10
Density
0.15
0.20
= 10
0.00
0.05
Gerao: R
(http://www.r-project.org)
10
15
20
25
17
Distribuio Uniforme
Parmetros: a e b (limite inferir e superior)
1
f X ( x)
, a xb
ba
0, outros casos
Utilizao:
Varivel limitada sem informao adicional
Direo de movimentao de um usurio em um rede
celular
Distncia entre fonte e destino em uma rede
Probabilidade de um pacote conter um erro
18
Distribuio Uniforme
0.10
Histogram of y
a=0
0.00
0.02
0.04
Density
0.06
0.08
b = 10
10
19
Distribuio Exponencial
Parmetro: (mdia)
f X ( x) e x , 0, x 0
0, outros casos
Utilizao:
Tempos entre eventos sucessivos
Tempo entre chamadas telefnicas
Tempo entre requisies a um servidor TELNET
Tempo entre falhas de um equipamento
20
Distribuio Exponencial
0.08
Histogram of y
0.04
0.02
0.00
Density
0.06
= 10
20
40
60
80
100
120
21
Utilizao:
Aleatoriedade causada por vrias fontes
independentes agindo em conjunto
Erros em medies
22
Histogram of y
0.2
0.1
0.0
D ensity
0.3
Normal Padro
=0
=1
-4
-2
23
E ( X ) pi xi xf X ( x)dx
i 1
Distribuies gaussianas
Quando um estatstico
estuda certos dados, ele
utiliza uma ferramenta
indispensvel: um grfico
em forma de sino que
representa a distribuio
gaussiana ou normal dos
dados
26
Distribuies gaussianas
As distribuies gaussianas so definidas a partir de
uma funo densidade de probabilidades que se
escreve da seguinte forma:
27
Exemplo
Desejamos medir o comprimento de uma mesa, que ser
nossa varivel aleatria x.
Ao realizarmos N medidas sucessivas obtemos uma
estimativa do valor mdio por
tende ao valor de
29
30
31
32
Leis de Potncia
Uma lei de potncia um tipo especial de relao
matemtica entre duas quantidades
Quando o nmero ou frequncia de um objeto ou
evento varia conforme a potncia de algum atributo
do objeto (ex.: o tamanho), diz-se que esse nmero
ou tamanho segue uma lei de potncia
Exemplo:
O nmero de cidades que tem uma certa
populao varia conforme uma potncia do
tamanho da populao
33
Lei de Potncias
Diversas distribuies, tanto de fenmenos naturais
quanto humanos, so compostos por:
Um grande nmero de fenmenos comuns
Um pequeno nmero de fenmenos raros
34
36
Definio
A lei de potncia uma relao polinomial que exibe a
propriedade de invarincia de escala. As leis de potncia
mais comuns relacionam duas variveis e tm a forma
onde
a e k so constantes
e o(xk) uma funo assintoticamente pequena
38
Escalando a funo
O reescalonamento do argumento da funo muda a
constante de proporcionalidade, mas preserva a
forma da funo
39
41
42
43
Aplicaes
Leis de potncia um tema de pesquisa ativa em
muitos campos da cincia, incluindo:
Fsica
Cincia da computao
Lingstica
Geofsica
Sociologia
Economia e muito mais.
46
48
49
51
52
53
Distribuio - WWW
Exemplo de Varivel
Aleatria
Nmero de links
(referncias) de cada
Pgina Web para outras
Pginas Web
54
57
58
60
Histograma de Grau
A medio dessa cauda um pouco complicada. Embora
em uma teoria temos apenas que construir um
histograma dos graus, na prtica raramente tem-se
medies suficientes para conseguir boas estatsticas
na cauda, e histogramas diretos so geralmente
ruidosos
Existem duas formas aceitas para contornar este
problema
Uma delas construir um histograma no qual os tamanhos
das faixas aumentam exponencialmente com o grau. Por
exemplo, as primeiras faixas podem cobrir graus 1, 2-3, 4-7,
8-15, e assim por diante. O nmero de amostras em cada
faixa ento dividido pela largura da faixa para normalizar
a medio
61
Histograma de Grau
Esse mtodo de construo de um histograma
muitas vezes usado quando o histograma ser
traado com uma escala logartmica de grau, de modo
que as larguras das faixas vo parecer iguais.
Devido as faixas ficarem mais largas a medida que
vamos em direo cauda, os problemas com as
estatsticas so reduzidas, embora eles ainda
estejam presentes, numa certa medida, enquanto pk
decai mais rpido do que k-1, o que deve acontecer
caso a distribuio seja integrada
62
63
64
65
66
Exerccios
Para os grafos dados a seguir:
i) Calcule o grau de todos os vrtices do grafo (indegree e out-degree, para grafos direcionados)
ii) Calcule a mdia dos graus dos vrtices e o desvio
padro
iii) Calcule e esboce um histograma dos graus
iv) Calcule e esboce a distribuio acumulada das
probabilidade de grau
67
Grafos do exerccio
a)
c)
b)
d)
68
Exerccio a)
i. Graus:
1Gin= 2; 1Gout=1;
2Gin=2; 2Gout=3;
=Sqrt( (Soma(xi-)2)/(N-1) )
3Gin=1; 3Gout=1;
4Gin=1; 4Gout=2;
5Gin=2; 5Gout=1.
ii. Mdia:
Gin = 8/5 = 1.6
Gout = 8/5 = 1.6
Gin:
=Sqrt( ( (2-1.6)2+ (2-1.6)2+
(1-1.6)2+ (1-1.6)2)+ (2-1.6)2 ) /
4) = 0.55
in=0.55
Gout:
=Sqrt( ( (1-1.6)2+ (3-1.6)2+
(1-1.6)2+ (2-1.6)2)+ (1-1.6)2 ) /
4) = 0.89
out=0.89
69
Gin
Gin=0: 0
Gin=1: 2 vezes
Gin=2: 3 vezes
Gin=2: 0
Gout
Gin=0: 0
Gin=1: 3 vezes
Gin=2: 1 vez
Gin=2: 1 vez
Grfico Histograma
histograma Gin
3
2
1
0
1.5
histograma Gout
3
2
1
0
1.5
2.5
70
0.5
Gout:
p(1) = 3/5 = 0.6
p(2) = 1/5 = 0.2
p(3) = 1/5 = 0.2
Dist.Cumulativa Gin
Dist.Cumulativa Gout
0.5
Exerccio b)
i. Graus:
S.Gin=0; S.Gout=2;
O.Gin=1; O.Gout=2;
P.Gin=2; P.Gout=1;
Q.Gin=1; Q.Gout=2;
R.Gin=2; R.Gout=1.
T.Gin=2; T.Gout=0
ii. Mdia:
Gin = 8/5 = 1.6 (=0.87)
Gout = 8/5 = 1.6 (=0.87)
iii.histograma
Gin e Gout:
G=0: 1 vez
G=1: 2 vezes
G=2: 3 vezes
Referncias
Barabasi, A.L., Linked: How Everything Is Connected
to Everything Else and What It Means for Business,
Science and Everyday Life, Plume, 2003.
Newman, M., The Structure and Function of Complex
Networks, Siam Review, Vol. 45, No 2, pp.167256,
2003.
Clauset, A.; Shalizi, C.R.; Newman, M., Power-law
distributions in empirical data, Siam Review, Vol. 51,
No 4, pp.661703, 2009.
73
Apndices
74
A Regra 80-20
O princpio de Pareto, tambm conhecido como a
regra 80-20, entre outros nomes, estabelece
que, para muitos eventos, aproximadamente 80%
dos efeitos (consequncias) so provenientes de
20% das causas. [3]
O economista italiano Vilfredo Pareto, que observou
em 1906 que 80% das terras na Italia eram
pertencentes 20% da populao, devenvolveu o
princpio pela observao de que 20% das vagens de
ervilha em seu jardim continham 80% das ervilhas.
[3] http://en.wikipedia.org/wiki/80-20_rule
75
78
Utilizando recursos computacionais, elabore uma programa para calcular: i) os graus in-degree e
out-degree de todos os vrtices do grafo; ii) a mdia dos graus dos vrtices e o desvio padro; iii)
o histograma dos graus; iv) a distribuio acumulada das probabilidade dos graus. Apresente o
resultado na forma de vetor. Esboce o grfico manualmente do histograma e da distribuio
acumulada.
Entregue o programa em arquivo, e os resultados e o grafico impressos.
Obs: Os custos das arestas no so usados.
79