You are on page 1of 48

Matemática

Organizadores
Antônio Carlos Brolezzi
Elvia Mureb Sallum
Martha S. Monteiro
Elaboradoras
Cristina Cerri
Lisbeth K. Cordani
2
módulo

Nome do Aluno
GOVERNO DO ESTADO DE SÃO PAULO
Governador: Geraldo Alckmin
Secretaria de Estado da Educação de São Paulo
Secretário: Gabriel Benedito Issac Chalita
Coordenadoria de Estudos e Normas Pedagógicas – CENP
Coordenadora: Sonia Maria Silva

UNIVERSIDADE DE SÃO PAULO


Reitor: Adolpho José Melfi
Pró-Reitora de Graduação
Sonia Teresinha de Sousa Penin
Pró-Reitor de Cultura e Extensão Universitária
Adilson Avansi Abreu

FUNDAÇÃO DE APOIO À FACULDADE DE EDUCAÇÃO – FAFE


Presidente do Conselho Curador: Selma Garrido Pimenta
Diretoria Administrativa: Anna Maria Pessoa de Carvalho
Diretoria Financeira: Sílvia Luzia Frateschi Trivelato

PROGRAMA PRÓ-UNIVERSITÁRIO
Coordenadora Geral: Eleny Mitrulis
Vice-coordenadora Geral: Sonia Maria Vanzella Castellar
Coordenadora Pedagógica: Helena Coharik Chamlian

Coordenadores de Área
Biologia:
Paulo Takeo Sano – Lyria Mori
Física:
Maurício Pietrocola – Nobuko Ueta
Geografia:
Sonia Maria Vanzella Castellar – Elvio Rodrigues Martins
História:
Kátia Maria Abud – Raquel Glezer
Língua Inglesa:
Anna Maria Carmagnani – Walkyria Monte Mór
Língua Portuguesa:
Maria Lúcia Victório de Oliveira Andrade – Neide Luzia de Rezende – Valdir Heitor Barzotto
Matemática:
Antônio Carlos Brolezzi – Elvia Mureb Sallum – Martha S. Monteiro
Química:
Maria Eunice Ribeiro Marcondes – Marcelo Giordan
Produção Editorial
Dreampix Comunicação
Revisão, diagramação, capa e projeto gráfico: André Jun Nishizawa, Eduardo Higa Sokei, José Muniz Jr.
Mariana Pimenta Coan, Mario Guimarães Mucida e Wagner Shimabukuro
Cartas ao
Aluno
Carta da
Pró-Reitoria de Graduação

Caro aluno,
Com muita alegria, a Universidade de São Paulo, por meio de seus estudantes
e de seus professores, participa dessa parceria com a Secretaria de Estado da
Educação, oferecendo a você o que temos de melhor: conhecimento.
Conhecimento é a chave para o desenvolvimento das pessoas e das nações
e freqüentar o ensino superior é a maneira mais efetiva de ampliar conhecimentos
de forma sistemática e de se preparar para uma profissão.
Ingressar numa universidade de reconhecida qualidade e gratuita é o desejo
de tantos jovens como você. Por isso, a USP, assim como outras universidades
públicas, possui um vestibular tão concorrido. Para enfrentar tal concorrência,
muitos alunos do ensino médio, inclusive os que estudam em escolas particulares
de reconhecida qualidade, fazem cursinhos preparatórios, em geral de alto
custo e inacessíveis à maioria dos alunos da escola pública.
O presente programa oferece a você a possibilidade de se preparar para enfrentar
com melhores condições um vestibular, retomando aspectos fundamentais da
programação do ensino médio. Espera-se, também, que essa revisão, orientada
por objetivos educacionais, o auxilie a perceber com clareza o desenvolvimento
pessoal que adquiriu ao longo da educação básica. Tomar posse da própria
formação certamente lhe dará a segurança necessária para enfrentar qualquer
situação de vida e de trabalho.
Enfrente com garra esse programa. Os próximos meses, até os exames em
novembro, exigirão de sua parte muita disciplina e estudo diário. Os monitores
e os professores da USP, em parceria com os professores de sua escola, estão
se dedicando muito para ajudá-lo nessa travessia.
Em nome da comunidade USP, desejo-lhe, meu caro aluno, disposição e vigor
para o presente desafio.

Sonia Teresinha de Sousa Penin.


Pró-Reitora de Graduação.
Carta da
Secretaria de Estado da Educação

Caro aluno,
Com a efetiva expansão e a crescente melhoria do ensino médio estadual,
os desafios vivenciados por todos os jovens matriculados nas escolas da rede
estadual de ensino, no momento de ingressar nas universidades públicas, vêm se
inserindo, ao longo dos anos, num contexto aparentemente contraditório.
Se de um lado nota-se um gradual aumento no percentual dos jovens aprovados
nos exames vestibulares da Fuvest — o que, indubitavelmente, comprova a
qualidade dos estudos públicos oferecidos —, de outro mostra quão desiguais
têm sido as condições apresentadas pelos alunos ao concluírem a última etapa
da educação básica.
Diante dessa realidade, e com o objetivo de assegurar a esses alunos o patamar
de formação básica necessário ao restabelecimento da igualdade de direitos
demandados pela continuidade de estudos em nível superior, a Secretaria de
Estado da Educação assumiu, em 2004, o compromisso de abrir, no programa
denominado Pró-Universitário, 5.000 vagas para alunos matriculados na terceira
série do curso regular do ensino médio. É uma proposta de trabalho que busca
ampliar e diversificar as oportunidades de aprendizagem de novos conhecimentos
e conteúdos de modo a instrumentalizar o aluno para uma efetiva inserção no
mundo acadêmico. Tal proposta pedagógica buscará contemplar as diferentes
disciplinas do currículo do ensino médio mediante material didático especialmente
construído para esse fim.
O Programa não só quer encorajar você, aluno da escola pública, a participar
do exame seletivo de ingresso no ensino público superior, como espera se
constituir em um efetivo canal interativo entre a escola de ensino médio e
a universidade. Num processo de contribuições mútuas, rico e diversificado
em subsídios, essa parceria poderá, no caso da estadual paulista, contribuir
para o aperfeiçoamento de seu currículo, organização e formação de docentes.

Prof. Sonia Maria Silva


Coordenadora da Coordenadoria de Estudos e Normas Pedagógicas
Apresentação
da área
[...] a Matemática procura compreender os modelos que permeiam o mundo que
nos rodeia assim como a mente dentro de nós. […] Assim é necessário colocar a
ênfase:
— em procurar soluções e não apenas em memorizar procedimentos;
— em explorar modelos e não apenas em memorizar fórmulas;
— em formular conjecturas e não apenas em fazer exercícios.
[...] com essas ênfases, os estudantes terão a oportunidade de estudar a Matemá-
tica como uma disciplina exploradora, dinâmica, que se desenvolve, em lugar de ser
uma disciplina que tem um corpo rígido, absoluto, fechado, cheio de regras que
precisam ser memorizadas.
Shoenfeld (1992)1
Este curso de Matemática com duração de 4 meses está sendo oferecido a
alunos do último ano do ensino médio da rede pública como um incentivo
para continuarem seus estudos em direção ao ensino superior. Embora não
cubra todo o programa do ensino médio, pretende-se estimular o interesse dos
alunos pelos diversos temas de Matemática por meio de abordagens variadas.
Serão estudados tópicos sobre Números, Estatística, Probabilidade e Aná-
lise Combinatória, Geometria Plana e Espacial, Geometria Analítica, Sistemas
Lineares e Funções, privilegiando o entendimento das possíveis facetas de
um mesmo assunto, a análise de resultados obtidos e a interligação entre os
diversos conteúdos.
Escolhas foram feitas de modo a priorizar sua formação, a discussão de
idéias e a percepção de que a Matemática é uma disciplina viva que pode ser
construída, e não um amontoado de fórmulas prontas para serem decoradas e
usadas. Lembrando que realmente aprendemos quando trabalhamos o conhe-
cimento, analisando-o de várias maneiras e usando-o com critério, considera-
remos, sempre que possível, aplicações em problemas reais e interdisciplinares.
Acreditando que o intercâmbio entre vocês, alunos do ensino médio, e os
alunos da USP, que serão os seus professores, venha a aumentar a sua predis-
posição para o ensino superior, desejamos a todos bons estudos!

Coordenação da área de Matemática

1
SCHOENFELD A. H. “Learning to think mathematically: Problem solving, metacognition and sense
making in mathematics”. In: D. A. Grouws (Ed.). Handbook of research on mathematicas teaching and
learning. p. 334-370. Nova Iorque: MacMillan, 1992.
Apresentação
do módulo
Uma das ferramentas mais utilizadas hoje em dia pelos cientistas, analistas
econômico-sociais, profissionais liberais, jornalistas etc. é a Estatística, que
descreve os dados observados e desenvolve a metodologia para a tomada de
decisão em presença da incerteza. O verbete estatística foi introduzido no
século XVIII, tendo origem na palavra latina status (Estado), e serviu inicial-
mente a objetivos ligados à organização político-social, como o fornecimento
de dados ao sistema de poder vigente. Hoje em dia, os modelos de aplicação
da Teoria Estatística se estendem por todas as áreas do conhecimento, como
testes educacionais, pesquisas eleitorais, análise de riscos ambientais, finan-
ças, controle de qualidade, análises clínicas, data mining, índices de desen-
volvimento, modelagem de fenômenos atmosféricos etc. Podemos informal-
mente dizer que a Teoria Estatística é uma ferramenta que ajuda a tomar deci-
sões com base na evidência disponível, decisões essas afetadas por margens
de erro, calculadas através de modelos de probabilidade.
No entanto, a probabilidade se desenvolveu muito antes de ser usada em
aplicações da Teoria Estatística. Um dos marcos consagrados na literatura
probabilística foi a correspondência entre B. Pascal (1623-1662) e P. Fermat
(1601-1665), onde o tema era a probabilidade de ganhar em um jogo com dois
jogadores, sob determinadas condições. Isso mostra que o desenvolvimento da
teoria de probabilidades começou com uma paixão humana, que são os jogos
de azar, mas evoluiu para uma área fortemente teórica, em uma perspectiva de
modelar a incerteza, derivando probabilidades a partir de modelos matemáti-
cos. A análise combinatória deve grande parte de seu desenvolvimento à ne-
cessidade de resolver problemas probabilísticos ligados à contagem, mas hoje
há diversas áreas em que seus resultados são fundamentais para o desenvolvi-
mento de teorias, como, por exemplo, a área de sistemas de informação.
Esta apostila tratará das três áreas descritas na introdução: estatística, pro-
babilidade e combinatória. Para o desenvolvimento dos temas, foi difícil a
escolha da ordem e do conteúdo, limitados que fomos pelo tempo disponível
para o desenvolvimento de cada assunto. Optamos por fazer um tratamento
sucinto de dados, através da estatística descritiva, por oferecer algumas no-
ções de probabilidade, a fim de trabalhar situações ligadas à incerteza, bem
como apresentar elementos de análise combinatória, visando desenvolver o
raciocínio para solucionar certos tipos de problemas de contagem dando me-
nos ênfase ao uso de fórmulas.
Unidade 1

Estatística descritiva
Organizadores
A Estatística é um veículo para que os indivíduos, de modo geral, desen- Antônio Carlos
volvam a capacidade de aproveitar as fontes disponíveis de informação para Brolezzi
expressar e construir suas próprias idéias. Além disso, como já dissemos, es- Elvia Mureb
sas noções são parte integrante de todas as áreas do conhecimento e certa- Sallum
mente serão de grande utilidade para o curso universitário, qualquer que seja Martha S.
a área de interesse do estudante, pois praticamente todas as carreiras universi- Monteiro
tárias contêm uma disciplina de Estatística, a qual tornou-se um suporte para o
desenvolvimento do conhecimento. Elaboradora
Lisbeth K. Cordani
Cada vez mais os meios de comunicação nos apresentam
gráficos e medidas estatísticas resumidas de natureza
descritiva. Esse é um material de apoio que deve ser utilizado
para aprender os conceitos com base em notícias de nosso
próprio cotidiano. Os gráficos e as estatísticas descritivas
normalmente não são um fim em si mesmos, mas constituem
uma parte importante do processo de análise.

Esta seção tem como objetivo mostrar aos alunos como se trabalha um
conjunto de dados simples, quer sejam de natureza numérica quer sejam de
natureza qualitativa. Esses dados normalmente constituem uma amostra de
determinada população de interesse de alguma área científica, econômica,
social etc. É muito difícil uma pesquisa envolver todos os elementos de uma
determinada população (o Censo faz isso), por motivos vários, e é por isso
que se recorre às amostras (que são subconjuntos de populações).

POPULAÇÃO
Conjunto de todos os indivíduos (ou elementos) de interesse.

AMOSTRA
Qualquer subconjunto de uma população.

ANÁLISE DE DADOS
Vamos iniciar a análise descritiva propondo uma tarefa para a classe: cada
um deverá medir o palmo de sua mão direita (em cm) com uma régua e regis-
trar o valor inteiro mais próximo. Se a leitura da régua informar uma medida
com 5 como o primeiro decimal (ex. 18,5 cm), vamos propor um arredonda-
mento rápido, mas grosseiro: considere 19 cm, se o dia de seu nascimento for
par, e 18 cm, se for impar. A classe pode discutir esse critério, pensando com


o(a) professor(a) outras formas de arredondamento. Sempre que falarmos aqui


da variável palmo, estaremos subentendendo que a medida é dada em cm. Os
dados abaixo reproduzem as medidas do palmo da mão direita de uma amos-
tra (que pertence a uma determinada população) de 30 adultos e está também
representada a variável sexo (categorias M para masculino e F para feminino).

19 18 23 20 20 21 20 20 19 20
F F M F M M F M F M
20 20 21 21 20 21 19 17 19 19
M M M F F M F F F F
21 21 20 20 21 22 20 21 18 20
M M M F M M M M F F Tabela 1

Estes mesmos dados estão representados no chamado Gráfico de pontos


que se encontra a seguir. Observe como foi feita a marcação e marque o valor
do palmo da sua mão direita na linha assinalada no gráfico (respeitando a or-
dem numérica). Todos os alunos deverão informar seu valor em voz alta e, à
medida que cada valor for informado, toda a classe marca tal valor na linha
acima do gráfico já construído – quando houver repetições, sigam a sugestão
do gráfico já feito, isto é, coloquem os valores um sobre o outro. Comparem o
gráfico obtido com os dados da classe com o proveniente dos dados da Tabela 1.

Na situação a seguir, os mesmos dados de palmo da Tabela 1 foram sepa-


rados por sexo e os gráficos de pontos têm a seguinte forma:

Neste exemplo estamos trabalhando com duas características, comprimento


do palmo da mão (palmo) e sexo. Em estatística, chamamos essas caracterís-
ticas de variáveis e, portanto, temos aqui duas variáveis já definidas: uma
delas, palmo, tem a classificação numérica (ou quantitativa) e a outra, sexo,
é classificada como qualitativa, apresentando duas categorias, ou seja mas-
culino (M) e feminino (F). Vamos registrar os valores de palmo e as categorias


 

de sexo em tabelas de freqüências e devem ser registrados, nas tabelas dispo-


níveis, os valores obtidos na classe (f denota freqüência absoluta = número
de pessoas). As variáveis numéricas podem ser classificadas como contínuas
(provenientes de mensuração) ou discretas (provenientes de contagem), en-
quanto que as qualitativas podem ser classificadas como ordinais (ordem im-
plícita) ou nominais (sem ordem implícita).

PALMO freqüência f
17 1
18 2
SEXO f
19 5
M 16
20 12
F 14
21 8
22 1
23 1 Tabela 2
PREENCHA
PALMO freqüência f
17
18
SEXO f
19
M
20
F
21
22
23

Vimos então duas maneiras de representar o conjunto de valores da variá-


vel numérica palmo: através do gráfico de pontos e através de tabelas de fre-
qüências. Também a variável qualitativa sexo foi contemplada, tanto na repre-
sentação da tabela de freqüências, separando quantos indivíduos eram do sexo
masculino e quantos eram do feminino, quanto na construção do gráfico de
pontos para a variável palmo, em que houve uma estratificação para cada
categoria da variável qualitativa sexo (M e F). Compare os valores de palmo
para cada categoria de sexo.
TENTE FAZER
Colete os valores da variável palmo da mão esquerda de todos os colegas e trabalhe
mão esquerda – mão direita
com a diferença entre as medidas (mão direita). Construa o gráfico
de pontos para as diferenças e a tabela de freqüências. Repare que você trabalhou com
medidas nos mesmos indivíduos – isso significa que você trabalhou com dados
emparelhados (ou pareados). Discuta e compare o comportamento do palmo da mão
direita e da mão esquerda através das diferenças.

Considerando novamente a variável palmo, além de usarmos todos os


valores em um gráfico ou em uma tabela, podemos caracterizar o comporta-
mento dos dados a partir de um (ou mais) valores que a caracterizem – são as
chamadas medidas-resumo.
Medidas-resumo de variáveis numéricas podem ser de dois tipos: de posição e de
variabilidade
variabilidade.

Há várias medidas de posição, assim chamadas porque podem ser assina-


ladas no mesmo eixo de representação dos pontos (por exemplo, podem ser




representadas no gráfico de pontos). Começaremos pelas chamadas de ten-


dência central: a média, a mediana e a moda.
A média (aritmética) da variável palmo é obtida através da somatória de todos
os valores de palmo dividida por 30 (dados da Tabela 1). A notação usual é:
n

∑X
i =1
i
Média aritmética de palmo = X = (1)
n
onde X é a representação para palmo (cada um pode escolher a sua represen-
tação), X é a notação usual para média de X e n é o número de elementos.
Fazendo então o cálculo, vem:
X = [(17 + 18 + 18 +……….+ 22 + 23) / 30] ≅ 20 cm
(aqui o resultado é uma dízima periódica e vamos trabalhar com este valor aproximado)

Com os valores apresentados sob a forma de tabela de freqüências, a ex-


pressão para a média aritmética fica:
k

∑ f .X i i
X= i =1 (2)
n
onde fi é a freqüência do valor Xi, n é a soma de f i e a média é evidentemente
igual à anterior:

X = [(1. 17 + 2. 18 + 5. 19 + 12 . 20 + 8 . 21 + 1. 22 + 1. 23) / 30 ] ≅ 20 cm
A classe deverá fazer a média dos valores obtidos da variável PALMO de
todos os seus alunos.
Tanto no caso dos dados da Tabela 1 como naqueles da Tabela 2, não houve
nenhuma perda de informação e os valores da média são idênticos. Se a tabela
de freqüências disponível fosse a Tabela 4 (que apresentaremos adiante) então
haveria perda de informação, pois os dados estariam compactados em classes e
o cálculo da média seria feito com o ponto médio de cada classe como valor de
X – assim, com perda de informação, a média obtida não seria necessariamente
igual à anterior. Não vamos aqui explorar esse conteúdo para o cálculo de me-
didas descritivas, uma vez que com os recursos computacionais atuais não é
necessário dividir os dados em classes com esse objetivo. No entanto, veremos
uma aplicação gráfica com a Tabela 4, cujos dados estão divididos em classes.
A mediana da variável palmo é um valor que divide o conjunto dos valo-
res dessa variável em duas partes: metade dos valores é inferior (ou igual) à
mediana e a outra metade apresenta valores maiores (ou iguais) à mediana.
Para encontrar a mediana é então necessário ordenar os valores da variável e
verificar o valor que ocupa a posição central. Se o número de elementos for
par, e esse é o caso do exemplo (com n = 30), toma-se para mediana a média
aritmética entre os dois valores centrais – neste caso será a média entre o 15o
e o 16 o elementos. Ordenando os dados de palmo do menor para o maior
(pode ser também ao contrário), tem-se:
17 18 18 19 19 19 19 19 20 20
20 20 20 20 20 20 20 20 20 20
21 21 21 21 21 21 21 21 22 23
Tabela 3


 

O 15o valor é 20 e o 16o valor também é 20. Portanto, a mediana da variável


palmo é 20 cm. Verifiquem a mediana da variável palmo do conjunto da classe.
A terceira medida de tendência central é a moda, que é definida como
sendo o valor mais freqüente. No nosso exemplo é bem claro o valor da moda,
pois o valor mais freqüente é 20 cm. Nem sempre a moda é tão evidente e há
situações com mais de uma moda.
Depois de calcular a média, a mediana e a moda, posicionem esses valores
no gráfico de pontos, feito inicialmente com os dados da classe. É fácil então
entender por que elas se chamam medidas de tendência central – elas resumem
os dados como se estivessem procurando um “equilíbrio” entre eles. Os dados
da Tabela 1 mostram uma certa simetria, situação em que média, mediana e
moda praticamente coincidem (rigidamente falando, a média não é exatamente
20 e sim 20,033...). Vejam qual a situação dos dados obtidos por vocês.
Há o costume de resumir um conjunto de dados pelo valor de alguma
medida de tendência central – a média é geralmente a mais utilizada, embora
em certos casos ela não reflita o comportamento dos dados. Como exemplo
disso, pode-se citar o caso em que ocorre um valor muito extremo em relação
aos demais: a média será afetada fortemente por ele e então se deslocará em
sua direção, não sendo, portanto, a melhor opção para resumir tais dados.
Neste caso, a mediana é mais eficiente.
Se temos uma discussão em uma empresa entre patrões e empregados, por
exemplo, onde os salários são em sua grande parte (80%) iguais a um salário
mínimo, e os demais mais do que 50 salários mínimos, o salário médio dará
uma idéia distorcida do poder aquisitivo dos membros da empresa. Nesse
caso, a mediana, que será igual a um salário mínimo, será mais informativa.
Calculem, por exemplo, a média dos valores 1, 2, 5, 7 e 10: a resposta será 5.
Se o número 10 for substituído pelo valor 100, a média será 23, de onde se
percebe o quanto ela é influenciada pelo valor extremo 100. A mediana nos
dois casos é 5, o que mostra que ela é uma medida “robusta” em relação a
valores extremos.
Outras medidas descritivas de posição são: valor máximo, valor mínimo, 1o
quartil (Q1) e 3o quartil (Q3). As duas primeiras são auto-explicativas e passa-
remos rapidamente pela definição das outras duas: o 1o quartil é como se fosse
a mediana da primeira metade dos dados e o 3o quartil é como se fosse a medi-
ana da segunda metade dos dados. As quatro medidas acima mais a mediana
são suficientes para construir um gráfico de variáveis numéricas conhecido
como boxplot ou gráfico de caixas, ou, ainda, gráfico dos cinco pontos. O leitor
interessado irá encontrar a sua construção nas referências desta apostila.
TENTE FAZER
Calcule as medidas de posição para as diferenças (mão esquerda - mão direita). Discuta.

No entanto, apesar de as medidas de posição ajudarem na compreensão


do comportamento dos dados, elas são incompletas para caracterizar o com-
portamento das variáveis, como mostra o próximo exemplo.
Exemplo 1: Imagine que 3 pessoas da família A apresentem para a variável
palmo os valores 19, 23 e 24 e que 3 pessoas da família B apresentem os valores
22, 22 e 22. Vamos calcular a média dessa variável para ambas as famílias:
Média da família A = XA = [(19 + 23 + 24) / 3] = 22
Média da família B = XB = [(22+22+22) / 3] = 22




Concluímos então que ambas as famílias apresentam a mesma média. Será


que isso basta? Vamos continuar trabalhando com esses dados. Marque os
valores da variável palmo de cada família na linha abaixo (isto é, faça um
gráfico de pontos), e note a diferença de comportamento entre os mesmos.

18 25

Você deve ter percebido que na família B todos os valores estão concen-
trados e na família A os valores estão dispersos. Esse aspecto não é percebido
se calcularmos somente a média, pois, como vimos, ela é igual para ambas as
famílias. Isso mostra que devemos complementar a medida de posição com
mais alguma coisa a fim de caracterizar as famílias quanto à variável palmo.
Voltaremos a este exemplo oportunamente.
Há uma idéia permeando esta discussão que diz respeito à diferença de
comportamento entre os dois grupos: é a idéia de variabilidade. Medidas des-
critivas de variabilidade representam a dispersão dos dados e podem ser defi-
nidas também por medidas resumo das variáveis numéricas em estudo. Fala-
remos aqui da amplitude, variância e desvio padrão.
A amplitude é a medida mais simples de variabilidade e é obtida através da
diferença entre os valores máximo e mínimo da variável em estudo, ou seja:

AMPLITUDE = MÁXIMO – MÍNIMO (3)

Para os dados da Tabela 1, a amplitude é igual a 23 – 17 = 6 cm (ser tão


simples é, ao mesmo tempo, uma vantagem – fácil de aprender e de aplicar –, e
uma desvantagem – só trabalha com os valores extremos, ignorando o resto).
Uma medida de dispersão mais rica de informação do que a amplitude,
deveria utilizar todos os dados disponíveis e uma idéia poderia ser o cálculo
das diferenças entre cada valor e a média. Só que tais diferenças, ao serem
somadas (para se obter uma dispersão total), dão como resultado o valor zero,
qualquer que seja o conjunto de dados (experimente!), o que inviabilizaria o
seu uso. Um modo de contornar esse problema seria considerar essas diferen-
ças ao quadrado e outro seria considerar o módulo das diferenças. Cada um
deles levará a uma medida de dispersão: considerando o quadrado, tem-se a
Variância e considerando o módulo tem-se o Desvio Médio Absoluto (este
não será discutido aqui – ver referências). A Variância é uma média dos qua-
drados das diferenças e calcula-se através da expressão:
n
( X i − média ) 2 n
( X i − X )2
Variância = ∑
i =1 n −1
= ∑
i =1 n −1
(4)

Aqui é bom frisar que o intuitivo seria fazer esta média com n no denomina-
dor – questões teóricas, fora do escopo deste texto, nos levam a usar (n – 1),
principalmente em casos onde estamos usando amostras. Quanto à unidade
associada à variância, ela não é a mesma unidade dos dados originais e sim o
quadrado dela – neste exemplo, a unidade da variância é cm2. Com os dados
da Tabela 1 temos:
[(19 – 20)2 + (18 – 20)2 +(23 – 20)2 + … + (18 – 20)2 + (20 – 20)2]
Variância =
(30 – 1)
Variância ≅ 1,48 cm2


 

No entanto, é desejável termos características da variável apresentadas na


mesma unidade dos dados coletados, o que neste caso significa ter uma medi-
da de variabilidade em cm. Define-se, então, uma medida resumo para varia-
bilidade, o Desvio Padrão, que é a raiz quadrada da variância.

Desvio Padrão = Variância (5)

Com os dados da Tabela 1, temos Desvio Padrão ≅ 1,22 cm (resgatando a


unidade de medida original, que era cm).
Exemplo 1 (cont.): continuando com a análise das famílias A e B, verifique
que a amplitude da família A é 5 cm e que a da família B é 0 cm. Isso já dá
uma boa idéia da diferença entre as famílias, diferença esta que não havia sido
detectada pela média! Daí a importância do cálculo de medidas de variabili-
dade, as quais, acopladas com a média (ou com outras medidas de posição),
permitem uma boa caracterização das variáveis de interesse.
Neste caso, a amplitude já seria suficiente para caracterizar a variabilida-
de, uma vez que temos somente 3 valores. Mas vamos aproveitá-los para o
cálculo do desvio padrão e, para isso, precisamos calcular primeiro a variância.
(19 - 22)2+ (23 - 22)2+ (24 - 22)2 (-3)2 + ( 1)2+ (2)2 9 + 1 + 4
A:VariânciaA= = = =
3 -1 3-1 2
A:VariânciaA= 7 cm2

Verifique que a variância dos dados da família B é igual a zero. A partir da


variância podemos calcular os desvios-padrão (D.P.). Assim:

D.P.A= 7 ≅ 2,65 cm e D.P.B= 0 cm.


TENTE FAZER
Calcule as medidas de variabilidade para as diferenças (mão esquerda - mão direita).
Discuta.

TENTE FAZER
No caso da tabela de freqüências com os dados da Tab ela 1, como seria feito o cálculo
abela
da variância? Recalcule e compare com o valor obtido anteriormente.

Quando a variável apresenta uma certa simetria, o intervalo [média – 1


desvio padrão; média + 1 desvio padrão] contém aproximadamente 70% dos
dados; o intervalo [média – 2 desvios padrão; média + 2 desvios padrão]
contém aproximadamente 95% dos dados e o intervalo [média – 3 desvios
padrão; média + 3 desvios padrão] contém aproximadamente 99% dos dados.
Este é um resultado que possibilita ter idéia da amplitude dos dados quando se
conhece a média e o desvio padrão dos mesmos.

Exemplo 2: com os dados da Tabela 1 vamos verificar o que foi dito acima. A
média ( X ) é 20 e vamos considerar o desvio padrão como sendo 1,2. Daí vem:

a) X – 1 D.P. = 20 – 1,2 = 18,8 X + 1 D.P. = 20 + 1,2 = 21,2


b) X – 2 D.P. = 20 – 2. 1,2 = 17,6 X + 2 D.P. = 20 + 2 . 1,2 = 22,4
c) X – 3 D.P. = 20 – 3.1,2 = 16,4 X + 3 D.P. = 20 + 3 . 1,2 = 23,6




Para verificar quantos são os valores que estão nos intervalos de interesse,
podemos nos reportar à Tabela 3, que representa os dados da Tabela 1 de
modo ordenado. Verifica-se assim que:
- no intervalo em a, (18,8; 21,2), encontramos 25 valores na Tabela 3 (83%).
- no intervalo em b, (17,6; 22,4), encontramos 28 valores na Tabela 3 (93%).
- no intervalo em c, (16,4; 23,6), encontramos 30 valores na Tabela 3 (100%).
T ENTE FAZER
Para os dados coletados em classe determine a porcentagem dos valores que pertencem
a cada um dos intervalos definidos acima. Compare com os resultados do Exemplo 2.

Voltando à análise gráfica, vamos terminar a abordagem descritiva com


mais três gráficos, um para variáveis qualitativas e dois deles para variáveis
numéricas. O primeiro será o chamado Gráfico de Setores (informalmente
chamado de gráfico em pizza) que mostramos a seguir e que representa a
proporção de homens e mulheres nos dados apresentados na Tabela 1. Faça,
no espaço em branco, um gráfico de setores utilizando as freqüências da va-
riável (sexo) coletada em classe.

O próximo gráfico é utilizado para variáveis numéricas, como a variável


palmo, em que os valores estão dispostos em classes, numa tabela de freqüên-
cias (Tabela 4). A Tabela 2 é também uma tabela de freqüências, porém, os
dados não estão dispostos em classes, como na Tabela 4. Então, com os da-
dos da Tabela 1, vamos construir uma tabela de freqüências a partir de classes
(ou intervalos), construídas de preferência com a mesma amplitude, com suas
respectivas freqüências. A Tabela 4 dará origem ao gráfico denominado His-
tograma: um gráfico cuja abscissa é formada pelas classes justapostas e cuja
ordenada é formada pelas freqüências absolutas correspondentes a cada clas-
se. Este gráfico pode também ser construído com as freqüências relativas (%)
ou com densidades, mas essas abordagens não serão desenvolvidas aqui.
PREENCHA
Construa a tabela com os dados coletados na classe

PALMO freqüência f PALMO freqüência f Obs.: O símbolo 16 |-18 significa


16|–18 1 intervalo fechado à esquerda: o
valor à esquerda, 16, está incluído
na classe e o valor à direita, 18, não
18|–20 7 está incluído na classe (é equiva-
lente à notação [16, 18[, vista na
20|–22 20 apostila 1).

22|–24 2
Tabela 4


 

Construa um histograma para


os dados da variável palmo
coletados na classe.

TENTE FAZER
Construa a tabela de freqüências das diferenças entre as medidas da mão esquerda e da
mão direita e o correspondente histograma. Use as freqüências relativas na ordenada.

O último gráfico que veremos neste tópico é aquele que relaciona duas
variáveis numéricas: diagrama de dispersão, que nada mais é do que a repre-
sentação em um eixo de coordenadas cartesianas de pares associados a duas
variáveis numéricas. A Tabela 5 mostra mais duas variáveis coletadas na amos-
tra dos trinta adultos: a altura e o peso. Normalmente (mas não obrigatoria-
mente) o gráfico de dispersão das variáveis peso e altura mostra um compor-
tamento crescente (aproximadamente linear), com a possível interpretação de
que peso e altura são diretamente proporcionais.

Sexo Peso (Kg) Altura (m)


M 94 1,85
M 99 1,92
M 84 1,75
M 88 1,88
F 70 1,66
F 65 1,58
M 73 1,75
F 72 1,76
F 59 1,60
F 70 1,65
F 80 1,75
M 85 1,75
M 85 1,82
M 85 1,73
F 69 1,72
M 85 1,86
F 66 1,73
M 83 1,72
F 72 1,70
M 83 1,71
F 67 1,63
F 69 1,71
M 99 1,89
M 83 1,81
F 64 1,70
M 94 1,89
F 72 1,74
F 69 1,70
M 83 1,72
M 88 1,79 Tabela 5




Vê-se acima o gráfico de dispersão das variáveis (peso(x), altura(y)) e,


neste caso, os valores foram separados pela variável sexo. É possível ampliar
o estudo das relações entre duas variáveis numéricas, quer ajustando uma
função, como, por exemplo, uma reta neste caso (ou mesmo duas, uma para o
SEXO masculino e outra para o SEXO feminino), quer calculando a “força”
da relação entre as variáveis através de algum coeficiente (por exemplo, o
coeficiente de correlação linear de Pearson). No entanto, essas abordagens
não serão feitas neste texto, e as referências bibliográficas podem ser consul-
tadas para este fim.
T ENTE FAZER
Colete na sua classe os dados de altura e peso e construa o gráfico de dispersão com
essas variáveis. Faça sem separar por sexo e depois faça com a separação. Comente e
compare com o gráfico de dispersão aqui apresentado.

Finalizando, gostaríamos de mencionar um gráfico de dispersão especial


em que a abscissa é o tempo (anos, meses, dias etc) e a ordenada é o valor da
variável de interesse (cotação do dólar, risco-país,
acompanhamento das marés, vendas de eletrodo-
mésticos etc.) em cada instante: são as chamadas
Séries de Tempo usadas para descrever o compor-
tamento de variáveis ao longo do tempo. A área de
economia é uma das que mais fazem uso das Séries
de Tempo, principalmente para variáveis associa-
das ao mercado financeiro. A seguir, apresentamos
uma Série de Tempo (Folha de São Paulo, 24 de
maio de 2004) que mostra o crescimento dos veí-
culos convertidos para o Gás Natural Veicular (GNV)
no Brasil ao longo dos anos (com ** significando o
valor de uma previsão).
T ENTE FAZER
Colete os dados do risco-país (você sabe o que é isso?) do primeiro dia útil de cada mês,
de janeiro de 2004 até o mês atual, e construa o gráfico de Série de Tempo. Você achará
esses dados em jornais de circulação nacional. Comente o aspecto do gráfico ao longo
do tempo.

Para outros dados, como, por exemplo, dados da Pesquisa Domiciliar ou


mesmo alguns relativos ao Censo, consulte o site www.ibge.gov.br.


Unidade 2

Probabilidade
Organizadores
Mais do que um arcabouço técnico, o racio- Antônio Carlos
cínio estatístico é uma forma de pensar e, asso- Brolezzi
ciado ao Cálculo de probabilidades, permite a
investigação de certas regularidades, de padrões Elvia Mureb
Sallum
de comportamento, com conclusões tomadas
levando em conta um risco associado. Se estivermos interessados em saber Martha S.
qual a probabilidade de obter 10 Caras em 10 lançamentos independentes de Monteiro
uma moeda honesta temos um problema de probabilidade a ser resolvido (e a Elaboradora
resposta é exata: (1/2)10). Por outro lado, se temos em mãos uma moeda e
Lisbeth K. Cordani
queremos saber se ela é honesta, podemos, por exemplo, jogá-la 10 vezes
(jogadas independentes uma da outra) e observar o resultado. Se o resultado
for 10 Caras, o que podemos concluir sobre a “honestidade” da moeda? Tere-
mos uma conclusão tão precisa quanto a obtida na resposta anterior? A res-
posta é não, pois qualquer que seja nossa decisão sobre a moeda, temos um
risco associado (ou seja, posso dizer que ela não é honesta – e ela ser honesta
– ou posso dizer que ela é honesta – e ela não ser honesta). O primeiro exem-
plo refere-se a um problema de probabilidade e o segundo é um problema
estatístico. De fato, neste segundo exemplo temos uma informação de uma
amostra (resultado de 10 lances de uma moeda) e queremos tirar uma conclu-
são para a população (probabilidade de Cara) – esta operação é chamada de
inferência estatística, e é construída levando-se em conta uma margem de
erro na conclusão, obtida através de raciocínio probabilístico. Na seção ante-
rior vimos como trabalhar com amostras, sob o ponto de vista de análise de
dados. Não abordaremos aqui nesta apostila a análise inferencial (que pode
ser vista nas referências bibliográficas) e passaremos a desenvolver noções
básicas de probabilidade.
Como já comentamos na introdução, a área de probabilidade começou a ser
desenvolvida para responder questões propostas em jogos de azar, desde o sé-
culo XVII, mas a área desenvolveu-se muitíssimo desde então. O termo pro-
babilidade faz parte do senso comum e as pessoas vivem o cotidiano calculan-
do tacitamente algumas probabilidades: desde situações de sua vida pessoal
(organizando-se para chegar ao trabalho no horário, levando em conta as cir-
cunstâncias do tráfego; agasalhando-se ao sair de casa se a previsão do tempo
indicar uma frente fria; não tomando determinados remédios que possam ter
efeitos colaterais em parte das pessoas etc) até tomadas de decisão em sua vida
profissional (abrir um negócio, aplicar dinheiro na Bolsa de Valores etc.).
Trabalharemos aqui algumas noções elementares do cálculo de probabili-
dades, para começar a pensar a incerteza. Antes mesmo de definir o termo
probabilidade, vamos caracterizar três situações distintas:


Situação A: qual a probabilidade de


sair Cara no lançamento de uma
moeda uma vez?

Situação B: qual a probabilidade de


uma semente germinar ao ser
plantada?

Situação C: qual a probabilidade de


o Brasil ganhar a próxima Copa do
Mundo de futebol?

Normalmente as pessoas sugerem como resposta o valor 50% (1/2) para a


Situação A, e argumentam que esta resposta se deve ao fato de os valores
possíveis serem dois (Cara ou Coroa) e os favoráveis apenas um (Cara), o que
produziria o quociente 1/2. Quando se passa à Situação B, em que há também
dois valores possíveis (germinar, não germinar) a resposta imediata é igual à
anterior, mas após uma pequena discussão, perguntando se elas comprariam
uma saca de sementes, em que a probabilidade de germinação por semente
fosse igual a 1/2, imediatamente percebem que não faz sentido aplicar a mes-
ma regra. Geralmente alguém sugere fazer um experimento plantando um
número grande de sementes, para observar quantas germinam. Já com a Situ-
ação C, começam a perceber que os três problemas têm naturezas diferentes e
que nem a primeira situação nem a segunda poderiam ajudar a responder a
pergunta formulada na terceira situação.
A resposta 1/2 para a pergunta da Situação A deve-se, possivelmente, ao
costume de ser usada uma moeda para decidir qual time começa jogando
determinada partida – isso “atestaria” a qualidade de “honestidade” intrínseca
da moeda, dando a mesma chance para qualquer dos dois resultados. Está
aqui então implícita a premissa que deve ser colocada para que a resposta
dada à Situação A seja verdadeira: ambos os resultados (Cara e Coroa) têm a
mesma chance de ocorrer, o que naturalmente levaria ao cálculo da probabili-
dade de Cara no lançamento de uma moeda honesta uma vez, através da cha-
mada definição clássica de probabilidade:

número de casos favoráveis


P(Cara) =
número de casos possíveis

Para a situação B, ao se fazer o experimento com as sementes, toma-se


como probabilidade o valor para o qual tende a freqüência relativa de semen-
tes germinadas (aqui está implícita a noção de limite, que não será explorada
neste texto) após um número muito grande de ensaios. Assim temos a defini-
ção freqüentista de probabilidade:

número de sementes germinadas


P(germinar) ≅ número de sementes plantadas

Esta definição leva em conta um resultado (Lei dos Grandes Números –


Bernoulli, séc. XVII) que diz que à medida que os ensaios vão aumentando


 

(sementes idênticas plantadas sob as mesma condições), a freqüência relativa


vai se estabilizando e aproximando-se do valor teórico da probabilidade de
germinar.
TENTE FAZER
Jogue uma moeda 10 vezes e marque a freqüência relativa de Caras. Repita para 20
lances, 30 lances, 40 lances e 50 lances. Coloque as freqüências observadas como
ordenadas num gráfico em que a abscissa seja o número de tentativas. Compare com o
resultado dos colegas. Comente.

Bem diferente dessas duas abordagens é a Situação C, sobre a probabili-


dade de o Brasil ganhar a próxima Copa do Mundo de futebol. Neste caso,
não é razoável pensar nem em aplicar a definição clássica (que teria que su-
por que as possibilidades têm igual chance de ocorrer) e nem a definição
freqüentista (pois não há como gerar dados através de repetição). A resposta
será de caráter individual, baseada tanto em desempenhos anteriores (regis-
tros históricos) da seleção brasileira e das demais participantes, como no co-
nhecimento do estágio atual das mesmas e ainda em um “sentimento” particu-
lar, que pode mudar de indivíduo para indivíduo. O caráter subjetivo desta
situação sugere a definição de probabilidade subjetiva, que é a opinião indivi-
dual sobre determinado resultado, a qual pode ou não ser baseada em infor-
mação anterior (informação a priori). Assim, podemos chamar genericamen-
te de p a Probabilidade (Brasil ganhar a próxima Copa do Mundo de Fute-
bol) – alguém pode colocar 0,8 (80%) ou 0,30 (30%) ou qualquer outro valor
entre 0 e 1 (ou entre 0% e 100%) .
O que há de comum entre essas três abordagens é que, para todos, a pro-
babilidade (p) é um número entre 0 e 1 que goza de algumas propriedades e,
em cada situação, devemos verificar o processo mais adequado para calculá-
la. Resumindo, temos que 0 ≤ p ≤ 1.

Exemplo 3: havia um boato na empresa MEX de que os funcionários estariam


descontentes com o salário. O diretor de RH resolveu fazer uma pesquisa
entre os seus 400 funcionários, os quais foram chamados a responder sim ou
não à seguinte pergunta:

Você aceita uma redução de jornada com redução de salário?

Os resultados foram registrados na chamada tabela de contingência como


segue:
Opinião
sim não total
Sexo
M 50 150 200
F 140 60 200
total 190 210 400

Nessa tabela os valores 200 e 200 significam o total de funcionários tanto


do sexo masculino quanto do feminino, sem levar em conta opinião. De modo
análogo, 190 e 210 representam a quantidade de sim e não, respectivamente,
sem levar em conta o sexo. Os valores internos representam conjuntamente
sexo e opinião – por exemplo, há 140 funcionários que são do sexo feminino
e que responderam sim.




O gerente faz um sorteio aleatório de uma viagem entre todos os 400


funcionários. Por sorteio aleatório entende-se um processo em que todos os
elementos têm igual probabilidade de serem sorteados – por exemplo, nume-
rar todos os funcionários, colocar os números em uma urna e sortear um ele-
mento da urna. Este sorteio é encarado como um processo normalmente de-
nominado de experimento.
Vamos olhar os resultados possíveis dentro de três perspectivas: a) sexo
do sorteado; b) opinião do sorteado; c) sexo e opinião do sorteado. Na primei-
ra perspectiva, o conjunto de todos os resultados possíveis seria {M,F}. Na
segunda, o conjunto de todos os resultados possíveis seria {SIM, NÃO} –
nessas duas primeiras perspectivas estamos somente interessados no compor-
tamento marginal do elemento sorteado, ou seja, quero saber algo sobre a
variável sexo ou algo sobre a variável opinião. A terceira perspectiva é relaci-
onada ao elemento sorteado sob o ponto de vista de sexo conjuntamente com
opinião e o conjunto de todos os resultados possíveis seria {M SIM, M NÃO,
F SIM, F NÃO}. Esses elementos descritos no último conjunto são os compo-
nentes do interior da tabela deste exemplo.
Trabalhar com probabilidades pode ser simplificado se usarmos os dados
dispostos em tabelas, ou ainda se considerarmos diagramas de árvore. Vamos
considerar o experimento de sortear ao acaso um funcionário dentre os 400
funcionários (já descrevemos o sorteio) e como o sorteio é aleatório (por su-
posição) todos os funcionários têm a mesma chance de serem sorteados. En-
tão, nesse caso, para o cálculo de probabilidades, faz sentido pensar na defi-
nição clássica já vista anteriormente e é este esquema que vamos adotar. Va-
mos responder, uma a uma, às seis perguntas seguintes, sempre com referên-
cia ao sorteio do funcionário e você, em alguns casos, poderá se reportar
implicitamente a elementos da teoria de conjuntos (como, por exemplo, as
noções de união e intersecção):

1 – qual a probabilidade de o sorteado ser do sexo feminino?


2 – qual a probabilidade de o sorteado ter dito não?
3 – qual a probabilidade de o sorteado dizer não ou ser do sexo feminino?
4 – qual a probabilidade de o sorteado ter dito não e ser do sexo feminino?
5 – qual a probabilidade de o sorteado ter dito sim e ser do sexo feminino?
6 – qual a probabilidade de o sorteado ser do sexo feminino dado que respon-
deu não?

Respostas:
1 – P(F) = ? Resposta: P(F) = (200/400) = 1/2 = 0,5 (ou 50%)
2 – P(NÃO) = ? Resposta: P(NÃO) = (210/400) = 0,525 (ou 52,5%)

As respostas às questões 1 e 2 foram obtidas diretamente dos valores marginais, ou seja,


200 funcionários do sexo feminino entre os 400 funcionários e 210 funcionários que
responderam não à pergunta entre os 400 funcionários.

3 –P ( NÃO ou F) = ? (União U)
Resposta: P (NÃO ou F)= (210 + 200 – 60)/400 = (350/400)= (7/8) =
= 0,875 (ou 87,5%)


 

A resposta à questão 3 foi obtida através da verificação de quantos funcionários podem


ser ou NÃO ou F, ou mesmo ambos, ou seja, é a união entre os funcionários NÃO com os
funcionários F. Veja que são retirados da soma os 60 funcionários que foram contados
duas vezes.

U
4 – P(NÃO e F) = ? (Intersecção )
Resposta: P(NÃO e F) = (60/400) = 0,15 (ou 15%).

A resposta à questão 4 foi obtida diretamente do valor do interior da tabela, ou seja,


dentre os 400 funcionários, 60 responderam não e ao mesmo tempo são do sexo feminino.
A questão 5 tem raciocínio análogo. Verifique!

5 – P(SIM e F) = ? Resposta: P (SIM e F) = (140/400) = 0,35 (35%)

Antes de passarmos a discutir a próxima questão, vamos voltar à questão


3, que trata da probabilidade da união de dois eventos. Genericamente, para
dois eventos A e B, a probabilidade de A ou B (A união B) é dada por
U
P(A U B) = P(A) +P(B) – P(A B) (6)

Evidentemente, se a intersecção for vazia, temos que a probabilidade as-


sociada é nula, e dizemos que A e B são eventos disjuntos. Vem então que, se
A e B forem eventos disjuntos (ou mutuamente exclusivos),

P(A U B) = P(A) + P(B) (7)

Como responder à questão 6? Aqui surge uma linguagem nova: dado que.
Isso significa que queremos um valor de probabilidade, mas temos alguma
informação adicional (dado que = sabendo que). A notação que usaremos
para dado que será uma barra vertical | , como a seguir:

6 – P (F dado NÃO) = P (F | NÃO) = ?


Resposta: P (F | NÃO) = (60/210) ≅ 0,286 (ou 28,6%).

A resposta à questão 6 levou em conta a informação, ou seja, podemos pensar que,


quando foi feito o sorteio o diretor olhou o resultado e avisou: o funcionário sorteado
respondeu não! Com essa informação, o total de funcionários diminuiu de 400 para 210,
que é o total marginal para as respostas não e então o denominador para o cálculo da
probabilidade fica sendo 210 e o numerador é igual ao número mulheres na categoria
não (60).

Vamos agora dar uma forma alternativa à resposta da questão – P (F |


NÃO) – através da definição de probabilidade condicional (sabendo que =
condicionado a)

P (F | NÃO) = [ P (F e NÃO)] / (P(NÃO)] (8)




Com os resultados já calculados, e com P (F e NÃO) = P (NÃO e F) (veri-


fique!), vem
Verifique que P (NÃO | F)
é igual a (60/200) = 0,30 P (F | NÃO) = [0,15 / 0,525] ≅ 0,286 (ou 28,6%),
(ou 30%)!
com resposta igual à já obtida diretamente da tabela.
Através da expressão (6) podemos derivar uma expressão formal para a
probabilidade conjunta, como nas questões 4 e 5, ou seja:

P(NÃO e F) = P(F e NÃO) = P(F |NÃO).P(NÃO) = P(NÃO |F).P(F)


(9)
P(SIM e F) = P(F e SIM ) = P(F |SIM).P(SIM) = P(SIM |F).P(F)

Vamos retomar a questão 6 para introduzir um novo conceito: indepen-


dência entre eventos. Nessa questão, calculamos a probabilidade condicional
de o sorteado ser do sexo feminino sabendo que a resposta foi não, isto é, P (F
| NÃO). O resultado foi aproximadamente 0,286 ou, em termos percentuais,
28,6%, o que significa que sabendo que a resposta foi não, a probabilidade de
o sorteado ser do sexo feminino é de 28,6%. Na questão 1, vimos que a proba-
bilidade de o sorteado ser do sexo feminino é de 50%, o que mostra que quan-
do damos a informação de que a resposta foi não, a probabilidade de ser do
sexo feminino diminui substancialmente (de 50% para 28,6%). Isso significa
que os eventos resposta não e sexo feminino são dependentes, pois a informa-
ção de que um ocorreu muda a probabilidade de o outro ocorrer.
Voltando à explicação dada na questão 6, quando o diretor avisou que o
funcionário sorteado tinha respondido não, os funcionários do sexo feminino
já viram suas chances diminuírem, pois com resposta não havia 150 homens
e somente 60 mulheres, ou seja, repetindo, saber que a resposta do funcioná-
rio sorteado foi não diminuiu a chance do sorteado ser do sexo feminino. Sob
o ponto de vista da pesquisa que deu origem à tabela, é fácil ver então que as
mulheres, diferentemente dos homens, aceitam, em sua maioria, a redução de
jornada com redução de salário.

De um modo geral, dizemos que dois eventos A e B são


independentes quando a informação de que B ocorreu não altera
(10)
a probabilidade da ocorrência de A, isto é, (P(A|B) = P(A))
P(A)). No caso
descrito acima, os eventos F e NÃO são dependentes.

A última afirmação implica que se A e B forem eventos independentes,


então
U
P(A B) = P(A) . P(B) (11)

pois, de acordo com a definição de independência, P(A|B) = P(A). A expres-


são (11) pode ser usada como alternativa à definição (10) para verificar se
dois eventos são independentes.

T ENTE FAZER
Com os dados do Exemplo 3 mostre, usando a expressão (11), que os eventos NÃO e F
são dependentes (ou não são independentes).


 

TENTE FAZER
Mostre que dois eventos disjuntos não são independentes.

Ao conjunto de todos os resultados possíveis associados a um experimen-


to dá-se o nome de Espaço Amostral (S) e os subconjuntos do espaço amostral
são chamados de Eventos (ver pág. 26). Se o experimento relacionar-se a
características numéricas contínuas – por exemplo, o tempo de duração de
uma lâmpada sorteada ao acaso de um lote de lâmpadas –, o espaço amostral

poderia ser descrito como {t | t 0}. Contudo, nesta apostila só abordaremos
situações numéricas discretas.
TENTE FAZER
- descreva um espaço amostral associado ao lançamento de uma moeda duas vezes;
- descreva um espaço amostral associado aos gols de uma partida de futebol;
- descreva um espaço amostral associado à coleta de peso de recém-nascidos.

TENTE FAZER
Usando os dados do Exemplo 3, mostre que:
P(SIM) = 1 – P(NÃO) e que P(M) = 1 – P(F). Ou seja,
A c) , para A U A c = S (espaço amostral).
P(A) = 1 – P(A

Em seguida, faremos uma representação ainda do mesmo problema dos


funcionários, em que um deles é sorteado, através do diagrama de árvore, o
que muitas vezes torna mais fácil a visualização dos resultados e das respecti-
vas probabilidades.
Podemos começar o diagrama por uma ou por outra característica – va-
mos começar pela opinião. Partindo do princípio de que o sorteado ou é do
sexo feminino ou do sexo masculino, construiremos dois ramos iniciais partin-
do do mesmo ponto e depois prosseguimos com os outros ramos referentes à
característica sexo (M ou F), conforme segue:

P(M | SIM)

M P(SIM e M) = (190/400).(50/190)
50/190
= 0,125 (ou 12,5%)
SIM
140/190
190/400 F P(SIM e F) = (190/400).(140/190)
= 0,35 (ou 35%)

210/400 M P(NÃO e M) = (210/400).(150/210)


NÃO 150/210
= 0,375 (ou 37,5%)

60/210
F P(NÃO e F) = (210/400).(60/210)
= 0,15 (ou 15%)




T ENTE FAZER
No espaço a seguir, faça um diagrama de árvore iniciando pela característica sexo.
Verifique que o conjunto dos resultados associados aos caminhos constitui o espaço
amostral já visto.

O diagrama de árvore tem todos os ramos e probabilidades associados ao


experimento de sortear um indivíduo da tabela inicialmente apresentada. Os
ramos iniciais, antes do “traço” vertical, representam eventos marginais da
tabela e as probabilidades também podem ser chamadas de marginais. Como
já havia sido visto na questão 2, P(NÃO) = (210/400) = 0,525. Como com
relação à OPINIÃO há somente duas possibilidades, podemos encontrar a
P(SIM) pelo complementar, ou seja, P(SIM) = 1 – P(NÃO) = 1 – 0,525 = 0,475
(= 190/400). Depois do “traço”, os eventos são considerados condicionais e
devem levar em conta a ocorrência antes do “traço”. Assim, o valor 50/190 é
P(M|SIM). O valor da probabilidade pedida na questão 6 é obtido diretamente
no último ramo após o traço, ou seja, P(F|NÃO) = 60/210 ≅ 0,286 (28,6%).
Ainda observando a árvore, vemos que ao percorrer os caminhos, desde o
nó inicial, temos quatro resultados, SIM M, SIM F, NÃO M e NÃO F, cujas
probabilidades podem ser obtidas através do produto dos ramos correspon-
dentes. Na verdade, isso não é novidade, pois as relações vistas anteriormente
permitem fazê-lo, ou seja, cada probabilidade pode ser calculada pelo produ-
to entre uma probabilidade marginal e uma condicional. De fato, temos, por
exemplo, para cálculo de P(NÃO e F) o produto (210/400).(60/210) = 0,15
(ou 15%, valor já obtido como resposta à questão 4).

Veremos a seguir uma aplicação do diagrama de árvore para um problema


da área financeira.
Exemplo 4
(FUVEST 2000). Um investidor quer aplicar 120 mil reais. Seu corretor lhe
oferece um investimento em duas fases, com as seguintes regras:
I) Na primeira fase do investimento, ocorrerá um entre os dois eventos seguin-
tes: com probabilidade p, o investidor ganha metade do que investiu; com
probabilidade (1-p), o investidor perde 1/3 do que investiu.


 

II) Na segunda fase do investimento, a quantia final da primeira fase será


reinvestida, de forma independente da primeira fase. Neste novo investimen-
to, ocorrerá um dentre os dois eventos seguintes: com probabilidade 1/2, o
investidor ganha a quarta parte do que foi reinvestido; com probabilidade 1/2,
o investidor perde metade do que foi reinvestido.
a) Se o investidor aplicar seu dinheiro desta forma, com que valores pode
ficar ao término do investimento? Qual a probabilidade, em função de p, de
ficar com cada um desses valores?
b) Uma revista especializada informa que, neste investimento, a probabilida-
de de perder dinheiro é de 70%. Admitindo como correta a informação da
revista, calcule p.
Vamos resolver esse problema aplicando o diagrama de árvore:

Quantia inicial: R$ 120.000,00

225.000 Ganha: (1/2)p


1/2

180.000
1/2
90.000 Perde: (1/2)p
p

(1-p)
100.000 Ganha: (1/2)p (1-p)
80.000 1/2

1/2
40.000 Perde: (1/2)p (1-p)

Observação: A premissa de que a segunda fase é independente da primeira


fase permite colocar na segunda parte dos ramos os valores 1/2 e 1/2 direta-
mente.

Resposta:
a) O investidor pode ficar com qualquer dos seguintes valores (e respectivas
probabilidades): R$ 225 000,00 [(½)p], R$ 90 000,00 [(½)p], R$ 100 000,00
[½(1-p)] ou R$ 40 000,00 [½(1-p)].
b) Levando em conta as quatro possibilidades, o investidor só não perde na
primeira delas. Como, segundo a revista, a probabilidade de perder é de 70%,
a probabilidade de não perder (complementar!) é de 30% e temos então que
(½) p = 0,30. Portanto p = 0,60.
Outra maneira de chegar a este resultado é igualar a probabilidade de
perder a 70%, ou seja,

P(perder) = [(½)p+ (½)(1-p)+( ½)(1-p)] = 0,70,

o que produz o resultado p = 0,60 (confira!).




Os exemplos analisados neste tópico de probabilidades procuraram dar


sentido aos conceitos, através de esquemas simples quer seja com tabelas ou
através de diagramas de árvore, sempre no contexto discreto. No entanto,
para experimentos mais sofisticados, ainda no âmbito do discreto, por exem-
plo, o caso em que o número de ramos se torna proibitivo, temos que recorrer
a técnicas de contagem para o cálculo de probabilidades e a área de análise
combinatória, que será desenvolvida na próxima seção, fornecerá elementos
para que esses cálculos sejam facilitados. O leitor, interessado em probabili-
dades associadas a experimentos em que a característica medida é contínua,
achará material nas referências bibliográficas.
A seguir, temos um resumo dos principais resultados descritos nesta seção
para eventos genéricos A e B (associados a um espaço amostral S).

Probabilidade da União
U
P(A ou B) = P(AU B) = P(A) +P(B) – P(A B)

Probabilidade Condicional
P(A | B) = P(A B) / P(B) para P (B) ≠ 0
U

Probabilidade Conjunta
U
P(A B) = P(A|B) . P(B) = P(B|A) . P(A)

Se A e B são independentes então


U
P(A B) = P(A) . P(B)


Unidade 3

Combinatória*
Organizadores
Antônio Carlos
Brolezzi
Qual é a chance de se ganhar na Loto ou na Mega-Sena? E na Loteria Elvia Mureb
Esportiva? Calcular a probabilidade de se ganhar num jogo de azar passa Sallum
muitas vezes por conhecer todos os elementos com os quais se está lidando e Martha S.
depois quais desses são os elementos “ganhadores”. Por exemplo, se uma Monteiro
moeda é lançada duas vezes, sucessivamente, temos quatro possíveis resulta-
dos: (cara, cara), (coroa, cara), (cara, coroa) e (coroa, coroa). Se “ganhamos” Elaboradora
quando obtivermos exatamente duas caras, então, se a moeda for honesta, só Cristina Cerri
temos uma chance em quatro de ganhar. Neste caso foi fácil contar quantos
são os casos possíveis (espaço amostral) e quantos são os (eventos) favorá-
veis. E se fossem 50 lançamentos? E no caso de jogos como da Loto ou da
Mega-Sena, quantas são todas as combinações possíveis de números?
Assim, para a resolução de problemas desse tipo, é essencial conhecer a
quantidade de elementos de determinados conjuntos, sem ter que, efetiva-
mente, listá-los e contá-los. Em outras situações concretas também é necessá-
rio saber o número de elementos de determinados conjuntos.

Quantos carros podem ser lacrados na cidade de


São Paulo com placas com 3 letras e 4 algarismos?

Problemas relacionados à contagem de elementos de um conjunto são trata-


dos numa área da matemática conhecida como Análise Combinatória, ou ape-
nas Combinatória. O estudo de problemas desse tipo é muito antigo e chamou
a atenção de muitos matemáticos importantes como L. Euler (1707-1783) e B.
Pascal (1625-1662), entre outros. Essa área tem tido um grande crescimento
nas últimas décadas, devido ao desenvolvimento da ciência da computação.
Problemas de enumeração (contagem) aparecem com muita freqüência em
teoria dos grafos, em análise de algoritmos etc. Muitos problemas importan-
tes podem ser modelados matematicamente usando a teoria dos grafos (pro-
blemas de pesquisa operacional, de armazenamento de informações em ban-
cos de dados nos computadores e também problemas matemáticos teóricos,
como o famoso problema das 4 cores, que veremos mais adiante).
O nosso principal objetivo aqui será o de estudar algumas técnicas e con-
ceitos que permitam a contagem de certos tipos de conjuntos finitos. Veremos
*Parcialmente baseado no material de Cerri, C.; Druck, I. F. e Pereira, A. L. Combinatória Sem Fórmulas,
do Projeto Pró-Ciências da Fapesp (2002) e do Projeto PEC-Construindo Sempre-PEB II, USP-SEE
(2003).


que muitos problemas de contagem podem ser tratados usando apenas alguns
princípios básicos. Vamos enfatizar a compreensão plena do problema trata-
do e o reconhecimento da técnica adequada em cada caso, não as fórmulas,
que são muito úteis, mas resolvem apenas tipos especiais de problemas.
Vamos começar discutindo um problema simples de contagem. Em um car-
dápio de um restaurante italiano estão listados 5 tipos de massas e 7 tipos de
molhos distintos. Quantos pedidos distintos podem ser feitos? É fácil obter a
resposta: 35. Foi utilizado um princípio básico de contagem: para cada tipo de
massa escolhida tem-se 7 molhos diferentes para escolher, e assim, temos 5 x 7
diferentes pratos.
Vamos retomar o problema das placas de carros na cidade de São Paulo.
Quantas placas de automóveis podem ser formadas usando-se três letras (in-
clusive K, Y e W) e quatro algarismos? Veja o esquema abaixo de uma placa
de automóvel:
1a 2a 3a 1o 2o 3o 4o
letra letra letra algarismo algarismo algarismo algarismo

Para formar uma placa, temos que escolher uma letra entre 26 para colo-
car na primeira posição. Escolhida essa letra, temos 26 escolhas possíveis
para a segunda posição. Então temos 26 x 26 = 676 possibilidades de preen-
chimento das duas primeiras letras da placa. Mas ainda temos que preencher
mais uma casa com uma letra. Assim podemos ter 26 x 26 x 26 = 17.576
maneiras de preencher a placa com 3 letras. Falta ainda colocar os 4 algaris-
mos. Em cada posição temos 10 escolhas de algarismos. Então temos 10 x 10
x 10 x 10 x 10 = 10.000 possibilidades. Portanto, no total teremos 175.760.000
placas. Como para cada carro temos apenas uma placa, esta é a quantidade de
carros que podem ser lacrados na cidade de São Paulo!
Neste caso, esta técnica de efetuar a contagem foi eficiente.
T ENTE FAZER
Você fará um exame cuja prova é composta de 10 questões de múltipla escolha com 5
alternativas por questão cada uma. Quantos são os gabaritos possíveis?

Vejamos mais um exemplo.


Uma bandeira é formada por quatro listras que
devem ser coloridas com até 4 cores, por exemplo,
amarelo, vermelho, branco e preto, não devendo
ter listras adjacentes com a mesma cor. De quantos
modos a bandeira pode ser colorida?
Podemos pintar a primeira listra com 4 cores
diferentes e a segunda listra com 3 cores. Mas 3
cores podem ser usadas para pintar a terceira listra, 1a 2a 3a 4a
pois pode-se repetir a cor usada na primeira listra.
listra listra listra listra
E finalmente podemos usar 3 cores para pintar a
quarta listra. Portanto temos 4 x 3 x 3 x 3 = 108
bandeiras diferentes.
Nos problemas acima, usamos um princípio
básico de contagem que pode ser escrito, na forma
geral, da seguinte maneira.


 

Princípio da Multiplicação
Se uma decisão d1 pode ser tomada de p1 maneiras e se, uma vez tomada a decisão d1 , a
decisão d2 puder ser tomada de p2 maneiras, então o número de maneiras de se tomarem
as decisões d1 e d2 é p1 x p2 maneiras.

Facilmente, o princípio acima pode ser generalizado para uma quantidade


finita de decisões.
Agora, usando o princípio da multiplicação, resolva alguns problemas de
contagem.
TENTE FAZER
Em uma estante existem 5 livros em espanhol, 6 em francês e 3 em inglês. De quantas
maneiras posso escolher 2 livros sem escolher dois da mesma língua?

TENTE FAZER
- Quantos números naturais de 3 algarismos distintos existem? (Preste atenção: as
decisões envolvidas podem ser tomadas em várias ordens. Qual é a mais conveniente?)
- Quantos números naturais pares de 3 algarismos distintos existem? (Qual a dificuldade
maior deste problema?)

Um outro princípio elementar de contagem diz respeito ao número de


elementos da união de conjuntos.
Princípio da Adição
Se A e B são dois conjuntos disjuntos, com p e q elementos respectivamente, então
A U B possui p+q elementos.
Um problema de contagem muito interessante é o seguinte: ao se colorir
um mapa, pode-se usar a mesma cor mais de uma vez, desde que dois países
que têm fronteira comum sejam pintados de cores diferentes. Usando no má-
ximo 4 cores, de quantas maneiras se pode colorir um mapa formado pelos
seguintes países: Brasil, Uruguai, Argentina e Paraguai? E um mapa formado
por Brasil, Uruguai, Argentina, Paraguai e Chile? E pelos países Brasil, Ar-
gentina, Paraguai e Bolívia?
Usando no máximo 3 cores, seria possível pintar um mapa formado pelos
países Brasil, Uruguai, Argentina e Paraguai? E o mapa formado por Brasil,
Argentina, Paraguai e Bolívia?

O Problema das 4 Cores


Cores.
Na resolução do problema anterior, você percebeu que, em alguns casos, não se pode usar
menos de 4 cores para pintar um determinado mapa. Mas, fazendo alguns testes, percebe-se
que é possível pintar vários mapas com até 4 cores. Será possível pintar qualquer mapa com
até 4 cores? Este atraente problema pode ser formulado matematicamente, já que “mapas”
não deixam de ser subdivisões do plano que não se sobrepõem. O Problema das 4 Cores,
como é conhecido hoje, foi proposto pela primeira vez em 1852, por Francis Guthrie. Contudo,
só foi publicado em 1878, após ter sido estudado por vários matemáticos da época. Em 1879,
Kempe apresentou a primeira “demonstração” da conjectura, cujo erro foi descoberto por
Heawood, que provou que o resultado era verdadeiro para 5 cores. Finalmente, depois de
muitos anos e esforços, o resultado foi provado em 1977 por K. Appel e W. Haken. Porém, a demonstração fez uso de
mais de 1200 horas de processamento (isso mesmo, computador!), o que provocou grandes discussões sobre a
validade da prova. Recentemente, em 1997, N. Robertson, D. Sanders, P. Seymour e R. Thomas encontraram uma
resolução mais simples, mas ainda dependente do auxílio de computadores.




O problema das 4 cores é um típico problema de Teoria dos Grafos. Um


“grafo” é um tipo de diagrama com vértices e linhas. Podemos fazer um es-
quema do problema das 4 cores usando um diagrama do tipo,

onde cada vértice é um país. Uma linha ligando os vértices significa que os
países têm fronteiras em comum. Um outro problema fascinante deste tipo é o
Problema das Sete Pontes de Königsberg, que foi resolvido por L. Euler em
1735. Como este é um assunto bastante vasto, não o discutiremos aqui. Se
você ficou interessado, leia sobre o problema na Revista do Professor de Ma-
temática (Alguns problemas clássico sobre grafos, n. 12, 1988) ou no site
http://www.prof2000.pt/users/agnelo/pontesh.htm.
Voltemos aos problemas de contagem.
T ENTE FAZER
- De quantos modos 3 pessoas podem se sentar em 5 cadeiras em fila? (Resposta 60)
- Quantos números de quatro dígitos são maiores que 2400 e
(a) têm todos os dígitos diferentes? (Resposta 3864)
(b) não têm dígitos iguais a 3, 5 ou 6? (Resposta 1567)
(c) satisfazem às duas condições acima simultaneamente? (Resposta 560)
- Quantos subconjuntos possuem um conjunto de n elementos? (Resposta 2n)
Discuta com seus colegas o raciocínio usado em cada resolução, pois às vezes obtém-se
a resposta correta por métodos incorretos.

Vamos fazer algumas generalizações. Consideremos n objetos distintos. De


quantas maneiras n objetos diferentes podem ser ordenados? De quantas for-
mas podemos permutá-los? A resposta é fácil agora: n(n-1).(n-2)...3.2.1=n! Se,
por outro lado, desejamos saber de quantos modos podemos ordenar m objetos
n!
dentre os n, logo m ≤ n, a resposta é de n( n − 1) ⋅ ( n − 2)...( n − m + 1) =
( n − m)!
maneiras.

ELIMINANDO REPETIÇÕES
Vamos ver agora outros tipos de problemas de contagem.
Quantas comissões de 4 alunos podem ser formadas numa classe de 7
alunos?
Para o primeiro lugar da comissão temos 7 escolhas, para o segundo lugar
6 escolhas, para o terceiro lugar 5 escolhas e para o quarto lugar 4 escolhas, o
que nos dá, pelo princípio da multiplicação, 7.6.5.4 = 840 escolhas de 4 alu-
nos. Entretanto, 840 não é a quantidade total de comissões! Note que a co-
missão formada pelos alunos A, B, C e D é a mesma daquela formada por B,
D, C e A. Precisamos saber quantas vezes cada comissão foi contada repe-
tidamente. Fixemos 4 alunos (uma comissão). De quantas maneiras podemos
formá-la? Chamando um aluno por vez, para a primeira chamada temos 4
opções, para a segunda 3, para a terceira 2 e para a quarta apenas 1. Logo


 

podemos chamar os alunos de 4.3.2.1=24 maneiras diferentes. Assim temos


que, das 840 escolhas, cada grupo de 24 representa a mesma comissão. Portanto,
840
o total de comissões será de = 35.
24
A seguir, vamos ver outra situação onde se deve usar a divisão para elimi-
nar repetições e efetuar a contagem.
Um anagrama é um código formado pela permutação das letras de uma
palavra, podendo ou não originar palavras com significado.

Quantos são os anagramas da palavra CASA?


Se as 4 letras fossem distintas então teríamos 4! = 24 anagramas. Neste
caso, estamos pensando que A C S A é diferente de A C S A. Só que temos a
mesma palavra A C S A. Assim, como cada anagrama foi contado duas vezes
4!
(que é o número de permutações dos dois A’s) temos na verdade = 12 anagra-
mas diferentes. 2 !

Quantos são os anagramas da palavra MATEMATICA?


Se as 10 letras fossem todas diferentes, uma aplicação simples do princí-
pio da multiplicação forneceria 10! anagramas. Entretanto, podemos permu-
tar os 2 T’s, os 2 M’s e, ignorando o acento, também os 2 A’s. Isso significa que
10 !
cada anagrama está sendo contado 2!2!3! vezes. Portanto, existem
anagramas distintos. 2 ! 2 !3!

Vamos analisar mais uma situação.


Qual é o número de rodas de ciranda distintas que
podem ser formadas com 6 crianças?
Temos certamente 6! filas de crianças. Entretanto, quan-
do organizadas em um círculo, duas filas formam a mesma
roda de ciranda se houver coincidência das crianças após
uma rotação de uma das rodas (ver o diagrama a seguir).
Podíamos dizer que tais filas são “equivalentes”.
Dessa forma, 6 filas distintas originam
uma mesma roda de ciranda. Portanto, o
6!
número de rodas de ciranda é = 5!
6

Em cada situação anterior, a divisão foi utilizada aqui para eliminar as


repetições. Identificando os elementos que são “iguais” podemos, usando a
divisão, eliminá-los da contagem.
Examinando mais detalhadamente os últimos exemplos, percebemos que
podemos dar um tratamento mais geral para situações onde a divisão é usada
para eliminar repetições em problemas de contagem.
Considere a seguinte situação: um conjunto A contém elementos de diver-
sos tipos distintos, digamos, tipo 1, tipo 2, tipo 3, ... tipo k. Se o número de
elementos de cada tipo é nk, então o número total de elementos de A é (n1 + n2
+...+ nk), ou seja, a soma do número de elementos de cada tipo. Em particular,
se o número de elementos de cada tipo é sempre igual a m, então o número de
elementos de A é obviamente k.m.




Agora, se o número total n de elementos de A e o número m de objetos de


m
cada tipo são conhecidos, então o número de tipos distintos é k = . Ocorre
n
que, como nos exemplos anteriores, em muitas situações, estamos interessa-
dos em calcular o número de tipos de elementos distintos.
Agora, usando este novo “princípio” e tudo que já discutimos, você certa-
mente poderá resolver mais problemas de contagem.
T ENTE FAZER
- Em uma classe de 15 alunos, quantas filas formada por 7 alunos podem ser formadas?
E quantas comissões?
- Se o conjunto C possui 9 elementos, quantos são os subconjuntos de C com 4 elementos?
T ENTE FAZER
Uma comissão formada por 3 homens e 3 mulheres deve ser escolhida em um grupo de
8 homens e 5 mulheres. Quantas comissões podem ser formadas? (Resposta 560)
Qual seria a resposta se um dos homens não aceitasse participar da comissão se nela
estivesse determinada mulher? (Resposta 434)
T ENTE FAZER
De quantos modos 9 crianças podem formar uma roda de ciranda de modo que duas
dessas crianças permaneçam juntas? (Resposta 2!.7!)
E de modo que 4 dessas crianças permaneçam juntas? (Resposta 3!.5!)

FAZENDO GENERALIZAÇÕES
Do que discutimos até aqui podemos ver que alguns problemas de contagem
são muito semelhantes e envolvem sempre o mesmo tipo de raciocínio e cálculo.
Numa escolha de m objetos dentre n objetos distintos, no qual m < n, a
ordem em que fazemos a escolha determina objetos diferentes. Em todas essas
situações, o número de escolhas possíveis é n(n-1).(n-2)...(n-m+1). Por serem
muito freqüentes recebem um nome especial: arranjo simples de m elementos
em n, ou como é mais comum, arranjo de n elementos tomados m a m. Uma
notação bastante usada para indicar esse resultado é
n!
Anm =
( n − m)!
Em outras situações, temos que fazer uma escolha de m objetos dentre n
objetos, onde m < n, e a ordem em que fazemos a escolha não determina obje-
tos diferentes. Se a ordem fosse relevante, obteríamos n(n-1).(n-2)...(n-m+1)
coleções de objetos. Só que essa quantidade de coleções é maior do que a
correta, já que as coleções estão sendo contadas várias vezes. Para eliminar
essas repetições usamos, então, a divisão, como nos exemplos vistos anterior-
mente. O número de coleções é:
n( n − 1) ⋅ ( n − 2)...( n − m + 1)
m( m − 1) ⋅ ( m − 2)...2 ⋅1
Como também essa situação é bastante comum, ela recebe um nome espe-
cial: combinação simples de m elementos em n, ou ainda, combinação de n
elementos tomados m a m. E o resultado é denotado por
n! n 
Cnm = = 
m !( n − m)!  m


 

Apesar dos problemas anteriores aparecerem com freqüência, a ponto de terem um


nome especial (e uma fórmula), os problemas de contagem não são, em geral, do tipo
arranjo ou combinação. Por isso, quando se deparar com um problema de contagem,
não se preocupe de imediato em qual fórmula usar. Em geral, muita engenhosidade e
várias fórmulas serão utilizadas para resolvê-los.

DESAFIOS
Vamos propor alguns problemas de contagem de diferentes graus de difi-
culdade. Ao tentar resolvê-los, lembre-se: problemas de aparência simples
podem ser difíceis. Para resolvê-los procure fazer uma representação. Lem-
bre-se que o objetivo é o de contar o número de objetos de uma certa classe.
Tente identificar precisamente quando um objeto pertence à classe e quando
dois deles devem ser considerados distintos. Examine quantas decisões você
deve tomar para executar a contagem.
Caso ainda não esteja claro como proceder, tente outras estratégias. Tente
dividir em subcasos que você saiba resolver. Pode ser útil “esquecer” algumas
das condições exigidas para que um objeto pertença à coleção. Isso, em geral,
dará origem a uma classe maior que a desejada. É necessário, portanto, ex-
cluir posteriormente os objetos “indesejados”. Depois que, aparentemente, o
problema foi resolvido, repense na sua solução, veja se você não está contan-
do alguns casos mais de uma vez ou está se esquecendo de algum.
1. No quadro abaixo, de quantos modos é possível formar a palavra MATEMATICA,
partindo de M e indo sempre para a direita ou para baixo?
M
M A
M A T
M A T E
M A T E M
M A T E M A
M A T E M A T
M A T E M A T I
M A T E M A T I C
M A T E M A T I C A

2. Um vagão de metrô tem 10 bancos individuais, sendo 5 de frente e 5 de


costas. De 10 passageiros, 4 preferem sentar de frente, 3 preferem sentar de
costas e os demais não têm preferência. De quantas maneiras os passageiros
podem sentar, respeitando as preferências? (Resposta 43200)
3. Quantos números inteiros entre 100 e 999 são ímpares e possuem três dígi-
tos distintos? (Resposta 320).

O TRIÂNGULO DE PASCAL
Num jogo de moedas, jogam-se 4 moedas simultaneamente. Se o vence-
dor for o que conseguir obter exatamente 3 caras e 1 coroa, quantas são as
possíveis combinações ganhadoras?




Vamos denotar por K a face “cara” da moeda e por C a face “coroa”.


Assim, temos KKKC, KKCK, KCKK e CKKK combinações vencedoras. Na
verdade, já vimos este tipo de problema: esta é a quantidade de anagramas
4!
formados por KKKC. Assim, temos exatamente = 4 combinações. Mas se
3!
as combinações ganhadoras são as com exatamente 2 caras e 2 coroas? Neste
4!
caso são = 6 combinações. Note também que o número de combinações
2! 2!
com exatamente 3 coroas é também 4.
T ENTE FAZER
Num tipo de jogo, 5 moedas idênticas são lançadas simultaneamente. Cada jogador,
antes de jogar as moedas, declara qual o número exato de caras e coroas que vai obter.
Ganha aquele que acertar o resultado. Qual das combinações é a melhor escolha?

Você já notou que se n é o número de moedas a serem jogadas e se m é o


número de caras (ou coroas) que se deseja, então o número de combinações
“vencedoras” é exatamente:
n! n 
Cnm = = 
m !( n − m)!  m
É claro que se m é o número de caras (ou coroas), então n-m é o número
de coroas (ou caras) e assim temos facilmente que,
n  n!  n 
Cmm =   = = = Cnn − m
 m m !( m − n)!  n − m
Esses números aparecem em muitas situações e possuem várias relações
surpreendentes. Tais relações foram observadas por vários matemáticos como
o árabe Al-Karaji (fins do século X) e Niccoló Fontana de Brescia, conhecido
por Tartaglia (1499-1557).
Colocando os valores acima na forma de triângulo e convencionando que 0! = 1,
temos:
 0
 0

1  1
 0 1

 2  2  2
 0 1   2

 3  3  3  3
 0 1   2  3

 4  4  4  4  4
 0 1   2  3   4

 5  5  5  5  5  5
 0 1   2  3  4  5

 6  6  6  6  6  6  6
 0 1   2  3  4  5  6


 

Foi B. Pascal (1623-1662) quem popularizou este “triângulo” quando pu-


blicou, em 1654, um tratado mostrando a relação dos coeficientes de (a+b)n
com os valores que aparecem nas linhas do triângulo. Apesar de ser conheci-
do antes, o triângulo aritmético passou a ser conhecido como o Triângulo de
Pascal.
Calculando os valores em cada linha e coluna, temos:

Triângulo de Pascal
1
1 1
1 2 1
1 3 3 1
1 4 6 4 1
1 5 10 10 5 1
1 6 15 20 15 6 1
1 7 21 35 32 21 7 1
... ...

Note algumas propriedades interessantes. Se selecionarmos uma linha n


qualquer e adicionamos ao elemento da coluna p o elemento da coluna p+1 o
resultado está na (n+1)-linha e (p+1)-coluna. Veja neste exemplo.

1 3 + 3 1

1 4 6 4 1

Esta relação é também conhecida como a Relação de Stifel1.


TENTE FAZER
Mostre que, de fato, vale sempre que
 n   n   n +1 
Cnm + Cnm +1 =   +   +  = Cnm++11
 m  n + 2  m + 1

Retornemos ao jogo de moedas. Sabemos que quando lançamos n moe-


das, o número total de resultados possíveis é 2n. Vimos que cada combinação
de m caras (ou coroas) aparece Cnm vezes. Portanto, somando-se todas as com-
binações temos que:
 n  n  n  n
Cn0 + Cn1 + Cn2 + ... + Cnn =   +   +   + ... +   = 2n
 0 1   2  n
Vamos agora representar os resultados dos lançamentos das moedas de
outra maneira.

1. Michael Stifel (1486-1567) é considerado como o maior algebrista alemão do século XVI.




Se jogarmos 2 moedas, temos 4 resultados possíveis. Se usarmos o símbo-


lo de soma e a propriedade distributiva, todas as combinações possíveis po-
dem ser representadas por:

KK + KC + CK + CC = (K + C) (K + C)

Mas neste jogo, KC = CK, isto é, ambas são combinações “vencedoras”.


Então:

KK + 2KC + CC = (K + C) (K + C)

No caso de jogarmos 3 moedas, sabemos que existem 8 possíveis resulta-


dos, mas as combinações KKC, KCK e CKK são “iguais” para o nosso propó-
sito. Assim também são “iguais” as combinações: CCK, CKC, KCC. Portanto:

KKK + 3 KKC + 3 KCC+ CCC = (K + C) (K + C) (K + C)

Podemos ainda simplificar a notação e escrever as seqüências de K ou C


na forma de potência. Por exemplo, escrevemos KKK da forma K3.
Assim:

K3 + 3 K2 C + 3 KC 2+ C 3 = (K + C)3

Mas isso pode ser feito sempre. Se jogarmos n moedas e se as combina-


ções que têm o mesmo número de K (caras) e C (coroas) são identificadas, ou
n 
seja, são “iguais”, então cada combinação aparece
 m vezes. Portanto, em
geral, temos que:

 n  n  n  n   n
( K + C ) n =   K n +   K n −1C +   K n −1C 2 + ... +   KC n −1 +   C n
 0 1   2  n − 1  n

Esta é a conhecida fórmula do Binômio de Newton. Isaac Newton (1642-


1727) mostrou como desenvolver expressões do tipo (a+b)r, com r racional, e
assim a fórmula acabou sendo conhecida com o seu nome. Contudo, o desen-
volvimento de uma expressão do tipo (a+b)n já era conhecida e usada antes.
T ENTE FAZER
Usando o desenvolvimento acima, dê uma expressão para (1+x)n

Observe que as linhas do Triângulo de Pascal são os coeficientes da ex-


pressão do binômio.
T ENTE FAZER
Qual é o coeficiente do termo a11b6 no desenvolvimento (a+b)17 ?

Há muito mais a ser explorado no Triângulo de Pascal. As relações numé-


ricas que aparecem surpreendem. Convidamos você a ler mais sobre isso em
[MORGADO] (ver referência). Você certamente ficará impressionado.


 

Bibliografia
BUSSAB, W.O.; MORETTIN, P. A. Estatística Básica. São Paulo: ed. Saraiva,
2002.
CARNEIRO, V.C. Colorindo Mapas. Revista do Professor de Matemática. São
Paulo: SBM, n. 29, 31-35, 1995.
CERRI, C.; DRUCK, I. F.; PEREIRA, A. L. Combinatória Sem Fórmulas. Pro-
jeto Pró-Ciências, São Paulo: Fapesp, 2002.
CERRI, C.; DRUCK, I .F. Combinatória Sem Fórmulas. Projeto PEC – Cons-
truindo Sempre – PEB II, São Paulo: USP-SEE, 2003.
EVES, H. Introdução à História da Matemática.3. ed. Tradução de H.
Domingues. Campinas: ed. Unicamp, 2002.
IEZZI, G. et al. Matemática: Ciência e Aplicações., v. 1, 2 e 3. São Paulo: ed.
Atual, 2001.
MAGALHÃES, M. N.; LIMA, A. C. P. Noções de Probabilidade e Estatística.
São Paulo: Edusp, 2004.
MACHADO, A. S. Matemática na escola do segundo grau. vol 1, 2 e 3. São
Paulo: ed. Atual, 1996.
MORGADO et al. Análise Combinatória e Probabilidades. Rio de Janeiro:
SBM, 1991.
PAIVA, M. Matemática.2. ed. vol 1, 2 e 3. São Paulo: ed. Moderna, 2003.

Sobre os autores
Cristina Cerri
Docente do Instituto de Matemática e Estatística (IME) da USP, fez Licen-
ciatura e Mestrado em Matemática na USP. Seu doutorado, na área de Análise
Funcional, foi realizado na USP e na University of New Mexico nos EUA.
Participa de projetos de capacitação e atualização de professores e foi coorde-
nadora da área de Matemática do Programa Construindo Sempre USP-SEESP.

Lisbeth K. Cordani
Licenciada e bacharela em Matemática (USP), mestra em Estatística (USP)
e doutora em Educação (USP). Docente (aposentada) do IME-USP, atualmen-
te é professora titular do CEUN-IMT. Tem oferecido oficinas de Estatística e
participado de projetos para professores universitários e do Ensino Médio.


Anotações
Anotações
Anotações
Anotações
Anotações

You might also like