You are on page 1of 7

0.

Introduction
MTH2302D
S. Le Digabel et F. Gilbert, Ecole Polytechnique de Montr eal

A2013
(v2)

MTH2302D: probabilit es

1/7

Analyse de donn ees


Expressions ` a la mode :
Data mining. Business analytics. Big data.

Importance de la visualisation et de lanalyse statistique densembles de donn ees :


Recherche scientique. Contr ole de la qualit e en ing enierie. Prise de d ecision en entreprise. Elaboration de politiques publiques. Sondages.

MTH2302D: probabilit es

2/7

Echantillon al eatoire
Les m ethodes statistiques ne sont justi ees que si lon dispose dun echantillon al eatoire. Pour savoir si un echantillon de donn ees est al eatoire ou non, il faut se renseigner sur la m ethodologie qui a et e utilis ee pour la collecte de ces donn ees : Exemple (www.cyberpresse.ca) : Le sondage a et e r ealis e du 22 au 25 ao ut 2012
par lentremise dentrevues t el ephoniques. L echantillon a et e tir e al eatoirement dans la r egion de Qu ebec, constitu ee de 12 circonscriptions provinciales d enies selon la nouvelle carte electorale de 2011. Les r epondants ont et e s electionn es de fa con al eatoire parmi les citoyens de 18 ans et plus dans les m enages contact es. Au total, 1007 entrevues ont et e r ealis ees. Les donn ees densemble ont et e pond er ees sur la base du recensement de 2011 en fonction du sexe, de l age et de la r epartition d emographique (circonscription) de la population, de fa con ` a rendre les r esultats conformes ` a la situation g en erale de la population de la r egion de Qu ebec. Les r esultats densemble comportent une marge derreur echantillonnale de 3,1%, selon un intervalle de conance de 95%.

MTH2302D: probabilit es

3/7

Echantillon al eatoire : Exemple


Une rme de sondages contacte des gens choisis au hasard dans des listes t el ephoniques. Les r epondants forment un echantillon al eatoire. Les visiteurs dun site web qui choisissent de r epondre ` a un sondage propos e sur le site ne forment pas un echantillon al eatoire. La population dun pays qui r epond ` a un recensement command e par son gouvernement ne forme pas un echantillon al eatoire.

MTH2302D: probabilit es

4/7

Inf erence statistique : R esum e

On veut conrmer ou inrmer une hypoth` ese au sujet dune population. On pr el` eve un echantillon al eatoire dans la population. On utilise des r` egles issues de la th eorie des probabilit es pour evaluer lhypoth` ese en se basant sur l echantillon. Les r` egles fournissent le niveau de conance de la conclusion obtenue.

MTH2302D: probabilit es

5/7

Inf erence statistique : R esum e


Dans le cadre du projet de session, vous devrez trouver des donn ees qui vous int eressent et les etudier ` a laide des m ethodes statistiques vues en classe. O` u trouver des donn ees ?
Base de donn ees de Statistique Canada : http ://www5.statcan.gc.ca/cansim. Bases de donn ees de lONU : http ://unstats.un.org/unsd/databases.htm. etc.

Quels types de donn ees ? Univari ees (histogrammes), bivari ees (nuages de points), s eries temporelles, etc.
MTH2302D: probabilit es 6/7

Probabilit es
La premi` ere partie du cours porte sur la th eorie de la probabilit e. Nous nen discutons pas tout de suite, mais donnons simplement un exemple c el` ebre et contre-intuitif : Paradoxe des anniversaires : Dans un groupe de n personnes, le probabilit e davoir au moins deux personnes n ees le m eme jour est de 365! 1 (365 n)!365n (en ignorant les gens n es le 29 f evrier). Cette probabilit e d epasse 50% pour n = 23 et vaut environ 97% pour n = 50. Probl` eme de Monty-Hall : Wikipedia.

MTH2302D: probabilit es

7/7

You might also like