You are on page 1of 13

Initiation aux statistiques et probabilit es : recueil dexercices

R. S. Stoica
Universit e Lille 1 Laboratoire Paul Painlev e 59655 Villeneuve dAscq Cedex, France radu.stoica@math.univ-lille1.fr

Septembre, 2010

Introduction

Les exercices de ce recueil ont constitu e les sujets dexamen du cours Initiation aux statistiques et probabilit es que je donne aux etudiants en deuxi` eme ann ee de licence en Sciences de la Vie et de la Terre ` a lUniversit e Lille 1, depuis lautomne 2006. Le cours comprend un volume horaire de 20 heures, et il est ce que lon appelle un cours-td. Cest-` a-dire que lenseignement comprend ` a la fois des parties de cours magistral et des parties consacr ees aux applications, aux exercices. La di erence par rapport au cadre classique cours et td, cest que dans ce cas cest lenseignant qui d ecide du poids quil doit donner ` a chacune de ces deux composantes. Malgr e la souplesse de cette nouvelle formule, je trouve le temps aect e a cet enseignement vraiment insusant. A vrai dire, ` ` a cause de cela jai eu lintention dappeler ce cours Eveil aux statistiques et probabilit es. En eet, selon la formule classique 20 heures comprendraient 5 s eances de cours de 2 heures, complet ees par 5 s eances de travaux dirig es de 2 heures egalement. Suivant la m eme ancienne formule, consid erons le semestre de 14 semaines denseignement avec un cours et un td par semaine. Il est facile de remarquer quelques faits notables, comme par exemple celui-ci : 14 4 = 20. A quelques rares exceptions, le niveau g en eral en math ematiques des etudiants rencontr es en cette li` ere est faible. Dans mon opinion, ceci est ind ependant de leur intelligence, leur capacit e dapprendre et leur soif de vivre. Malgr e toutes leurs qualit es, ce cours pose beaucoup de dicult es aux etudiants car il sappuie sur des pre-r equis math ematiques solides. En plus, cest peut etre un des premiers enseignements o` u ils sont amen es ` a r e echir et non plus faire des exercices. Dans ce contexte, pendant ce cours jai d ecid e de limiter les d eg ats. Cependant, souvent je me suis demand e si je ne suis pas en train denseigner le programme de seconde ... LUniversit e a une double mission. La premi` ere est de pr eparer les etudiants a int ` egrer les structures socio- economiques daujourdhui, qui sont toujours en perp etuelle transformation. La deuxi` eme mission est de pr eparer les etudiants ` a trouver des r eponses aux questions quaujourdhui on trouve tr` es diciles et aussi ` a formuler les questions et les probl` emes ouverts des ann ees ` a venir.

3 Je ne peux pas memp echer de me demander comment nos etudiants vont trouver des solutions aux probl` emes qui se poseront bient ot ` a eux ? Sans doute, en sappuyant sur leur extraordinaires qualit es. Peut- etre aussi en utilisant un peu lexp erience de leurs enseignants. Ceci dit, je ne sais pas si avec le morcellement actuel de lenseignement dans certaines li` eres universitaires auquel sassocie trop souvent la r eduction du nombre dheures, lon donne aux etudiants les el ements les plus concrets pour avoir conance dans la vie. Pour la construction de cet enseignement jai beneci e de laide de mes coll` egues Jeanne Devolder, Nelly Hanoune, Philippe Heinrich et Bernard Lecocq qui ont g en ereusement mis ` a ma disposition leur ressources p edagogiques. Jai egalement utilis e des exercices et des donn ees provenant de pages Web dautres coll` egues en France ou bien ` a l etranger. Les documents mis en ligne par le collectif des statisticiens et probabilistes de lInstitut de Math ematiques de lEPFL a constitu e egalement une source importante dexercices. Jai aussi utilis e des exemples et des exercices des livres tr` es connues comme [1] ou la premi` ere edition de [2]. Certaines des donn ees utilis ees proviennent de sites http://www.insee.fr/ ou http://www.statsci.org/. A tous ces gens et ` a tous ceux que seulement par hasard jai d u oublier, jadresse mes remerciements les plus sinc` eres.

Exercices

Exercice 1.1. Les donn ees suivantes repr esentent les valeurs dun indicateur statistique calcul e chaque ann ee pour les pays de lUE. Cet indicateur mesure l emission totale de gaz ` a eet de serre. (Donn ees INSEE). Ann ee Allemagne Espagne France 1995 88,9 110,0 98,5 1996 89,6 107,7 101,3 1997 86,6 114,8 100,1 1998 84,6 118,5 102,5 1999 81,9 128,2 99,6 2000 81,8 133,1 98,7 2001 83,2 133,2 99,0 2002 81,7 139,1 97,4 2003 81,7 141,6 97,9 2004 80,9 147,0 97,9

a) Calculez les quartiles empiriques q25% , q50% et q75% correspondantes. b) Tracez et comparez les diagrammes en bo tes(-` a moustaches) de donn ees. c) Est-ce que vous identiez des valeurs aberrantes ? d) Interpr etez les r esultats obtenus. Exercice 1.2. Les donn ees suivantes repr esentent les quantit es de pr ecipitations enregistr ees pour des nuages naturels ainsi que pour des nuages trait es chimiquement. 7.09 6.72 5.91 5.84 5.77 5.49 5.09 4.99 4.55 4.46 4.39 4.22 3.85 3.71 3.60 3.36 Nuages naturels : 3.35 3.26 3.26 3.19 3.07 2.85 2.44 1.58 1.58 0.01 7.91 7.43 7.41 6.88 6.55 6.19 6.06 5.81 5.71 5.61 5.61 5.54 5.49 5.30 5.29 4.86 Nuages trait es : 4.77 4.77 4.74 4.52 3.70 3.48 3.44 2.86 2.04 1.41 a) Calculez les quartiles empiriques q25% , q50% et q75% correspondantes. b) Tracez et comparez les diagrammes en bo tes(-` a moustaches) de donn ees. c) Est-ce que vous identiez des valeurs aberrantes ? d) Interpr etez les r esultats obtenus.

Exercice 1.3. Les donn ees suivantes repr esentent laire du corpus callosum (partie qui relies les deux h emisph` eres du cerveau) en [cm2 ] pour un echantillon de 10 femmes et 10 hommes.

5 Femmes Hommes 6.08 7.99 5.73 8.76 6.22 6.32 5.80 6.32 7.99 7.60 8.42 7.62 7.44 6.03 6.84 6.59 6.48 7.52 6.43 7.67

a) Tracez les deux diagrammes tige-feuilles. b) Calculez les quantiles empiriques Q25% , Q50% et Q75% . c) Tracez et comparez les diagrammes en bo tes(-` a moustaches) de deux suites de donn ees. Exercice 1.4. Les pistons dun moteur automobile comportent des anneaux forg es. Les donn ees suivantes repr esentent le diam` etre int erieur (en m100) de ces pi` eces. 1030 1002 992 995 992 1014 1121 1002 1015 1009 1001 988 1024 1021 1005 994 997 1007 1015 985 a) Tracez lhistogramme. b) Calculez les quantiles empiriques Q25% , Q50% et Q75% , ainsi que la moyenne et l ecart-type de l echantillon. c) Apr` es v erication, une valeur aberrante a et e d et ect ee (1121). Apr` es avoir elimin e cette valeur calculez la moyenne et la m ediane. Comparez les r esultats obtenus avec ceux du point b). Exercice 1.5. Pour comparer leet de la vitamine C du jus dorange et de lacide ascorbique de synth` ese, on a donn e du jus dorange ` a un group de 10 cobayes, et de la vitamine de synth` ese ` a un groupe de 10 autres cobayes, pendant six semaines, et on a mesur e la longueur des odontoblastes des incisives. On a obtenu les r esultats suivants : Jus dorange Acide ascorbique 8.2 4.2 9.4 5.2 9.6 5.8 9.7 6.4 10.0 7.0 14.5 7.3 15.2 10.01 16.1 11.2 17.6 11.3 21.5 11.5

a) Tracez les deux diagrammes tige-feuilles. b) Calculez les quantiles empiriques Q25% , Q50% et Q75% . c) Tracez et comparez les diagrammes en bo tes(-` a moustaches) de deux suites de donn ees. d) Est-ce que vous identiez des valeurs aberrantes ? e) Interpr etez les r esultats obtenus. Exercice 1.6. Une entreprise souhaite comparer les performances en terme de bruit des deux ltres pour automobiles. On a obtenu les mesures suivantes :

6 Filtre A Filtre B 810 835 820 815 820 835 820 825 820 845 820 825 840 855 820 770 840 850 825 760 845 760 775 765 785 760 775 820 790 770 775 825 785 825 835 825

a) Tracez les deux diagrammes tige-feuilles. b) Calculez les quantiles empiriques Q25% , Q50% et Q75% pour les deux ltres. c) Tracez et comparez les diagrammes en bo tes(-` a moustaches) de deux suites de donn ees. d) Est-ce que vous identiez des valeurs aberrantes ? e) Interpr etez les r esultats obtenus. Exercice 1.7. Les donn ees suivantes repr esentent le pourcentage de la force de travail employ ee en agriculture, industrie et services pour 10 pays europ eens pendant lann ee 1960. Nous allons comparer la distribution de la force de travail dans ces trois secteurs. Agriculture Industrie Services 14 53 33 4 56 40 18 45 37 15 60 25 20 44 36 6 52 42 20 49 32 36 30 34 27 46 28 44 33 23

a) Tracez les trois diagrammes tige-feuilles. b) Calculez les quartiles empiriques Q25% , Q50% et Q75% correspondantes. c) Tracez et comparez les diagrammes en bo tes(-` a moustaches) de donn ees. d) Est-ce que vous identiez des valeurs aberrantes ? e) Interpr etez les r esultats obtenus. Exercice 1.8. Les donn ees suivantes repr esentent les pourcentages de femmes qui travaillent enregistr es dans 19 villes des Etats-Unis, pendant les ann ees 1968 et 1972, respectivement. 1972 45 50 52 45 46 55 60 49 35 55 52 53 57 53 1968 45 50 52 45 43 55 45 34 45 54 42 51 49 54 a) Tracez les deux diagrammes tige-feuilles. b) Calculez les quartiles empiriques Q25% , Q50% et Q75% correspondantes. c) Tracez et comparez les diagrammes en bo tes(-` a moustaches) de donn ees. d) Est-ce que vous identiez des valeurs aberrantes ? e) Interpr etez les r esultats obtenus. Exercice 2.1. Les donn ees ci-dessous repr esentent vingt mesures de l epaisseur dun l en m.

59 50

64 58

50 49

553 527

558 555

544 534

547 579

488 575

561 529

565 510

427 586

529 585

530 536

a) Repr esentez ces donn ees ` a laide dun histogramme. b) Calculez la moyenne et la variance de l echantillon. Dans la suite de cet exercice, on suppose que les donn ees proviennent dune loi normale. c) Superposez ` a lhistogramme la courbe de la densit e normale avec cette moyenne et cette variance. d) Calculez la probabilit e que l epaisseur soit inf erieure ` a 510m. e) D eterminez l epaisseur du l telle que 20% des valeurs lui soient sup erieures.

Exercice 2.2. Les donn ees ci-dessous repr esentent la taille (en millim` etres) des oeufs de deux oiseaux, le Pipit des arbres et le Troglodyte familier. Pipit des arbres 21.05 23.45 21.85 23.45 22.05 23.65 22.45 23.85 22.65 24.05 23.25 24.05 23.25 24.05 23.25 21.05

Troglodyte familier

19.85 21.05

20.05 21.25

20.25 21.45

20.85 22.05

20.85 22.05

20.85 22.05

21.05

a) Tracez les deux diagrammes tige-feuilles. b) Calculez les quantiles empiriques Q25% , Q50% et Q75% . d) Tracez et comparez les diagrammes en bo tes(-` a moustaches) de deux suites de donn ees. d) Parmi les donn ees, y a-t-il des valeurs aberrantes ? Exercice 2.3. Soit les observations suivantes : X Y 9 20 3 9 2 5 5 13 10 22 1 5 9 20

a) Dessinez le diagramme en nuage de points. b) Calculez le coecient de corr elation r . c) Calculez les param` etres a et b de la droite de moindres carr es Y = aX + b + . Exercice 2.4. Les donn ees suivantes sont issues dun etude statistique du gouvernement Britannique. Dans 11 r egions, on a enregistr e les d epenses moyennes dun foyer pour les boissons alcoolis ees et le tabac :

Alcool Tabac

6.47 4.03

6.13 3.76

6.19 3.77

4.89 3.34

5.63 3.47

4.52 2.92

5.89 3.20

4.79 2.71

5.27 3.53

6.08 4.51

4.02 4.56

a) Dessinez le diagramme en nuage de points. b) Calculez le coecient de corr elation r . c) Calculez les param` etres a et b de la droite de moindres carr es Y = aX + b + . d) Est-ce que vous pouvez observer un couple de valeurs qui a une grande inuence sur la forme de la droite de moindre carr es ? Exercice 2.5. Les donn ees suivantes repr esentent le nombre de buts marqu es et encaiss es par l equipe Olympique Lyonnais lors de la premi` ere partie du saison jusquau 15 d ecembre 2008 de la Ligue 1 de Football 2008/2009. Le nombre de buts a et e pr elev e tous les 15 minutes. Minutes Buts marqu es Buts encaiss es 0 - 15 2 2 15 - 30 2 3 30 - 45 8 1 45-60 4 2 60 - 75 4 2 75 - 90 2 2

a) Dessinez les histogrammes des deux jeux de donn ees. b) Comparez les deux distributions en utilisant la moyenne, la m ediane et le mode. c) Quelle est la loi de probabilit e des buts marqu es ? Et celle des buts encaiss es ? d) Dapr` es ces donn ees, quelle est la probabilit e que Lyon marque dans le premier quart dheure ou dans le dernier quart dheure du match ? Et quelle est la probabilit e que Lyon encaisse un but apr` es un quart dheure de jeu ? e) Quelles sont les qualit es de Lyon : d efense ou attaque ? R epondez ` a cette question en vous laissant guider par la raison et surtout par lanalyse statistique des donn ees de cet exercice. Exercice 2.6. Les donn ees suivantes repr esentent le nombre de buts marqu es et encaiss es par l equipe de Bordeaux lors de la saison 2008/2009 de la Ligue 1 de Football. Le nombre de buts a et e pr elev e tous les 15 minutes. Minutes Buts marqu es Buts encaiss es 0 - 15 7 4 15 - 30 6 5 30 - 45 9 7 45-60 12 8 60 - 75 12 3 75 - 90 16 6

a) Dessinez les histogrammes des deux jeux de donn ees. b) Comparez les deux distributions en utilisant la moyenne, la m ediane et

9 le mode. c) Quelle est la loi de probabilit e des buts marqu es ? Et celle des buts encaiss es ? d) Dapr` es ces donn ees, quelle est la probabilit e que Bordeaux marque dans le premier quart dheure ou dans le dernier quart dheure du match ? Et quelle est la probabilit e que Bordeaux encaisse un but apr` es un quart dheure de jeu ? e) Quelles sont les qualit es de Bordeaux : d efense ou attaque ? R epondez ` a cette question en vous laissant guider par la raison et surtout par lanalyse statistique des donn ees de cet exercice. Exercice 2.7. Les donn ees suivantes repr esentent les mesures eectu ees par Henry Cavendish en 1798 pour evaluer la densit e de la terre : 5.50 5.29 5.75 5.57 5.34 5.29 5.42 5.26 5.10 5.61 5.44 5.86 5.53 5.46 5.58 5.47 5.55 5.27 4.88 5.34 5.85 5.62 5.30 5.65 5.63 5.36 5.39 4.07 5.79

a) Tracez le diagramme tige-feuilles. b) Repr esentez les donn ees ` a laide dun histogramme. c) Est-ce quil y a des donn ees aberrantes ? Argumentez. d) Les exp eriences montrent que la densit e moyenne de la terre est 5.42. Dans ce cas, quel est le meilleur estimateur de cette quantit e la moyenne empirique ou la m ediane ? Argumentez. Exercice 2.8. Les donn ees suivantes repr esentent l evolution du pourcentage demballages (verre) recycl es par rapport ` a la production demballages (Donn ees INSEE - France m etropolitaine). Ann ee Verre recycl e 1985 16,7 1990 26,8 1995 39,5 2000 49,7 2005 59,7 2006 59,5 2007 61,6

a) Dessinez le diagramme en nuage de points. b) Calculez le coecient de corr elation r . c) Calculez les param` etres a et b de la droite de moindres carr es Y = aX + b + . d) Faites une pr ediction de ce pourcentage pour lann ee 2010. Exercice 3.1. a) Calculez la moyenne, la m ediane et les quartiles (Q25% et Q75% ) dune variable continue X qui suit une loi uniforme dans lintervalle

10 [10, 20]. b) G en eralisez au cas dune loi uniforme sur lintervalle [a, b].

Exercice 3.2. Les notes possibles donn ees aux r eponses dun questionnaire en biologie vont de 0 ` a 10. La note moyenne est de 6.7 et l ecart-type de 1.2. En supposant que les notes soient distribu ees suivant une loi normale, d eterminez a) la note que les 10% les plus mauvais de la classe nont pas d epass ee. b) la note que les 10% les meilleurs de la classe ont tous d epass ee. Exercice 3.3. a) D eterminez les quantiles ` a 5%, 10%, 90% et 95% dune densit e normale 2 avec param` etres = 0 et = 1. b) Utilisez les r esultats pr ec edents pour d eterminer ces m emes quantiles 2 pour une densit e normale de param` etres = 5 et = 4. Exercice 3.4. Soit X une variable al eatoire qui suit une loi normale de 2 param` etres = 2 et = 4. Calculez : a) P (X < 2) b) P (X + 2 > 2) c) P (|2X + 2| 2) d) P (|X 2 + cos(X ) 2| < 0) Exercice 3.5. a) D eterminez les quantiles ` a 7%, 17%, 92% et 97% dune densit e normale 2 avec param` etres = 0 et = 1. b) Utilisez les r esultats pr ec edents pour d eterminer ces m emes quantiles 2 pour une densit e normale de param` etres = 3 et = 4. Exercice 3.6. a) D eterminez les quantiles ` a 8%, 19%, 91% et 99% dune densit e normale avec param` etres = 0 et 2 = 1. b) Utilisez les r esultats pr ec edents pour d eterminer ces m emes quantiles 2 pour une densit e normale de param` etres = 1.5 et = 9. Exercice 3.7. Soit X une variable al eatoire r eelle de loi N (, 2 ), avec P (X > 3) = 0.8413 et P (X > 9) = 0.0228. a) En utilisant la table de la loi normale centr ee r eduite, etablir deux equations lin eaires dont et sont solutions.

11 b) D eterminez et . Exercice 3.8. Soit X une variable al eatoire r eelle de loi N (, 2 ), avec = 2 et 2 = 9. Calculez. a)P (X < 0) b)P (X + 2 2) c)P (|X + 2| 2) d)P (|X 2 + 3 X 2| < 0) Exercice 4.1. Les densit es normales sont souvent utilis es pour d ecrire les scores des tests de quotient intellectuel (QI). Les sp ecialistes admettent g en erallement comme param` etres = 100 et = 15 pour r epresenter la r epartition de cette variable. a) Calculez la probabilit e quune personne ait un QI compris entre 100 et 130. b) D eterminez la proportion de la population dont le QI est sup erieur ` a 130. Exercice 4.2. Soit X une variable al eatoire normale de param` etres = 3 et = 2. Calculez a) P (2 X < 5) b) P (X 0) c) P (|X 3| 1) Soient maintenant et quelconques. Calculez c) P ( 1.96 X + 1.96 ) Exercice 4.3. Soit une bo te qui contient cent allumettes dont dix sont d efectueuses. a) On choisit cinq allumettes au hasard. Quelle est la probabilit e quaucune ne soit d efectueuse ? Quelle est la probabilit e quexactement une soit d efectueuse ? b) Si lon choisit dix allumettes quelle est la probabilit e quexactement deux soient d efectueuses ? Exercice 4.4. Soit P la probabilit e d enie sur lespace de congurations . Consid erons deux ev enements quelconques, A et B des sous-ensembles de . Prouvez les propri etes suivantes : c a) P (A ) = 1 P (A) b) A B P (A) P (B ) c) 0 P (A) 1 d) P (A B ) = P (A) + P (B ) P (A B )

12

Exercice 4.5. Dans une clinique, on eectue un test m edical sur n = 140 personnes, pour savoir si elles sont s eropositives ou pas. La probabilit e quune personne soit d etect ee positive ` a ce test, alors quelle nest pas porteuse du virus HIV, est p = 0.005. Soit X le nombre de personnes d etect ees positives au test, alors quelles sont en bonne sant e. a) Quelle est la loi de X ? b) Calculez P (X = 2) et P (X 1). Exercice 4.6. Soit la densit e de probabilit e donn ee par f (x) = a tan2 (x) 1 + cos(2x) + 2 1 + tan2 (x)

et d enie dans lintervalle [0, /2). a) Trouvez la constante a tel que f (x) soit bien d enie. b) Calculez la P (/6 < X < /3). c) Calculez E[X ] et V ar [X ]. Exercice 5.1. On consid` ere deux sous-ensembles disjoints A et B dun ensemble , pour lesquels P (A) = a > 0 et P (B ) = b > 0. Ecrivez en fonction de a et b les probabilit es suivantes. a) P (A B ) b) P (A B ) c) P (Ac B ) d) P ((A B )c ) e) P (Ac B c ) f) P (A \ B ) Exercice 5.2. On consid` ere deux sous-ensembles non-disjoints A et B dun ensemble . Nous savons egalement que A B , P (A) = a > 0 et P (B ) = b > 0. Ecrivez en fonction de a et b les probabilit es suivantes. a) P (A B ) b) P (A B ) c) P (Ac B ) d) P ((A B )c ) e) P (Ac B ) f) P (Ac \ B c ) Exercice 5.3. La dur ee de vie dun composant dune machine a une distribution continue sur lintervalle [0, 40] avec densit e de probabilit e f (x) =

13 c(2x + 5). a) Trouvez la constante c tel que f (x) soit bien une densit e de probabilit e. b) Calculez la probabilit e que la dur ee de vie du composant de la machine soit moins que 6. c) Calculez E[X ] et V ar [X ]. Exercice 5.4. Soit la densit e de probabilit e donn ee par f (x) = c sin(x) et d enie dans lintervalle [0, ]. a) Trouvez la constante c tel que f (x) soit bien d enie. b) Calculez la P (/4 < X < 3/4). c) Calculez E[X ] et V ar [X ]. Exercice 5.5. Soit la densit e de probabilit e donn ee par f (x) = a cos(x) et d enie dans lintervalle [/2, /2]. a) Trouvez la constante a tel que f (x) soit bien d enie. b) Calculez la P (/4 < X < /4). c) Calculez E[X ] et V ar [X ]. Exercice 5.6. Soit la densit e de probabilit e donn ee par f (x) = a(cos2 (x) + 2 sin (x)) et d enie dans lintervalle [0, /2]. a) Trouvez la constante a tel que f (x) soit bien d enie. b) Calculez la P (/6 < X < /3). c) Calculez E[X ] et V ar [X ]. Exercice 5.7. Soit la densit e de probabilit e donn ee par f (x) = a exp[2x] et d enie dans lintervalle [0, ). a) Trouvez la constante a tel que f (x) soit bien d enie. b) Calculez les quartiles de cette distribution, cest ` a dire q25% , q50% et q75% .

References
[1] D. S. Moore and G. P. McCabe. Introduction to the Practice of Statistics. W. H. Freeman and Company, 1989. [2] G. Saporta. Probabilit es, analyse des donn ees et statistique, 2` eme edition. Technip, 2006.

You might also like