Pour les articles homonymes voir Statistique homonymie La statistique ou les statistiques est la discipline qui étudie d
Statistique

La statistique ou les statistiques est la discipline qui étudie des phénomènes à travers la collecte de données, leur traitement, leur analyse, l'interprétation des résultats et leur présentation afin de rendre ces données compréhensibles par tous. C'est à la fois une branche des mathématiques appliquées, une méthode et un ensemble de techniques.

Partie de | Mathématiques, science formelle |
---|---|
Pratiqué par | |
Champs | Statistique descriptive statistique inférentielle (d) |
Objets | Donnée statistique loi de probabilité |
Histoire | Histoire des statistiques |
La statistique est un domaine des mathématiques et de plus en plus, elle fait partie de ce que l'on appelle aujourd'hui la science des données (en anglais : Data Science). L'analyse applique des lois mathématiques plus générales (ensembles, groupes, inclusion, exclusion). Elle possède une composante théorique ainsi qu'une composante appliquée. La composante théorique s'appuie sur la théorie des probabilités et forme avec cette dernière, l'analyse de phénomènes aléatoires. La statistique appliquée est utilisée dans presque tous les domaines de l'activité humaine : ingénierie, management, économie, biologie, informatique, la physique (fondamentaux de la physique quantique, par exemple). La statistique utilise des règles et des méthodes sur la collecte des données, pour que celles-ci puissent être correctement interprétées, souvent comme composante d'une aide à la décision. Le statisticien a pour profession la mise au point d'outils statistiques, dans le secteur privé ou le secteur public, et leur exploitation généralement dans un domaine d'expertise.
Étymologie
D'usage généralisé en français vers 1785, dérivé de l’italien statista (« homme d’État, statiste »), emprunté à l'allemand Statistik, forgé ou repris, vers 1749, par l'économiste Gottfried Achenwall : la statistique représentant pour lui l'ensemble des connaissances que doit posséder un homme d’État. C'est son ouvrage Aperçu sur la gestion étatique des empires et républiques européens les plus distingués à l'usage des cours universitaires (Abriss der neuesten Staatswissenschaft der vornehmsten Europäischen Reiche und Republiken zum Gebrauch in seinen Akademischen Vorlefungen) paru en 1749 qui conféra son rayonnement à la notion.
Histoire
Bien que le nom de statistique soit relativement récent – on attribue en général l'origine du nom au XVIIIe siècle, de l'allemand Staatskunde (connaissance ou science de l'État) – cette activité semble exister dès la naissance des premières structures sociales. D'ailleurs, les premiers textes écrits retrouvés sont des recensements du bétail, des informations sur son cours et des contrats divers. On a ainsi tracé des recensements en Chine ou en Égypte, au XVIIIe siècle av. J.-C. Ce système de recueil de données se poursuit jusqu'au XVIIe siècle. En Europe, le rôle de collecteur de données est souvent tenu par des guildes marchandes, puis par les intendants de l'État.
Ce n'est qu'au XVIIIe siècle que l'on voit apparaître le rôle prévisionnel des statistiques, avec la construction des premières tables de mortalité. Antoine Deparcieux écrit en 1746 l'Essai sur les probabilités de la durée de vie humaine. Elles vont d'abord servir aux compagnies d'assurances sur la vie, qui se créent alors.
La statistique est aussi un appui pour l'histoire prospective ou rétrospective, de la démographie notamment. Ainsi en 1842, le Baron de Reiffenberg présentait-il à l'Académie ses calculs rétrospectifs de population chez des peuples gaulois, d'après des données chiffrées laissées par Jules César dans ses Commentaires sur la Guerre des Gaules (De bello Gallico, v.).
Les statistiques mathématiques s'appuyaient sur les premiers travaux concernant les probabilités, développés par Fermat et Pascal. C'est probablement chez Thomas Bayes que l'on vit apparaître un embryon de statistique inférentielle. Condorcet et Laplace parlaient encore de probabilité, là où l'on parlerait aujourd'hui de fréquence. Mais c'est à Adolphe Quetelet que l'on doit l'idée que la statistique est une science s'appuyant sur les probabilités.
Le XIXe siècle voit cette activité prendre son plein essor. Des règles précises sur la collecte et l'interprétation des données sont édictées. La première application industrielle des statistiques eut lieu lors du recensement américain de 1890, qui mit en œuvre la carte perforée inventée par le statisticien Herman Hollerith. Celui-ci avait déposé un brevet au bureau américain des brevets.
Au XXe siècle, ces applications industrielles se développèrent, d'abord aux États-Unis, qui étaient en avance sur les sciences de gestion, puis seulement après la Première Guerre mondiale en Europe. Le régime nazi employa des méthodes statistiques à partir de 1934 pour le réarmement. En France, on était moins au fait de ces applications.
L'application industrielle des statistiques en France se développe avec la création de l'Insee, qui remplaça le Service National des Statistiques créé par René Carmille.
L'avènement de l'informatique, dans les années 1940 (aux États-Unis), puis en Europe (dans les années 1960), permit de traiter un plus grand nombre de données, mais surtout de croiser entre elles des séries de données de types différents. C'est le développement de ce qu'on appelle l'analyse multidimensionnelle. Au cours du siècle, plusieurs courants de pensée vont s'affronter :
- les objectivistes ou fréquentistes, qui pensent que les probabilités fournissent un modèle permettant d'idéaliser la distribution en fréquence, et que là s'arrête leur rôle ;
- les subjectivistes, qui voient les probabilités comme un moyen de mesurer la confiance que l'on peut avoir dans une prévision ;
- les néo-bayesiens, qui soutiennent que les données statistiques seules ne permettent pas de donner le modèle probabiliste idéalisant la distribution en fréquence : il est nécessaire de proposer au départ une forme générale du modèle.
Définition
Commençons par préciser que donner une définition de la statistique n'est pas chose facile : comme expliqué dans la section précédente, les définitions de la statistique évoluent en fonction de l'époque ou de son utilisation. En 1935, le statisticien Walter F. Willcox dénombrait entre 100 et 120 définitions différentes.
« Parmi les thèmes à propos desquels les statisticiens ne sont pas d'accord, se trouve la définition de leur science. »
— Maurice Kendall
Donnons en premier lieu, la définition la plus classique actuellement utilisée, au moins depuis 1982 : « La statistique est l'ensemble des méthodes qui ont pour objet la collecte, le traitement et l'interprétation de données d'observation relatives à un groupe d'individus ou d'unités. » Par cette définition, la statistique apparaît comme une science autonome, orientée vers les données, comme la physique l'est vers la matière et la biologie vers la vie. Mais comme elle s'appuie sur la théorie des probabilités, étant elle-même une science de l'aléatoire, (voir Interconnexions entre la théorie des probabilités et la statistique pour plus de détails), elle apparaît souvent, en particulier d'un point de vue universitaire, comme une branche des mathématiques appliquées. Aujourd'hui, elle s'inscrit dans un champ disciplinaire plus transverse que les anglo-saxons nomment « Data Science » et dans lequel par ailleurs, l'informatique a elle aussi une place importante. Les différents aspects de la statistique sont regroupés en différents domaines ou concepts : la statistique descriptive, plus couramment appelée aujourd'hui statistique exploratoire, l'inférence statistique, la statistique mathématique, l'analyse des données, l'apprentissage statistique, etc.
John Tukey prétend qu'il y a deux approches en statistiques, entre lesquelles on jongle constamment : les statistiques exploratoires et les statistiques confirmatoires (exploratory and confirmatory statistics) :
- on explore d'abord les données pour avoir une idée experte du fonctionnement du système qu'elles représentent, ce qui permet de formuler des hypothèses cognitives sur les phénomènes mis en jeu, de leurs propriétés ;
- puis à partir de ces hypothèses de comportement, on élabore des expériences permettant de les confirmer ou de les infirmer en recourant à d'autres techniques statistiques.
Remarquons que la statistique est parfois notée « la Statistique » (avec une majuscule)[source insuffisante], ce qui permet de différencier ses applications mathématiques avec une statistique (avec une minuscule). Le pluriel est également souvent utilisé pour la désigner : « les statistiques ».
Domaines d'application
En 1982, le statisticien Pierre Dagnelie propose trois grandes tendances de la statistique :
- la statistique qualifiée d'« administrative » ou « gouvernementale » faite dans les instituts de statistique à propos de grands ensembles de données, ;
- la statistique dite « mathématique » ou « universitaire » faite avec peu de données et qui a pour but la novation ;
- enfin la statistique « appliquée » ou « de terrain » faite dans les instituts de sondage d'opinion ou les facultés de médecine pour des problèmes concrets.
Dans la pratique, les méthodes et outils statistiques sont utilisés dans des domaines tels que :
- géophysique, pour les prévisions météorologiques, la climatologie, la pollution, les études des rivières et des océans ;
- démographie : le recensement permet de faire une photographie à un instant donné d'une population et permettra par la suite des sondages dans des échantillons représentatifs ;
- sciences économiques et sociales, et en économétrie : l'étude du comportement d'un groupe de population ou d'un secteur économique s'appuie sur des statistiques. C'est dans cette direction que travaille l'Insee. Les questions environnementales s'appuient également sur des données statistiques ;
- sociologie : les sources statistiques constituent des matériaux d'enquête, et les méthodes statistiques sont utilisées comme techniques de traitement des données ;
- marketing : le sondage d'opinion devient un outil pour la décision ou l'investissement ;
- dans les jeux de hasard et les paris tels que le loto ou les paris équestres, pour « prévoir » les résultats ;
- physique : l'étude de la mécanique statistique et de la thermodynamique statistique (cf Physique statistique) permet de déduire du comportement de particules individuelles un comportement global (passage du microscopique au macroscopique) ;
- métrologie, pour tout ce qui concerne les systèmes de mesure et les mesures elles-mêmes ;
- production industrielle, avec des outils comme la Maîtrise Statistique des Procédés ;
- médecine et en psychologie, tant pour le comportement des maladies que leur fréquence ou la validité d'un traitement ou d'un dépistage ;
- archéologie, appliquée aux vestiges (céramologie, archéozoologie…) ;
- écologie, pour l'étude des communautés végétales et des écosystèmes ;
- assurance et en finance (calcul des risques, actuariat, etc.) ;
- informatique, surtout en algorithmique (anti-crénelage, interpolation numérique) ;
- génomique : le problème de détection de ruptures sert à étudier différents types de cancers.
Statistique descriptive et statistique mathématique
Le but de la statistique est d'extraire des informations pertinentes d'une liste de nombres difficile à interpréter par une simple lecture. Deux grandes familles de méthodes sont utilisées selon les circonstances. Rien n'interdit de les utiliser en parallèle dans un problème concret mais il ne faut pas oublier qu'elles résolvent des problèmes de natures totalement distinctes. Selon une terminologie classique, ce sont la statistique descriptive et la statistique mathématique. Aujourd'hui, il semble que des expressions comme analyse des données et statistique inférentielle soient préférées, ce qui est justifié par le progrès des méthodes utilisées dans le premier cas.
Considérons par exemple les notes globales à un examen. Il peut être intéressant d'en tirer une valeur centrale qui donne une idée synthétique sur le niveau des étudiants. Celle-ci peut être complétée par une valeur de dispersion qui mesure, d'une certaine manière, l'homogénéité du groupe. Si on veut une information plus précise sur ce dernier point, on pourra construire un histogramme ou, d'un point de vue légèrement différent, considérer les déciles. Ces notions peuvent être intéressantes pour faire des comparaisons avec les examens analogues passés les années précédentes ou en d'autres lieux. Ce sont les problèmes les plus élémentaires de l'analyse des données qui concernent une population finie. Les problèmes portant sur des statistiques multidimensionnelles nécessitent l'utilisation de l'algèbre linéaire. Indépendamment du caractère, élémentaire ou non, du problème il s'agit de réductions statistiques de données connues dans lesquelles l'introduction des probabilités améliorerait difficilement l'information obtenue. Il est raisonnable de regrouper ces différentes notions :
- statistique descriptive pour les notions élémentaires ;
- analyse en composantes principales ;
- analyse factorielle des correspondances ;
- analyse discriminante ;
- visualisation des données ;
- etc.
Un changement radical se produit lorsque les données ne sont plus considérées comme une information complète à décrypter selon les règles de l'algèbre mais comme une information partielle sur une population plus importante, généralement considérée comme une population infinie. Pour induire des informations sur la population inconnue il faut introduire la notion de loi de probabilité. Les données connues constituent dans ce cas une réalisation d'un échantillon, ensemble de variables aléatoires supposées indépendantes (voir Loi de probabilité à plusieurs variables). La théorie des probabilités permet alors, entre autres opérations :
- d'associer les propriétés de l'échantillon à celles qui sont prêtées à la loi de probabilité, inconnue en toute rigueur, c'est l'échantillonnage ;
- de déduire inversement les paramètres de la loi de probabilité des informations que donne l'échantillon, c'est l'estimation ;
- de déterminer un intervalle de confiance qui mesure la validité de l'estimation ;
- de procéder à des tests d'hypothèse, le plus utilisé étant le test du χ² pour mesurer l'adéquation de la loi de probabilité choisie à l'échantillon utilisé ;
- etc.
La démarche statistique
Recueil des données
L'enquête statistique est toujours précédée d'une phase où sont déterminés les différents caractères à étudier.
L'étape suivante consiste à choisir la population à étudier. Il se pose alors le problème de l'échantillonnage : choix de la population à sonder (au sens large : cela peut être un sondage d'opinion en interrogeant des humains, ou bien le ramassage de roches pour déterminer la nature d'un sol en géologie), la taille de la population et sa représentativité.
Que ce soit pour un recueil total (recensement) ou partiel (sondage), des protocoles sont à mettre en place pour éviter les erreurs de mesures qu'elles soient accidentelles ou répétitives (biais).
Le pré traitement des données est extrêmement important, en effet, une transformation des données initiales (un passage au logarithme, par exemple), peuvent considérablement faciliter les traitements statistiques suivants.
Traitement des données
Le résultat de l'enquête statistique est une série de données quantitatives (tailles, salaires) ou de données qualitatives (langues parlées, marques préférées). Pour pouvoir les exploiter, il va être nécessaire d'en faire un classement et un résumé visuel ou numérique. Il sera parfois nécessaire d'opérer une compression de données. C'est le travail de la statistique descriptive. Il sera différent selon que l'étude porte sur une seule ou sur plusieurs variables.
Étude d'une seule variable
Le regroupement des données, le calcul des effectifs, la construction de graphiques permettent un premier résumé visuel du caractère statistique étudié. Dans le cas d'un caractère quantitatif continu, l'histogramme en est la représentation graphique la plus courante.
Les valeurs numériques d'un caractère statistique se répartissent dans , il est nécessaire de définir leurs positions. En statistiques, on est en général en présence d'un grand nombre de valeurs. Or, si l'intégralité de ces valeurs forme l'information, il n'est pas aisé de manipuler plusieurs centaines voire milliers de données, ni d'en tirer des conclusions. Il faut donc calculer quelques valeurs qui vont permettre d'analyser les données : c'est le rôle des réductions statistiques. Celles-ci peuvent être extrêmement concises, réduites à un nombre : c'est le cas des valeurs centrales et des valeurs de dispersion. Certaines d'entre elles (comme la variance) sont élaborées pour permettre une exploitation plus théorique des données (voir Inférence statistique).
On peut aussi chercher à comparer deux populations. On s'intéressera alors plus particulièrement à leurs critères de position, de dispersion, à leur boîte à moustaches ou à l'analyse de la variance.
Étude de plusieurs variables
Les moyens informatiques permettent aujourd'hui d'étudier plusieurs variables simultanément. Le cas de deux variables va donner lieu à la création d'un nuage de points, d'une étude de corrélation éventuelle entre les deux phénomènes ou d'une étude de régression linéaire.
Mais on peut rencontrer des études sur plus de deux variables : c'est l'analyse multidimensionnelle dans laquelle on va trouver l'analyse en composantes principales, l'analyse en composantes indépendantes, la régression linéaire multiple et l'exploration de données (appelée aussi « knowledge discovery » ou « data mining »). Aujourd'hui, l'exploration de données s'appuie, entre autres, sur la statistique pour découvrir des relations entre les variables de très vastes bases de données. Les avancées technologiques (augmentation de la fréquence des capteurs disponibles, des moyens de stockage, et de la puissance de calcul) donnent à l'exploration de données, un réel intérêt.
Interprétation et analyse des données
L'inférence statistique a pour but de faire émerger des propriétés d'un ensemble de variables connues uniquement à travers quelques-unes de ses réalisations (qui constituent un échantillon de données).
Elle s'appuie sur les résultats de la statistique mathématique, qui applique des calculs mathématiques rigoureux concernant la théorie des probabilités et la théorie de l'information aux situations où on n'observe que quelques réalisations (expérimentations) du phénomène à étudier.
Sans la statistique mathématique, un calcul sur des données (par exemple une moyenne), n'est qu'un indicateur. C'est la statistique mathématique qui lui donne le statut d'estimateur dont on maîtrise le biais, l'incertitude et autres caractéristiques statistiques. On cherche en général à ce que l'estimateur soit sans biais, convergent (ou consistant) et efficace.
On peut aussi émettre des hypothèses sur la loi générant le phénomène général, par exemple « la taille des enfants de 10 ans en France suit-elle une loi gaussienne ? ». L'étude de l'échantillon va alors valider ou non cette hypothèse : c'est ce qu'on appelle les tests d'hypothèses. Les tests d'hypothèses permettent de quantifier la probabilité avec laquelle des variables (connues seulement à partir d'un échantillon) vérifient une propriété donnée.
Enfin, on peut chercher à modéliser un phénomène a posteriori. La modélisation statistique doit être différenciée de la modélisation physique. Dans le second cas, des physiciens (c'est aussi vrai pour des chimistes, biologistes, ou tout autre scientifique), cherchent à construire un modèle explicatif d'un phénomène, qui est soutenu par une théorie plus générale décrivant comment les phénomènes ont lieu en exploitant le principe de causalité. Dans le cas de la modélisation statistique, le modèle va être construit à partir des données disponibles, sans aucun a priori sur les mécanismes entrant en jeu. Ce type de modélisation s'appelle aussi modélisation empirique. Compléter une modélisation statistique par des équations physiques (souvent intégrées dans les pré traitements des données) est toujours positif.
Un modèle est avant tout un moyen de relier des variables à expliquer à des variables explicatives
, par une relation fonctionnelle :
Les modèles statistiques peuvent être regroupés en grandes familles (suivant la forme de la fonction ):
- les modèles linéaires ;
- les modèles non linéaires ;
- les modèles non paramétriques.
Les modèles bayésiens (du nom de Thomas Bayes) peuvent être utilisés dans les trois catégories.
Statistique mathématique
Cette branche des mathématiques, très liée aux probabilités, est indispensable pour valider les hypothèses ou les modèles élaborés dans la statistique inférentielle. La théorie mathématiques des probabilités formalise les phénomènes aléatoires. Les statistiques mathématiques se consacrent à l'étude de phénomènes aléatoires que l'on connaît via certaines de ses réalisations.
Par exemple, pour une partie de dés à six faces :
- le point de vue probabiliste est de formaliser un tel jeu par des probabilités
associées aux événements la première, deuxième..., sixième face est tirée. La théorie des probabilités nous dit par exemple que pour que ces probabilités forment une loi de probabilité, il est nécessaire que
. On peut alors étudier différentes propriétés de ce jeu ;
- une fois cela fixé, les statistiques s'intéressent alors à ce genre de question : « Si au bout de 100 parties, chaque face
a été tirée
fois, puis-je avoir une idée de la valeur des probabilités
? Avec quel degré de confiance ? »
Une fois la règle établie, elle peut être utilisée en statistique inférentielle.
Statistique en sciences sociales
Les statistiques sont utilisées dans la plupart des sciences sociales. Elles présentent une méthodologie commune avec toutefois certaines spécificités selon la complexité de l'objet d'étude.
En sociologie
L'analyse géométrique des données (analyse factorielle, classification ascendante hiérarchique) est très souvent utilisée par les sociologues quantitativistes. Ces méthodes permettent de dresser des profils synthétiques prenant en compte un ensemble de variables quantitatives (revenu, âge, etc.) et/ou qualitatives (sexe, catégorie socio-professionnelle, etc.). Il est par exemple possible de déterminer des sociostyles.
Enseignement
Afrique
Notes et références
- Haccoun Robert et Denis Cousineau, Statistiques : concepts et applications, Presses de l'université de Montréal, , 412 p. (ISBN 978-2-7606-2014-8, lire en ligne).
- (en) G HENKIN et A SHANANIN, « Asymptotic behavior of solutions of the Cauchy problem for Burgers type equations », Journal de Mathématiques Pures et Appliqués, vol. 83, no 12, , p. 1457–1500 (ISSN 0021-7824, DOI 10.1016/s0021-7824(04)00111-4, lire en ligne, consulté le )
- Saporta 2006, p. 16
- [1].
- [2].
- Thierry Martin, « Rationalité de l’action et arithmétique politique à l’aube du XVIIIe siècle », dans Thierry Martin et Michèle Virol (dir.), Vauban, architecte de la modernité ?, Besançon, Presses universitaires de Franche-Comté, (ISBN 978-2-84867-232-8, DOI 10.4000/books.pufc.25907
, lire en ligne), p. 15–24
- Almanach des Français, traditions et variations, p. 194.
- Essai sur la statistique ancienne de la Belgique. I. Population. - II. Architecture. - III. Mobilier, Costumes. Par le Baron de Reiffenberg, Seconde partie séance de l'académie du 3 novembre 1832, Bruxelles, PDF, 142 p.
- Pierre Dagnelie, « Diversité et unité de la statistique », Journal de la société statistique de Paris, vol. 123, no 2, , p. 86-92 (lire en ligne)
- J. Torrens-Ibern, « Variété. Qu'est-ce que la statistique ? », Journal de la société statistique de Paris, vol. 97, , p. 289-296 (lire en ligne)
- M. Dumas, « Discussion sur la définition du mot « statistique » », Journal de la société statistique de Paris, vol. 97, , p. 253-258 (lire en ligne).
- Frédéric Lebaron, « L’analyse géométrique des données dans un programme de recherche sociologique: Le cas de la sociologie de Bourdieu », Revue MODULAD, (lire en ligne)
Voir aussi
Bibliographie
- Olivier Rey, Quand le monde s'est fait nombre, Stock, 2016 (ISBN 978-2-234-07339-5)
- Bernard Delmas, Statistique descriptive pour l’économie et la gestion, Presses universitaires du Septentrion, 2009 (ISBN 978-2-7574-0074-6).
- Jean-Pierre Favre, Mathématiques de gestion, Digilex, 2009 (ISBN 978-2-940404-01-8).
- Olivier Martin, L'Enquête et ses méthodes : l'analyse de données quantitatives, Paris, Armand Colin, 2005 ; 2009.
- Michel Volle, Le Métier de statisticien, Economica 1984, 2e édition, (ISBN 2-7178-0824-8), lire en ligne
- Michel Volle, Histoire de la statistique industrielle, Economica, 1982, (ISBN 2-7178-0520-6), lire en ligne.
- Georges Hostelet, Le Concours de l’analyse mathématique à l’analyse expérimentale des faits statistiques, Paris, Hermann, Actualités Scientifiques et Industrielles, no 585), 1937, 70 pp.
- T. H. et R. J. Wonnacott, Statistique, éd. Economica, 1995 (4e éd.), 922 p., (ISBN 2-7178-2072-8)
- Gilbert Saporta, Probabilités, Analyse des données et Statistiques, Paris, Éditions Technip, , 622 p. [détail des éditions] (ISBN 978-2-7108-0814-5, présentation en ligne)
- Nicolas Gauvrit, Statistiques : Méfiez-vous !, éd. Ellipses (Paris), 2007 (ISBN 978-2-7298-3070-0)
- Stéphanie Dupays, Déchiffrer les statistiques économiques et sociales, éd. Dunod, 2008 (ISBN 2-10-051584-5)
- Alain Desrosières, La Politique des grands nombres : histoire de la raison statistique, Paris, La Découverte, , 456 p. (ISBN 978-2-7071-6504-6)
- (en) Anders Hald, A History of Mathematical Statistics, New-York, Wiley, , 795 p. (ISBN 0-471-17912-4)
- (en) David Salsburg, The Lady Tasting Tea : How Statistics Revolutionized Science in the Twentieth Century, Holt McDougal, , 1re éd., 340 p. (ISBN 978-0-8050-7134-4)
Articles connexes
- Statistiques (mathématiques élémentaires)
- Statistique descriptive
- Statistique inférentielle
- Inférence bayésienne
- Statistique mathématique
- Stylométrie
- Liste de statisticiens
- Apprentissage automatique
- Métrologie
- Probabilité
- Eurostat
- Institut national de statistique
- Interconnexions entre la théorie des probabilités et les statistiques
- Journée mondiale de la statistique
Liens externes
- Ressources relatives à la santé :
- Medical Subject Headings
- NCI Thesaurus
- Ressource relative à la recherche :
- JSTOR
- Notices dans des dictionnaires ou encyclopédies généralistes :
- Britannica
- Den Store Danske Encyklopædi
- Dictionnaire historique de la Suisse
- Gran Enciclopèdia Catalana
- Larousse
- Store norske leksikon
- Treccani
- Notices d'autorité :
- BnF (données)
- LCCN
- GND
- Japon
- Israël
- Tchéquie
- Lettonie
- Corée du Sud
- « Les statistiques, c'est pas automatique », La Méthode scientifique, France Culture, 30 septembre 2021.
- Statistiques OCDE, sur le site stats.oecd.org
- Revue de Statistique Appliquée, texte intégral de 1953 à 2000
- Portail des probabilités et de la statistique
Auteur: www.NiNa.Az
Date de publication:
wikipedia, wiki, wikipédia, livre, livres, bibliothèque, article, lire, télécharger, gratuit, téléchargement gratuit, mp3, vidéo, mp4, 3gp, jpg, jpeg, gif, png, image, musique, chanson, film, livre, jeu, jeux, mobile, téléphone, android, ios, apple, téléphone portable, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, pc, web, ordinateur
Pour les articles homonymes voir Statistique homonymie La statistique ou les statistiques est la discipline qui etudie des phenomenes a travers la collecte de donnees leur traitement leur analyse l interpretation des resultats et leur presentation afin de rendre ces donnees comprehensibles par tous C est a la fois une branche des mathematiques appliquees une methode et un ensemble de techniques StatistiquePartie deMathematiques science formellePratique parStatisticien ou statisticienneChampsStatistique descriptive statistique inferentielle d ObjetsDonnee statistique loi de probabiliteHistoireHistoire des statistiques modifier modifier le code modifier Wikidata La statistique est un domaine des mathematiques et de plus en plus elle fait partie de ce que l on appelle aujourd hui la science des donnees en anglais Data Science L analyse applique des lois mathematiques plus generales ensembles groupes inclusion exclusion Elle possede une composante theorique ainsi qu une composante appliquee La composante theorique s appuie sur la theorie des probabilites et forme avec cette derniere l analyse de phenomenes aleatoires La statistique appliquee est utilisee dans presque tous les domaines de l activite humaine ingenierie management economie biologie informatique la physique fondamentaux de la physique quantique par exemple La statistique utilise des regles et des methodes sur la collecte des donnees pour que celles ci puissent etre correctement interpretees souvent comme composante d une aide a la decision Le statisticien a pour profession la mise au point d outils statistiques dans le secteur prive ou le secteur public et leur exploitation generalement dans un domaine d expertise EtymologieD usage generalise en francais vers 1785 derive de l italien statista homme d Etat statiste emprunte a l allemand Statistik forge ou repris vers 1749 par l economiste Gottfried Achenwall la statistique representant pour lui l ensemble des connaissances que doit posseder un homme d Etat C est son ouvrage Apercu sur la gestion etatique des empires et republiques europeens les plus distingues a l usage des cours universitaires Abriss der neuesten Staatswissenschaft der vornehmsten Europaischen Reiche und Republiken zum Gebrauch in seinen Akademischen Vorlefungen paru en 1749 qui confera son rayonnement a la notion HistoireArticle detaille Histoire de la statistique Bien que le nom de statistique soit relativement recent on attribue en general l origine du nom au XVIII e siecle de l allemand Staatskunde connaissance ou science de l Etat cette activite semble exister des la naissance des premieres structures sociales D ailleurs les premiers textes ecrits retrouves sont des recensements du betail des informations sur son cours et des contrats divers On a ainsi trace des recensements en Chine ou en Egypte au XVIII e siecle av J C Ce systeme de recueil de donnees se poursuit jusqu au XVII e siecle En Europe le role de collecteur de donnees est souvent tenu par des guildes marchandes puis par les intendants de l Etat Ce n est qu au XVIII e siecle que l on voit apparaitre le role previsionnel des statistiques avec la construction des premieres tables de mortalite Antoine Deparcieux ecrit en 1746 l Essai sur les probabilites de la duree de vie humaine Elles vont d abord servir aux compagnies d assurances sur la vie qui se creent alors La statistique est aussi un appui pour l histoire prospective ou retrospective de la demographie notamment Ainsi en 1842 le Baron de Reiffenberg presentait il a l Academie ses calculs retrospectifs de population chez des peuples gaulois d apres des donnees chiffrees laissees par Jules Cesar dans ses Commentaires sur la Guerre des Gaules De bello Gallico v Les statistiques mathematiques s appuyaient sur les premiers travaux concernant les probabilites developpes par Fermat et Pascal C est probablement chez Thomas Bayes que l on vit apparaitre un embryon de statistique inferentielle Condorcet et Laplace parlaient encore de probabilite la ou l on parlerait aujourd hui de frequence Mais c est a Adolphe Quetelet que l on doit l idee que la statistique est une science s appuyant sur les probabilites Le XIX e siecle voit cette activite prendre son plein essor Des regles precises sur la collecte et l interpretation des donnees sont edictees La premiere application industrielle des statistiques eut lieu lors du recensement americain de 1890 qui mit en œuvre la carte perforee inventee par le statisticien Herman Hollerith Celui ci avait depose un brevet au bureau americain des brevets Au XX e siecle ces applications industrielles se developperent d abord aux Etats Unis qui etaient en avance sur les sciences de gestion puis seulement apres la Premiere Guerre mondiale en Europe Le regime nazi employa des methodes statistiques a partir de 1934 pour le rearmement En France on etait moins au fait de ces applications L application industrielle des statistiques en France se developpe avec la creation de l Insee qui remplaca le Service National des Statistiques cree par Rene Carmille L avenement de l informatique dans les annees 1940 aux Etats Unis puis en Europe dans les annees 1960 permit de traiter un plus grand nombre de donnees mais surtout de croiser entre elles des series de donnees de types differents C est le developpement de ce qu on appelle l analyse multidimensionnelle Au cours du siecle plusieurs courants de pensee vont s affronter les objectivistes ou frequentistes qui pensent que les probabilites fournissent un modele permettant d idealiser la distribution en frequence et que la s arrete leur role les subjectivistes qui voient les probabilites comme un moyen de mesurer la confiance que l on peut avoir dans une prevision les neo bayesiens qui soutiennent que les donnees statistiques seules ne permettent pas de donner le modele probabiliste idealisant la distribution en frequence il est necessaire de proposer au depart une forme generale du modele DefinitionCommencons par preciser que donner une definition de la statistique n est pas chose facile comme explique dans la section precedente les definitions de la statistique evoluent en fonction de l epoque ou de son utilisation En 1935 le statisticien Walter F Willcox denombrait entre 100 et 120 definitions differentes Parmi les themes a propos desquels les statisticiens ne sont pas d accord se trouve la definition de leur science Maurice Kendall Donnons en premier lieu la definition la plus classique actuellement utilisee au moins depuis 1982 La statistique est l ensemble des methodes qui ont pour objet la collecte le traitement et l interpretation de donnees d observation relatives a un groupe d individus ou d unites Par cette definition la statistique apparait comme une science autonome orientee vers les donnees comme la physique l est vers la matiere et la biologie vers la vie Mais comme elle s appuie sur la theorie des probabilites etant elle meme une science de l aleatoire voir Interconnexions entre la theorie des probabilites et la statistique pour plus de details elle apparait souvent en particulier d un point de vue universitaire comme une branche des mathematiques appliquees Aujourd hui elle s inscrit dans un champ disciplinaire plus transverse que les anglo saxons nomment Data Science et dans lequel par ailleurs l informatique a elle aussi une place importante Les differents aspects de la statistique sont regroupes en differents domaines ou concepts la statistique descriptive plus couramment appelee aujourd hui statistique exploratoire l inference statistique la statistique mathematique l analyse des donnees l apprentissage statistique etc John Tukey pretend qu il y a deux approches en statistiques entre lesquelles on jongle constamment les statistiques exploratoires et les statistiques confirmatoires exploratory and confirmatory statistics on explore d abord les donnees pour avoir une idee experte du fonctionnement du systeme qu elles representent ce qui permet de formuler des hypotheses cognitives sur les phenomenes mis en jeu de leurs proprietes puis a partir de ces hypotheses de comportement on elabore des experiences permettant de les confirmer ou de les infirmer en recourant a d autres techniques statistiques Remarquons que la statistique est parfois notee la Statistique avec une majuscule source insuffisante ce qui permet de differencier ses applications mathematiques avec une statistique avec une minuscule Le pluriel est egalement souvent utilise pour la designer les statistiques Domaines d applicationEn 1982 le statisticien Pierre Dagnelie propose trois grandes tendances de la statistique la statistique qualifiee d administrative ou gouvernementale faite dans les instituts de statistique a propos de grands ensembles de donnees la statistique dite mathematique ou universitaire faite avec peu de donnees et qui a pour but la novation enfin la statistique appliquee ou de terrain faite dans les instituts de sondage d opinion ou les facultes de medecine pour des problemes concrets Dans la pratique les methodes et outils statistiques sont utilises dans des domaines tels que geophysique pour les previsions meteorologiques la climatologie la pollution les etudes des rivieres et des oceans demographie le recensement permet de faire une photographie a un instant donne d une population et permettra par la suite des sondages dans des echantillons representatifs sciences economiques et sociales et en econometrie l etude du comportement d un groupe de population ou d un secteur economique s appuie sur des statistiques C est dans cette direction que travaille l Insee Les questions environnementales s appuient egalement sur des donnees statistiques sociologie les sources statistiques constituent des materiaux d enquete et les methodes statistiques sont utilisees comme techniques de traitement des donnees marketing le sondage d opinion devient un outil pour la decision ou l investissement dans les jeux de hasard et les paris tels que le loto ou les paris equestres pour prevoir les resultats physique l etude de la mecanique statistique et de la thermodynamique statistique cf Physique statistique permet de deduire du comportement de particules individuelles un comportement global passage du microscopique au macroscopique metrologie pour tout ce qui concerne les systemes de mesure et les mesures elles memes production industrielle avec des outils comme la Maitrise Statistique des Procedes medecine et en psychologie tant pour le comportement des maladies que leur frequence ou la validite d un traitement ou d un depistage archeologie appliquee aux vestiges ceramologie archeozoologie ecologie pour l etude des communautes vegetales et des ecosystemes assurance et en finance calcul des risques actuariat etc informatique surtout en algorithmique anti crenelage interpolation numerique genomique le probleme de detection de ruptures sert a etudier differents types de cancers Statistique descriptive et statistique mathematiqueLe but de la statistique est d extraire des informations pertinentes d une liste de nombres difficile a interpreter par une simple lecture Deux grandes familles de methodes sont utilisees selon les circonstances Rien n interdit de les utiliser en parallele dans un probleme concret mais il ne faut pas oublier qu elles resolvent des problemes de natures totalement distinctes Selon une terminologie classique ce sont la statistique descriptive et la statistique mathematique Aujourd hui il semble que des expressions comme analyse des donnees et statistique inferentielle soient preferees ce qui est justifie par le progres des methodes utilisees dans le premier cas Considerons par exemple les notes globales a un examen Il peut etre interessant d en tirer une valeur centrale qui donne une idee synthetique sur le niveau des etudiants Celle ci peut etre completee par une valeur de dispersion qui mesure d une certaine maniere l homogeneite du groupe Si on veut une information plus precise sur ce dernier point on pourra construire un histogramme ou d un point de vue legerement different considerer les deciles Ces notions peuvent etre interessantes pour faire des comparaisons avec les examens analogues passes les annees precedentes ou en d autres lieux Ce sont les problemes les plus elementaires de l analyse des donnees qui concernent une population finie Les problemes portant sur des statistiques multidimensionnelles necessitent l utilisation de l algebre lineaire Independamment du caractere elementaire ou non du probleme il s agit de reductions statistiques de donnees connues dans lesquelles l introduction des probabilites ameliorerait difficilement l information obtenue Il est raisonnable de regrouper ces differentes notions statistique descriptive pour les notions elementaires analyse en composantes principales analyse factorielle des correspondances analyse discriminante visualisation des donnees etc Un changement radical se produit lorsque les donnees ne sont plus considerees comme une information complete a decrypter selon les regles de l algebre mais comme une information partielle sur une population plus importante generalement consideree comme une population infinie Pour induire des informations sur la population inconnue il faut introduire la notion de loi de probabilite Les donnees connues constituent dans ce cas une realisation d un echantillon ensemble de variables aleatoires supposees independantes voir Loi de probabilite a plusieurs variables La theorie des probabilites permet alors entre autres operations d associer les proprietes de l echantillon a celles qui sont pretees a la loi de probabilite inconnue en toute rigueur c est l echantillonnage de deduire inversement les parametres de la loi de probabilite des informations que donne l echantillon c est l estimation de determiner un intervalle de confiance qui mesure la validite de l estimation de proceder a des tests d hypothese le plus utilise etant le test du x pour mesurer l adequation de la loi de probabilite choisie a l echantillon utilise etc La demarche statistiqueRecueil des donnees L enquete statistique est toujours precedee d une phase ou sont determines les differents caracteres a etudier L etape suivante consiste a choisir la population a etudier Il se pose alors le probleme de l echantillonnage choix de la population a sonder au sens large cela peut etre un sondage d opinion en interrogeant des humains ou bien le ramassage de roches pour determiner la nature d un sol en geologie la taille de la population et sa representativite Article detaille Plan d experience Que ce soit pour un recueil total recensement ou partiel sondage des protocoles sont a mettre en place pour eviter les erreurs de mesures qu elles soient accidentelles ou repetitives biais Articles detailles Erreur metrologie et Erreur statistique Le pre traitement des donnees est extremement important en effet une transformation des donnees initiales un passage au logarithme par exemple peuvent considerablement faciliter les traitements statistiques suivants Traitement des donnees Article detaille Statistique descriptive Le resultat de l enquete statistique est une serie de donnees quantitatives tailles salaires ou de donnees qualitatives langues parlees marques preferees Pour pouvoir les exploiter il va etre necessaire d en faire un classement et un resume visuel ou numerique Il sera parfois necessaire d operer une compression de donnees C est le travail de la statistique descriptive Il sera different selon que l etude porte sur une seule ou sur plusieurs variables Etude d une seule variable Le regroupement des donnees le calcul des effectifs la construction de graphiques permettent un premier resume visuel du caractere statistique etudie Dans le cas d un caractere quantitatif continu l histogramme en est la representation graphique la plus courante Article detaille Representations graphiques de donnees statistiques Les valeurs numeriques d un caractere statistique se repartissent dans R displaystyle mathbb R il est necessaire de definir leurs positions En statistiques on est en general en presence d un grand nombre de valeurs Or si l integralite de ces valeurs forme l information il n est pas aise de manipuler plusieurs centaines voire milliers de donnees ni d en tirer des conclusions Il faut donc calculer quelques valeurs qui vont permettre d analyser les donnees c est le role des reductions statistiques Celles ci peuvent etre extremement concises reduites a un nombre c est le cas des valeurs centrales et des valeurs de dispersion Certaines d entre elles comme la variance sont elaborees pour permettre une exploitation plus theorique des donnees voir Inference statistique Articles detailles Criteres de position et Criteres de dispersion On peut aussi chercher a comparer deux populations On s interessera alors plus particulierement a leurs criteres de position de dispersion a leur boite a moustaches ou a l analyse de la variance Etude de plusieurs variables Les moyens informatiques permettent aujourd hui d etudier plusieurs variables simultanement Le cas de deux variables va donner lieu a la creation d un nuage de points d une etude de correlation eventuelle entre les deux phenomenes ou d une etude de regression lineaire Mais on peut rencontrer des etudes sur plus de deux variables c est l analyse multidimensionnelle dans laquelle on va trouver l analyse en composantes principales l analyse en composantes independantes la regression lineaire multiple et l exploration de donnees appelee aussi knowledge discovery ou data mining Aujourd hui l exploration de donnees s appuie entre autres sur la statistique pour decouvrir des relations entre les variables de tres vastes bases de donnees Les avancees technologiques augmentation de la frequence des capteurs disponibles des moyens de stockage et de la puissance de calcul donnent a l exploration de donnees un reel interet Interpretation et analyse des donnees Article detaille Inference statistique L inference statistique a pour but de faire emerger des proprietes d un ensemble de variables connues uniquement a travers quelques unes de ses realisations qui constituent un echantillon de donnees Elle s appuie sur les resultats de la statistique mathematique qui applique des calculs mathematiques rigoureux concernant la theorie des probabilites et la theorie de l information aux situations ou on n observe que quelques realisations experimentations du phenomene a etudier Sans la statistique mathematique un calcul sur des donnees par exemple une moyenne n est qu un indicateur C est la statistique mathematique qui lui donne le statut d estimateur dont on maitrise le biais l incertitude et autres caracteristiques statistiques On cherche en general a ce que l estimateur soit sans biais convergent ou consistant et efficace On peut aussi emettre des hypotheses sur la loi generant le phenomene general par exemple la taille des enfants de 10 ans en France suit elle une loi gaussienne L etude de l echantillon va alors valider ou non cette hypothese c est ce qu on appelle les tests d hypotheses Les tests d hypotheses permettent de quantifier la probabilite avec laquelle des variables connues seulement a partir d un echantillon verifient une propriete donnee Enfin on peut chercher a modeliser un phenomene a posteriori La modelisation statistique doit etre differenciee de la modelisation physique Dans le second cas des physiciens c est aussi vrai pour des chimistes biologistes ou tout autre scientifique cherchent a construire un modele explicatif d un phenomene qui est soutenu par une theorie plus generale decrivant comment les phenomenes ont lieu en exploitant le principe de causalite Dans le cas de la modelisation statistique le modele va etre construit a partir des donnees disponibles sans aucun a priori sur les mecanismes entrant en jeu Ce type de modelisation s appelle aussi modelisation empirique Completer une modelisation statistique par des equations physiques souvent integrees dans les pre traitements des donnees est toujours positif Un modele est avant tout un moyen de relier des variables a expliquer Y displaystyle Y a des variables explicatives X displaystyle X par une relation fonctionnelle Y F X displaystyle Y F X Les modeles statistiques peuvent etre regroupes en grandes familles suivant la forme de la fonction F displaystyle F les modeles lineaires les modeles non lineaires les modeles non parametriques Les modeles bayesiens du nom de Thomas Bayes peuvent etre utilises dans les trois categories Statistique mathematique Article detaille Statistique mathematique Cette branche des mathematiques tres liee aux probabilites est indispensable pour valider les hypotheses ou les modeles elabores dans la statistique inferentielle La theorie mathematiques des probabilites formalise les phenomenes aleatoires Les statistiques mathematiques se consacrent a l etude de phenomenes aleatoires que l on connait via certaines de ses realisations Par exemple pour une partie de des a six faces le point de vue probabiliste est de formaliser un tel jeu par des probabilites p1 p2 p6 displaystyle p 1 p 2 ldots p 6 associees aux evenements la premiere deuxieme sixieme face est tiree La theorie des probabilites nous dit par exemple que pour que ces probabilites forment une loi de probabilite il est necessaire que n 16pn 1 displaystyle sum n 1 6 p n 1 On peut alors etudier differentes proprietes de ce jeu une fois cela fixe les statistiques s interessent alors a ce genre de question Si au bout de 100 parties chaque face n displaystyle n a ete tiree fn displaystyle f n fois puis je avoir une idee de la valeur des probabilites p1 p2 p6 displaystyle p 1 p 2 ldots p 6 Avec quel degre de confiance Une fois la regle etablie elle peut etre utilisee en statistique inferentielle Statistique en sciences sociales Les statistiques sont utilisees dans la plupart des sciences sociales Elles presentent une methodologie commune avec toutefois certaines specificites selon la complexite de l objet d etude En sociologie L analyse geometrique des donnees analyse factorielle classification ascendante hierarchique est tres souvent utilisee par les sociologues quantitativistes Ces methodes permettent de dresser des profils synthetiques prenant en compte un ensemble de variables quantitatives revenu age etc et ou qualitatives sexe categorie socio professionnelle etc Il est par exemple possible de determiner des sociostyles EnseignementCette section est vide insuffisamment detaillee ou incomplete Votre aide est la bienvenue Comment faire Afrique Article detaille Etudes en statistique en Afrique Cette section est vide insuffisamment detaillee ou incomplete Votre aide est la bienvenue Comment faire Notes et references a et b Haccoun Robert et Denis Cousineau Statistiques concepts et applications Presses de l universite de Montreal 2007 412 p ISBN 978 2 7606 2014 8 lire en ligne en G HENKIN et A SHANANIN Asymptotic behavior of solutions of the Cauchy problem for Burgers type equations Journal de Mathematiques Pures et Appliques vol 83 no 12 decembre 2004 p 1457 1500 ISSN 0021 7824 DOI 10 1016 s0021 7824 04 00111 4 lire en ligne consulte le 15 fevrier 2021 Saporta 2006 p 16 1 2 Thierry Martin Rationalite de l action et arithmetique politique a l aube du XVIIIe siecle dans Thierry Martin et Michele Virol dir Vauban architecte de la modernite Besancon Presses universitaires de Franche Comte 2008 ISBN 978 2 84867 232 8 DOI 10 4000 books pufc 25907 lire en ligne p 15 24 Almanach des Francais traditions et variations p 194 Essai sur la statistique ancienne de la Belgique I Population II Architecture III Mobilier Costumes Par le Baron de Reiffenberg Seconde partie seance de l academie du 3 novembre 1832 Bruxelles PDF 142 p a et b Pierre Dagnelie Diversite et unite de la statistique Journal de la societe statistique de Paris vol 123 no 2 1982 p 86 92 lire en ligne J Torrens Ibern Variete Qu est ce que la statistique Journal de la societe statistique de Paris vol 97 1956 p 289 296 lire en ligne M Dumas Discussion sur la definition du mot statistique Journal de la societe statistique de Paris vol 97 1986 p 253 258 lire en ligne Frederic Lebaron L analyse geometrique des donnees dans un programme de recherche sociologique Le cas de la sociologie de Bourdieu Revue MODULAD 2010 lire en ligne Voir aussiSur les autres projets Wikimedia statistique sur le WiktionnaireStatistique sur Wikiversity Une categorie est consacree a ce sujet Statistiques Bibliographie Olivier Rey Quand le monde s est fait nombre Stock 2016 ISBN 978 2 234 07339 5 Bernard Delmas Statistique descriptive pour l economie et la gestion Presses universitaires du Septentrion 2009 ISBN 978 2 7574 0074 6 Jean Pierre Favre Mathematiques de gestion Digilex 2009 ISBN 978 2 940404 01 8 Olivier Martin L Enquete et ses methodes l analyse de donnees quantitatives Paris Armand Colin 2005 2009 Michel Volle Le Metier de statisticien Economica 1984 2e edition ISBN 2 7178 0824 8 lire en ligne Michel Volle Histoire de la statistique industrielle Economica 1982 ISBN 2 7178 0520 6 lire en ligne Georges Hostelet Le Concours de l analyse mathematique a l analyse experimentale des faits statistiques Paris Hermann Actualites Scientifiques et Industrielles no 585 1937 70 pp T H et R J Wonnacott Statistique ed Economica 1995 4e ed 922 p ISBN 2 7178 2072 8 Gilbert Saporta Probabilites Analyse des donnees et Statistiques Paris Editions Technip 2006 622 p detail des editions ISBN 978 2 7108 0814 5 presentation en ligne Nicolas Gauvrit Statistiques Mefiez vous ed Ellipses Paris 2007 ISBN 978 2 7298 3070 0 Stephanie Dupays Dechiffrer les statistiques economiques et sociales ed Dunod 2008 ISBN 2 10 051584 5 Alain Desrosieres La Politique des grands nombres histoire de la raison statistique Paris La Decouverte 2000 456 p ISBN 978 2 7071 6504 6 en Anders Hald A History of Mathematical Statistics New York Wiley 1998 795 p ISBN 0 471 17912 4 en David Salsburg The Lady Tasting Tea How Statistics Revolutionized Science in the Twentieth Century Holt McDougal mai 2002 1re ed 340 p ISBN 978 0 8050 7134 4 Articles connexes Statistiques mathematiques elementaires Statistique descriptive Statistique inferentielle Inference bayesienne Statistique mathematique Stylometrie Liste de statisticiens Apprentissage automatique Metrologie Probabilite Eurostat Institut national de statistique Interconnexions entre la theorie des probabilites et les statistiques Journee mondiale de la statistique Liens externes Ressources relatives a la sante Medical Subject Headings NCI Thesaurus Ressource relative a la recherche JSTOR Notices dans des dictionnaires ou encyclopedies generalistes Britannica Den Store Danske Encyklopaedi Dictionnaire historique de la Suisse Gran Enciclopedia Catalana Larousse Store norske leksikon Treccani Notices d autorite BnF donnees LCCN GND Japon Israel Tchequie Lettonie Coree du Sud Les statistiques c est pas automatique La Methode scientifique France Culture 30 septembre 2021 Statistiques OCDE sur le site stats oecd org Revue de Statistique Appliquee texte integral de 1953 a 2000 Portail des probabilites et de la statistique