Variable aléatoire
En thĂ©orie des probabilitĂ©s, une variable alĂ©atoire est une variable dont la valeur est dĂ©terminĂ©e aprĂšs la rĂ©alisation dâun phĂ©nomĂšne, expĂ©rience ou Ă©vĂ©nement, alĂ©atoire. En voici des exemples : la valeur dâun dĂ© entre 1 et 6 ; le cĂŽtĂ© de la piĂšce dans un pile ou face ; le nombre de voitures en attente dans la 2e file dâun tĂ©lĂ©pĂ©age autoroutier ; le jour de semaine de naissance de la prochaine personne que vous rencontrez ; le temps dâattente dans la queue du cinĂ©ma ; le poids de la part de tomme que le fromager vous coupe quand vous lui en demandez un quart ; etc. Notez bien que les situations rĂ©alistes prĂ©sentĂ©es ici ne sont pas nĂ©cessairement celles de la rĂ©alitĂ©, le point important Ă©tant quâelles sont ici placĂ©es dans le cadre de la thĂ©orie des probabilitĂ©s.
MathĂ©matiquement, câest une application dĂ©finie sur lâensemble des Ă©ventualitĂ©s, câest-Ă -dire lâensemble des rĂ©sultats possibles dâune expĂ©rience alĂ©atoire. Ce furent les jeux de hasard qui amenĂšrent Ă concevoir les variables alĂ©atoires, en associant Ă une Ă©ventualitĂ© (rĂ©sultat du lancer dâun ou plusieurs dĂ©s, dâun tirage Ă pile ou face, dâune roulette, etc.) un gain. Cette association Ă©ventualitĂ©-gain a donnĂ© lieu par la suite Ă la conception dâune fonction de portĂ©e plus gĂ©nĂ©rale. Le dĂ©veloppement des variables alĂ©atoires est associĂ© Ă la thĂ©orie de la mesure.
Introduction
Les valeurs possibles d'une variable alĂ©atoire pourraient reprĂ©senter les rĂ©sultats possibles d'une expĂ©rience, dont la valeur dĂ©jĂ existante est incertaine. Ils peuvent aussi reprĂ©senter conceptuellement soit les rĂ©sultats d'un processus alĂ©atoire « objectif » (comme lancer un dĂ©) ou le caractĂšre alĂ©atoire « subjectif » qui rĂ©sulte de la connaissance incomplĂšte d'une quantitĂ© (comme la tempĂ©rature qu'il fera dans 5 jours). La signification des probabilitĂ©s attribuĂ©es aux valeurs possibles d'une variable alĂ©atoire ne fait pas partie de la thĂ©orie des probabilitĂ©s, mais est plutĂŽt liĂ©e Ă des arguments philosophiques sur l'interprĂ©tation de la probabilitĂ©. Les mathĂ©matiques fonctionnent de la mĂȘme maniĂšre quelle que soit l'interprĂ©tation.
La fonction mathĂ©matique dĂ©crivant les valeurs possibles d'une variable alĂ©atoire et leur probabilitĂ© est connue sous le nom de loi de probabilitĂ© ou de distribution de probabilitĂ©. Les variables alĂ©atoires peuvent ĂȘtre de trois natures : discrĂštes, continues ou un mĂ©lange des deux. Elles sont discrĂštes quand elles peuvent prendre toutes les valeurs d'une liste finie ou dĂ©nombrable de valeurs spĂ©cifiĂ©es, et elles sont alors dotĂ©es d'une fonction de masse, caractĂ©ristique d'une distribution de probabilitĂ©s. Elles sont continues quand elles peuvent prendre une valeur numĂ©rique quelconque d'un intervalle ou d'une famille d'intervalles, par l'intermĂ©diaire d'une fonction de densitĂ© de probabilitĂ© caractĂ©ristique de la distribution de probabilitĂ©s. Les rĂ©alisations d'une variable alĂ©atoire, c'est-Ă -dire, les rĂ©sultats des valeurs choisies au hasard en fonction de la loi de probabilitĂ© de la variable, sont appelĂ©es des variations alĂ©atoires.
DĂ©finitions
DĂ©finition â Soient un espace probabilisĂ© et un espace mesurable. On appelle variable alĂ©atoire de Ω vers E, toute fonction mesurable X de Ω vers E.
Cette condition de mesurabilité de X assure que l'image réciproque par X de tout élément B de la tribu possÚde une probabilité et permet ainsi de définir, sur , une mesure de probabilité, notée , par
La mesure est l'image, par l'application X, de la probabilité définie sur .
DĂ©finition â La probabilitĂ© est appelĂ©e loi de probabilitĂ© de la variable alĂ©atoire X.
Dans la suite, désigne la tribu borélienne de l'espace topologique E.
Cas standard
Lorsque l'image est finie ou infini dĂ©nombrable, cette variable alĂ©atoire est alors appelĂ©e une variable alĂ©atoire discrĂšte[1], et sa distribution peut ĂȘtre dĂ©crite par une fonction de masse de probabilitĂ© qui assigne une probabilitĂ© de chaque valeur Ă l'image de X. Si l'image est indĂ©nombrablement infinie, alors on appellera X une variable alĂ©atoire continue. Dans le cas oĂč sa continuitĂ© est absolue, sa distribution peut ĂȘtre dĂ©crite par une fonction de densitĂ© de probabilitĂ©, qui affecte des probabilitĂ©s aux intervalles; en particulier, chaque point individuel doit nĂ©cessairement avoir une probabilitĂ© nulle pour une variable alĂ©atoire absolument continue. Toutes les variables alĂ©atoires continues ne sont pas absolument continues[2], par exemple une distribution de mĂ©lange. De telles variables alĂ©atoires ne peuvent pas ĂȘtre dĂ©crites par une densitĂ© de probabilitĂ© ou une fonction de masse de probabilitĂ©.
Toute variable alĂ©atoire peut ĂȘtre dĂ©crite par sa fonction de rĂ©partition cumulative, qui donne la probabilitĂ© que la variable alĂ©atoire soit infĂ©rieure ou Ă©gale Ă une certaine valeur.
Extensions
Le terme « variable aléatoire » en statistiques est traditionnellement limité au cas de la valeur réelle (). Ceci assure qu'il est possible de définir des quantités telles que la valeur attendue et la variance d'une variable aléatoire, sa fonction de répartition cumulative, et les moments de la distribution.
Toutefois, la définition ci-dessus est valable pour n'importe quel espace mesurable E de valeurs. Ainsi, on peut tenir compte des éléments aléatoires d'autres ensembles, comme valeurs booléennes aléatoires, les variables catégorielles, les nombres complexes, des vecteurs, des matrices, des séquences, des arbres, des ensembles, des formes, et des fonctions. On peut alors se référer spécifiquement à une variable aléatoire de type E, ou d'une variable aléatoire évaluée E.
Ce concept plus gĂ©nĂ©ral d'un Ă©lĂ©ment alĂ©atoire est particuliĂšrement utile dans des disciplines telles que la thĂ©orie des graphes, l'apprentissage machine, le traitement du langage naturel, et d'autres domaines en mathĂ©matiques discrĂštes et informatique, oĂč l'on est souvent intĂ©ressĂ© Ă la modĂ©lisation de la variation alĂ©atoire de donnĂ©es structurelles non-numĂ©rique. Dans certains cas, il est cependant meilleur de reprĂ©senter chaque Ă©lĂ©ment E en utilisant un ou plusieurs nombres rĂ©els. Dans ce cas, un Ă©lĂ©ment alĂ©atoire peut Ă©ventuellement ĂȘtre reprĂ©sentĂ© sous la forme d'un vecteur de variables alĂ©atoires Ă valeurs rĂ©elles (toutes dĂ©finies sur le mĂȘme espace de probabilitĂ© Ω sous-jacent, ce qui permet aux diffĂ©rentes variables alĂ©atoires de covarier). Par exemple:
- Un mot alĂ©atoire peut ĂȘtre reprĂ©sentĂ© comme un nombre alĂ©atoire qui sert d'index dans le vocabulaire des mots possibles. Dit autrement, il peut ĂȘtre reprĂ©sentĂ© comme un vecteur alĂ©atoire d'indicateur dont la longueur est Ă©gale Ă la taille du vocabulaire, oĂč les seules valeurs de probabilitĂ© positive sont (1 0 0 0, ...), (0 1 0 0, ...), (0 0 1 0 ...) et la position du 1 indique la parole.
- Une phrase alĂ©atoire de longueur N donnĂ©e peut ĂȘtre reprĂ©sentĂ©e comme un vecteur de N mots alĂ©atoires.
- Un graphe alĂ©atoire sur les sommets N donnĂ©s peut ĂȘtre reprĂ©sentĂ© comme une matrice de variables alĂ©atoires N Ă N dont les valeurs spĂ©cifient la matrice d'adjacence du graphe alĂ©atoire.
- Une fonction alĂ©atoire F peut ĂȘtre reprĂ©sentĂ©e par un ensemble de variables alĂ©atoires F(x), ce qui donne les valeurs de la fonction aux diffĂ©rents points x dans le domaine de la fonction. F(x) sont des variables alĂ©atoires Ă valeurs rĂ©elles ordinaires, Ă condition que la fonction soit Ă valeurs rĂ©elles. Par exemple, un processus stochastique est une fonction alĂ©atoire de temps, un vecteur alĂ©atoire est une fonction alĂ©atoire de certains ensembles d'indices tels que 1,2,âŠ,n, et un champ alĂ©atoire est une fonction alĂ©atoire sur un ensemble (gĂ©nĂ©ralement le temps, l'espace, ou un ensemble discret).
Moments
La distribution de probabilitĂ© d'une variable alĂ©atoire est souvent caractĂ©risĂ©e par un nombre rĂ©duit de paramĂštres, qui ont Ă©galement une interprĂ©tation pratique. Par exemple, il est souvent suffisant de savoir quelle est la valeur moyenne. Ceci est possible grĂące au concept mathĂ©matique de la valeur attendue d'une variable alĂ©atoire, notĂ© et aussi appelĂ© le premier moment. En gĂ©nĂ©ral, n'est pas Ă©gal Ă . Une fois que la valeur moyenne est connue, on pourrait alors se demander Ă quelle distance de cette valeur moyenne sont en gĂ©nĂ©ral les valeurs de E, question Ă laquelle rĂ©pondent les notions de variance et d'Ă©cart-type d'une variable alĂ©atoire. peut ĂȘtre considĂ©rĂ©e comme une moyenne obtenue Ă partir d'une population infinie, dont les membres sont des Ă©valuations particuliĂšres de E.
Mathématiquement, cela est connu sous le nom du problÚme des moments : pour une classe donnée de variables aléatoires E, trouver une collection {fi} de fonctions telles que l'attente des valeurs caractérise la répartition de la variable aléatoire E.
Les moments ne peuvent pas ĂȘtre dĂ©finis pour des fonctions Ă valeurs rĂ©elles de variables alĂ©atoires (ou de valeur complexe, etc.). Si la variable alĂ©atoire est une valeur rĂ©elle, alors les moments de la variable elle-mĂȘme peuvent ĂȘtre pris, ce qui est Ă©quivalent aux moments de la fonction f(X)=X de la variable alĂ©atoire. Cependant, mĂȘme pour des variables alĂ©atoires aux valeurs non-rĂ©elles, des moments peuvent ĂȘtre pris aux fonctions rĂ©elles de ces variables. Par exemple, pour une variable alĂ©atoire catĂ©gorielle E qui peut prendre des valeurs nominales « rouge », « bleu » ou « vert », la fonction de valeur rĂ©elle [X = vert] peut ĂȘtre construite; ce processus utilise le crochet de Iverson, et possĂšde la valeur 1 si E a la valeur « verte », il possĂ©dera la valeur 0 dans un cas diffĂ©rent. Ainsi, la valeur attendue et d'autres moments de cette fonction peuvent ĂȘtre dĂ©terminĂ©s.
Exemples
Une variable aléatoire est souvent à valeurs réelles (gain d'un joueur dans un jeu de hasard, durée de vie) et on parle alors de variable aléatoire réelle : .
La variable aléatoire peut aussi associer à chaque éventualité un vecteur de ou , et on parle alors de vecteur aléatoire :
ou .
La variable alĂ©atoire peut encore associer Ă chaque Ă©ventualitĂ© une valeur qualitative (couleurs, Pile ou Face), ou mĂȘme une fonction (par exemple une fonction de ), et on parlera alors de processus stochastique.
Plus rigoureusement :
- Lorsque , on dit que est une variable aléatoire réelle.
- Lorsque, pour un entier d ℠1, , on dit que est un vecteur aléatoire.
- Lorsqu'il existe un ensemble fini ou dĂ©nombrable S â E tel que , on dit que est une variable discrĂšte. Par exemple, le choix permet de voir les variables alĂ©atoires suivant la loi de Poisson ou la loi binomiale comme des variables alĂ©atoires rĂ©elles.
- Le mouvement brownien , qui modĂ©lise la trajectoire de certaines particules dans l'espace, peut ĂȘtre vu comme une variable alĂ©atoire B Ă valeurs dans l'espace des fonctions continues de dans muni de la topologie de la convergence uniforme sur tout compact, et de la tribu borĂ©lienne correspondante. Pour chaque t â„ 0, B(t), qui reprĂ©sente la position de la particule Ă l'instant t, est une variable alĂ©atoire rĂ©elle dont la loi est gaussienne. Ainsi, B peut aussi ĂȘtre vu comme une famille de variables alĂ©atoires rĂ©elles.
Notes et références
- (en) Cet article est partiellement ou en totalitĂ© issu de lâarticle de WikipĂ©dia en anglais intitulĂ© « random variable » (voir la liste des auteurs).
- (en) Daniel S., The Practice of Statistics : TI-83/89 Graphing Calculator Enhanced, W. H. Freeman and Company, , 858 p. (ISBN 978-0-7167-4773-4, présentation en ligne)
- (en) Liliana Blanco Castañeda, Viswanathan Arunachalam et Selvamuthu Dharmaraja, Introduction to Probability and Stochastic Processes with Applications, Wiley, , 614 p. (ISBN 978-1-118-34494-1, lire en ligne)
Voir aussi
Articles connexes
- Vecteur aléatoire
- Indépendance de variables aléatoires
- Suite aléatoire
- Nombre pseudo-aléatoire