ESSEC 2001




Le but du problème est l'étude du coefficient de corrélation linéaire de deux variables aléatoires qu'on aborde d'abord de façon générale (partie I), puis dans un cas particulier (partie II).

PARTIE I

On considère deux variables aléatoires X et Y définies sur un même espace probabilisé et admettant des espérances E ( X ) et E ( Y ) et des variances V ( X ) et V ( Y ) et on suppose V ( X ) > 0 (on rappelle que V ( X ) = 0 si et seulement si, avec une probabilité égale à 1 , X est constante). La covariance des deux variables aléatoires X et Y (que celles-ci soient discrètes ou à densité) est alors le nombre réel défini par :

C o v ( X , Y ) = E [ ( X E ( X ) ) ( Y E ( Y ) ) ] ,  ou encore  E ( X Y ) E ( X ) E ( Y ) .

  1. Covariance des variables aléatoires X et Y

    1. Exprimer C o v ( λ X + Y , λ X + Y ) en fonction de V ( λ X + Y ) et en déduire la formule suivante pour tout nombre réel λ : V ( λ X + Y ) = λ 2 V ( X ) + 2 λ C o v ( X , Y ) + V ( Y ) .

    2. En déduire que ( C o v ( X , Y ) ) 2 V ( X ) V ( Y ) .
      A quelle condition nécessaire et suffisante a-t-on l'égalité ( ( C o v ( X , Y ) ) 2 = V ( X ) V ( Y ) ?

  2. Coefficient de corrélation linéaire des variables aléatoires X et Y .
    On suppose dans cette question les variances V ( X ) et V ( Y ) de X et Y strictement positives.

    1. Exprimer le coefficient de corrélation linéaire ρ des variables aléatoires X et Y en fonction de C o v ( X , Y ) et des écarts-types σ ( X ) et σ ( Y ) des variables aléatoires X et Y et montrer que ρ appartient à [ 1 , + 1 ] .
      Préciser de plus à quelle condition nécessaire et suffisante ρ est égal à 1 ou + 1 .

    2. Donner la valeur de ρ lorsque les variables aléatoires X et Y sont indépendantes.

    3. On suppose enfin que X suit une loi normale centrée réduite N ( 0 , 1 ) et Y = X 2 .
      Préciser les espérances et les variances de X et Y ainsi que la covariance et le coefficient de corrélation de X et Y . Etudier alors la réciproque de la question 2.b).

PARTIE II

  1. Calculs préliminaires

    1. On considère deux nombres entiers naturels q et n tels que n q . En raisonnant par récurrence sur n , établir la formule suivante : k = q n C k q = C n + 1 q + 1

    2. En faisant q = 1 , 2 , 3 , en déduire une expression factorisée des quatre sommes suivantes : k = 1 n k ;    k = 2 n k ( k 1 ) e t k = 1 n k 2 ;    k = 3 n k ( k 1 ) ( k 2 ) . On considère dans toute la suite de cette partie un nombre entier n 2 et une urne contenant n jetons numérotés de 1 à n .
      On extrait de cette urne successivement et sans remise 2 jetons et on désigne alors par :

      • N 1 la variable aléatoire indiquant le numéro du premier jeton tiré.

      • N 2 la variable aléatoire indiquant le numéro du second jeton tiré.

      • X la variable aléatoire indiquant le plus petit des numéros des 2 jetons tirés.

      • Y la variable aléatoire indiquant le plus grand des numéros des 2 jetons tirés.

      On note E ( N 1 ) et V ( N 1 ) , E ( N 2 ) et V ( N 2 ) , E ( X ) et V ( X ) , E ( Y ) et V ( Y ) les espérances et variances des quatre variables aléatoires N 1 , N 2 , X , Y .

  2. Lois conjointe et marginales des variables aléatoires N 1 et N 2 .

    1. Déterminer les probabilités P ( N 1 = i ) pour 1 i n et P ( N 2 = j / N 1 = i ) pour 1 j n , j i .
      En déduire P ( N 2 = j ) pour 1 j n , puis comparer les lois de N 1 et N 2 .

    2. Calculer les espérances E ( N 1 ) et E ( N 2 ) , les variances V ( N 1 ) et V ( N 2 ) .

    3. Déterminer les probabilités P ( N 1 = i N 2 = j ) pour 1 i n et 1 j n en distinguant les deux cas i = j et i j et en déduire que : E ( N 1 N 2 ) = ( n + 1 ) ( 3 n + 2 ) 12 . En déduire la covariance et le coefficient de corrélation linéaire de N 1 et N 2 .

    4. Exprimer enfin sous forme factorisée la variance V ( N 1 + N 2 ) .

  3. Lois conjointe, marginales et conditionnelles des variables aléatoires X et Y

    1. Montrer que les probabilités P ( X = i Y = j ) sont égales à 2 n ( n 1 ) pour 1 i < j n .
      Que valent-elles sinon ?

    2. En déduire les probabilités P ( Y = j ) pour 2 j n et P ( X = i ) pour 1 i n 1 .
      (On vérifiera que les formules donnant P ( Y = j ) et P ( X = i ) restent valables si j = 1 ou i = n ).

    3. Déterminer les probabilités P ( X = i / Y = j ) et P ( Y = j / X = i ) pour 1 i < j n , puis reconnaître la loi de X conditionnée par Y = j et la loi de Y conditionnée par X = i .

    4. Comparer les lois des variables aléatoires n + 1 X et Y , autrement dit les deux probabilités P ( n + 1 X = j ) et P ( Y = j ) pour 2 j n .
      En déduire que E ( n + 1 X ) = E ( Y ) et V ( n + 1 X ) = V ( Y ) , puis en déduire les expressions de E ( X ) en fonction de E ( Y ) et de V ( X ) en fonction de V ( Y ) .

  4. Espérances et variances des variables aléatoires X et Y

    1. Exprimer les espérances E ( Y ) et E ( X ) en fonction de n .

    2. Exprimer sous forme factorisée E [ ( Y ( Y 2 ) ] , puis E ( Y 2 ) , V ( Y ) et V ( X ) en fonction de n .

  5. Covariance et coefficient de corrélation linéaire des variables aléatoires X et Y

    1. Vérifier que X + Y = N 1 + N 2 , puis en déduire sous forme factorisée la variance de X + Y et la covariance de X et Y .

    2. En déduire le coefficient de corrélation de X et Y .
      On remarquera que ce coefficient de corrélation linéaire de X et Y est indépendant de n .

  6. Utilisation de la fonction génératrice des variables aléatoires X et Y
    On se propose de retrouver les résultats précédents par une autre méthode, en ne supposant connues que les probabilités P ( X = i Y = j ) pour 1 i n et 1 j n .
    On désigne par G la fonction génératrice du couple de variables aléatoires ( X , Y ) , définie par : G ( u , v ) = j = 1 n i = 1 n P ( X = i Y = j ) ( 1 + u ) i ( 1 + v ) j

    1. Montrer que G u ( 0 , 0 ) = E ( X ) et a G v G ( 0 , O ) = E ( Y ) .
      Donner des égalités analogues pour 2 G u 2 ( 0 , 0 ) , 2 G u 2 ( 0 , 0 ) et 2 G u v ( 0 , 0 ) .

    2. Montrer, en posant w = u + v + u v , c'est à dire 1 + w = ( 1 + u ) ( 1 + v ) , qu'on a pour u , v , w 0 : G ( u , v ) = 2 ( 1 + w ) n ( n 1 ) u [ ( 1 + w ) n 1 w ( 1 + v ) n 1 v ] En développant ci-dessus ( 1 + w ) n et ( 1 + v ) n , quelle expression de G ( u , v ) en déduit-on ?

    3. Préciser les deux dérivées partielles w u et w v puis retrouver sous forme factorisée les nombres E ( X ) , E ( Y ) , E ( X 2 ) et V ( X ) , E ( Y 2 ) et V ( Y ) , E ( X Y ) et C o v ( X , Y ) , et pour terminer le coefficient de corrélation des variables aléatoires X et Y .