🎲

Terminale Comp · Fiche de cours

Probabilités et statistiques — Terminale Complémentaire

Lois discrètes et continues, densité de probabilité. Statistique à deux variables : nuage de points, régression linéaire, coefficient de corrélation.

8 min Avancé⚡ Jouer ce chapitre

✅ À retenir

  • Loi \mathcal{N}(\mu,\sigma^2) : P(\mu-2\sigma \leq X \leq \mu+2\sigma) \approx 95\%.
  • Droite de régression y sur x : y = ax+b avec a=\dfrac{\text{cov}(X,Y)}{V(X)}, b=\bar{y}-a\bar{x}.
  • Coefficient de corrélation r : |r|\to 1 liaison forte, |r|\to 0 liaison faible.

📖 Définition — Variables aléatoires continues

Une variable aléatoire XX est continue s'il existe une fonction f0f \geq 0 (densité) telle que :

P(aXb)=abf(x)dxavec +f(x)dx=1P(a \leq X \leq b) = \int_a^b f(x)\,dx \qquad \text{avec } \int_{-\infty}^{+\infty} f(x)\,dx = 1

Loi normale N(μ,σ2)\mathcal{N}(\mu, \sigma^2) :

  • E(X)=μE(X) = \mu, σ(X)=σ\sigma(X) = \sigma
  • P(μσXμ+σ)68%P(\mu-\sigma \leq X \leq \mu+\sigma) \approx 68\%
  • P(μ2σXμ+2σ)95%P(\mu-2\sigma \leq X \leq \mu+2\sigma) \approx 95\%
  • Standardisation : Z=(Xμ)/σN(0,1)Z = (X-\mu)/\sigma \sim \mathcal{N}(0,1)
Figure géométrique

📖 Définition — Statistique à deux variables

Pour un nuage de points (xi,yi)(x_i, y_i) :

xˉ=xin,yˉ=yin\bar{x} = \frac{\sum x_i}{n}, \quad \bar{y} = \frac{\sum y_i}{n}

cov(X,Y)=(xixˉ)(yiyˉ)n=xyxˉyˉ\text{cov}(X,Y) = \frac{\sum (x_i-\bar{x})(y_i-\bar{y})}{n} = \overline{xy} - \bar{x}\bar{y}

r=cov(X,Y)σXσY[1,1]r = \frac{\text{cov}(X,Y)}{\sigma_X \sigma_Y} \in [-1, 1]

Droite de régression (moindres carrés) passant par G(xˉ,yˉ)G(\bar{x}, \bar{y}) :

y=ax+b,a=cov(X,Y)V(X),b=yˉaxˉy = ax + b, \quad a = \frac{\text{cov}(X,Y)}{V(X)}, \quad b = \bar{y} - a\bar{x}

🔢 Méthode — Calculer et interpréter la régression linéaire

  1. Calculer x̄, ȳ (moyennes).
  2. Calculer V(X) = x̄²_carr − x̄² (variance de X) et cov(X,Y) = x̄ȳ_moy − x̄ȳ.
  3. Calculer le coefficient directeur : a = cov(X,Y)/V(X).
  4. Calculer l'ordonnée à l'origine : b = ȳ − ax̄.
  5. Calculer r = cov/(σX×σY) et interpréter : |r|>0,9 → liaison très forte.

✏️ Exemple — Régression linéaire simple

⚠️

Corrélation ≠ causalité. Deux variables peuvent être fortement corrélées sans que l'une cause l'autre. Exemple classique : la consommation de glaces et les noyades sont corrélées (r proche de 1) — mais c'est la chaleur qui cause les deux, pas les glaces !

Numi

La régression linéaire, c'est "la droite qui passe au mieux" à travers le nuage de points. Elle minimise la somme des carrés des distances verticales. L'intelligence artificielle et le machine learning, c'est de la régression généralisée — les maths du lycée sont au cœur de l'IA !

🎯 Mini-quiz

1. X ~ N(50, 10²). P(30 ≤ X ≤ 70) ≈ ?

2. Coefficient de corrélation r=−0,95. Cela signifie :

3. La droite de régression de y sur x passe toujours par :