\documentclass[11pt]{article}


% Packages gestion des caractères, du français et de la mise en page

\usepackage[french]{babel}
\usepackage[utf8]{inputenc}
\usepackage[T1]{fontenc}
\usepackage{fancyhdr}

\usepackage[margin=2.5cm]{geometry}
\usepackage[pdftex,pdfborder={0 0 0},hypertexnames=false]{hyperref}

\setlength{\parindent}{0pt}
\setlength{\headheight}{4ex}
\setlength{\headsep}{2ex}
\renewcommand{\FrenchLabelItem}{\textbullet}

\usepackage{comment}
\usepackage{enumitem}
\usepackage{tabularx}


% Graphiques et Figures

\usepackage{subfig}
\usepackage{pgf,tikz}
\usetikzlibrary{arrows}
\usepackage[figurename=Figure]{caption}


% Packages pour les maths

\usepackage{mathtools}
\usepackage{amsthm}
\usepackage{amsfonts}
\usepackage{amssymb}
\usepackage{stmaryrd}


% Nouveaux environnements

\theoremstyle{plain}
	\newtheorem{thm}{Théorème}
	\newtheorem{cor}[thm]{Corollaire}
	\newtheorem{lem}[thm]{Lemme}
	\newtheorem{prop}[thm]{Proposition}


\theoremstyle{definition}
	\newtheorem*{dfn}{Définition}
	\newtheorem{exo}{Exercice}
	\newtheorem*{ntn}{Notation}
	\newtheorem*{ntns}{Notations}

\theoremstyle{remark}
	\newtheorem*{hint}{Indication}
	\newtheorem*{rem}{Remarque}
	\newtheorem*{ex}{Exemple}
	\newtheorem*{exs}{Exemples}
		

% Commandes et opérateurs utiles

\newcommand{\C}{\mathbb{C}}
\newcommand{\N}{\mathbb{N}}
\renewcommand{\P}{\mathbb{P}}
\newcommand{\Q}{\mathbb{Q}}
\newcommand{\R}{\mathbb{R}}
\renewcommand{\S}{\mathbb{S}}
\newcommand{\Z}{\mathbb{Z}}

\newcommand{\cA}{\mathcal{A}}
\newcommand{\cB}{\mathcal{B}}
\newcommand{\cC}{\mathcal{C}}
\newcommand{\cE}{\mathcal{E}}
\newcommand{\cF}{\mathcal{F}}
\newcommand{\cG}{\mathcal{G}}
\newcommand{\cN}{\mathcal{N}}
\newcommand{\cP}{\mathcal{P}}
\newcommand{\cU}{\mathcal{U}}
\newcommand{\cX}{\mathcal{X}}

\newcommand{\Poisson}{\; \propto \hspace{-0.96em} \cdot \hspace{0.5em}}

\renewcommand{\bar}{\overline}
\renewcommand{\epsilon}{\varepsilon}
\renewcommand{\geq}{\geqslant}
\renewcommand{\leq}{\leqslant}
\renewcommand{\tilde}{\widetilde}
\renewcommand{\hat}{\widehat}

\newcommand{\cov}[2]{\Cov\parentheses*{#1, #2}}
\newcommand{\CVL}[1]{\xrightarrow[#1]{\text{loi}}}
\newcommand{\CVP}[1]{\xrightarrow[#1]{\P}}
\newcommand{\CVps}[1]{\xrightarrow[#1]{\text{p.s.}}}
\newcommand{\dx}{\dmesure\!}
\newcommand{\esp}[2][]{\mathbb{E}_{#1}\squarebrackets*{#2}}
\newcommand{\espcond}[3][]{\mathbb{E}_{#1}\squarebrackets*{#2 \mvert #3}}
\newcommand{\gauss}[2]{\mathcal{N}\parentheses*{#1,#2}}
\newcommand{\mvert}{\mathrel{}\middle|\mathrel{}}
\newcommand{\one}{\mathbf{1}}
\newcommand{\trans}[1]{\,\prescript{\text{t}}{}{\! #1}}
\newcommand{\var}[2][]{\Var_{#1}\parentheses*{#2}}
\newcommand{\vol}[1]{\Vol\parentheses*{#1}}


\DeclareMathOperator{\card}{Card}
\DeclareMathOperator{\Cov}{Cov}
\DeclareMathOperator{\dist}{dist}
\DeclareMathOperator{\dmesure}{d}
\DeclareMathOperator{\Id}{Id}
\DeclareMathOperator{\vect}{Vect}
\DeclareMathOperator{\sym}{Sym}
\DeclareMathOperator{\Var}{Var}
\DeclareMathOperator{\Vol}{Vol}

\DeclarePairedDelimiter{\ang}{\langle}{\rangle}
\DeclarePairedDelimiter{\brackets}{\{}{\}}
\DeclarePairedDelimiter{\ceil}{\lceil}{\rceil}
\DeclarePairedDelimiter{\floor}{\lfloor}{\rfloor}
\DeclarePairedDelimiter{\norm}{\lvert}{\rvert}
\DeclarePairedDelimiter{\Norm}{\lVert}{\rVert}
\DeclarePairedDelimiter{\parentheses}{(}{)}
\DeclarePairedDelimiterX{\prsc}[2]{\langle}{\rangle}{#1\,, #2}
\DeclarePairedDelimiter{\squarebrackets}{[}{]}
\DeclarePairedDelimiterX{\ssquarebrackets}[2]{\llbracket}{\rrbracket}{#1;#2}


%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

% Gestion de l'affichage des solutions avec le package comment

% Nouveaux compteurs pour avoir une numérotation des équations indépendante dans les solutions

\newcounter{aux}
\newcounter{soleq}

% Définition d'un environnement sol qui peut être commenté à loisir ci-dessous
% La numération des équations est indépendantes et en chiffres romains dans les solutions

\specialcomment{sol}{
	\setcounter{aux}{\value{equation}}
	\setcounter{equation}{\value{soleq}}
	\renewcommand{\theequation}{\roman{equation}}
	\par\begingroup\color{violet}
	}
	{
	\endgroup
	\setcounter{soleq}{\value{equation}}
	\setcounter{equation}{\value{aux}}
	\renewcommand{\theequation}{\arabic{equation}}
	}

% Le contenu des environnements sol est visible par défaut, décommenter la ligne suivante le cache
%\excludecomment{sol}

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%


% Informations du document

\author{Thomas Letendre}
\date{2025 -- 2026}
\title{Feuille 6 -- Intervalles de confiance}


\begin{document}

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

% Mise en page de l'en-tête

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

\thispagestyle{fancy}

\lhead{Université de Rennes, 2025--2026}
\rhead{Probabilités et Statistiques pour la Science des Données}

\makeatletter

\begin{center}
\begin{Large}
\@title
\end{Large}
\end{center}

\hrule

\vspace{1ex}

\makeatother

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

% Début du corps du texte

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

Dans cette feuille, toutes les variables aléatoires sont définies sur un espace de probabilité $\parentheses*{\Omega,\cA,\P}$.

On note $(q_\alpha)_{0 < \alpha <1}$ les quantiles de la loi $\gauss{0}{1}$, qui sont supposés connus.

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

\begin{exo}[Oeufs de pingouins]

On collecte un oeuf de pingouin fécondé et on observe s'il éclos (succès) ou pas (échec). On répète cette expérience $n$ fois, et on cherche à déterminer la proportion théorique $\theta \in [0;1]$ d'éclosion.

\begin{enumerate}

\item Proposer un modèle statistique pour cette expérience.

\begin{sol}

On observe juste le succès ou l'échec de l'expérience, avec une probabilité $\theta \in [0;1]$. En codant le succès par $1$ et l'échec par $0$, l'espace des observation est donc $\cX= \brackets{0;1}$, avec la tribu de ses parties. L'espace des paramètres est $\Theta=[0;1]$ et la famille de lois considérées est $\parentheses*{\cB(\theta)}_{0 \leq \theta \leq 1}$.

\end{sol}

\item Dans ce modèle, pour $n \in \N^*$ fixé, déterminer l'estimateur $T_n$ de $\theta$ par la méthode des moments.

\begin{sol}

Soit $X$ une variable de loi $\cB(\theta)$ on a $\mu_1(\theta) = \esp[\theta]{X}= \theta$. Donc $\mu_1$ est l'identité de $[0;1]$. En particulier, c'est bien un homéomorphisme vers son image. Soit $(X_1,\dots,X_n)$ un $n$-échantillon de loi-mère $\cB(\theta)$, alors $\bar{X}_n = \frac{1}{n}\sum_{k=1}^n X_k$ est bien à valeurs dans $[0;1]$. Donc l'estimateur de $\theta$ par la méthode des moments est bien défini et c'est $T_n = \mu_1^{-1}(\bar{X}_n) = \bar{X}_n$.

\end{sol}

\item Calculer le risque quadratique de $T_n$.

\begin{sol}

On sait que $n T_n = \sum_{k=1}^n X_k$ suit la loi $cB(n,\theta)$ de moyenne $n\theta$ et de variance $n\theta(1-\theta)$. Donc $\esp[\theta]{T_n} = \theta$ pour tout $\theta \in [0;1]$ et $T_n$ est sans biais. Puis
\begin{equation*}
\forall \theta \in [0;1], \qquad R_{T_n}(\theta) = \var[\theta]{T_n} = \frac{\theta(1-\theta)}{n}.
\end{equation*}

\end{sol}

\item En déduire un intervalle de confiance non-asymptotique $I_n$ de niveau $0,\!95$ pour $\theta$.

\begin{sol}

Soit $\epsilon>0$, pour tout $\theta \in [0;1]$, on a
\begin{equation*}
\P_\theta\parentheses*{\norm*{T_n - \theta} > \epsilon} \leq \frac{1}{\epsilon^2}R_{T_n}(\theta) = \frac{\theta(1-\theta)}{n\epsilon^2} \leq \frac{1}{4n\epsilon^2},
\end{equation*}
car $t \mapsto t(1-t)$ est bornée par $\frac{1}{4}$ sur $[0;1]$. On a
\begin{equation*}
\frac{1}{4n\epsilon^2} \leq 0,\!05 \iff \epsilon \geq \frac{1}{\sqrt{n}}\frac{1}{\sqrt{4 \times 0,\!05}} = \frac{1}{\sqrt{n}} \sqrt{\frac{1}{0,\!2}} = \sqrt{\frac{5}{n}}.
\end{equation*}
Donc, en notant $\epsilon_n = \sqrt{\frac{5}{n}}$, on a
\begin{equation*}
\P_\theta\parentheses*{\norm*{T_n - \theta} \leq \epsilon_n} = 1 -\P_\theta\parentheses*{\norm*{T_n - \theta} > \epsilon_n} \geq 1 - \frac{1}{4n\epsilon_0^2} = 1 - \frac{1}{20} = 0,\!95.
\end{equation*}
Donc, pour tout $\theta \in [0;1]$, $\P_\theta\parentheses*{\norm*{T_n - \theta} \leq \sqrt{\frac{5}{n}}} \geq 0,\!95$, et donc $I_n=\squarebrackets*{T_n - \sqrt{\frac{5}{n}};T_n + \sqrt{\frac{5}{n}}}$ est un intervalle de confiance de niveau $0,\!95$ pour $\theta$.

\end{sol}

\end{enumerate}

On se restreint désormais à $\Theta = \,]0:1[$ et on considère la suite $(T_n)_{n \in \N^*}$ d'estimateurs de $\theta$.

\begin{enumerate}[resume]

\item Montrer que $\sqrt{T_n(1-T_n)} \CVps{n \to +\infty} \sqrt{\theta(1-\theta)}$.

\begin{sol}

Par la loi forte des grands nombres, $T_n = \frac{1}{n}\sum_{k=1}^n X_k \CVps{n \to +\infty} \theta$. Comme $t \mapsto \sqrt{t(1-t)}$ est une fonction continue, on a donc $\sqrt{T_n(1-T_n)} \CVps{n\to +\infty} \sqrt{\theta(1-\theta)}$. En particulier, presque sûrement, pour tout $n$ assez grand $\sqrt{T_n(1-T_n)} >0$.

\end{sol}

\item Montrer que $\sqrt{n}\frac{T_n-\theta}{\sqrt{T_n(1-T_n)}}\CVL{n \to +\infty} \gauss{0}{1}$.

\begin{sol}

Les $(X_k)_{k \in \N^*}$ sont une suite de v.a.i.i.d $L^2$ de moyenne $\theta$ et de variance $\theta(1-\theta)$. D'après le théorème central limite,
\begin{equation*}
\sqrt{n}(T_n-\theta) = \frac{1}{\sqrt{n}}\sum_{k=1}^n (X_k-\theta) \CVL{n \to +\infty} \gauss{0}{\theta(1-\theta)}.
\end{equation*}
D'après la question précédente, en particulier, $\sqrt{T_n(1-T_n)} \CVL{n\to +\infty} \sqrt{\theta(1-\theta)}$. Donc, par le lemme de Slutsky, $\sqrt{n}\frac{T_n-\theta}{\sqrt{T_n(1-T_n)}}\CVL{n \to +\infty} \frac{1}{\sqrt{\theta(1-\theta)}}\gauss{0}{\theta(1-\theta)}=\gauss{0}{1}$.
\end{sol}

\item En déduire un intervalle de confiance asymptotique $J_n$ de niveau $0,\!95$ pour $\theta$.

\begin{sol}

Par simplicité, on note $q = q_{0,975} = -q_{0,025}$. D'après la question précédente, pour tout $\theta \in \, ]0;1[$,
\begin{equation*}
\P_\theta\parentheses*{-q \leq \sqrt{n}\frac{T_n-\theta}{\sqrt{T_n(1-T_n)}} \leq q} \xrightarrow[n \to +\infty]{} \P\parentheses*{\gauss{0}{1} \in [-q;q]\strut} = 0,\!975 - 0,\!025 = 0,\!95.
\end{equation*}
Par ailleurs,
\begin{align*}
-q \leq \sqrt{n}\frac{T_n-\theta}{\sqrt{T_n(1-T_n)}} \leq q &\iff -q \sqrt{\frac{T_n(1-T_n)}{n}} \leq T_n - \theta \leq q \sqrt{\frac{T_n(1-T_n)}{n}}\\
&\iff \theta \in \squarebrackets*{T_n -q \sqrt{\frac{T_n(1-T_n)}{n}}; T_n +q \sqrt{\frac{T_n(1-T_n)}{n}}} = J_n.
\end{align*}
Donc $\P_\theta\parentheses*{\theta \in J_n} \xrightarrow[n \to +\infty]{}0,\!95$, et $J_n$ est un intervalle de confiance asymptotique de niveau $0,\!95$ pour $\theta$.

\begin{rem}
On peut majorer brutalement $T_n(1-T_n)$ par $\frac{1}{4}$. On obtient que $J_n$ est de largeur au plus $\frac{q}{\sqrt{n}}$ alors que $I_n$ est de largeur $\frac{2\sqrt{5}}{\sqrt{n}}$. On sait que $q= q_{0,975} \simeq 1,\!96$ alors que $2\sqrt{5} \simeq 4,\!47$. Asymptotiquement, $J_n$ est meilleur que~$I_n$. Cependant, $J_n$ est seulement un intervalle de confiance asymptotique, alors que $I_n$ est un intervalle de confiance à $n$ fixé.
\end{rem}

\end{sol}

\end{enumerate}

\end{exo}

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%


\begin{exo}[Temps d'attente]

Devant CNews, le temps écoulé entre le début d'une émission et le premier propos raciste, sexiste ou homophobe est modélisé par une loi exponentielle de paramètre $\lambda>0$. On répète l'expérience $n$ fois, avec $n$ beaucoup trop grand, et on cherche à déterminer $\lambda$.

\begin{enumerate}

\item Proposer un modèle statistique pour cette expérience enrichissante.

\begin{sol}

Chaque observation est une réalisation d'une loi exponentielle de paramètre $\lambda >0$ inconnu. On va donc se placer dans le modèle $\parentheses*{\cE(\lambda)}_{\lambda >0}$. Sous-entendu, l'espace de paramètres est $\Theta=\R_+^*$ et l'espace d'observation est $\cX=\R_+^*$.

\end{sol}

\item Déterminer l'estimateur $T_n$ de $\lambda$ par la méthode des moments.

\begin{sol}

On note $X$ une variable aléatoire de loi $\cE(\lambda)$. Alors $\mu_1$ est définie par, pour tout $\lambda >0$, $\mu_1(\lambda) = \esp[\lambda]{X} = \frac{1}{\lambda}$. En particulier, $\mu_1:\lambda \mapsto \frac{1}{\lambda}$ est un homéomorphisme de $\R_+^*$ dans lui-même, d'inverse $\mu_1^{-1}:x \mapsto \frac{1}{x}$.

Si $(X_1,\dots,X_n)$ est un $n$-échantillon de loi-mère $\cE(\lambda)$, alors les $X_i$ sont à valeurs dans $\R_+^*$, donc $\bar{X}_n= \frac{1}{n}\sum_{k=1}^n X_k$ aussi. Donc on a bien $\bar{X}_n$ à valeurs dans $\mu_1(\R_+^*)$, l'estimateur de $\lambda$ par la méthode des moments est bien défini, et c'est $T_n = \mu_1^{-1}(\bar{X}_n) = \frac{1}{\bar{X}_n} = \frac{n}{\sum_{k=1}^n X_k}$.

\end{sol}

\item\label{q: asymp} Montrer que $\sqrt{n}\frac{T_n - \lambda}{\lambda} \CVL{n\to +\infty} \gauss{0}{1}$.

\begin{sol}

L'espace de paramère $\Theta = ]0;+\infty[$ est un intervalle ouvert. Pour tout $\lambda >0$, $\esp[\lambda]{X^2} < +\infty$ et $\var[\lambda]{X} = \frac{1}{\lambda^2}$. La fonction $\mu_1$ est $\cC^1$ et $\mu_1':\lambda \mapsto - \frac{1}{\lambda^2}$ ne s'annule pas. Enfin, on vient de voir que $T_n$ était bien défini pour tout $n$.

D'après le cours, on a donc $\sqrt{n}(T_n - \lambda) \CVL{n \to +\infty} \gauss{0}{\frac{\var[\lambda]{X}}{\mu_1'(\lambda)^2}}$ pour tout $\lambda >0$. On en déduit
\begin{equation*}
\sqrt{n}\frac{T_n - \lambda}{\lambda} \CVL{n\to +\infty} \gauss{0}{1},
\end{equation*}
car $\frac{1}{\lambda^2}\frac{\var[\lambda]{X}}{\mu_1'(\lambda)^2} = \frac{1}{\lambda^2}\frac{\frac{1}{\lambda^2}}{\parentheses*{-\frac{1}{\lambda^2}}^2}=1$.

\end{sol}

\item\label{q: pivot} Soit $q \in \,]0;\sqrt{n}[$, montrer que $-q \leq \sqrt{n}\frac{T_n - \lambda}{\lambda} \leq q \iff \frac{T_n}{1+\frac{q}{\sqrt{n}}} \leq \lambda \leq \frac{T_n}{1-\frac{q}{\sqrt{n}}}$.

\begin{sol}

On résout les inéquations de sorte à isoler $\lambda$:
\begin{align*}
-q \leq \sqrt{n}\frac{T_n - \lambda}{\lambda} \leq q & \iff -\frac{q}{\sqrt{n}} \leq \frac{T_n}{\lambda} -1 \leq \frac{q}{\sqrt{n}} \iff 1 -\frac{q}{\sqrt{n}} \leq \frac{T_n}{\lambda} \leq 1 +\frac{q}{\sqrt{n}}\\
&\iff \frac{1}{1 +\frac{q}{\sqrt{n}}} \leq \frac{\lambda}{T_n} \leq \frac{1}{1 -\frac{q}{\sqrt{n}}} \iff \frac{T_n}{1+\frac{q}{\sqrt{n}}} \leq \lambda \leq \frac{T_n}{1-\frac{q}{\sqrt{n}}}.
\end{align*}
Remarquons que la condition $0 < q < \sqrt{n}$ assure que $0< 1 - \frac{q}{\sqrt{n}}$, ce qui permet de manipuler les inégalités correctement.

\end{sol}

\item En déduire un intervalle de confiance asymptotique $I_n$ de niveau $0,\!95$ pour $\lambda$.

\begin{sol}

On choisit $q = q_{0,975} = -q_{0,025}$. D'après la question~\ref{q: asymp}, pour tout $\lambda >0$ on a:
\begin{equation*}
\P_\lambda\parentheses*{-q \leq \sqrt{n}\frac{T_n - \lambda}{\lambda} \leq q} \xrightarrow[n \to +\infty]{} \P\parentheses*{\gauss{0}{1} \in [-q;q]} = 0,\!975 - 0,\!025 = 0,\!95.
\end{equation*}
La question~\ref{q: pivot} montre que, pour tout $n > q^2$, on peut pivoter. C'est-à-dire,
\begin{equation*}
\P_\lambda\parentheses*{-q \leq \sqrt{n}\frac{T_n - \lambda}{\lambda} \leq q} = \P_\lambda\parentheses*{\frac{T_n}{1+\frac{q}{\sqrt{n}}} \leq \lambda \leq \frac{T_n}{1-\frac{q}{\sqrt{n}}}}.
\end{equation*}
Si on pose $I_n = \squarebrackets*{\frac{T_n}{1+\frac{q}{\sqrt{n}}};\frac{T_n}{1-\frac{q}{\sqrt{n}}}}$ on a donc, pour tout $\lambda >0$, $\P_\lambda\parentheses*{\lambda \in I_n} \xrightarrow[n \to +\infty]{} 0,\!95$. Donc $I_n$ est un intervalle de confiance asymptotique de niveau $0,\!95$ pour $\lambda$.

\end{sol}

\end{enumerate}

\end{exo}

%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

\begin{exo}[Fonction pivot]

On considère le modèle statistique $\parentheses*{\gauss{0}{\sigma^2}}_{\sigma>0}$. Soit $n \in \N^*$ et $(X_1,\dots,X_n)$ un $n$-échantillon de loi-mère $\gauss{0}{\sigma^2}$, on définit $T_n = \frac{1}{n}\sum_{k=1}^n X_k^2$.

\begin{enumerate}

\item Montrer que $T_n$ est un estimateur fortement consistant de $\sigma^2$.

\begin{sol}

On part d'une suite $(X_k)_{k \in \N^*}$ de v.a.i.i.d. de loi $\gauss{0}{\sigma^2}$, en particulier $L^2$. Alors $(X_k^2)_{k \in \N^*}$ est une suite de v.a.i.i.d. $L^1$ de moyenne $\esp[\sigma]{X_k^2} = \var[\sigma]{X_k}=\sigma^2$. Par la loi forte des grands nombres,
\begin{equation*}
T_n = \frac{1}{n}\sum_{k=1}^n X_k^2 \CVps{n \to +\infty} \sigma^2.
\end{equation*}
Donc $T_n$ est un estimateur fortement consistant.

\end{sol}

\item On admet que $\frac{nT_n}{\sigma^2}$ suit la loi $\chi^2(n)$ et que cette loi admet des quantiles $(t^{(n)}_\alpha)_{0 < \alpha <1}$ bien définis et strictement positifs. Construire un intervalle de confiance non-asymptotique $I_n$ de niveau $\gamma \in \,]0;1[$ pour $\sigma^2$, par la méthode de la fonction pivot.

\begin{sol}

Soient $\alpha$ et $\beta$ tels que $0 < \alpha < \beta < 1$. Soit $Y \sim \chi^2(n)$, on a
\begin{equation*}
\P_\sigma\parentheses*{t^{(n)}_\alpha \leq \frac{nT_n}{\sigma^2} \leq t^{(n)}_\beta} = \P\parentheses*{t^{(n)}_\alpha \leq Y \leq t^{(n)}_\beta} = \beta - \alpha.
\end{equation*}
Par ailleurs, comme $t^{(n)}_\alpha >0$, si $t^{(n)}_\alpha \leq \frac{nT_n}{\sigma^2}$ alors $T_n >0$. On a donc:
\begin{align*}
t^{(n)}_\alpha \leq \frac{nT_n}{\sigma^2} \leq t^{(n)}_\beta &\iff \frac{t^{(n)}_\alpha}{nT_n} \leq \frac{1}{\sigma^2} \leq \frac{t^{(n)}_\beta}{nT_n} \iff \frac{nT_n}{t^{(n)}_\beta} \leq \sigma^2 \leq \frac{nT_n}{t^{(n)}_\alpha}\\
&\iff \sqrt{\frac{nT_n}{t^{(n)}_\beta}} \leq \sigma \leq \sqrt{\frac{nT_n}{t^{(n)}_\alpha}}.
\end{align*}

Ainsi $P_\sigma\parentheses*{\sqrt{\frac{nT_n}{t^{(n)}_\beta}} \leq \sigma \leq \sqrt{\frac{nT_n}{t^{(n)}_\alpha}}} = \P_\sigma\parentheses*{t^{(n)}_\alpha \leq \frac{nT_n}{\sigma^2} \leq t^{(n)}_\beta}= \beta-\alpha$. En particulier, on peut prendre $\alpha = \frac{1-\gamma}{2}$ et $\beta=\frac{1+\gamma}{2}$, de sorte que $\beta - \alpha = \gamma$. Finalement, on obtient un intervalle de confiance non-asymptotique de niveau $\gamma$ qui est:
\begin{equation*}
I_n = \squarebrackets*{\sqrt{\frac{\sum_{k=1}^n X_k^2}{t^{(n)}_{\frac{1+\gamma}{2}}}} ; \sqrt{\frac{\sum_{k=1}^n X_k^2}{t^{(n)}_{\frac{1-\gamma}{2}}}}}.
\end{equation*}

Si on veut se rapprocher des notations du cours, on peut poser $g:(\sigma,x_1,\dots,x_n) \mapsto \frac{1}{\sigma^2}\sum_{k=1}^n x_i^2$ de $]0;+\infty[ \times \R^n$ vers $\R^+$. Alors $g(\sigma,X_1,\dots,X_n) = \frac{1}{\sigma^2}\sum_{k=1}^n X_i^2 = \frac{nT_n}{\sigma^2} \sim \chi^2(n)$ est de loi indépendante de $\sigma>0$. Par ailleurs, soient $0<a<b$, on a:
\begin{align*}
a < g(\sigma,x_1,\dots,x_n) < b &\iff \frac{1}{b} > \frac{\sigma^2}{\sum_{k=1}^n x_i^2} > \frac{1}{a} \iff \frac{\sum_{k=1}^n x_i^2}{b} < \sigma^2 < \frac{\sum_{k=1}^n x_i^2}{a}\\
&\iff h_+(x_1,\dots,x_n) < \sigma < h_+(x_1,\dots,x_n),
\end{align*}
où $h_-:(x_1,\dots,x_n) \mapsto \sqrt{\frac{\sum_{k=1}^n x_i^2}{b}}$ et $h_+:(x_1,\dots,x_n) \mapsto \sqrt{\frac{\sum_{k=1}^n x_i^2}{a}}$. Donc $g$ est bien une fonction pivot. Pour $a= t^{(n)}_{\frac{1-\gamma}{2}}$ et $b= t^{(n)}_{\frac{1+\gamma}{2}}$, on retrouve $I_n = \squarebrackets*{h_-(X_1,\dots,X_n);h_-(X_1,\dots,X_n)}$.
\end{sol}

\end{enumerate}

\end{exo}

\end{document}