Thèse Estival Estimation Statistique en Temps Irrégulier pour Modèles à Variables Latentes H/F - Doctorat.Gouv.Fr
- CDD
- Doctorat.Gouv.Fr
Les missions du poste
Établissement : Université Bretagne Sud École doctorale : École doctorale Mathématiques & Sciences et Technologies de l'Information et de la Communication en Bretagne Océane Laboratoire de recherche : Laboratoire de mathématiques de Bretagne Atlantique Direction de la thèse : Matthieu MARBAC ORCID https://orcid.org/00 Date limite de candidature : 2026-05-15T00:00:00
Ce projet vise à fonder une théorie statistique rigoureuse pour l'inférence des modèles à variables latentes sous échantillonnage temporel discontinu. L'objectif principal est de développer de nouvelles méthodes d'estimation et de sélection de modèles capables de traiter l'irrégularité temporelle sans sacrifier la flexibilité. Une attention particulière sera portée à l'approche semi-paramétrique afin d'atténuer les biais associés aux modèles paramétriques classiques souvent mal spécifiés pour les données réelles. Le projet ambitionne ainsi de lever des verrous méthodo-
logiques majeurs pour l'analyse des processus stochastiques en temps continu.
L'étude des modèles à variables latentes est aujourd'hui cruciale pour analyser des systèmes complexes où une dynamique invisible régit les observations. Les Modèles de Markov Cachés (HMM) occupent une place centrale dans cette famille, car ils constituent un cadre flexible pour modéliser des processus dont les états ne sont pas directement observables, permettant ainsi de capturer la dépendance temporelle et l'hétérogénéité des données via une structure de dépendance markovienne.
Cette hypothèse est pourtant fréquemment infirmée dans les applications concrètes : en santé, les examens médicaux surviennent à des intervalles irréguliers dépendant de variables latentes, tandis qu'en écologie, les trajectoires de déplacement ne sont enregistrées que lors de fenêtres d'opportunité (par exemple lorsqu'un animal marin remonte à la surface). L'utilisation de modèles standards sur de telles données peut induire des biais d'inférence significatifs. Récemment, un algorithme EM a été proposé pour obtenir l'estimateur du maximum de vraisemblance d'un HMM dans le cas de données collectées en temps irrégulier. Cependant, ce travail soulève plusieurs questions théoriques, notamment concernant la consistance ou la vitesse de convergence des estimateurs. L'enjeu actuel réside donc dans le développement de cadres méthodologiques intégrant l'incertitude liée à l'échantillonnage irrégulier et à la multiplicité des sources de données.