Introduction
L'analyse de survie, également appelée analyse de durée, est un ensemble de méthodes statistiques qui se concentre sur le délai avant un événement dans les études de survie. Elle est largement utilisée en recherche biomédicale, notamment en épidémiologie, dans les essais cliniques et en santé publique. Ce cours vise à approfondir la compréhension de l'analyse de survie et des modèles de risque, notamment leur application, leurs hypothèses et leur interprétation en recherche biologique.
Contexte et motivation
Avant de se lancer dans l'analyse de survie, il est essentiel de comprendre le contexte et les motivations de son utilisation. L'objectif principal de la recherche biomédicale est d'améliorer les résultats en matière de santé, ce qui implique souvent de comprendre la progression de la maladie, les effets des traitements et les facteurs de risque. L'analyse de survie constitue un outil puissant pour répondre à ces questions en modélisant le délai avant un événement, tel que l'apparition de la maladie, le décès ou la récidive.
Concepts clés de l'analyse de survie
Cette section abordera les concepts fondamentaux de l'analyse de survie, notamment :
- Fonction de survie : Probabilité de survie au-delà d'un instant donné
- Fonction de risque cumulé : Probabilité de subir un événement jusqu'à un instant donné
- Fonction de taux de risque : Taux instantané de probabilité qu'un événement se produise à un instant donné, sachant que l'individu a survécu jusqu'à cet instant
- Estimateur de Kaplan-Meier : Méthode non paramétrique d'estimation des probabilités de survie au fil du temps à partir de données censurées
- Modèle de risques proportionnels de Cox : Modèle de régression semi-paramétrique utilisé pour évaluer l'effet des variables explicatives sur le taux de risque
- Risques concurrents : Situations où un individu peut subir plusieurs types d'événements, et où la survenance d'un événement influence la probabilité d'un autre événement
- Covariables dépendantes du temps : Covariables susceptibles de changer au fil du temps et d'influencer le taux de risque
- Modèles de fragilité : Prise en compte de l’hétérogénéité non observée au sein d’une population
Hypothèses, limites et interprétation des modèles
La compréhension des hypothèses, des limites et de l’interprétation des modèles de survie est essentielle à leur bonne application en recherche biologique. Cette section couvrira :
- Hypothèses : Explication des hypothèses courantes formulées dans l’analyse de survie, telles que l’hypothèse d’indépendance de la censure et l’hypothèse des risques proportionnels.
- Limites : Discussion des situations dans lesquelles les modèles de survie peuvent ne pas être appropriés et des approches alternatives qui peuvent être utilisées.
- Interprétation du modèle : Lignes directrices pour l’interprétation des résultats de l’analyse de survie, y compris les rapports de risque, les intervalles de confiance et les valeurs de p.
- Comparaison et sélection de modèles : Méthodes de comparaison et de sélection parmi différents modèles de survie en fonction de l’adéquation et de la précision prédictive.
- Validation du modèle : Techniques de validation des modèles de survie, telles que la validation interne (bootstrap, jackknife) et la validation externe (échantillons de réplication, ensembles de données indépendants).
Études de cas en recherche biologique
Cette section présentera des études de cas illustrant l’application de l’analyse de survie en recherche biologique, notamment :
- Analyse de la survie au cancer : Analyse du délai jusqu’au décès après un diagnostic de cancer, en tenant compte du traitement, des données démographiques, et facteurs cliniques
- Dynamique de transmission des maladies infectieuses : Modélisation du délai d’infection ou de rétablissement lors d’épidémies de maladies infectieuses, en tenant compte des covariables temporelles et des risques concurrents
- Comportement animal et longévité : Analyse de la survie des animaux sauvages, en tenant compte de l’âge, du sexe, de l’habitat et d’autres facteurs susceptibles d’influencer la longévité
- Essais cliniques : Évaluation de l’effet d’un nouveau traitement sur la survie par rapport à un groupe témoin, en tenant compte des facteurs de confusion potentiels
Sujets avancés en analyse de survie et modèles de risque
Cette section abordera des sujets avancés qui s'appuient sur les bases présentées précédemment :
- Modèles multi-états : Modélisation des transitions entre plusieurs états de santé au fil du temps
- Modèles conjoints : Prise en compte simultanée des données longitudinales (mesures répétées) et des données de survie
- Modèles de fragilité pour données longitudinales : Extension des modèles de fragilité pour tenir compte de l'hétérogénéité non observée dans les mesures répétées
- Analyse de survie avec plans d'échantillonnage complexes : Intégration des pondérations d'enquête, du clustering et de la stratification dans les modèles d'analyse de survie
- Inférence causale dans l'analyse de survie : Méthodes d'estimation des effets causaux à l'aide de données de survie, telles que les variables instrumentales, la formule g et l'appariement par score de propension
- Analyse de survie avec covariables variables dans le temps : Prise en compte des covariables variables dans le temps qui peuvent évoluer au cours de l'étude
- Modèles de survie non paramétriques : Approches alternatives aux modèles de survie paramétriques tels que l'estimateur de Nelson-Aalen et l'estimateur d'Aalen-Johansen
- Modèles de temps de défaillance accélérés : Modélisation de la relation entre les variables explicatives et le logarithme du temps de défaillance plutôt que le taux de risque