La Regression de Poisson est
– une analyse multivariable
– pour une variable de comptage discrète
– dont la distribution suit la Loi de Poisson
– qui prend en considération la notion du temps d’exposition pour chaque groupe
– nous permet de mesurer l’Incidence Risque Ratio (IRR).
Hier, dans le Lancet, a été publiée les données intermédiaires de l’étude phase 3 du vaccin anti-SarsCov2, développé par Oxford-AstraZeneca. Les résultats ont été calculé en utilisant la regression Poisson. L’occasion de rappeler les conditions d’utilisation de cette méthode.
En entrée, quelle différence y’a-t-il entre le RR et le IRR?
Le Risque Relatif (RR)
Le RR d’un événement est le rapport entre la probabilité de l’évènement chez les exposés et la probabilité de l’évènement chez les non exposés.
Il correspond aux rapports des 2 taux d’attaques.
Le RR est calculé dans les études de cohorte, transversalles ou expérimentales.
Dans notre exemple, et pour faciliter la démonstration, nous allons nous concentrer sur une seule ligne, la ligne correspondante aux patients symptomatiques COVID19, toutes études confondues (Mais, vous pouvez, très bien, vous amusez à refaire les calculs pour les autres groupes ).

Nombre de cas COVID19 | Effectif total | Risque Absolu | |
Groupe vacciné | 37 | 5807 | 0.63% |
Groupe control | 112 | 5829 | 1.92% |
On obtient , selon les définitions, que vous pouvez, retrouvez dans le post précedent:
RR = R1 / R0 = 0.63 / 1.92 = 0.32
Et La réduction du risque relatif (RRR) ?
Elle correspond à… L’EFFICACITE
Eh, oui, tout simplement 1- RR
Souvenez-vous

Dans notre exemple, elle correspond à 1 – 0.32 = 67%.
Pour rappel, l’odds ratio OR est le rapport des cotes d’exposition. Cette notion de cote est semblable à celle utilisée pour les paris sportifs. L’OR est utilisé dans les études cas-témoins. Lorsque la fréquence de la maladie est faible, on peut supposer que le OR peut être similaire au risque relatif (RR) de la maladie. J’y reviendrais en détails, dans le cadre d’une étude cas-témoins.
L’ Incidence Risque Ratio (IRR)
IRR prend en considération la notion de suivi des patients dans le temps, de façon différente que le RR.
Le risque ratio d’incidence est un rapport de 2 taux d’incidence.
La différence est que le RR est le rapport de 2 taux d’attaque avec le même temps de suivi calculé dans les études de cohorte (par exemple, taux d’attaque des personnes exposées après 5 ans d’étude : nombre de cas en 5 ans/ toutes les personnes exposées).
Le IRR correspond au rapport de 2 taux d’incidence prenant en compte le temps pendant lequel chacun des sujets a été exposé et il est calculé, ici, par régression de Poisson (taux d’incidence : cas/somme de temps pendant lequel chaque participant est exposé).
On arrive à la regression de Poisson
Il y a donc une Regression et une Loi de Poisson
On y va
Je vais vous présenter les conditions de son utilisation sans développer les théories mathématiques
Regression = Analyse multiple multivariable (et non pas multivariée, voire le post correspondant).
Nous avons donc:
A – une variable à expliquer, dites également “variable dépendante” .
Pour utiliser la Regression de Poisson, il faut que la variable à expliquer soit:
– un évenement rare
ou
–une variable de comptage: Il s’agit d’une variable quantitative discrète
soit en dénombrement d’événement pendant une période de temps donnée
(exemple: moyenne des infections nosocomiales dans un service donné sur une période d’1 an)
ou exprimée en personnes-temps qui correspond à la densité de l’incidence.
Dans notre exemple, on parle de PersonneJour

B – Les variables explicatives
Elles correspondent aux différents facteurs confondants (potentiellement de risque ou protecteur).
Le choix des variables explicatives dépendra, comme pour toute régression,
-des résultats de l’analyse univarié (p>0.05), voire p>0.02 selon le plan d’analyse statistique choisi.
-des données de la littérature
-du risque d’interaction entre les variables.
La Loi de Poisson
Pour utiliser la Regression de Poisson, il faut que la distribution de la variable discrète suive la loi de Poisson.
Autrement dit, une courbe où la moyenne est égale à la variance.
Ce qui, en pratique, est assez rare et difficile à vérifier, d’où un risque de “surdispersion” et de résultats faussement significatifs.
Dans ce cas, la regression de Poisson n’est pas valable, et on utilisera un autre modèle statistique, qui est la régression binominale négative.
Bref,
La Regression de Poisson est
– une analyse multivariable
– pour une variable de comptage discrète
– dont la distribution suit la Loi de Poisson (la moyenne est égale à la variance)
– qui prend en considération la notion du temps d’exposition pour chaque groupe
– nous permet de mesurer l’Incidence Risque Ratio (rapport de 2 taux d’incidence prenant en compte le temps pendant lequel chacun des sujets a été exposé).
Je saute le dessert ce soir
Le sujet étant assez complexe, je n’ai pas souhaité développer tous ces aspects dans un seul post.
Voici quelques références pour aller plus loin, si vous le souhaitez:
https://www.youtube.com/watch?v=sTvOgrLWEgY
A modified Poisson regression approach to prospective studies with binary data. Am J Epidemiol. 2004; 159: 702-706
http://ocw.jhsph.edu/courses/fundepiii/PDFs/Lecture16.pdf
https://www.em-consulte.com/article/143634/figures/risque-relatif-et-odds-ratio
http://www-sante.ujf-grenoble.fr/SANTE/corpus/disciplines/sanpub/methodo/72/leconimprim.pdf
Et voici la réference de l’article:
Safety and immunogenicity of the ChAdOx1 nCoV–19 vaccine against SARS–CoV–2: a preliminary report of a phase 1/2, single-blind, randomised controlled trial.Folegatti PM, Ewer KJ, Aley PK, et al. Oxford COVID Vaccine Trial Group.Lancet. 2020 Aug 15;396(10249):467-478. doi: 10.1016/S0140-6736(20)31604-4. Epub 2020 Jul 20.PMID: 32702298 Free PMC article.
N’hésitez pas à me faire part de vos questions et commentaires.
A très vite
Ihsane