Tải bản đầy đủ (.pdf) (26 trang)

Mô hình xác suất & thống kê phân tích các mối nguy hiểm thực phẩm docx

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.38 MB, 26 trang )

Rencontre Matrisq/Mét@risk/Morse
le 23/02/2010
Modélisation probabiliste & statistique
pour l’analyse des risques alimentaires
Isabelle Albert, CR1, Unité Mét@risk, Département
MIA (Mathématiques et Informatique appliquées),
INRA
Modélisation probabiliste & statistique
pour l’analyse des risques alimentaires
• Le risque (alimentaire) : notion qui sous-entend l’incertain,
domaine des probabilités et de la statistique
• Objectif : développer des méthodes quantitatives d’évaluation
de risque alimentaire
de risque alimentaire
• Données : de consommation (fréquences, quantités en g
consommées), mesures de contamination (mesures au mieux de
concentration par g), informations sur les paramètres
déterminant l’évolution de la contamination (données de la
littérature (ex: sur la demi-vie d’un contaminant), mesures
(températures de cuisson d’un aliment) et/ou dires d’experts (ex:
température minimale de croissance d’une bactérie))
Modélisation probabiliste & statistique
pour l’analyse des risques alimentaires
• Le(s) but(s) de la modélisation :
– rendre compte de situations et permettre le calcul du risque (sources de
variabilité/incertitude, données au caractère « sparse », risques
« extrêmes », sur le court/long terme, etc. )
– déterminer les facteurs influents
• Utilisation et développement de méthodes statistiques
originales :
Théorie des valeurs extrêmes (pour déterminer la probabilité


de dépassement d’une exposition tolérable), méthodes
d’apprentissage statistique (pour déterminer des régimes
alimentaires), statistiques des processus (pour le suivi de la
contamination dans l’organisme), techniques bayésiennes
(pour la quantification du risque), etc.
Plan
• Modélisation stochastique de la fourche à
la fourchette
• Modélisation stochastique et intégration
de données par statistique bayésienne
de données par statistique bayésienne
• Elicitation de dires d’experts
• Perspectives
Modélisation probabiliste & statistique
pour l’analyse des risques alimentaires
• Modélisation stochastique de la fourche à la
fourchette
• Applications :
– Projet AFSSA/INRA : Évaluation par un modèle stochastique de
la croissance de Listeria monocytogenes dans un tank à lait
réfrigérant
réfrigérant
» Distinction variabilité/incertitude (Modèle hiérarchique
bayésien, simulation de Monte Carlo d’ordre 2)
– ANR B. cereus : Appréciation quantitative du risque
d'émergence de Bacillus cereus, des matières premières au
consommateur
– Perspectives : Projet ANR RIBENUT : Nouvelles approches
pour une évaluation du compromis risque microbiologique –
bénéfice nutritionnel pour les légumes traités thermiquement

» modèles de dégradation de la vitamine C selon la chaleur, le
pH, l’oxygène…
1. Contexte et objectif
B. cereus
2. Matériel
Couple B. Cereus / REPFED (refrigerated processed food of
extended durability; ici purée de courgette)
B. cereus
extended durability; ici purée de courgette)
 Continuum de mésophiles, …, psychrotrophes
 Processus biologiques (croissance, destruction,
germination) couplés à des traitements industriels
(cuisson, mélange, pasteurisation,
partitionnement)
Hétérogénéité de B. cereus
Groupe
génétique
Croissance à Type TIA
7°C 10°C 43°C
I Non Oui* Non* B. pseudomycoïdes Non
II
Oui*
Oui
Non
Non défini
Oui
B. cereus
Référence : Guinebretière et al., 2008
II
Oui*

Oui
Non
Non défini
Oui
III Non Non Oui Emetic
B. cereus strains
Oui
IV Non Oui Oui*
Non défini
Oui
V Non Oui Non
Non défini
Oui
VI Oui Oui Non B. weihenstephanensis,
B. mycoïdes
Non
VII Non Non Oui “French killer” Oui
Considérer la diversité des souches dans la population
Si la population des souches était mésophile alors….
Si la population des souches était psychrotrophe alors…
B. cereus
psyc1
psyc2
méso1
méso2
méso3
p
1
=p
2

=p
3
=1/6
p
4
=p
5
=1/4
Vers une réelle prévalence
Diagramme de flux
Batch de
légumes
Broyage
Transport
réfrigéré
Prot
é
ine
de
Conservation au
froid en usine
Cuisson
Batch de
légumes
Broyage
Transport
réfrigéré
Prot
é
ine

de
Conservation au
froid en usine
Cuisson
Batch de
légumes
Broyage
Transport
réfrigéré
Prot
é
ine
de
Prot
é
ine
de
Conservation au
froid en usine
Cuisson
G
E
R
M
I
N
A
C
T
C

R
O
I
S
B. cereus
Broyage
Mélange
Partitionnement
Conservation au froid
en magasin
Transport à la
maison
Conservation au froid au
réfrigérateur domestique
Prot
é
ine
de
lait
Amidon
Autres
ingrédients
Intervalle de temps
Pasteurisation
Broyage
Mélange
Partitionnement
Conservation au froid
en magasin
Transport à la

maison
Conservation au froid au
réfrigérateur domestique
Prot
é
ine
de
lait
Amidon
Autres
ingrédients
Intervalle de temps
Pasteurisation
Broyage
Mélange
Partitionnement
Conservation au froid
en magasin
Transport à la
maison
Conservation au froid au
réfrigérateur domestique
Prot
é
ine
de
lait
Amidon
Autres
ingrédients

Prot
é
ine
de
lait
Amidon
Autres
ingrédients
Amidon
Autres
ingrédients
Intervalle de temps
Pasteurisation
M
I
N
A
T
I
O
N
T
I
V
A
T
I
O
N
S

S
A
N
C
E
 Modèle stochastique (simulation de Monte Carlo) :
 Modélisation de la croissance et décroissance bactérienne à chaque « étape-clé »
 La quantité de bactérie à une étape dépend de la quantité de bactérie à l’étape
précédente
 À chaque paramètre d’entrée est associée une distribution de probabilité reflétant son
incertitude et/ou sa variabilité

Les profiles temps
-
températures de cuisson et pasteurisation enregistrés par les
3. Méthode : approche probabiliste
B. cereus

Les profiles temps
-
températures de cuisson et pasteurisation enregistrés par les
industriels ont été convertis en temps équivalents pour une température cible de 90°C
 Partitionnement des batchs de courgettes en paquet : répartition aléatoire de la
contamination dans les paquets
 2 000 batchs, 860 paquets, 100 paquets contaminés suivis
 Une itération : suivi des 6 groupes génétiques
 28 paramètres par groupe génétique :
• input : contamination initiale du légume et des 2 types d’ingrédients,
• paramètres industriels (ex : temps de cuisson et température de cuisson)
• paramètres microbiologiques (Tr, z, p, delta, température maximale de germination, T

min
, T
opt
, T
max
, …)
 Modélisation des paramètres
 Source d’industriels et de microbiologistes
• Données observées
• Données de littérature
• Avis d’experts
 Distribution de probabilité
• Valeur nominale
• Ajustement à des données validé par des tests d’adéquation

Distribution établie par avis d

experts
B. cereus

Distribution établie par avis d

experts
ex : BetaPert(min,,valeur la plus probable, max)
Pert(0,5; 1; 1,4)

0,0
0,5
1,0
1,5

2,0
2,5
0,4
0,5
0,6
0,7
0,8
0,9
1,0
1,1
1,2
1,3
1,4
1,5
100,0%
0,500 1,400
19%
87%
81%
33%
100%
54%
62%
83%
III
II
Total
groupe génétique de B. cereus
Pourcentage d’unités (batch ou paquet)
contenant au moins une spore bactérienne

de l’un au moins des groupes génétiques
4. Résultats
0,6%
0,1%
0,1%
82%
37%
9%
6%
4%
100%
81%
65%
47%
30%
49%
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
VII
VI
V
IV
III
groupe génétique de B. cereus
paquets contaminés (%)
Après cuisson
Après mélange et partitionnement
Après pasteurisation

II: 50.5%
VII: 0.3%

VI: 48.3%
V: 0.2%
VI: 13.1%
VII: 13%
Proportion moyenne de chaque groupe génétique
sur la population totale de B. cereus
IV: 0.3%
III: 0.3%
V: 0.3%
VI: 48.3%
II: 54.9%
III: 11.7%
IV: 7.1%
(1) Avant cuisson
des courgettes
(2) Après cuisson
des courgettes
Modélisation probabiliste & statistique
pour l’analyse des risques alimentaires
• Modélisation stochastique et intégration de
données par statistique bayésienne
• Construction d’un Réseau bayésien sur l’ensemble de la
chaîne à partir d’informations a priori (dires d’experts; données
résumées de la littérature)
• Amélioration des connaissances et évaluation du risque de
manière bayésienne une fois les données introduites
manière bayésienne une fois les données introduites
– Applications :
• Campylobacter/Poulet
• PNRA Quant’HACCP : l’appréciation quantitative des risques

microbiologiques au service des mesures de maîtrise des
dangers afin de respecter des objectifs de sécurité des aliments
– WP4 : B. cereus
Construction du réseau : notamment définir les liens stochastiques ou
fonctionnels entre les variables
p_f
l_c
m_f
s_f
a_c
b_c
Consumption
Chicken
Farm
Cons
Campylobacter
p_b
p_ey
p_h
p_ib
s_b
m_bd_bf
l_e p_e
p_hc p_hh
p_it
p_ie
p_iq
Broiler
Production
Exposure

Hygiene
Illness
logit(p_b) ~ Normal(m_b,s_b^2)
m_b = m_f + d_bf
d_bf >= 0
Incorporation des données :
- Rattachement des données aux réseaux
- Calcul des distributions a posteriori des quantités non observées
l_c
s_f
a_c
b_c
g_situ
n_csb
g_fs
l_cs l_csb
p_fs
Consumption
Chicken
Farm
Cons
Campylobacter
p_f
p_b
p_ey
l_c
p_h
p_ib
m_f
s_b

m_bd_bf
b_c
l_e p_e
p_hc p_hh
p_it
p_ie
p_iq
n_csb
g_bs
p_situ
g_ie
p_bs
Broiler
Production
Exposure
Hygiene
Illness
Validation a priori et a posteriori du modèle
Campylobacter
Modélisation probabiliste & statistique
pour l’analyse des risques alimentaires
• Elicitation de dires d’experts
• Combinaison de dires d’experts
– Application : Modèle dose-réponse Listeria mono. sur des souris
X
d
= nombre de souris mortes quand n souris
reçoivent la même dose de pathogène (listeria)
X
d

| p(d) ~Bino(n, p(d)),
où p(d) = Prob de mourir avec une dose d
Modèle
Modèle sur p(d)
Exponentiel : p(d) = 1 – exp(-αd)
1 paramètre α
α
αα
α
= shape parameter,
Pas d’interprétation concrète !
Approche
Construction de l’a priori
On suppose une famille paramétrique (dans notre
exemple log-normale)
π(θ) ∈ { π( θ | λ ), λ ∈ Λ }
Les N experts nous donnent des quantités D =
Les N experts nous donnent des quantités D =
{D
1
, , D
N
} sur λ
Approche bayésienne
λ
λ
π
λ
θ
π

θ
π
θ
π
d
D
D
)
(
)
(
)
(
)
(

=
=
Combinaison
Interactions entre experts ?
Les experts peuvent avoir des sources de
connaissances similaires (expériences
communes, séminaires communs,…)
(ex: experts microbio Pasteur=3 et Tours=2)
(ex: experts microbio Pasteur=3 et Tours=2)
Les quantités données sont moins informatives
que si elles provenaient d’experts indépendants
Idée = considérer des groupes d’experts dans un
modèle à structure hiérarchique
Modèle hiérarchique

π(θ) = ∫ π(θ | λ) π(λ | D) dλ
K groupes d’experts
Pour chaque expert i du groupe j :
λ
ij
=
λ
j
+

ij


ij
~ (0 ,
τ
j
)
: variation
λ
ij
=
λ
j
+

ij


ij

~ (0 ,
τ
j
)
: variation
dans le groupe
λ
j
= λ + ∆
j
où ∆
j
~ (0 , τ) : variation
intergroupe
λ ~ π
0
faiblement informative
Modèle hiérarchique
π(λ | D) ∝ π
0
(λ) ∫ ∫ ∏π(D | λ
ij
) π(λ
ij
| λ
j
) π(λ
j
| λ
)


ij

obtenue par MCMC

π
(
θ
) =

π
(
θ
|
λ
)
π
(
λ
|
D) d
λ

π
(
θ
) =

π
(

θ
|
λ
)
π
(
λ
|
D) d
λ
obtenue par MCMC

Un modèle d’erreur sur les quantités données est
introduit
D
ij
| D
ijTrue
~ (0, v
ij
)
Vraisemblance
Erreur sur les quantiles élicités : probit model
Φ
-1
(q
ijt
) = Φ
-1
(q

true
ijt
) + ε
ijt
avec ε
ijt
~ N(0,v
ijt
)
Choix de v
ijt
basé sur les confiances demandées c
ijt
et
une précision posée q*
P(| Φ
-1
(q
ijt
) - Φ
-1
(q
true
ijt
) |<q*)=c
ijt
ijt
ijt
ijt


P(-q* ≤ ε
ijt
≤q*) = c
ijt

√v
ijt
= q*/Φ
-1
((c
ijt
+1)/2)
Par exemple : q*=1.96,
Si c
ijt
=90% →√v
ijt
=1.2 et c
ijt
=50% →√v
ijt
=2.9

×