Les champs aléatoires conditionnels (conditional random fields ou CRFs) sont une classe de modèles statistiques utilisés en reconnaissance des formes et plus généralement en apprentissage statistique. Les CRFs permettent de prendre en compte l'interaction de variables « voisines ». Ils sont souvent utilisés pour des données séquentielles (langage naturel, séquences biologiques, vision par ordinateur).
Les CRFs sont un exemple de réseau probabiliste non orienté. Il s'agit d'une version de type modèle discriminant des champs aléatoires de Markov généralement présentés comme des modèles discriminatifs, c'est-à-dire que l'on cherche à modéliser la probabilité conditionnelle , étant les observations et les variables à estimer, au lieu de .
Description
Un CRF est défini par Lafferty, McCallum et Pereira[1] comme suit.
Soit un graphe. est indexé par les nœuds ( pour vertices) de : . On dit que est un champ aléatoire conditionnel si les variables aléatoires conditionnées à obéissent à la propriété de Markov :
, où signifie que et sont des voisins dans .
Ici la propriété de Markov signifie que la probabilité de chaque variable ne dépend que des valeurs en les voisins de .
Références
- Conditional random fields: Probabilistic models for segmenting and labeling sequence data, Lafferty, J., McCallum, A., Pereira, F., Proc. 18th International Conf. on Machine Learning, Morgan Kaufmann, p. 282–289, 2001