Classe VC
Une classe de Vapnik-Tchervonenkis ou classe VC (suivant la translitération anglaise) est un sous-ensemble d'un ensemble donné dont la dimension VC est finie. Cette notion est utilisée en apprentissage machine (« machine learning ») puisqu'elle est une condition nécessaire et suffisante au principe de minimisation du risque empirique (principe MRE).
Définition
Classe VC d'ensemble
Soit une classe de sous-ensembles d'un ensemble . Soit des éléments de . On dit que prélève un sous-ensemble s'il existe tel que . On dit que pulvérise si tous les sous-ensembles de ce dernier sont prélevés par .
On appelle taille VC ou dimension VC de l'ensemble le plus petit pour laquelle aucun élément de est pulvérisé par . Si pulvérise tous les ensembles de tailles arbitraires, sa taille VC est infinie. Cette dimension est notée en général ou . De manière plus formelle, on introduit la taille des prélèvements qui correspond au nombre de sous-ensembles que que peut prélever, et la taille VC d'une classe par
L'ensemble est appelé classe de Vapnik-Tchervonenkis ou classe VC si sa taille VC est finie : . On peut également préciser qu'il s'agit d'une classe VC d'ensembles.
Remarque : la définition de la taille VC peut être différente selon les sources. En effet, certains auteurs prennent comme définition le plus grand entier pour lequel la classe de fonctions arrive à pulvériser tout échantillon de taille . La différence entre ces deux définitions n'est que de 1.
Exemples :
- La classe des intervalles est une classe VC de dimension VC 1. La classe arrive à expulser un point mais pas deux points. En effet si avec alors n'arrive pas à prélever puisque .
- La classe des intervalles est une classe VC de dimension VC 2. n'arrive pas à expulser trois points : si avec alors n'arrive pas à prélever . arrive à expulser deux points : soient avec alors si on pose ,
- ;
- ;
- .
- La classe boules de , i.e. est une classe VC de dimension . Rappel : avec une distance donnée.
- La classe des polygones du plan est de dimension VC infini, autrement dit peut repousser au moins un ensemble de taille arbitraire. En effet, pour tout , on peut prendre des points appartenant à un même cercle, tel que le cercle unité. Alors tout sous-ensemble de forme les sommets d'un polygone et ce dernier ne contiendra pas les points de n'appartenant pas au sous-ensemble.
Classe VC de fonctions
Soit une classe de fonctions mesurables définies sur et à valeurs réelles. Si la classe des sous-graphes des fonctions de (le sous-graphe de est ) forme une classe VC alors est appelée classe VC (ou classe VC de sous-graphe).
Exemple :
- La classe des fonctions indicatrices est une classe VC de dimension 1.
Propriétés
Lemme de Sauer
Le lemme de Sauer borne le nombre de sous-ensemble d'un échantillon de taille fixée prélevée par une classe VC que l'on peut avoir au maximum. Formellement, si est une classe VC d'ensemble alors (cf. corollaire 2.6.3[1])
où .
Classe VC
Les classes VC vérifient des propriétés de stabilité. Autrement dit, des opérations de classes VC (comme l'union, l'intersection, ...) de classes VC est toujours une classe VC.
Classe VC d'ensembles
Soit et des classes VC d'un même ensemble et et des fonctions. Alors (cf. lemme 2.6.17[1]) :
- est une classe VC ;
- est une classe VC ;
- est une classe VC ;
- est une classe VC si est injective ;
- est une classe VC.
Si sont classes VC respectivement des ensembles et alors
- est une classe VC de .
Si est une classe de cardinal fini alors est une classe VC de dimension VC bornée par
Classe VC de fonctions
Soient et des classes VC de fonctions d'un ensemble et et des fonctions. Alors (cf. lemme 2.6.18[1])
- est une classe VC de fonctions (rappel : ) ;
- est une classe VC de fonctions (rappel : ) ;
- est une classe VC d'ensemble ;
- est une classe VC de fonctions ;
- est une classe VC de fonctions ;
- est une classe VC de fonctions ;
- est une classe VC de fonctions ;
- est une classe VC de fonctions si est monotone.
Recouvrement polynomial
Les classes VC sont des classes polynomiales, i.e. que le nombre de recouvrement est polynomiale. En effet (cf. théorème 2.6.4[1]), il existe une constante universelle tel que pour tout classes VC , pour tout mesure de probabilité , pour tout et ,
Les classes VC de fonctions vérifient également ce type de propriété. En effet (cf. théorème 2.6.7[1]), il existe une constante universelle tel que pour toute classe VC de fonctions avec une enveloppe mesurable et , on a pour toute mesure de probabilité vérifiant et tout ,
Références
- (en) A. W. Van Der Vaart et J. A. Wellner, Weak Convergence and Empirical processes, Springer