Kernelisation
En informatique théorique, et notamment en théorie de la complexité, la kernelisation ou réduction au noyau est une formalisation d'un prétraitement efficace d'une instance d'un problème NP-difficile qui consiste à l'alléger et à le simplifier. La réduction se place dans le cadre de la complexité paramétrée.
La réduction est possible quand une instance d'un problème possède des parties qui sont facilement décidables et détectables, et que l'on peut enlever sans modifier le problème de départ. Les données qui subsistent après ces réductions forment le noyau de l'instance.
Exemples
Avant de donner une définition formelle, des exemples typiques :
Dans une instance du problème de coloration de graphe avec q couleurs, on peut successivement enlever les sommets x dont le degré est inférieur à q puisque, dans une coloration en q couleurs du reste du graphe, le voisinage du sommet x contient au plus q-1 couleurs, ainsi il reste toujours une couleur de disponible pour colorer x. Par conséquent, le graphe de départ est colorable en q couleurs si et seulement si le graphe obtenu par suppression du sommet x l’est.
Dans une instance (G,k) du problème de couverture par sommets (qui consiste en la recherche d'une couverture par k sommets) on peut choisir successivement des sommets x dont le degré est plus grand que k. En effet ces sommets font nécessairement partie d'une couverture par sommets parce que les arêtes incidentes à x doivent être couvertes, et si x ne fait pas partie de la couverture, tous les sommets de son voisinage doivent en faire partie ; s'il y a plus de k voisins, la borne de k serait dépassée. Ainsi, G possède une couverture de taille au plus k si le graphe privé de x possède une couverture de taille au plus k-1.
Dans une instance G du problème d'existence d'une clique de q sommets, on peut supprimer successivement des sommets x dont le degré est strictement plus petit que q-1, parce que les sommets d'une clique de taille q sont voisins des autres q-1 sommets de la clique ce qui implique qu'ils sont de degré au moins q-1. Ainsi, G possède une clique de taille q exactement si le graphe privé de x en possède une.
Définition formelle
Deux formulations proches ont été proposées :
Formulation de Downey et Fellows
Pour Downey et Fellows 1999, un problème paramétré est une partie qui décrit un problème de décision.
Une kernelisation pour un problème paramétré est un algorithme qui prend une instance et la transforme, en temps polynomial en la taille n de et de la valeur en une instance avec les propriétés suivantes :
- est dans si et seulement est dans ,
- la taille de est majoré par une fonction calculable en ,
- est majoré par une fonction en indépendante de .
Le résultat de la kernelisation est appelé le noyau. La taille de est ici juste sa longueur comme chaîne de symboles ; on peut aussi considérer le nombre de sommets ou le nombre d'arêtes, dans le contexte de problèmes sur les graphes.
On dit que le problème admet un noyau polynomial si , et un noyau linéaire si . Si on trouve un tel algorithme, alors on sait résoudre le problème de départ en temps , où est le coût d’un algorithme de résolution du problème non paramétré et où le terme correspond au coût polynomial de la réduction[1].
Formulation de Flum et Grohe
Pour Flum et Grohe 2006, p. 4, un problème paramétré est composé d'un problème de décision et d'une fonction , la paramétrisation. Le paramètre d'une instance est le nombre .
Une kernelisation pour un problème paramétré est un algorithme qui prend une instance avec paramètre et la transforme, en temps polynomial en une instance avec les propriétés suivantes :
- est dans si et seulement si est dans et
- la taille de est majorée par une fonction calculable en .
Dans cette formulation, la borne sur la taille de implique que le paramètre de est aussi majoré par une fonction en .
La fonction est fréquemment appelée la taille du noyau. Si , on dit que possède un noyau polynomial. De même, si , le problème possède un noyau linéaire.
Remarque
Dans la formulation de la réduction, le problème de départ n'est pas forcément décidable ou récursivement énumérable. Par exemple, la suppression d'états inaccessibles dans une machine de Turing répond formellement à la définition d'une réduction au noyau pour la question (indécidable) de savoir si la fonction calculée par la machine de Turing est une fonction partielle.
Exemples (suite)
Donnée: un graphe G = (V, E) et un entier k.
Problème: existe-t-il un ensemble de k sommets couvrants ?
On commence par supprimer les boucles et arêtes multiples, puis on supprime itérativement les sommets de degré qui sont nécessairement dans l'ensemble ouvrant. Le graphe restant n’a que des sommets de degré . Il a donc arêtes, sinon il ne peut pas être couvert par sommets de degré . Il reste donc au plus sommets non isolés : on a extrait un noyau de taille en temps . Avec la stratégie des arêtes on obtient un algorithme en [1]. Un algorithme brute-force opère en temps ce qui est toujours encore raisonnable pour un petit k, et de grandes valeurs de n et m.
- Coupe-cycles de sommets
- Le problème du coupe-cycles de sommets possède un noyau de sommets et arêtes[2].
FPT et kernelisation
Un problème paramétré est un langage formel , où est un alphabet fini ; la deuxième composante d'une instance est appelé son paramètre. Un problème est fixed-parameter-tractable s'il admet un algorithme qui, à paramètre fixé, décide d'une instance of en temps , où n est la taille de X, et où f est une fonction calculable. La classe des problèmes fixed-parameter-tractable est notée FPT.
Tout problème décidable paramétré, pour lequel on sait que la taille du noyau de chaque instance (X,k) est majorée par f(k) pour une fonction f, est fixed-parameter-tractable, parce que l'on peut, après la réduction, appliquer au noyau un algorithme de complexité en temps 'h, ce qui donne une complexité en temps .
Réciproquement, on peut démontrer que toute instance (X,k) d'un problème fixed-parameter-tractable possède une noyau calculable en temps polynomial et dont la taille est majorée par f(k) pour une fonction gf'.
Tout problème FPT admet une réduction (en temps polynomial en ) à un noyau (a priori de taille exponentielle en ).
Il en résulte que la classe de complexité FPT correspond exactement à la classe de problèmes paramétrés dont les noyaux sont majorés par une fonction du paramètre. Même pour les problèmes qui ne sont pas fixed parameter tractable, pour lesquels une taille du noyau relativement petite ne peut pas être garantie, une réduction au noyau préalable à chaque appel récursif peut s'avérer avoir une utilité en pratique, parce qu'ils peuvent apporter des améliorations considérables pour les temps de calculs.
La kernelisation, comme la complexité paramétrée, est un domaine de recherche en pleine activité : pour 2016, il y a 38 articles ou communications à des colloques recensés dans la base DBLP[3] sous le vocable « kernelisation ».
Notes et références
- Gilles Schaeffer, « Complexité paramétrique », Cours d'informatique INF550, École polytechnique, (consulté le ).
- Thomassé 2010
- Kernelization sur DBLP.
Bibliographie
- Rodney G. Downey et Michael R. Fellows, Parameterized Complexity, Springer, (ISBN 0-387-94883-X, DOI 10.1007/978-1-4612-0515-9, MR 1656112).
- Rodney G. Downey et Michael R. Fellows, Fundamentals of Parameterized Complexity, Springer, , xxx+763 (ISBN 978-1-4471-5558-4 et 978-1-4471-5559-1, DOI 10.1007/978-1-4471-5559-1, MR 3154461, présentation en ligne).
- Jörg Flum et Martin Grohe, Parameterized Complexity Theory, Springer, , xiii+495 (ISBN 978-3-540-29952-3, présentation en ligne).
- Rolf Niedermeier, Invitation to Fixed-Parameter Algorithms, Oxford University Press (no 31), , xi+300 (ISBN 0-19-856607-7, SUDOC 112132154).
- Marek Cygan, Fedor V. Fomin, Łukasz Kowalik, Daniel Lokshtanov, Daniel Marx, Marcin Pilipczuk, Michał Pilipczuk et Saket Saurabh, Parametrized Algorithms, Springer, , xvii+613 (ISBN 978-3-319-21274-6 et 978-3-319-21275-3, DOI 10.1007/978-3-319-21275-3).
- Hans L. Bodlaender, Rod G. Downey, Michael R. Fellows et Danny Hermelin, « On problems without polynomial kernels », Journal of Computer and System Sciences, vol. 75, no 8, , p. 423–434 (DOI 10.1016/j.jcss.2009.04.001).
- Michael Lampis, « A kernel of order 2k − c log k for vertex cover », Information Processing Letters, vol. 111, nos 23–24, , p. 1089–1091 (DOI 10.1016/j.ipl.2011.09.003).
- Stéphan Thomassé, « A 4k2 kernel for feedback vertex set », ACM Transactions on Algorithms, vol. 6, no 2, (DOI 10.1145/1721837.1721848).
Article lié
Liens externes
- Frédéric Havet, Christophe Paul, « Introduction aux algorithmes FPT ».
- Un wiki sur la complexité paramétrée (en).
- Christophe Paul, « Complexité et algorithmes paramétrés (1) » et « Complexité et algorithmes paramétrés (2) », Perpignan, , École des jeunes chercheurs.