Fork (programmation)
La fonction fork fait partie des appels système standard d'UNIX (norme POSIX[1]). Cette fonction permet à un processus (un programme en cours d'exécution) de donner naissance à un nouveau processus qui est sa copie conforme, par exemple en vue de réaliser un second traitement parallèlement au premier. Un bon moyen de visualiser l'effet d'un fork sur un processus est d'imaginer une division cellulaire.
Il existe une filiation dans les processus : le créateur d'un nouveau processus est appelé le père et le nouveau processus, le fils.
La plupart des attributs système du père (par exemple les droits sur le système de fichier) sont transmis au fils, de la même manière que l'héritage. Au démarrage d'un système Unix, un seul processus existe (de numéro 1). Tous les autres processus qui peuvent exister au cours de la vie du système descendent de ce premier processus, appelé init
, via des appels système comme fork
[2], vfork
[3], posix_spawn
[4] ou d'autres moyens. Sur les premiers UNIX, seul l'appel système fork
permet de créer de nouveaux processus[5] - [6].
Fonctionnement
L'appel système fork fournit une valeur résultat qui est entière. Pour identifier le père du fils nouvellement créé, il suffit de regarder la valeur de retour du fork(). Celle-ci peut être le PID du fils, auquel cas nous sommes dans le processus père, ou bien 0 auquel cas nous sommes dans le processus fils. Le fork() peut également renvoyer la valeur -1, qui traduit une erreur lors de l’exécution de la commande.
Afin d'obtenir le numéro du processus, il suffit de faire l'appel système getpid(), ou getppid() pour obtenir le numéro du père.
Interactions entre processus
Il est possible d’interagir entre processus de plusieurs manières différentes. Premièrement, on peut envoyer des signaux. En langage de commande kill <pid> permet de tuer le processus ayant pour pid ce que l'on entre dans la commande.
Il est possible de faire attendre un processus grâce à sleep(n) pour bloquer le processus pendant n secondes, ou en utilisant pause() qui bloque jusqu'à la réception d'un signal.
Pour mettre fin Ă un processus, on peut utiliser exit(etat) sachant que etat est un code de fin, par convention 0 si ok, code d'erreur sinon.
Il peut être très pratique que le père attende la fin de l'un de ses fils, pour ce faire on utilise pid_t wait(int *ptr_etat) qui donne comme valeur de retour le pid du fils qui a terminé, et le code de fin est stocké dans ptr_etat.
On peut également attendre la fin du fils grâce à son pid : pid_t waitpid(pid_t pid, int *ptr_etat, int options).
Un terme commun dans la partie « Système » de l'informatique est ce que l'on appelle les processus zombies. Cela arrive quand le processus est terminé mais que le père n'a pas attendu son fils, c'est-à -dire qu'il n'a pas fait d'appels à wait(). C'est une situation qu'il convient d'éviter absolument car le processus ne peut plus s'exécuter mais consomme encore des ressources.
Utilisation et alternative
Chaque processus d'un fork possède son propre espace d'adressage, qu'il est coûteux de dupliquer, même avec des astuces comme le copie-sur-écriture. Il est parfois avantageux de remplacer les forks par des fils (processus légers) qui partagent le même espace mémoire… aux risques et périls du programmeur, cependant.
La fonction fork est largement utilisée dans les applications client-serveur avec plusieurs clients simultanés.
Notes et références
- (en) « POSIX Interface Library: liboskit_posix.a »
- POSIX, fork - create a new process
- POSIX, vfork - create a new process; share virtual memory
- POSIX, posix_spawn, posix_spawnp - spawn a process
- D. M. Ritchie and K. Thompson, The UNIX Time-Sharing System, pages 7 et 8
- D. M. Ritchie and K. Thompson, Manuel de UNIX version 1, fork -- spawn new process