ISO 639-3, la nouvelle liste de langues

Première rédaction de cet article le 14 Février 2007
Dernière mise à jour le 4 Juin 2008


Après une longue genèse, la nouvelle itération de la norme ISO 639 sur les langues humaines a été publiée le 5 février.

ISO 639 normalise une liste de langues et un code (d'abord à deux lettres, désormais à trois) pour chaque langue. fr est le français, cop le copte, cy le gallois, etc. Cette norme sert de base à bien d'autres normes, par exemple les étiquettes de langue que l'IETF a normalisées dans le RFC 4646. La nouvelle itération de ISO 639 marque deux changements importants :

  • Une nouvelle agence de maintenance, SIL, dont le travail est très apprécié mais qui a suscité des controverses, notamment pour son activité trop... missionnaire dans les pays du Sud,
  • Un bond considérable du nombre de langues, qui passe de moins de cinq cents à plus de sept mille.

Cette augmentation n'a pas été sans mal puisque les premières itérations, ISO 639-1 et ISO 639-2, ne prenaient en compte que des langues établies, normalisées et bien connues. Désormais, des langues nettement plus marginales sont enregistrées, et il est souvent très difficile de savoir si deux de ces langues sont différentes ou pas.

D'autres changements font leur apparition comme la notion de macrolangue, permettant de traiter des cas complexes d'apparentement de langues.

Parmi les nouvelles langues, notons au hasard :

Comme d'habitude, l'ISO, organisation privée et fermée, ne distribue pas la norme, mais la vend cher. Heureusement, elle est disponible via le site Web de l'agence de maintenance.

Plusieurs systèmes d'exploitation intégrent un fichier contenant tous les codes définis par cette norme. Par exemple, pour Debian, c'est en CSV et c'est dans le paquetage iso-codes pour lequel une version intégrant 639-3 est en préparation.

Le groupe de travail LTRU de l'IETF est actuellement occupé à mettre au point la nouvelle version de la norme des étiquettes de langue (nommée RFC 4646bis, en référence à la norme actuelle, le RFC 4646) et la nouvelle version du registre des langues, le 4645bis (en référence au RFC 4645).

Pendant ce temps, les gens qui travaillent sur la norme ISO ne restent pas inactifs et sont notamment occupés avec ISO 639-5, qui normalise les relations entre les langues et ISO 639-6 pour les dialectes. On peut avoir une idée des développements en cours en lisant l'article Developments in Language Codes standards, écrits par Gillam, Garside et Cox, trois des participants à l'ISO 639.

Source XML de cette page (cette page est distribuée sous les termes de la licence GFDL)