Aujourd'hui 6 juin, la nouvelle version d'Unicode est sortie, la 11.0. Une description officielle des principaux changements est disponible mais voici ceux qui m'ont intéressé particulièrement. (Il n'y a pas de changement radical.)
Pour explorer plus facilement la grande base
ucd=> SELECT count(*) AS Total FROM Characters;
total
--------
137439
Combien de caractères sont arrivés avec la version 11 ?
ucd=> SELECT version,count(version) FROM Characters GROUP BY version ORDER BY version::float;
...
9.0 | 7500
10.0 | 8518
11.0 | 684
684 nouveaux, bien moins que dans les versions précédentes. Quels sont
ces nouveaux caractères ?
ucd=> SELECT To_U(codepoint) AS Codepoint, name FROM Characters WHERE version='11.0';
codepoint | name
-----------+----------------------------------------------------------------------------
...
U+1F9B8 | SUPERHERO
U+1F9B9 | SUPERVILLAIN
U+1F9C1 | CUPCAKE
...
U+10D00 | HANIFI ROHINGYA LETTER A
...
U+16E60 | MEDEFAIDRIN SMALL LETTER M
...
U+1D2E0 | MAYAN NUMERAL ZERO
...
U+1F12F | COPYLEFT SYMBOL
...
U+1F99D | RACCOON
U+1F99E | LOBSTER
U+1F99F | MOSQUITO
...
U+1F9B0 | EMOJI COMPONENT RED HAIR
Outre les habituels
Toujours dans les emojis, on notera que la norme a précisé que
les emojis n'ont
pas forcément de genre. Et elle a ajouté des modificateurs
permettant de faire varier l'image comme le U+1F9B0 pour mettre des
cheveux
Tiens, d'ailleurs, combien de caractères Unicode sont des
symboles (il n'y a pas que les emojis parmi eux, mais Unicode n'a pas
de catégorie « emoji ») :
ucd=> SELECT count(*) FROM Characters WHERE category IN ('Sm', 'Sc', 'Sk', 'So');
count
-------
7110
Ou, en plus détaillé, et avec les noms longs des catégories :
ucd=> SELECT description,count(category) FROM Characters,Categories WHERE Categories.name = Characters.category AND category IN ('Sm', 'Sc', 'Sk', 'So') GROUP BY category, description;
description | count
-----------------+-------
Other_Symbol | 5984
Math_Symbol | 948
Modifier_Symbol | 121
Currency_Symbol | 57
(4 rows)
Si vous avez les bonnes