Lancement d'AIZI – une base de données unique de caractères chinois, 08.12.2021, www.aizi.ch

Lancement d'AIZI – une base de données unique de caractères chinois
08.12.2021
www.aizi.ch


Développé par une équipe composée de designers (ECAL) et d'ingénieur·e·s (EPFL), le projet de recherche AIZI propose une base de données unique de caractères chinois - composée de 93 876 entrées - afin d'aider les typographes à dessiner des caractères chinois: www.aizi.ch


www.aizi.ch

Bien qu'il soit utilisé par quelque 900 millions de locuteur·trice·s natif·ve·s, le système d'écriture chinois repose actuellement sur un petit nombre de caractères numériques, que ce soit sur papier ou à l'écran. Cela est dû en partie à la quantité de caractères. Il n'existe pas de chiffre officiel, mais certains dictionnaires atteignent jusqu'à 106 230 glyphes, la norme Unicode ne comportant «que» 20 902 glyphes. Un·e Chinoise hautement éduqué·e en connaît plus de 13 000 – être capable de lire un quart de ce chiffre n'a rien de honteux dans la Chine contemporaine. Pour un·e designer, la création d'un caractère chinois peut facilement prendre plus d'un an et représente un investissement bien plus important, en temps et en argent, qu'un caractère latin (ou grec, ou cyrillique). Ces difficultés pratiques limitent également l'intérêt des étranger·e·s pour la création de caractères chinois, car la tâche semble insurmontable.

L'intelligence artificielle (IA) pourrait-elle aider la création de caractères chinois à surmonter ses limites actuelles ? Est-il possible d'enseigner à un programme d'apprentissage automatique les règles de la composition et du dessin chinois afin de lui permettre de créer les milliers de glyphes nécessaires à un caractère ? «L'idée initiale du projet de recherche AIZI était de définir un ensemble réduit de caractères de base qui pourraient être utilisés comme données d'entraînement pour un système d'IA, avec pour objectifs ultimes de démocratiser le design des caractères chinois et l'accès à l'écriture pour les débutant·e·s et les étranger·e·s, et d'élargir la gamme stylistique d'un système d'écriture largement dominé par les formes calligraphiques traditionnelles à base de pinceau. A terme, cela pourrait conduire à une plus grande qualité dans la production des polices de caractères pour l'écriture chinoise», explique Shuhui Shi, qui a lancé le projet dans le cadre du Master Type Design de l'ECAL.

Enraciné dans les structures traditionnelles, le système qui a été développé analyse et rationalise la construction des glyphes et a donné naissance à une base de données - disponible en accès libre sur www.aizi.ch - qui pourrait être utilisée pour entraîner les algorithmes AIZI ainsi que tout autre outil de l'IA futur. La base de données contient 93 876 entrées et s'adresse aux designers de caractères, leur fournissant la référence nécessaire pour dessiner un ensemble de Hanzi, même s'ils·elles ne parlent ni ne lisent le chinois.


AIZI a été développé par une équipe composée à la fois de designers (ECAL) et d'ingénieur·e·s (EPFL). Dans le cadre du programme de Master Type Design de l'ECAL, Shuhui Shi, initiatrice du projet, était en charge de la partie design en collaboration avec Kai Bernau, sous la supervision de Matthieu Cortat. Le processus et les algorithmes de Machine Learning ont été développés par Wei Wang, sous la supervision de Mathieu Salzmann du Laboratoire de Vision Informatique de l'EPFL.


Information
Shuhui Shi – Responsable de projet, ECAL: shuhui.shi.ss@gmail.com
Matthieu Cortat, Responsable du Master Type Design, ECAL: matthieu.cortat@ecal.chwww.ecal.ch
Mathieu Salzmann – Senior Researcher, Computer Vision Laboratory, EPFL: mathieu.salzmann@epfl.chwww.epfl.ch/labs/cvlab/

Informations
Dates et horaires

08.12.2021

Lieu
www.aizi.ch