
J'ai un programme (http://www.cosmogol.fr/shadok.html) qui utilise Parsec pour l'analyse syntaxique. Le langage qu'il analyse est en ASCII pur. Maintenant, des utilisateurs réclament de l'Unicode (encodé en UTF-8). Quelqu'un a déjà essayé ? Il faut pouvoir lire l'UTF-8 depuis Haskell et pouvoir définir une grammaire avec de l'Unicode (voir http://www.w3.org/TR/REC-xml/#NT-Letter pour un joli exemple : c'est la liste des caractères légaux pour un identifiant XML). Quelques références dont je ne sais pas ce qu'elles valent (on note qu'il n'y a rien sur Parsec) : http://www.haskell.org/pipermail/haskell-i18n/2004-February/000127.html http://en.wikibooks.org/wiki/User:Newhoggy/UTF8_for_Haskell http://sophos.berkeley.edu/macfarlane/pandoc/ semble savoir faire tout ça, faut que je lise le source.