- HTML5 Conformance Checker
- Abandonné, remplacé par validator.nu
- HTML5Lib
- Implémentations en C, PHP, Python et Ruby. L'implémentation en C a l'air de se limiter à la détection du charset. Pour l'implémentation en PHP, le tokenizer a l'air fini, même s'il diffère de la spécification (mouvante). Pas de modification depuis 4 mois pour l'implémentation en Ruby, son API a l'air d'être complètement différente de celle en Python. L'implémentation en Python est la plus avancée, et c'est la seule à avoir visiblement plus d'une seule personne travaillant dessus (et le seul à avoir le début d'une ombre de documentation). On y retrouve d'ailleurs des noms biens connus dans le petit cercle du WTF.
- Twintsam
- Implémentation en C#, pas de modification depuis bientôt un an, jamais fini.
- Validator.nu parser
- L'implémentation la plus aboutie, en Java, par l'inénarrable qui met des espaces de nom partout, sauf en HTML, parce que c'est trop difficile, bouh bouh.
- Implementations in Web browsers
- Mic mac d'implémentations de "fonctionnalités" qui se sont retrouvées dans HTML 5, la plupart du temps en version non-terminée (en même temps, c'est difficile d'avoir une implémentation terminée quand la spécification ne l'est pas). On ne retrouve nulle part sur cette page quel navigateur implémente un parser HTML5. La réponse est probablement : aucun. Il existe pour Firefox / Camino / Minimo / SeaMonkey / Thunderbird / Sunbird une version de Gecko appelant une conversion à la machine du parser Validator.nu en C++. Le commentaire de l'auteur laisse penser que ça consomme encore plus de mémoire que Firefox 2, ce qui, avec les promesses du SQL côté navigateur devrait très sérieusement faire penser à vendre des ordinateurs dédiés à GMail.
Au final, c'est pas brillant, restons avec TagSoup.
3 réactions
1 De karl - 21/02/2009, 05:34
BeautifulSoup sur Python est pas mal non plus.
2 De Damien B - 21/02/2009, 11:57
Py-quoi ?
3 De Bouilloire - 21/02/2009, 12:43
Et moi je vais aller faire une tarte à la courge tiens