lawrent Bonsoir ! J'étais pas content de la place du h alors je l'ai déplacé (ouh le filou… il a osé) et, dans la foulée, je remets en question la place d'autres caractères. Mais pour estimer la pertinence de mes choix, ça serait top si je pouvais avoir sous la main la fréquence d'apparition de certains trigrammes, par exemple: 'des' est-il plus fréquent que 'les' et si oui, de combien? Alors ça serait super chouette si les membres qui se sont impliqués dans le développement de la méthode d'apprentissage des trigrammes pouvaient créer une page sur le wiki avec la fréquence d'apparition des trigrammes les plus courants dans le corpus choisi 🙂
Flamme Salut, Google a déjà fait le boulot : http://storage.googleapis.com/books/ngrams/books/datasetsv2.html Mais les données sont brutes.
Yahyalexandre J'ai trouvé également ceci : http://www.bibmath.net/crypto/index.php?action=affiche&quoi=chasseur/frequences_francais