lawrent a écritJ'ai lu la page du MTGAP, en gros il nous donne toute faite la recette avec laquelle il a créé sa disposition et la carte d'accessibilité sur laquelle il s'est basée. La seule chose qu'on a à faire, c'est de reprendre son programme et de le lancer sur un corpus francophone.
À supposer qu’on soit d’accord avec son évaluation et qu’on ne veuille pas tenter de prendre en compte des trigrammes.
lawrent a écritOn a pas besoin d'analyser des Go de texte de Wikipedia, l'important c'est de trouver un corpus représentatif du texte qu'on tape.
Ce qui n’est pas la même chose : utilisation de la première de et de la seconde personne, tournures probablement moins sophistiquées, biais sur le sujet de chaque article de Wikipedia…
lawrent a écritComme ça la fonction d'évaluation d'une disposition ne prendrait pas 3h
Si on factorise en digrammes ou trigrammes, la taille du corpus en texte brut sera nettement moins pénalisante.
Si on veut qu’il soit bien représentatif, le plus dur sera de le créer.
lawrent a écritEn parlant de corpus, pour tenir compte de l'anglais et de LaTeX on pourrait y ajouter la source .tex d'un poly de maths, non?
Trop spécifique à mon avis.
Pour moi, il y a d’une part le français, pour lequel il faut optimiser globalement la disposition, et les autres usages, pour lesquels il ne faut pas forcément que la disposition soit très efficace, mais seulement qu’elle ne soit pas pénible.
Supposons que tu mettes du Perl dans le corpus avec une pondération très faible.
Ça va avoir une relative incidence sur l’efficacité pour le français, mais ça ne me garantira pas que $ n’arrive pas sur la touche [²] (Azerty) quand même, vu qu’il ne sert pas en français. Or pour un tel usage, je me fiche un peu de l’efficacité, mais je tiens à ce que ce ne soit pas pénible.
Je pense qu’idéalement, pour les usages secondaires, il faudrait considérer avec une pondération pas trop faible les trucs pénibles (touche [²], digramme sur le même doigt), mais avec une pondération très faible les critères d’efficacité (roulement possible, alternance…).
Autre possibilité : optimiser pour les autres usages après coup en fixant un seuil de dégradation admissible pour la fonction d’évaluation pour le français.
lawrent a écritUn autre point qui sera crucial, c'est la carte d'accessibilité sur laquelle on veut se baser. Personnellement je n'aime pas la sienne, étant donné qu'avec ma méthode de saisie en V inversé je trouve le {B} et le {J} plus accessibles que le {O} et le {V}.
Oui, enfin si tu as une méthode de saisie rien qu’à toi trop différente de la méthode classique (bon, je ne sais pas dans quelle mesure c’est le cas)…