Ce site est optimisé pour être consulté depuis un navigateur moderne dans lequel JavaScript est activé.

tests pré-v2

Arathor

Je pense comme Laurent que le placement final d’une touche résulte de plusieurs facteurs. L’algo doit bien commencer quelque part, donc il place E et espace sur des touches accessibles. Mais au fur et à mesure qu’il rajoute des symboles, il faut qu’il s’assure de toutes les autres contraintes (hors fréquence du symbole + accessibilité de la touche choisie).

Comme dit Laurent, B et A sont tous les deux bien placés mais beaucoup de monde n’aime pas le digramme BA. Ça montre qu’on ne peut pas placer 10 touches puis 10 autres etc… ça doit rester dynamique.

ariasuni

Laurent a écritIl faut arrêter de mettre l’alternance en priorité absolue ; c’était approprié pour les machines à écrire mécaniques.

Test : tapez le plus vite possible (en Bépo) des répétitions de la chaîne « iset » (en Azerty : « dkjf »).

Je suis d’accord, c’est pour ça qu’on doit faire autrement que juste traiter les digrammes je pense. Peut-être qu’en prenant simplement les trigrammes en compte ça marche? Genre pour «iset», on aurait «ise» et «set» et on voit bien que ça pourrait être mieux si c’était sur une main.

Bon après le truc c’est que j’ai l’impression que l’alternance est plus facile à optimiser que les roulements (mais on peut dire bon digramme (donc on compte les roulements) mieux qu’alternance mieux que les mauvais digrammes).

robin_moussu

Je vous rappelle juste que les algorithme génétiques sont excellant pour résoudre ce type de problème. Ils nécessitent d'avoir une fonction d'évaluation (dont on a forcément besoin), et d'une fonction pour fabriquer un enfant à partir de deux parents. Celle que j'ai proposé me parait valide. Ce qui est cool, c'est que les algos génétiques n'ont pas besoin de connaitre ce qu'ils doivent résoudre, ce qui fait que l'on n'aura pas besoin de fabriquer des dispositions à la main (il vaut mieux tout générer), et que la validité d'une dispo est de toute façon vérifié (toutes les solution avec un e sur le {w} seront d'office éliminées. De plus, comme je le disais ils peuvent être arrêtés n'importe quand (donc on peut les laisser tourner deux heures pour un test rapide, où 15 jours pour optimiser.

Mais le plus urgent c'est de réaliser la fonction de test.
On pourrait même en avoir plusieurs : une rapide pour élaguer rapidement, et une lente beaucoup plus précise pour déterminer la meilleur du top 10.

Laurent

lawrent a écritTant qu'à me citer, autant me citer jusqu'au bout.

Désolé. Ça fait longtemps que je prêche dans le désert. Ce n’est pas à toi que je peux reprocher de ne pas m’entendre, dans la mesure où tu es dans les derniers arrivés, c’est juste tombé sur ton message.

Après, il va falloir que j’arrive à convaincre que la progression vers l’intérieur n’est pas forcément le mieux (si ce ne sont pas les mêmes touches qui sont impliquées)…

Par exemple, comparez le digramme « iu » (Bépo, « ds » en Azerty) avec le digramme « ai » (Bépo, « qd » en Azerty).

D’une part, la longueur des doigts a une incidence, mais surtout, le fait que les doigts ne sont pas complètement intépendants entre eux musculairement (sauf le pouce) en a une encore plus importante. « Sauter » un doigt n’est pas si immédiat, surtout si c’est l’annulaire (le moins agile). En sauter deux est plus facile (comparez « ai » à « ae »).

Pour deux touches données, effectivement, c’est plus facile vers l’intérieur, mais à mon sens, ça ne vient qu’après la question de quelle paire de touches.

lawrent a écritC'est seulement une idée hein, mais on pourrait mettre une pénalité 0 en cas d'alternance gauche-droite ou de digramme "neutre", une pénalité 1 en cas de digramme difficile (exemple: sauter d'une rangée à l'autre avec le même doigt) et une pénalité -1 en cas de roulement.

C’est à peu près ma vision.

Ce la dit, je dois admettre que je l’ai en partie empruntée à Michael Dickens, le concepteur de la disposition MTGAP.

Je vous invite fortement à lire son article concernant la conception d’une disposition.

robin_moussu a écritJe vous rappelle juste que les algorithme génétiques sont excellant pour résoudre ce type de problème.

Michael Dickens fournit aussi son programme, basé sur un algorithme génétique (sans croisements) et capable d’arriver à un résultat rapidement (mais en ne considérant que des digrammes).

Je n’ai pas encore eu le courage d’essayer de comprendre son programme, mais le faire pourrait nous faire gagner beaucoup de temps (même si on ne décide pas de l’utiliser, tel quel ou modifié, les solutions qu’il a utilisées sont certainement intéressantes — on sait au moins qu’elles fonctionnent).

sinma a écritJe suis d’accord, c’est pour ça qu’on doit faire autrement que juste traiter les digrammes je pense. Peut-être qu’en prenant simplement les trigrammes en compte ça marche?

Faire une simulation sur tout un corpus serait très long.
En prenant des n-grammes (n à déterminer), on peut factoriser le corpus et accélérer énormément l’évaluation d’une disposition par rapport à lui.
Après, plus n sera grand, plus on aura d’informations, mais plus le nombre d’éléments à évaluer sera important (augmentation exponentielle).

Avec n=1, on aurait seulement autant d’éléments à considérer que de caractères différents, mais on n’aurait aucune info sur l’enchaînement des touches, seulement la possibilité de bien placer les caractères les plus fréquents.

Avec n=2, le nombre d’éléments sera déjà plus important, mais on serait capable de dire si l’on a un roulement facile, une alternance, un digramme difficile voire sur un seul doigt…

Avec n=3, le nombre d’éléments sera encore bien plus important, mais on peut vérifier d’autres défauts potentiels. Par exemple, si « ae » (Bépo, « qf » Azerty) est un roulement assez facile et « ei » (Bépo, « fd Azerty) aussi, « aei » (Bépo, « qfd » Azerty) n’est pas terrible.

n=2 est le minimum pour faire quelque chose d’intéressant.
Avec n=3, on améliore l’évaluation, mais au net détriment de la vitesse d’exécution. Il faudrait voir si ça reste dans la limite du raisonnable ou pas.
n=4 serait à mon avis bien trop lourd par rapport à l’amélioration apportée.

robin_moussu a écritMais le plus urgent c'est de réaliser la fonction de test.

Ce n’est pas tant urgent que crucial. Il faut réussir à ce qu’elle soit à la fois suffisamment pertinente et suffisamment rapide. Sinon, on va ramer pour pas grand chose.

ariasuni

Je suis d’accord, n doit être dans {2,3}. Et merci pour les liens, je les étudierais plus en détails plus tard.

lawrent

J'ai lu la page du MTGAP, en gros il nous donne toute faite la recette avec laquelle il a créé sa disposition et la carte d'accessibilité sur laquelle il s'est basée. La seule chose qu'on a à faire, c'est de reprendre son programme et de le lancer sur un corpus francophone. (C'est beau le travail qu'un individu peut faire tout seul dans son coin en comparaison d'une communauté entière 🙂 .) On pourrait bidouiller son algorithme évolutif pour qu'en même temps il tienne compte de la couche AltGr.

Je pense que le choix du corpus est un élément décisif de la V2. On a pas besoin d'analyser des Go de texte de Wikipedia, l'important c'est de trouver un corpus représentatif du texte qu'on tape. Tout au plus quelques Mo je dirais. (À titre d'ordre de grandeur, la Bible au format txt fait 4.3 Mo…) Comme ça la fonction d'évaluation d'une disposition ne prendrait pas 3h. En parlant de corpus, pour tenir compte de l'anglais et de LaTeX on pourrait y ajouter la source .tex d'un poly de maths, non?

Un autre point qui sera crucial, c'est la carte d'accessibilité sur laquelle on veut se baser. Personnellement je n'aime pas la sienne, étant donné qu'avec ma méthode de saisie en V inversé je trouve le {B} et le {J} plus accessibles que le {O} et le {V}.

Robipo

Pour savoir quels digrammes/trigrammes sont faciles ou pas, on pourrait aussi essayer d'analyser les fantômes du dactylotest et voir le nombre de millisecondes pour faire le n-gram en moyenne (bon par contre faut être sûr de la dispo qu'utilisent les fantômes..)
Mais ça pourrait ptet faire ressortir des n-grams particulièrement faciles ou difficiles auxquels on aurait pas fait gaffe ou pas pensé (et voir aussi quel ordre de grandeur ça impact, genre entre le trigramme le plus facile à X ms et le trigramme le plus difficile fait combien de X*Y ms)

robin_moussu

Bon, pour la fonction de test, je propose cet algo :

------ Préparation à ne faire qu'une seule fois ------
Variable :
NGRAMME = 2 ou 3 (je préfèrerais 3)
TAILLE_CORPUS = beaucoup, disons 1 million (le nombre de lettre dans le corpus)
CORPUS = tableau de caractère contenant un savant mélange entre français, anglais, … en fonction de ce qu'on aura décidé
NOMBRE_CARACTÈRES_TESTÉS = pas mal (cf http://bepo.fr/wiki/Caract%C3%A8res_support%C3%A9s si vous avez envie de compter). On n'est pas obligé de tous les tester, mais je pense que prendre au moins les 150 plus courants pourrait être intéressant. La liste différencie les caractères accentué entre eux (ex : é, e, è sont trois caractères.

OCCURRENCE = tableau de (NOMBRE_CARACTÈRES_TESTÉS ^ L_ DIGRAMME) cases + 1 (les caractères non supportés). C'est un énorme tableau, j'en suis bien conscient. Pour NGRAMME = 3, ça devrait rester acceptable (et j'aimerai bien qu'on teste les trigrammes). Pour gagner un peu de place en mémoire, on peux aussi diminuer NOMBRE_CARACTÈRE_TESTÉS. Si on prend NGRAMME = 3 et NOMBRE_CARACTÈRE_TESTÉS = 100, avec chaque occurrence stocké dans un entier de 32 bits, le tableau ferait donc 1 000 000 d'entiers, soit 8 MO.

debut :
pour i de NGRAMME à TAILLE_CORPUS faire
si (( CORPUS [ i ],CORPUS [ i - 1 ], CORPUS [ i - 2 ] (pour NGRAMME == 3)) sont des caractères connus) alors
incrémenter la case correspondant au N-gramme (CORPUS [ i ], CORPUS [ i - 1 ], CORPUS [ i - 3 ])
sinon
incrémenter la case correspondant à caractère non testé.
fin si
fin pour
enregistrer les résultats, et éventuellement les trier par ordre d’occurrence.
fin

ex : si on parce le corpus «Hé, c'est un pain pas bon», on obtiendra les stats suivantes (avec NGRAMME = 3) :
«Hé,» 1
«é, » 1
«, c» 1
« c'» 1
«c'e» 1
«'es» 1
«est» 1
«st » 1
«t u» 1
« un» 1
«un » 1
«n p» 2
« pa» 2
«pai» 1
«ain» 1
«in » 1
«pas» 1
«s b» 1
« bo» 1
«bon» 1

À part les NGRAMME première lettres et les NGRAMME dernières, elle seront toutes prises en comptes NGRAMME fois. En soit, ce n'est pas grave.
Cette méthode permet également de prendre en compte les débuts et fin de mots.

-----------

calcul du coup de tout les n-grammes
On se base sur les positions physiques des touches, pas du layout.

Cette étape peut également être en partie pré calculé/déterminé ( place prise en mémoire : (NOMBRE_DE_TOUCHE_SUR_LE_CLAVIER ^ NGRAMME) * (COUCHE_MODIFICATRICE ^ NGRAMME), soit environ (50^3) * (6 ^ 3) si on a 50 touches utiles, et les couches normale, maj, altgr, altgr+maj, level5, level5+maj) pour chacun des emplacement possible pour les touches modificatrices (mais ça ils ne devrait pas y en avoir 50 !)

Pour cela, on détermine le coup du n-gramme en question (on prendra en compte la position de chaque touche (ainsi que le coup pour activer les modificateurs si nécessaire), et un bonus si ça s'enchaine facilement, ou un malus si c'est dur).

C'est la partie compliqué, mais de toute façon on devrai la faire quelque soit l'algo utilisé.

---------------

fonction d'évaluation (la seule à effectué à chaque fois)

variable :
NB_ NGRAMMES_PRIS_EN_COMPTE = selon la vitesse à laquelle on veux évaluer, on peux prendre les 1000, 10000, … n-grammes les plus courants dans le tableau calculé à l'étape précédente.

COUP_TOTAL = entier

début
COUP_TOTAL = 0
pour i de 0 à NB_ NGRAMMES_PRIS_EN_COMPTE
On récupère le coup associé pour générer le n-gramme en question calculé à l'étape 2
on multiplie ce résultat par le nombre d’occurrences correspondant à ce n-gramme calculé à l'étape 1
on ajoute la valeur obtenue à COUP_TOTAL
fin pour
fin

---------------------------

L'avantage, c'est qu'on peux faire facilement des tests sur les lettres accentué, sur plusieurs couches, … sans que ça ne soit trop long (c'est une simple suite de multiplication d'entier).

robin_moussu

@Robipo, c'est une très bonne idée d’analyser les fantômes pour récupérer le coup des n-grammes de manière objective.
Si on fait ça, ils faudrait que tout les monde enregistre quelque fantômes en plus, histoire d'avoir plus de stats.

Laurent

lawrent a écritJ'ai lu la page du MTGAP, en gros il nous donne toute faite la recette avec laquelle il a créé sa disposition et la carte d'accessibilité sur laquelle il s'est basée. La seule chose qu'on a à faire, c'est de reprendre son programme et de le lancer sur un corpus francophone.

À supposer qu’on soit d’accord avec son évaluation et qu’on ne veuille pas tenter de prendre en compte des trigrammes.

lawrent a écritOn a pas besoin d'analyser des Go de texte de Wikipedia, l'important c'est de trouver un corpus représentatif du texte qu'on tape.

Ce qui n’est pas la même chose : utilisation de la première de et de la seconde personne, tournures probablement moins sophistiquées, biais sur le sujet de chaque article de Wikipedia…

lawrent a écritComme ça la fonction d'évaluation d'une disposition ne prendrait pas 3h

Si on factorise en digrammes ou trigrammes, la taille du corpus en texte brut sera nettement moins pénalisante.
Si on veut qu’il soit bien représentatif, le plus dur sera de le créer.

lawrent a écritEn parlant de corpus, pour tenir compte de l'anglais et de LaTeX on pourrait y ajouter la source .tex d'un poly de maths, non?

Trop spécifique à mon avis.
Pour moi, il y a d’une part le français, pour lequel il faut optimiser globalement la disposition, et les autres usages, pour lesquels il ne faut pas forcément que la disposition soit très efficace, mais seulement qu’elle ne soit pas pénible.

Supposons que tu mettes du Perl dans le corpus avec une pondération très faible.
Ça va avoir une relative incidence sur l’efficacité pour le français, mais ça ne me garantira pas que $ n’arrive pas sur la touche [²] (Azerty) quand même, vu qu’il ne sert pas en français. Or pour un tel usage, je me fiche un peu de l’efficacité, mais je tiens à ce que ce ne soit pas pénible.

Je pense qu’idéalement, pour les usages secondaires, il faudrait considérer avec une pondération pas trop faible les trucs pénibles (touche [²], digramme sur le même doigt), mais avec une pondération très faible les critères d’efficacité (roulement possible, alternance…).

Autre possibilité : optimiser pour les autres usages après coup en fixant un seuil de dégradation admissible pour la fonction d’évaluation pour le français.

lawrent a écritUn autre point qui sera crucial, c'est la carte d'accessibilité sur laquelle on veut se baser. Personnellement je n'aime pas la sienne, étant donné qu'avec ma méthode de saisie en V inversé je trouve le {B} et le {J} plus accessibles que le {O} et le {V}.

Oui, enfin si tu as une méthode de saisie rien qu’à toi trop différente de la méthode classique (bon, je ne sais pas dans quelle mesure c’est le cas)…

robin_moussu

@lawrent Je ne peux pas décider pour tout le monde, mais je pense que ta méthode de saisie ne sera pas retenue, car elle n'est pas compatible avec les claviers ergos (et c'est dommage par ce que j'ai l'impression qu'elle est plus adapté aux claviers 105).

@laurent, c'est sur sa page perso : http://bepo.fr/wiki/Utilisateur:Lawrent#Utilisation_recommand.C3.A9e

lawrent

Laurent, ça n'a rien de personnel contre toi, mais j'avoue que te voir flinguer mes posts les un après les autres, ça me fatigue 🙂

Laurent a écrit
lawrent a écritEn parlant de corpus, pour tenir compte de l'anglais et de LaTeX on pourrait y ajouter la source .tex d'un poly de maths, non?
Trop spécifique à mon avis.

[…]

lawrent a écritUn autre point qui sera crucial, c'est la carte d'accessibilité sur laquelle on veut se baser. Personnellement je n'aime pas la sienne, étant donné qu'avec ma méthode de saisie en V inversé je trouve le {B} et le {J} plus accessibles que le {O} et le {V}.
Oui, enfin si tu as une méthode de saisie rien qu’à toi trop différente de la méthode classique (bon, je ne sais pas dans quelle mesure c’est le cas)…

Laurent dans un autre post a écrit
lawrent a écritEt si ils sont toujours pas contents, rien ne les empêche de bidouiller leur propre version.
Ha ha ! On me l’a déjà faite !

Laurent

lawrent a écritLaurent, ça n'a rien de personnel contre toi, mais j'avoue que te voir flinguer mes posts les un après les autres, ça me fatigue 🙂

Pas fait gaffe, c’est les tiens à chaque fois ?

Regarde le bon côté des choses : dans ceux auxquels je ne réponds pas, il y en a où c’est parce qu’ils n’apportent rien d’intéressant…

lawrent a écrit
Laurent dans un autre post a écrit
lawrent a écritEt si ils sont toujours pas contents, rien ne les empêche de bidouiller leur propre version.
Ha ha ! On me l’a déjà faite !

On ne peut pas exclure qu’on se retrouve tous les deux (encore !) avec notre propre version…

Hubert

Résumé : Post où je brasse les évidences et du rabâché
Où il est question des claviers nouvelles génération : raccourcis avec moins de touches.
------------------

un rappel venu du wiki : j'ai les mêmes conclusiions et doléances. La phrase de fin m'a fait rire.

«Le bépo remplit donc bien son objectif qui est la typographie française et non l'anglais. Si le placement de {Z} et {Ç} reste acceptable pour taper du français, celui de {W} est problématique pour d'autres langues. Et surtout, si l'utilisateur n'a pas un pc105, il peut avoir une mauvaise surprise en essayant le bépo (et potentiellement abandonner l'idée). C'est valable pour les claviers pc101/104, beaucoup de claviers ergonomiques, les pc105 de certains portables… Qu'on le veuille ou non, les constructeurs de ces claviers compriment et/ou déforment le pavé auxiliaire pour gagner de la place.

Certains claviers ergos déportent aussi Z et M. On peut critiquer ce choix, mais il est logique en fait. Ça revient juste à symétriser la partie droite (surchargée sur les pc10X) par rapport à la partie gauche. C'est un progrès ! (qui nous complique la vie, certes). Si c'est pour refuser toute évolution, autant rester en azerty. »

Dans cet article il y est dit grosso modo ce que j'argumente ailleurs.
Il va sortir de plus en plus de clavier symetriques, parfois orthogonaux, avec souvent moins de touches. Tous compatibles Qwerty et Azerty (car ils ont sacrifié des touches très peu usitées), mais tous hélas incompatible BÉPO, «l'utilisateur qui n'a pas un pc105, il peut avoir une mauvaise surprise en essayant le bépo (et potentiellement abandonner l'idée)».

Cordialement

Hubert

yeKcim

idée : faire une liste des défauts du bépo (liste variable selon chacun évidemment) pour éviter de faire les mêmes erreurs (ça n’empêchera pas d’en faire d’autres…). Pour ma part, je liste surtout :
→ w trop loin
→ < et > impossibles à une main donc faiblement accessibles
→ altgr uniquement à droite (lié à la remarque précédente ?)

il y en a surement plein d’autres, mais comme ça ce sont les premiers trucs qui me viennent à l’esprit. L’idée de liste vous semble pertinente ?

Mimoza

"{}" dans la même position que "<>"
le ";" m'est plus utile que la ","
Bref pour taper du code c'est pas pratique

yeKcim

question dont je ne trouve pas la réponse : pour le groupe de texte permettant de définir les touches les plus fréquente, est-ce que la méthode est de prendre des textes dans pleins de langue et d’appliquer des coefs ou c’est une autre méthode qui est appliquée ? avec cette méthode le ç s’éloigne surement au profit du w par exemple…

yeKcim

Autre souci : je n’utilise jamais ' mais toujours ’ mais c’est sûrement parce que je ne dev pas beaucoup. Peut-être faudrait-il faire un topic pour lister… ou un système de vote pour indiquer d’une façon ou d’une autre combien de personnes trouve chaque point gênant…

ariasuni

J’avais commencé à lister les défauts et c’est devenu ça: http://bepo.fr/wiki/Utilisateur:Sinma/V2/Symboles

Pour les défauts, j’ai commencé un sujet ici: http://forum.bepo.fr/viewtopic.php?pid=9135#p9135

Laurent

yeKcim a écrit→ < et > impossibles à une main donc faiblement accessibles

En quoi est-ce utile qu’ils soient faisables à une main ?

Pour ma part, je les ai mis en AltGr mais sous la position de repos (je peux même faire un roulement pour <=, >= voire pour <>, <=>, spécifiques à Perl) : je préfère conserver les caractères utilisés pour le français au maximum en accès direct pour ne pas freiner ma frappe, alors que pour les signes fréquents dans les langages informatiques, j’ai cherché en priorité à ce qu’ils soient bien placés pour améliorer le confort. Les langages informatiques nécessitent une précision qui demande de toute façon plus d’attention et donc moins de vitesse.

« Page précédente Page suivante »