Ce site est optimisé pour être consulté depuis un navigateur moderne dans lequel JavaScript est activé.

[Question] Bépo et turc

Laurent

Yannick a écritJ'ai fait les tests, mais je ne sais pas les lire.

C’est-à-dire que dans ton optique, ce que tu devrais comparer, ce sont des variantes de ton adaptation du Bépo entre elles (en échangeant les lettres que tu as ajoutées), pour sélectionner la meilleure.

Là, tu testes des claviers très différents, c’est intéressant (tant que les résultats sont cohérents…), mais pas très utile.

Yannick a écritRésultats :

Comparaison : Original=Clavier-F/Modifié=Bıpo
[…]
Résultats du changement (en %) :
Charge des doigts (de gauche à droite, d'auriculaire à auriculaire)
ancien% 4,63 6,92 7,23 15,81 0,00 13,67 15,96 9,57 5,98 20,24

Il semblerait que le clavier F chargerait énormément l’auriculaire droit et aussi le pouce droit (espace et AltGr). Soit ça, soit le comparateur interprète mal la description du clavier F…

Yannick a écritnouveau% 11,68 8,24 7,26 14,98 0,00 0,26 4,11 5,95 9,02 11,17

C’est l’auriculaire gauche qui est plus chargé avec ton Bıpo. Là, le résultat paraît cohérent avec les letters qui sont sur les touches : les doigts les plus chargés sont l’index gauche, qui a en charge E et O et l’auriculaire, qui a en charge A.

Yannick a écritEnergie : -42,27%

Le Bιpo consommerait moins d’énergie.

Yannick a écritAccessibilité : -21,16%

Par contre, il aurait une moins bonne accessibilité, mais je ne sais pas comment c’est pondéré exactement. Peut-être serait-ce surtout à cause d’une moins bonne alternance :

Yannick a écritAlternance brute : -25,77%

Quant aux digrammes, il y en aurait beaucoup moins de toutes les catégories… Curieux, à moins que tu n’aies plus de caractères en accès direct plutôt qu’en AltGr ou en composition avec une touche morte…

Yannick a écritFrappes vers l'intérieur : (21922 - 24300) / 199801 = -1,19% absolu, -9,79% relatif
Digrammes faciles (hors alternance) : (9998 - 11252) / 199801 = -0,63% absolu, -11,14% relatif
Digrammes moyens (hors alternance) : (14410 - 29868) / 199801 = -7,74% absolu, -51,75% relatif
Digrammes faciles (incluant alternance) : (79556 - 90052) / 199801 = -5,25% absolu, -11,66% relatif
Digrammes moyens (incluant alternance) : (37212 - 77487) / 199801 = -20,16% absolu, -51,98% relatif
Digrammes difficiles : (24515 - 32262) / 199801 = -3,88% absolu, -24,01% relatif
dont digrammes 1 doigts (touches différentes) : (8431 - 13975) / 199801 = -2,77% absolu, -39,67% relatif

Enfin j’ai un doute sur le fait que le comparateur fonctionne correctement avec le clavier F, mais ce n’est pas moi qui vais le déboguer. Ça m’est déjà arrivé de réussir à déboguer des programmes écrits dans des langages que je ne pratique pas, mais là , c’est du Java, je ne sais même pas comment utiliser leur outils de développement à la con. Rien que pour lancer un programme Java, les auteurs donnent souvent des indications différentes et souvent mauvaises, et ça, ce sont des gens qui savent développer en Java…

Je te suggère de te contenter de comparer différentes variantes du Bιpo : c’est ce qui te sera utile, ça a l’air de fonctionner et puis il sera relativement simple de voir si les résultats sont cohérents.

Yannick

Hm... Douteux...

Sur un dump du wikipedia turc http://dumps.wikimedia.org/trwiki/latest/trwiki-latest-pages-articles.xml.bz2 , nettoyé avec http://medialab.di.unipi.it/wiki/Wikipedia_Extractor

Fréquence des lettres :

$ awk -vFS="" '{for(i=1;i<=NF;i++){ if($i~/[a-zA-Z.!?'\'':;,-]/) { w[tolower($i)]++} } }END{for(i in w) print w[i],i}' vikipedia-tr-dump.xml | sort -nr
28357853 a
22124527 e
22057243 i
18057240 r
17461481 n
17133693 l
11374558 k
11183120 d
10935739 ı
10485615 t
8305459 s
8109155 m
7625032 u
7278503 y
7243326 o
5164754 b
4109212 ü
3862459 .
3554707 ş
3234168 g
3042981 v
3040262 c
2904857 h
2775158 p
2649625 z
2253975 ç
2144476 ğ
2104991 ö
2035836 ,
1621413 f
1311683 '
651604 w
365129 :
359640 -
285353 j
218440 ?
88721 ;
76254 â
73979 x
43465 î
30897 q
22756 é
10517 !
10012 û
9628 á
5655 ó
5575 í
4946 ä
3271 ā
3121 è
3030 š
2815 ć
2652 ã
2644 ə
2519 ō
2231 ú
2072 ñ
2055 č
1914 ê
1523 ū
1492 à
1451 ï
1448 ł
1340 ë
1287 ī
1034 ģ
1016 ß
1016 ø
960 å
954 ô
693 ŋ
634 ă
615 ġ
611 æ
499 ń
483 ē
459 ì
429 ś
429 ð
401 õ
379 ò
374 ș
362 ė
359 đ
335 ý
335 ě
316 ù
255 ţ
246 ę
228 ḥ
223 ř
214 ą
211 ő
203 ħ
196 ǎ
153 ḳ
151 º
123 ǔ
115 ǐ
110 ṣ
108 œ
99 ɛ
97 ň
93 ṭ
84 ț
77 ệ
74 ḫ
73 ĝ
69 ḵ
57 ų
55 į
53 ĭ
51 ŭ
50 ɔ
48 ů
48 ŏ
48 ȟ
45 ņ
42 ố
41 ư
41 ễ
40 ế
38 ǒ
38 ḍ
34 ũ
34 ť
34 ǫ
33 ĥ
29 ḡ
29 ĕ
28 ľ
28 ả
25 ử
25 ƣ
25 ĉ
25 ạ
24 ơ
24 ḷ
24 ǧ
23 ÿ
23 ŝ
22 ṅ
22 ǩ
21 ờ
21 ĩ
20 ộ
20 ấ
18 ű
18 ṯ
18 ồ
17 ọ
17 ầ
16 ṇ
16 ķ
16 ď
15 ứ
15 ļ
13 ĵ
13 ḏ
12 ǝ
11 ṛ
11 ɵ
11 ị
10 ŵ
10 ớ
10 ḩ
10 ẽ
10 ậ
9 ủ
8 ỳ
8 ự
7 ṃ
7 ċ
6 ụ
6 ǜ
6 ǘ
6 ổ
6 ṋ
6 ỉ
5 ữ
5 ŧ
5 ſ
5 ṟ
5 ở
5 ḿ
5 ḻ
5 ĺ
5 ǰ
5 ḗ
5 ª
4 ǚ
4 ŕ
4 ề
4 ẩ
4 ẵ
4 ắ
3 ẍ
3 ừ
3 ǖ
3 ợ
3 ỗ
3 ȃ
2 ỹ
2 ṙ
2 ĸ
2 ṗ
2 ṓ
2 ṉ
2 ẖ
2 ẹ
2 ẻ
2 ể
2 ɖ
2 ḇ
2 ḃ
2 ặ
2 ằ
1 ẏ
1 ŷ
1 ẋ
1 ƿ
1 ṫ
1 ȓ
1 ȯ
1 ǹ
1 ṁ
1 ḹ
1 ĳ
1 ḓ
1 ḉ
1 ɓ
1 ǽ
1 ȧ
1 ǟ
1 ẫ

Laurent

Yannick a écritHm... Douteux...

Quoi donc ?

A2

Que trouves-tu « douteux » ? Pour les corpus, travaille en %, je trouve ça plutôt cohérent même avec un corpus 1 000 fois plus petit :
a premier à 11 %
ei sont dans le même ordre au-dessus de 8 %
r et n vers 7 %
l un peu derrière (bien plus présent sur wp) vers 6 %
kdı entre 4 et 5 %
pour le 10e caractère le choix est plus difficile, il faut voir avec les digrammes et trigrammes etc.

Ceci dit tu as déjà les lettres à mettre sous les doigts : c’est la notion de base qui rendra la disposition plus confortable quelque soit l'arrangement du reste (sur les deux corpus les 10 premiers caractères représentent 60-62 %). C’est bizarre que ces caractères diffèrent pas mal de ceux choisis sur la disposition Türk F. Il faudrait chercher à comprendre pourquoi, c’est surement lié à la méthode de frappe utilisée. Autant, ils n'avaient pas les outils qu’on a pour calculer ça en 1955… Et le vocabulaire de la langue a évolué aussi depuis là.

Pour tes corpus, on ne sait pas quelle référence est la plus fiable mais j'aurais tendance à dire que le plus volumineux des deux donne de meilleures statistiques, il faudrait connaitre comment fonctionne trwiki (beaucoup de robots pour écrire des ébauches d’articles ? état global de l'encyclopédie ? comment fonctionne le WP Extractor ? gestion des modèles, des données des tableaux, etc.)

trwiki 256 Mcar.			corpus 165 kcar.	
a	11,08		a	11,21
e	8,65		e	8,57
i	8,62		i	7,90
r	7,06		n	6,94
n	6,82		r	6,49
l	6,70		l	5,49
k	4,45		ı	4,87
d	4,37		k	4,52
ı	4,27		d	4,37
t	4,10		m	4,05
s	3,25		y	3,68
m	3,17		u	3,26
u	2,98		s	2,90
y	2,84		t	2,88
o	2,83		o	2,74
b	2,02		b	2,71
ü	1,61		.	2,08
.	1,51		ü	1,83
ş	1,39		ş	1,73
g	1,26		z	1,60
v	1,19		,	1,42
c	1,19		g	1,25
h	1,14		ç	1,13
p	1,08		ğ	1,00
z	1,04		h	0,98
ç	0,88		c	0,92
ğ	0,84		ö	0,85
ö	0,82		v	0,81
,	0,80		p	0,80
f	0,63		f	0,37
'	0,51		'	0,20
w	0,25		?	0,18
:	0,14		;	0,12
-	0,14		!	0,07
j	0,11		-	0,06
?	0,09		:	0,04
;	0,03		j	0,01
â	0,03		w	0,01
x	0,03		â	0,00
î	0,02		x	0,00
q	0,01		q	0,00
é	0,01

Yannick

Ce que tu pointes plus haut : comment peut-on avoir moins de digrammes dans toutes les catégories ? Le mapping est assez semblable : toutes les lettres sont en accès direct. J'ai même replacé le Q et le X sur le clavier 105 standard. D'où mon "douteux" ; ça sent le bug ou alors on ne sais pas lire le résultat...

A2

Dans la foulée, comme les traducteurs automatiques sont le mal incarné, pourriez-vous traduire ou faire traduire http://tr.wikipedia.org/wiki/F_klavye en français ?

Si le nom « Disposition Turc-F » est correct en français ou peut-être simplement « Turc-F », sauvegardez simplement la traduction brute sur http://fr.wikipedia.org/wiki/Disposition_Turc-F (au pire on renommera) avec en commentaire « traduction de l’article [[:tr:F_klavye]] » je m’occuperais de la mise en forme pour frwiki (bandeau trad/ébauche, liens internes, redirections depuis [[disposition Dvorak]], etc.). Merci d'avance !

Laurent

A2 a écritPour tes corpus, on ne sait pas quelle référence est la plus fiable mais j'aurais tendance à dire que le plus volumineux des deux donne de meilleures statistiques

Un corpus tiré de Wikipédia est représentatif… d’une encyclopédie.
Pour écrire un mail, par exemple, on utilisera plus la première et la seconde personne, des tournures interrogatives, de l’impératif, probablement un vocabulaire moins recherché…

Yannick a écritCe que tu pointes plus haut : comment peut-on avoir moins de digrammes dans toutes les catégories ?

Comme je te l’ai dit, j’ai l’impression que le comparateur bogue sur le Turc-F, rien que les charges des doigts sont bizarres (même avec ma disposition qui fait un usage important d’AltGr je n’atteins que 6,75 % pour le pouce — accessoirement, l’AltGr symétrique lui échappe). Note que tu es le premier à l’utiliser avec et qu’il a essentiellement servi à comparer des variantes du Bépo…

Vérifie quand même que ton corpus est en bien en UTF-8 (sinon, convertis-le ou choisis le bon encodage à l’ouverture du corpus), laisse le « Placements doigts » à « Dactylo » et utilise plutôt un Java 1.6 qu’un 1.7 (il a été programmé a l’époque du 1.6). Regarde aussi les éventuels messages d’erreur qu’il affiche avant le résultat : il y en a peut-être qui expliquent le résultat bizarre.

Après, si ton objectif est bien d’adapter le Bépo à minima, l’intérêt est de comparer les variantes que tu pourrais faire entre elles, comparer avec le Turc-F n’est pas indispensable.

damien thiriet

Je m’étais posé des questions similaires avec le polonais, qui m’a conduit à adapter mon bépo au polonais. À la pratique, je me suis cependant rendu compte qu’il vallait mieux utiliser une dispo ad hoc lorsque je devais taper de longs textes en polonais. À la rigueur, plus les dispositions diffèrent, mieux c’est pour l’apprentissage. Quand elles sont proches mais assez différentes (du style nombreuses interversion de deux touches), cela rend à mon avis plus difficile l’apprentissage.

robin_moussu

C’est aussi mon avis. Avoir beaucoup de symboles sur son clavier c’est bien pour pouvoir les écrire une fois tout les trois mois (genre √ ⅛ ⊕ et autres symboles provenant des langues étrangères), mais si on utilise régulièrement une autre langue très différente du français il faut une disposition dédiée.

Yannick

damien thiriet a écritJe m’étais posé des questions similaires avec le polonais, qui m’a conduit à adapter mon bépo au polonais. À la pratique, je me suis cependant rendu compte qu’il vallait mieux utiliser une dispo ad hoc lorsque je devais taper de longs textes en polonais. À la rigueur, plus les dispositions diffèrent, mieux c’est pour l’apprentissage. Quand elles sont proches mais assez différentes (du style nombreuses interversion de deux touches), cela rend à mon avis plus difficile l’apprentissage.

Merci de prendre le temps de venir en parler. J'essaie justement de ne pas avoir d'inversion de lettres :
- il n'y a que deux lettres qui changent de place et elles n'existent pas en turc (le x et le q) ; c'est une commodité pour écrire des mots étrangers,
- le changement sur les lettres sont principalement des substitution entres des lettres du français qui n'existent pas en turc et des lettres turques qui n'existent pas en français ; ainsi une touche est mémorisée comme une sorte de combinaison entre deux lettres qui ont toujours la même place,
- pour des raisons de place je déplace le ? avec le ! ce qui a une petite cohérence et je vire l'apostrophe droite qui ne devrait pas être utilisée en français pour la mettre sur l'apostrophe française (donc la même touche du côté gauche) car ils ont une apostrophe droite.

Il faut aussi que je pense à remplacer les guillemets français par les leurs.

Cela donne ceci :
http://sevmek.free.fr/bepo/tr-bipo.png

Le principe directeur est que toutes les lettres communes aux deux langues sont à la même place. Est-ce que c'est ce que tu avais fait ?

damien thiriet

En fait, si je n’ai pas trop de polonais à taper, je me contente de mon clavier bépo polonais mais pour les textes longs, je passe à ma version ergo du clavier polonais, qui est encore en beta, justement à cause de l’apprentissage. Je suis de toute façon obligé d’inverser certaines lettres: z doit être sur la ligne de repos, je l’ai mis dans la rangée des voyelles pour les digrammes cz dz sz, a est la voyelle la plus utilisée, y l’est plus que i etc. Bref il faut tout chambouler et comme le résultat est différent du bépo sans être radicalement différent cela se ressend dans l’apprentissage. Je l’avais interrompu mais pour une autre raison.

[raconte ma vie]
changer de clavier implique des problèmes de gestion de mes applications vimifiées. Pour les régler, j’ai dû passer d’emacs à vim afin de limiter le changement de clavier au mode insert de vim. Emacs ne permet cette manœuvre que depuis le 24.3 et celle-ci ne devrait pas être accessible dans la livraison à venir d’OpenBSD, vers lequel je compte switcher.
[/raconte ma vie]

Si tu dois taper de longs textes en turc, il faut à mon avis optimiser pour le turc abstraction faite du bépo, une solution intermédiaire se traduit par des km en plus pour les doigts. Je crois que les muscles finissent de toute façon par s’y mettre, même si la courbe d’apprentissage est plus abrupte…