|
|
Forum du petit sténographe Forum d'échange et d'entr'aide autour de la sténographie
|
Voir le sujet précédent :: Voir le sujet suivant |
Auteur |
Message |
mttiro
Inscrit le: 27 Sep 2011 Messages: 969
|
Posté le: Ven 04 Nov 2011 11:22 am Sujet du message: Reconnaissance automatique sténo Pitman, Renqun |
|
|
Déjà il y a une trentaine d'années, quand cette pauvre vieille chose qu'est la sténographe était encore
répandue, des informaticiens se sont intéressés à la reconnaissance automatique des tracés sténographiques
sur tablette pour les convertir en texte usuel (donc ceci est à bien distinguer des programmes de conversion
couplés à des sténotypes).
On a par exemple un article "très ancien" de l'ingénieur et universitaire anglais Graham Leedham partiellement
consultable en ligne. Il se trouve dans l'ouvrage collectif reprenant des commmunications à un colloque
de la International Graphonomics Society : Computer processing of handwriting, C. Graham Ledham
& Réjean Plamondon, eds., World Scientific 1990.
Graham Leedham a un article dans ce recueil, Automatic recognition and transcription of
Pitman's handwritten shorthand, pp. 235-269. Peu importe la technique utilisée à l'époque. Ce qui est
intéressant à considérer, parce qu'on n'en trouve guère d'exemples aussi facilement accessibles sur Internet,
c'est la discussion commençant à la page 241 (mais malheureusement reproduite de façon partielle)
sur la variabilité et la lisibilité des notes en sténographie Pitman selon les sources. On a, répartie entre
les pages 242 et 243, une figure 4 où se trouvent (a) un texte sténographié dans un manuel, avec des tracés soigneux ;
(b) un texte produit par un étudiant passant un examen à 100 mots / minute (déjà là le "renforcement" ("shading")
est évanescent ; (c) un texte produit par un professionnel, en l'occurrence un journaliste travaillant très vite.
Il y a "longtemps", en 2005, Graham Leedham était co-auteur d'un article intitulé "Transliteration of online handwritten
phonetic Pitman's shorthand with the use of a Bayesian network" (résumé disponible).
Un googlage rapide sur le site de la International Graphonomics Society me fait trouver, du même Graham Leedham,
une communication de colloque en novembre 2007, intitulée "Is there a future for handwritten shorthand?". En 2010,
un certain John Klein cherche à trouver cet article, en indiquant ceci : "We are developing a new shorthand system,
to be called DASH, to be used for manual writing as well as computer pen input". Mais je ne trouve pas de site Web
pour "Dash Shorthand", et j'ignore si Dash a rejoint le cimetière des sténographies, sans fleurs, ni couronnes,
ni amis à son enterrement.
Un article encore assez frais est Graham Leedham, Yang ma, Michael Blumenstein, Handwritten shorthand and
its future potential for fast mobile text entry, International Journal of Pattern Recognition and Artificial Intelligence,
23,5 (2009) : 1031-1051. On peut le lire en ligne ici :
http://www98.griffith.edu.au/dspace/bitstream/10072/29652/1/60940_1.pdf
Extrait : "While shorthand was originally intended as a means of fast note-taking, and the reader of the shorthand
would usually be the original writer, it has been shown that Pitman shorthand has many features of a machinography –
a machine compatible handwritten script, whilst Gregg shorthand is based on curves which are less compatible
with current computer recognition techniques (Brooks, (1985)) [...]. In the last ten years, a research group
at Mysore University (Nagabhushan et al. (1999, 2000, 2002)) has been working on automation text production
from offline Pitman notes. From their point of view, Pitman shorthand has advantages in being integrated into the present
speech processing systems as it is the only
universally accepted medium known for enabling real-time speech to text production.
With the recent widespread availability of inexpensive portable hand-held devices"
(Observation : Leedham et ses collègues sont, comme c'est assez compréhensible, très ethnocentristes. Au début de l'article,
il y a un paragraphe retraçant l'histoire de la sténographie, où sont nommés Bright, Willis, Shelton, Byrom (dont j'espère parler bientôt),
Taylor, Pitman, Gregg, et... Gabelsberger (en tant qu'inspirateur de la cursivité de la Gregg). Je ne reprocherai rien aux auteurs,
ayant eu l'occasion de lire, comme les habitués de ce forum, des tas de témoignages où des gens parlent de "la" sténographie,
en se référant à la méthode qu'ils connaissent, dans leur langue à eux, et qu'ils croient sincèrement être la seule).
Continuons la citation :
"With the recent widespread availability of inexpensive portable hand-held devices, it is now time to reassess the potential
of Pitman shorthand as a viable means of rapid handwritten text entry in mobile computer applications. Some promising
algorithms have been arising recently for the recognition and transcription of Pitman shorthand (Ma et al. 2004, 2007;
Htwe et al, 2004). Quite significantly, the Pitman shorthand structure is also applicable to Mandarin Chinese where
the phonetic sounds of Chinese are mapped to the geometric strokes of the Pitman-style shorthand (Ma & Leedham, 2007)
in a shorthand system called Renqun (Liao (1985)). Examples of Pitman and Renqun shorthand are shown in Figures 1 and 2.
There has been some work reported for recognising and transcribing Renqun shorthand (Chen & Yu (1998), Chen et al. (2000),
Chen & Qiao (1997)). If the accurate recognition of Pitman shorthand is achievable, the techniques are equally applicable to
Mandarin Chinese (with a different transcription system) and thus the recognition engine is potentially usable by two
of the world’s most widely spoken languages – English and Mandarin Chinese. The potential users of such a system
would be anyone who needs to make notes or record verbatim speech in real-time as it is spoken. This would include
news reporters, students and secretaries. It is estimated that about 750 million people speak
English and 1000 million speak Mandarin. If only 1 in 10,000 or 0.01% of these people found such a device useful
there would be over 1.5 million users. In the remainder of the this paper the critical issues which need to be addressed in a mobile usable"
Regardez pages 10-11 les échantillons fournis par un sténographe confirmé (a), un sténographe occasionnel (b),
un sténographe débutant (c), le tout sur tablette.
Chose très réconfortante, le taux de reconnaissance du dispositif est très élevé.
Dernier paragraphe :
"Unless handwritten shorthand enters the technology age and is incorporated into mobile computing devices it will fall
further into disuse and only used by the motivated few, as was the case 300-400 years ago. Of the surviving
shorthand systems, still with a large user population, the Pitman/Renqun shorthand is the most machine compatible,
or most closely related to a machinography. For shorthand transcription systems to become available and used,
well designed, high performance, mobile products which prove themselves able to assist motivated people in their work
by enabling real-time entry and transcription of English and Mandarin text into systems at high speed need to be developed
in the next few years. This is now technically possible."
Attention : le choix de la Pitman, qui peut paraître étonnamment nombriliste vu de l'extérieur, et motivé par la sournoiserie
habituelle de la Perfide Albion, est motivé par des considérations parfaitement sensées : 1) application reconnue aux deux
langues les plus parlées dans le monde ; 2) meilleure facilité de reconnaissance automatique par rapport à la Gregg qui est
l'autre système le plus répandu dans le monde anglophone. Si je ne fais pas erreur, au vu de l'état actuel de la technique,
la supériorité de la Pitman sur la Gregg tient à son caractère géométrique, encore que le renforcement ne me paraisse pas
simplifier les choses. Mais rien ne m'enlèvera de l'idée que si l'informatique avait été une création allemande au lieu d'avoir été
une création anglo-américaine, on n'aurait pas hésité à déverser des sommes d'argent importantes dans la reconnaissance
automatique de la DEK, et à vanter les mérites de la cursivité sur le géométrisme. Heureusement les Allemands réagissent.
Voir la récente thèse de Niko Will (2010) sur la reconnaissance automatique de la DEK, " On-Line Handschriftenerkennung
(OLCR) der Deutschen Einheitskurzschrift " :
http://www.nw-software.com/wp-content/uploads/2011/02/On-Line-Handschriftenerkennung-der-Deutschen-Einheitskurzschrift.pdf
Au congrès de juin 2011 à Cancun (les graphonomistes savent vivre), Charles Tappert a communiqué sur : "Analysis of
shorthand alphabets in pen-centric handwriting interfaces.
L'article de Graham 1990 indique que, à l'époque, donc en 1990, les estimations du Pitman Examination Institute étaient que,
dans le monde entier, il devait y avoir quelque chose comme 500000 (ou plus) personnes capables de noter en Pitman
à au moins 100 mots / minute. En plus il devait y avoir plusieurs millions de personne qui avaient reçu une formation
dans ce système, avec un niveau variable. En 1990 la population mondiale était estimée aux environs de 5,3 milliards.
Graham Leedham, qui a été président de la International Graphonomics Society, est actuellement professeur à la University
of New England, qui se trouve en Australie :
http://www.une.edu.au/staff/hos-st.php
Note sur la sténographie chinoise
Le système sténographique auquel il est fait allusion a été inventé par un certain Liao en 1985. Il est manifestement géométrique,
et j'ai cru deviner tout de même que le système analyse les syllabes en attaque consonantique + rime V(C), selon la tradition
de la phonétique chinoise, parfaitement adaptée en l'occurrence, et qui se retrouve dans le système d'écriture Pahawh Hmong
de Shong Lue Yang, que j'ai décrit ailleurs. Mais j'échoue à trouver de plus amples informations pour le moment. J'écris
de ce pas à M. Yang Ma (= Ma Yang : le patronyme est Ma, en premier à la chinoise, en second à l'occidentale), car je brûle
d'en connaître un peu plus.
Pour les amateurs : le peu évident "q" de la translitération pinyin du chinois mandarin correspond dans "Renqun" (apparemment 人群)
à ce que les phonéticiens notent ainsi : [tɕʰ], une espèce de "tch" suivi d'un souffle, que la transcription anglaise Wade-Giles
notait ch'. En sorte que, sur les pages concernant la sténographie chinoise de Tsuguo Kaneko (voir le post sur la sténographie
en Russie, Corée, Chine) ce système est bien mentionné, mais sous la translittération Liao Renjun, et même sur une page,
par lapsus amusant, Liao Regnum. Selon Tsuguo Kaneko, le système serait "mi-cursif". Mais on décrit la Gregg ainsi,
et Leedham et Ma n'ont pas l'air de la considérer ainsi.
Si vous voulez vous procurer l'ouvrage de 1985, le voici :
http://item.taobao.com/item.htm?id=5239434165
On trouvera une vieille adaptation de la Pitman au chinois, par Julia A. Barrett, Universal stenograph, or Chineseshorthand (1902), ici :
http://www.archive.org/details/universalstenogr00barr |
|
Revenir en haut |
|
|
mttiro
Inscrit le: 27 Sep 2011 Messages: 969
|
Posté le: Mer 14 Déc 2011 11:05 am Sujet du message: Translitération automatique de Pitman, suite |
|
|
Je signale un travail de 1982 portant sur la conversion automatique par ordinateur d'une transcription de l'anglais en sténographie Pitman vers une notation en orthographe courante.
Colin P. Brooks, Computer transliteration of shorthand, Sprelling Progress Bulletin, Fall 1982, pp. 15-20.
http://www.spellingsociety.org/bulletins/b82/fall/shorthand.php |
|
Revenir en haut |
|
|
|
|
Vous ne pouvez pas poster de nouveaux sujets dans ce forum Vous ne pouvez pas répondre aux sujets dans ce forum Vous ne pouvez pas éditer vos messages dans ce forum Vous ne pouvez pas supprimer vos messages dans ce forum Vous ne pouvez pas voter dans les sondages de ce forum
|
|