Accueil Présentation Tous les sujets Rechercher Me contacter  





Recherche par mot Liste des sujets




Version du système
ligne horizontale

La présente version du système, installée le 9 juillet 2004, apporte de nombreuses corrections au corpus. Elle corrige aussi quelques bugs mineurs.





Présentation du système
ligne horizontale


Qu'est-ce que c'est ?
Utilisation
Ce qui est possible aujourd'hui...
Ce qui serait possible demain...
Un peu de théorie
Éléments techniques, plateformes supportées, bugs connus


Qu'est-ce que c'est ?

Il est sans doute assez spontané, lorsqu'on débute l'apprentissage d'une langue étrangère, de se constituer des fiches de vocabulaire, que l'on enrichit peu à peu au fil des leçons... Le résultat ainsi obtenu est une liste de mots et d'expressions présentés selon une logique vaguement thématique, puisque élaborée au gré des sujets abordés par les leçons. Au fur et à mesure que ce vocabulaire s'étoffe, il devient cependant de plus en plus difficile de retrouver dans ses notes un mot vu dans une leçon précédente.

Dans une langue comme le grec moderne, où les racines, les préfixes, suffixes et autres transformations de radicaux sont nombreux, et où le jeu des déclinaisons altère articles, noms et adjectifs, la nécessité de pouvoir rapprocher un mot nouveau d'un autre mot assimilé précédemment se fait rapidement sentir. Car la mémorisation d'un mot construit sur des racines d'autres termes déjà connus est très probablement bien plus aisée que celle d'un mot totalement neuf : il sera sans doute plus simple de retenir τακτοποιώ si l'on connaît déjà τάξη, et si le lien sémantique et morphologique existant entre ces deux mots nous est signalé.

Dans une phase de révision ou d'apprentissage volontariste du vocabulaire, on peut également souhaiter constituer des fiches thématiques ; une telle classification est en outre un bon point d'entrée pour rechercher et retrouver un mot oublié ou inconnu. En définitive, dès qu'il s'enrichit un peu, le corpus du vocabulaire constitué par celui qui apprend une langue étrangère suscite rapidement un besoin d'ordre "navigationnel" : du nouveau vers le déjà connu, mais aussi, par curiosité, du déjà connu vers le nouveau. Les exemples de situations de première espèce sont nombreux : on connaît déjà un mot de "même" sens que celui que l'on vient de rencontrer... mais il existe sans doute une petite différence de sens ou d'usage ; ou bien, on croyait que ce mot-là voulait dire autre chose (mais peut-être a-t-il plusieurs sens ?) ; ou encore, on connaissait l'adjectif, et voici le verbe correspondant ; on peut aussi confondre deux mots (νόμος et νομός...) - et dans ce cas, peut-être plus encore que dans les précédents, il est bien utile de rapprocher le mot connu du mot nouveau.

Mátala est une tentative de mise en place d'un système de navigation au sein d'un lexique bilingue français-grec. Mátala est très clairement une maquette, un prototype : le but poursuivi ici n'est pas de fournir un système définitif, opérationnel et directement utilisable, mais plutôt d'évaluer la pertinence d'un tel système, sur deux plans : d'une part, évaluer les potentialités réelles de navigation d'un tel système (peut-être 80 % des mots ne seront-ils in fine liés à rien du tout ?) ; d'autre part, confronter les concepts (modèle de données), sur lesquels le système s'appuie, à la réalité d'un corpus modeste mais déjà complexe. Mátala est aussi, en Crète, à l'extrémité de la plaine de Messará, un petit port cerné de falaises de calcaire ; dans les années soixante-dix, le village acquit une certaine célébrité en hébergeant, dans les grottes qui l'entourent, la plus grande communauté hippie d'Europe. C'est aujourd'hui une station balnéaire ; elle est toujours située à quelques kilomètres au sud de la plage où Zeus aurait, sous les formes d'un taureau, enlevé la belle Europe.


Utilisation

L'entrée dans le système se fait par la Liste des sujets.
Il est possible de cliquer sur à peu près tous les termes français et grecs présentés par le système pour "en savoir plus" sur ceux-ci...Les termes en français pouvant être cliqués sont toujours signalés par une typographie particulière (bleu et/ou italique).
D'une manière générale, les termes sur lesquels il est possible de cliquer s'activent lorsqu'on les survole avec la souris.


Ce qui est possible aujourd'hui...

Le corpus initial du système est constitué d'environ deux mille mots et expressions saisis par un néophyte, durant ses premières phases d'apprentissage du grec moderne, sans aucune intention initiale de constituer un système informatique. Aussi, les noms peuvent apparaître au pluriel ou déclinés, les verbes sous une forme conjuguée, les adjectifs sous une forme accordée, même si on a tenté de normaliser au maximum tous ces termes. Les expressions sont le plus souvent des exemples d'utilisation de termes également présents de façon isolée.

Les navigations suivantes sont possibles :

Navigation sur la base de critères sémantiques
- naviguer dans un réseau simple, et a priori arborescent, de sujets, de sous-sujets, etc. Ce réseau accepte dans le système actuel les parentages multiples (on trouvera le sujet "Musique" à la fois dans les sujets "Les arts, la culture" et "Entendre, écouter") ;
- consulter tous les termes classés dans un sujet particulier. Lorsqu'un terme apparaît dans un sujet, il apparaît également dans la liste des termes parents de celui-ci (λεμονιά, citronnier, étant classé dans le sujet "Arbres", lui-même fils du sujet "Plantes", λεμονιά apparaîtra aussi lorsqu'on consultera le contenu du sujet "Plantes") ;
- consulter tous les sujets dans lesquels est classé un terme donné (ou plus précisément un sème, voir ci-après), afin de pouvoir accéder aux autres termes rattachés à ce(s) même(s) sujet(s) ;
- voir, dans la langue maternelle, la liste des différentes acceptions possibles de chaque terme de la langue apprise (ικανός donnera : suffisant, apte à, etc.). Pour désigner cette situation, on parlera dans la suite, et de façon probablement abusive, de "polysémie" ;
- à l'inverse, voir les autres termes de la langue apprise ayant le "même" sens qu'un terme donné de cette même langue (σημαντικός, important, conduira alors à σπουδαίος). On parlera pour simplifier de synonymie.

Navigation sur la base de critères morphologiques, et éléments grammaticaux
- voir, depuis un terme donné de la langue apprise, les autres termes de même(s) racine(s). Pour une expression, il nous a semblé que cette action n'avait guère de sens, et on l'a remplacée par un accès à chacun des termes figurant dans l'expression et identifié de façon individuelle dans le système (les actions citées ci-dessus sont alors accessibles pour chacun de ces termes) ;
- les racines elles-mêmes sont rappelées entre parenthèses, et la liste de tous les termes construits sur une racine donnée est accessible ;
- pour certains termes, on disposait d'informations grammaticales élémentaires. Ces informations sont essentiellement, pour les verbes, la conjugaison, et pour les adjectifs, l'accord au nominatif singulier, quand l'information était présente dans les données. Mais on ne trouvera malheureusement pas ici la déclinaisons des noms communs, sauf pour quelques cas particulièrement atypiques (το κρέας, το παρελθόν)...


Ce qui serait possible demain...

On présente ici la première version du système. Aussi, de nombreuses évolutions sont envisageables :

1. une présentation alphabétique des sujets, des termes grecs et de leurs traductions ;
2. des fonctionnalités d'édition assistée du corpus ;
3. écoute en streaming de la prononciation de chaque terme grec ;
4. une traduction en anglais des données correspondant à la langue maternelle. Cette traduction permettrait en particulier d'éprouver un peu la robustesse des concepts sur lesquels on a fondé la modélisation des données (voir ci-après).

Le troisième point ci-dessus est assez prospectif : un système tel que celui-ci ne vaut que si les données sur lesquelles il s'appuie ne contiennent pas de doublons. Lorsqu'un utilisateur ajoute le sujet "arbre" dans la base, il faut le prévenir qu'il existe déjà un sujet "Arbres" ; et lorsqu'il crée l'entrée συνείδηση, il faudrait, idéalement, que le système détecte automatiquement les racines συν- et ειδ-, et crée les liens idoines avec le nouveau terme, ou au moins les suggère à l'utilisateur. D'une manière générale, l'édition et l'enrichissement de tels corpus structurés nous semble la question centrale posée par de tels systèmes, pour ne pas dire l'obstacle majeur à leur mise en place réaliste, en vraie grandeur : aussi longtemps que de tels outils "intelligents" d'analyse linguistique ne sont pas là pour assister l'utilisateur durant les phases d'enrichissement du corpus, faire vivre de telles bases demeure une tāche à la fois très délicate et interminable.


Un peu de théorie

Les sèmes
La problématique centrale d'un système bilingue tel que Mátala est bien sûr celle de la traduction : comment gérer les différentes traductions possibles d'un terme grec donné ? Comment gérer les diverses manières de dire en grec une idée exprimée en français ? Pour aborder ce problème, on a fait l'hypothèse suivante : s'il est possible de traduire une idée (dans un sens ou dans l'autre), c'est que cette idée peut être exprimée dans chacune des deux langues.
Bien entendu, cette première hypothèse est déjà réductrice : tout objet ou concept n'existant que dans l'une des deux cultures ne pourra être traduit que par une paraphrase fournissant une description succincte de l'objet en question (le domaine culinaire est riche de tels exemples : τζατζίκι, κολοκυθοκεφτέδες...). Il existe aussi des situations plus délicates, où un mot désigne une idée générale inexprimable dans la langue maternelle autrement que par accumulation de traductions complémentaires : προλαβαίνω, avoir le temps de, arriver à temps, qui de plus est transitif (πρόλαβα το τραίνο, j'ai réussi à avoir le train, sous-entendu : malgré mon retard) ; un autre exemple est fourni par les prépositions ayant un double sens logique et temporel : αφού (puisque et après que), άμα (si, quand).

Dans un deuxième temps, on a essayé d'affiner ces concepts afin d'arriver à des unités sémantiques élémentaires, non ambiguës, et communes aux deux langues. Dans la suite, ces atomes sémantiques sont appelés sèmes. Maison, facile, découvrir (quelque chose d'inconnu), plaine de Thessalie sont des sèmes. Mais, par exemple, on a distingué sortir (quelque chose de quelque part) et sortir (quelque part), car sortir seul est ambigu. Les sèmes sont pourvus d'un libellé en français. Ce libellé est unique, et les ambiguïtés inhérentes à la langue française sont levées, comme le montrent les exemples ci-dessus, par une précision indiquée entre parenthèses. On verra plus loin que ces libellés ne servent en fait qu'à identifier le sème : ce ne sont pas eux qui sont utilisés pour fournir à l'utilisateur la traduction des termes grecs.

Sujets
Les sèmes constituent le pivot entre les deux langues : en amont, côté sémantique (ou, si on préfère, côté langue maternelle) les sèmes peuvent être classés dans un réseau arborescent de sujets, eux aussi présentés dans la langue maternelle. (De fait, les sujets sont également des sèmes, correspondant seulement à des objets mentaux abstraits et génériques ; aussi, on pourrait sans doute élaborer ce réseau directement depuis les sèmes). Du point de vue de l'utilisateur, le point d'entrée du système est précisément ce réseau de sujets : il est possible de passer de sujet en sujet, de voir tous les sèmes d'un sujet, et tous les sujets où est classé un sème donné.

Termes grecs et mots grecs
En "aval", côté langue apprise et côté morphologie, le coeur des données est constitué de termes grecs, qui sont un mot ou une expression. Chaque terme de la langue apprise est lié à un ou plusieurs sèmes, qui correspondent aux diverses idées que ce terme peut colporter ("polysémie") : αδειάζω est lié aux sèmes vider et se vider. Inversement, un sème peut être lié à plusieurs termes grecs, afin de gérer la synonymie : ευχαριστιέμαι et χαίρομαι sont liés au même sème prendre plaisir.

Liens entre sèmes et termes grecs
Ces liens entre sèmes et termes grecs constituent l'élément central de l'affichage. En effet, lorsqu'on considère l'un de ces liens sème-terme, on dispose, non seulement du terme, mais aussi de l'un des sèmes auxquels il est rattaché. On dispose donc d'une information plus riche que celle fournie par le seul lexique des termes grecs : le sème auquel le terme est lié fournit une indication sémantique qui renseigne sur la façon dont l'utilisateur est parvenu jusqu'à ce terme grec. Ceci permet de fournir à l'utilisateur une traduction contextualisée des termes de la langue apprise, tenant compte de l'itinéraire navigationnel qui l'a amené jusqu'à ce terme. On évite ainsi l'écueil classique du lexique qui, ne disposant d'aucune information contextuelle, ne peut fournir, pour chaque terme, qu'une liste toutes ses traductions possibles.
Par exemple, ανοιχτός sera traduit par clair, ouvert ou allumé suivant qu'on aura abouti à ce terme depuis les sujets "Couleurs", "Ouvrir, fermer", "Allumé et éteint" (mais, dans les trois cas, les autres significations seront mentionnées) ; bien sûr, le versant morphologique (racines, accord de l'adjectif, etc.) sera commun à ces trois affichages.
Dans le cas où le terme grec est en fait une expression (ou un mot composé), il est lié à tous les sèmes identifiables dans l'expression (Τι ώρα ; , À quelle heure... ?, est lié aux sèmes quel ? et heure) ; dans ce cas, les libellés des sèmes ne sont pas non plus exploitables directement pour la traduction, car ce que l'on souhaite traduire est un objet composite, invoquant dans sa signification une articulation grammatical de plusieurs sèmes (les aspects grammaticaux sont bien sûr volontairement exclus de notre travail).

Ainsi, ni les sèmes, ni les termes ne suffisent à donner l'information nécessaire à une traduction pertinente ; c'est pourquoi la traduction dans la langue maternelle des termes de la langue apprise a été placée sur le lien sème-terme lui-même.

Racines grecques
à leur tour, les termes grecs sont disséqués en mots grecs (ceci afin d'isoler les différents mots dans le cas où le terme grec est une expression). Aujourd'hui, le type des mots (nom, adjectif, etc.) et les informations grammaticales complémentaires (genre des noms, conjugaison des verbes, etc.), sont gérés au niveau du terme grec. C'est une erreur de conception : ces informations devraient logiquement être attachées au mot grec.
Enfin, il existe un corpus de racines grecques : chaque mot grec peut être lié aux diverses racines qui apparaissent dans sa formation.
Ces relations permettent à l'utilisateur de rebondir, depuis un mot, vers les autres mots de même racine, ou bien vers les expressions où ce mot est employé. En fait, pour des raisons ergonomiques, cette navigation est offerte directement depuis l'affichage des termes grecs ; mots et racines ne sont présentés que si un choix de la part de l'utilisateur est nécessaire, c'est-à-dire quand le terme visualisé présente plusieurs mots (cas d'une expression), ou bien si plusieurs racines sont identifiables dans un même mot. Dans ces situations, des listes intermédiaires de mots (par racine) et les racines elles-mêmes sont présentées à l'utilisateur afin de lui permettre d'effectuer la navigation de son choix.

On résume dans le schéma ci-dessous l'ensemble de toutes ces données, et les relations existant entre elles, sur lesquelles s'appuient toutes les possibilités de navigation dans Mátala.




Éléments techniques, plateformes supportées, bugs connus

Le système actuel s'appuie sur une technologie PHP/MySQL, cette dernière base de données hébergeant les données structurées sous une forme relationnelle suivant exactement le modèle logique exposé ci-dessus.
Les configurations sur lesquelles le système fonctionne sont a minima :

- Windows (NT, XP et probablement les versions antérieures) et Internet Explorer ;
- Mac OS X et Safari ou Mozilla. Sous Mac OS X, le système ne fonctionne pas avec Internet Exporer. Mátala n'a pas été testé sous Mac OS 9.x ;
- Linux (testé sur Redhat 7.x et Redhat 8) et Mozilla.

Bugs connus :

1 - dans l'affichage des liens termes-sèmes (affichage principal), la liste des éléments de même racine n'est pas limitée en taille. Lorsqu'on a plus de 15 éléments environ, la liste se superpose parfois avec le terme lui-même, ou bien avec le zoom grammatical (conjugaison du verbe ou accord de l'adjectif).

Les bugs et les fautes peuvent être signalés par mail à Pascal Mullon. Cet e-mail est également accessible directement depuis la page où le problème est constaté, en cliquant sur l'icône en haut de la page.