Association francophone
pour la recherche et l'enseignement en
sciences et technologies de l'information


Stic-Hebdo

No 18. 17 mai 2004

Sommaire : Trois questions à Michael Zock (Limsi/CNRS) | L'actualité de la semaine | Théories et concepts | Enseignement | Dans les entreprises | La recherche en pratique | Manifestations | Détente

  Abonnement/Désabt. 

  Accueil Asti 

  Accueil Gerbert 

  Numéros précédents 

 Dictionnaire 

 

Colloque Creis - Revue Terminal. Paris-30 Juin, 1er et 2 juillet 2004
Société de l'information? Société du contrôle? Evolution de la critique de l'informatisation

Le programme  S'inscrire

 


"Les dictionnaires sont des composants essentiels à tous les systèmes de traitement de la langue. Nous travaillons à doter les dictionnaires électroniques de fonctionnalités qui en accroissent l'efficacité."

Trois questions à Michael Zock

Limsi-CNRS

Stic-hebdo : Sous le titre "Les dictionnaires électroniques", la revue "Traitement automatique des langues" (Hermes Lavoisier) vient de publier son numéro 2/2003 sous votre direction (avec John Carroll). La montée des moteurs de recherche sur la Toile n'a-t-elle pas rendu tous les dictionnaires obsolètes ?

Michael Zock : Il y a en effet des similitudes pour ce qui est de la localisation de l'objet recherché (mot, document). Mais les moteurs de recherche répondent souvent par tout et n'importe quoi. Ils ont tendance à noyer l'utilisateur sous la masse des documents, sans forcément trouver l'objet voulu. Par conséquent, le problème de l 'accès à l'information reste entier, et des recherches sur l'accès lexical restent pertinentes.

Un dictionnaire est un composant fondamental de tout système de traitement de la langue, qu'il s'agisse d'un être humain ou d'une machine. Mais un dictionnaire ne vaut que par l'information qu'il contient et par les moyens qu'il offre pour accéder à l'information.

A l'heure actuelle, il y a un fossé énorme entre les dictionnaires sur papier, les dictionnaires électroniques et le dictionnaire mental. L'architecture particulière de ce dernier lui confère un énorme pouvoir en termes d'organisation et de souplesse d'accès. Contrairement à une hiérarchie avec une seule voie d'accès, les réseaux offrent de nombreux moyens d'accéder à l'information recherchée. Tirant bénéfice de cette qualité, nous essayons de doter un dictionnaire électronique existant des liens (associations) permettant de naviguer dans l'hyperespace lexical en suivant des liens. Trouver un mot consisterait donc à entrer dans ce réseau par un mot, une idée ou un concept, puis à suivre des liens. Nous ne sommes actuellement qu'au début d'un travail de longue haleine, mais il est clair qu'un tel dictionnaire aurait de nombreuses applications, bien au delà de l'accès lexical.

Comme ce type de connaissance, pourtant capital, n'est pas inné, il est normal que l'on s'intéresse à son acquisition (dans le cas d'un être humain), à sa construction (dans le cas du traitement par la machine) et à son utilisation (dans les deux cas). Les articles présentés dans ce numéros traitent de ces questions, et présentent de nombreuses réalisations concrètes, y compris un historique du Trésor de la langue française informatisé, des années 1960 à 1990.

Ce domaine de recherche est très vivant. Avec Patrick Saint Dizier (Irit, Toulouse), nous préparons pour fin août un atelier sur le thème des dictionnaires électroniques (leurs usages, comment les améliorer). Il se tiendra dans la foulée de Coling, congrès international faisant référence en matière de traitement des langues.

S.H. : Et vous personnellement, quel est votre thème de recherche principal ?

M.Z. : Actuellement il y en a deux : la construction automatique de plan (découverte automatique des liens entre les idées) et l'accès lexical. Plus spécifiquement : comment trouver un mot qu'on a "sur le bout de la langue". Les dictionnaires existants répondent mal à ce type de question puisque, organisés de manière alphabétique, ils supposent déjà en entrée le mot à trouver. Or le rédacteur n'a souvent au départ que des éléments de sens (partie de définition) et/ou des liens de mots associés au mot recherché (par exemple, à la place du mot-cible café, on peut avoir des associations comme noir, fort, délicieux, Colombie...). L'objectif que je poursuis, avec d'autres chercheurs, est de doter les dictionnaires électroniques de ce type de liens afin d'aider l'usager à trouver le mot-cible grâce aux associations.

A cette fin, nous envisageons de construire une mémoire associative en extrayant ces liens d'un corpus, partagé par "tout le monde" : une encyclopédie. Nous faisons donc l'hypothèse, partagée par de nombreux chercheurs, selon laquelle le dictionnaire mental est un réseau, dont les noeuds sont des mots (et/ou des concepts), et des liens, des associations. Pour assister la construction automatique de tels réseaux par machine, il est utile de pouvoir s'appuyer sur des ontologies.

Avec le type d'outils que nous développons, l'utilisateur lance sa recherche à partir des mots lui venant à l'esprit. Ces mots peuvent être soit un élément de la définition du mot recherché, soit des mots associés au mot cible. Le système construit alors un réseau avec tous les mots liés, mais comme ce réseau est trop complexe pour permettre une navigation aisée, on présente des mots candidats sous forme de types. C'est à dire, au lieu d'un réseau ou d'une liste de mots, on présente un arbre dont les noeuds sont les types (catégorie sémantique à laquelle appartient le mot) et les feuilles sont les mots.

S.H. : Etes-vous plutôt un praticien ou un théoricien ? Comment concevez-vous votre activité de recherche ?

M.Z: Un peu les deux.  Je pars toujours des problèmes du monde réel. Mon point de départ pour ces recherches, ce sont les difficultés et les frustrations auxquelles est confronté celui qui veut apprendre une nouvelle langue. J'ai enseigné les langues et, suite à un stage d'un an au Credif (centre de recherches qui élabore des méthodes d'apprentissage des langues) j'ai formé des professeurs de langues. Je viens d'ailleurs de me remettre dans cette situation d'étudiant de langue en allant au Japon. C'est une forme de gymnastique qui me paraît propice pour faire mon métier. Cela me paraît capital de cultiver l'intuition, d'acquérir des connaissances basées sur du vécu. Je pars donc d'un problème concret pour envisager ensuite la construction d'un outil permettant de combler cette lacune. Puis j'essaie de faire abstraction du cas particulier pour voir dans quels autres cas de figure on pourrait appliquer cette idée. Autrement dit, quel est le cas général du problème et de sa méthode de résolution.

Pour moi, la recherche est plutôt un état d'esprit, une forme d'activité, qu'un "travail". D'ailleurs, je regrette qu'il y ait si peu de chercheurs profitant des possibilités que leur offre ce métier pour s'épanouir. Je pense que les chercheurs manquent trop souvent le côté joueur. Ils sont trop sérieux ou, du moins, ils se prennent trop au sérieux. En revanche, on ne sent pas assez le plaisir d'avoir la chance d'exercer ce métier. Nous manquons également de visionnaires, de gens qui, après avoir été en prise directe avec la réalité, se posent des questions comme : "Pourquoi fait-on cela ? Qu'est-ce qu'il serait sensé de faire d'ici dix, vingt ou cinquante ans ? Est-ce que le prix à payer en vaut l'enjeu ? Qu'est-ce qui n'a aucun sens ? Je pense qu'il faut avoir, dans la recherche comme dans la vie, la place du conducteur, décider où l'on veut aller, tout en restant ouvert aux situations imprévues. On peut aussi se poser comme un architecte, planifier, avoir une idée globale de ce qu'on il veut construire, et pourquoi. Hélas, la (com)passion et la vision globale sont deux qualités qui semblent faire défaut à beaucoup de gens et pas seulement à ceux de mon âge.

Propos recueillis par Pierre Berger


Actualité de la semaine

La loi sur l'économie numérique a été adoptée

Après l'Assemblée nationale la semaine dernière, le Sénat a validé à son tour hier le texte. Un recours du PS devant le Conseil constitutionnel pourrait encore en modifier certains points. La promulgation de la loi est repoussée à fin juin. (14/05/2004). (Selon Le journal du net ).

Ingénierie de modèles. Logiciels et systèmes

La trentième journée de l’Ofta (Observatoire français des techniques avancées), le 12 mai 2004, avait pour objet Ingénierie de modèles – Logiciels et systèmes. La notion de modèle succède au paradigme des vingt dernières années, basé sur les notions d’objet, classe, instance, héritage, composant. Dans cette nouvelle vision, le code exécutable ne représente plus le référentiel unique d’informations pour le cycle de développement. De nombreux modèles (de métier, de test, d’architecture, de déploiement, etc.) existent, sont développés, documentés et maintenus en dehors du code.

Le point de départ de ce changement de paradigme peut être situé exactement au 27 novembre 2000, date de publication de l’article fondateur de MDA (Model Driven Architecture) par Richard Soley de l’OMG (Object Management Group), alors que le groupe OFTA dédié à cette étude a été constitué en octobre 2000. Ce groupe, coordonné par Jean Bézivin, professeur à l’université de Nantes, Equipe Atlas (Inria et Lina), réunit de nombreux chercheurs, experts et responsables d’organisations aussi bien publiques que privées.

www.ofta.net ; www.omg.org

Claire Rémy

Transports : bilan du projet Actif

Le projet Actif (Architecture cadre pour les transports intelligents en France), animé par le ministère de l'Equipement, s'appuie sur les projets européens Karen puis Frame. Les "systèmes de transports intelligents" permettent de "collecter, stocker, traiter et distribuer de l'information relative au mouvement des personnes et des marchandises". Sans brider les projets particuliers, Actif vise au contraire à leur fournir un cadre méthodologique garantissant l'intégration entre les systèmes, l'interopérabilité des équipements, applications et services, et la référence aux mêmes normes et standards.

Au total, commente Claude Chiaramonti dans Vendredi, ce projet est un exemple à suivre quant à l'implication "intelligente" des pouvoirs publics dans la définition d'une architecture-cadre permettant ensuite aux différents acteurs de mieux valoriser leurs projets grâce à leur cohérence. 'Tous les numéros de VendrEDI peuvent être téléchargés en www.actimum.com/acvendredi.htm.

Colloque "Indépendance de l'Europe et souveraineté technologique"

On peut lire, dans La G

gazette n°99 du 11 mai 2004 sous la plume de Jean-Paul Baquiast, les premières conclusions relatives au colloque Indépendance de l'Europe et souveraineté technologique que l'Union paneuropéenne France et Automates-intelligents ont organisé les 28 et 29 avril 2004 au Centre des conférences internationales Kléber à Paris. JB Le site.


Théories et concepts

Technologies médicales

L'Inria présentera du 25 au 28 mai à Paris Expo deux projets impliqués dans les technologies médicales. Depuis plusieurs années, l'institut collabore avec ses partenaires afin de comprendre comment les Stic peuvent contribuer au développement des recherches dans le monde médical.
Le communiqué.


Enseignement

Tice 2004. Appel à communications

Le colloque international Tice 2004 se tiendra du 20 au 22 octobre 2004 à l'UTC de Compiègne. Voici l'appel aux communications :

"Les universités, les écoles d'ingénieurs et les entreprises sont confrontées à l'introduction massive des technologies numériques dans leurs pratiques d' éducation et de formation. En arrière plan, la « société de la connaissance » interpelle tous les acteurs de la formation, de l'innovation et de la recherche pour mieux comprendre les enjeux, encore mal mesurés, qu' elle induit et proposer des réponses pertinentes. De leur côté, les laboratoires scientifiques élaborent des concepts et modèles originaux ou développent des prototypes qui mobilisent les nouvelles technologies de l' information et de la connaissance. Ils déterminent ainsi de nouveaux usages pédagogiques et de nouveaux modes d'organisation. Tice 2004 a pour objectif de faire le point sur ces questions, d'apporter des éclairages nouveaux, de présenter des solutions innovantes et de confronter les points de vue au travers d'expériences multiples développées ces dernières années en France, en Europe et ailleurs. L'appel.

L'humain dans l'enseignement en ligne

Le deuxième colloque Tice Méditerranée se tiendra à Nice les 26 et 27 novembre 2004, sur le thème L'humain dans l'enseignement en ligne. Organisé par les universités Nice Sophia-Antipolis, Toulon Var, Aix Marseille III, Gênes (Università degli studi di Genova), ce colloque international prend la suite des journées Tice organisées par l'Université de Nice Sophia Antipolis depuis 1998, des rencontres des sciences de l'information et de la communication de l'Université de Toulon Var, du colloque Tice méditerranée organisé à Toulon les 17 et 18 octobre 2003. Il a vocation à rassembler un large public autour des universités de l'arc méditerranéen.

L'édition 2004 sera consacrée à l'étude des facteurs de réussite d'une véritable intégration des technologies de l'information et de la communication dans la pratique pédagogique de tout enseignant et dans l'environnement d'apprentissage de tout étudiant. Exposés de travaux scientifiques et retours d'expérience concrètes permettront d'illustrer les débats.

Le colloque sera l'occasion également de faire le point sur le partage des formations et l'échange de compétences entre tous les pays du pourtour méditerranéen d'expression francophone. Date limite pour le premier appel à communication: 31 mai (proposition de 500 mots max.). Le site de la DNTE.

Cours en ligne de l'INT

L'Institut national des télécommunications, fait partie du Groupe des écoles des télécommunications, établissement public d'enseignement supérieur et de recherche sous la tutelle du ministère de l'Economie, des finances et de l'industrie. L'INT est membre de la Conférence des grandes écoles. Un certain nombre de cours en ligne sont disponibles sans inscription préalable (notamment ceux marqués "tout public" et "Internet"): théorie de l'information, langage C, XML, bases de données relationnelles, interface homme-machine, etc. Explorer le site.

Rubrique animée par Jacques Baudé


Entreprises

IBM conforte sa stratégie architecturale

Big blue est en train de conforter une stratégie offensive avec son orientation grille, services web et SOA (Services oriented architecture). CBDi propose comme définition de la SOA Save our assets ou, plus sérieusement, The policies, practices, frameworks that enable application functionality to be provided and consumed as sets of services published at a granularity relevant to the service consumer. Services can be invoked, published and discovered, and are abstracted away from the implementation using a single, standards-based form of interface. C'est "services", qui est important dans cette définition, la SOA ne se résumant pas à une vision plus large de services web plus "maniables" par les utilisateurs.

Tous les numéros de VendrEDI peuvent être téléchargés à www.actimum.com/acvendredi.htm.


La recherche en pratique

Le magazine Upgrade lance un appel à contributions

Upgrade magazine "The european journal for the informatics professional" recherche des contributions pour sa nouvelle section Mosaic. Elle a pour but premier de couvrir une grande variété de sujets relatifs aux TIC, par exemple les services web, l'ubiquité, les flux de données (workflow). Elle accueille aussi bien des articles que des compte-rendus de colloques et congrès et des analyses d'ouvrages récents.

Contacts : Zakaria Maamar ou Soraya Kouadri Mostefaoui.

Veille mutualisée à Lyon

Pr@tic (Pôle de ressources et d'assistance pour les technologies de l'information) est un service transversal de l'ENS Lyon assurant la veille et le développement de ressources dans le domaine des technologies de l'information et de la communication (TIC). Cette page fournit un point d'entrée sur les différents développements en cours à l'ENS Lyon dans le domaine des TIC pour leur application à l'enseignement et à la diffusion de ressources scientifiques:
- ressources scientifiques sur internet,
- ressources scientifiques et pédagogiques des départements d'enseignement,
- diffusion des connaissances (avec le soutien du CCSTI de la région Rhône-Alpes),
- campus Numériques,

La signature électronique au CNRS

Un rapport sur l’utilisation de la signature électronique au CNRS est disponible en ligne sur le site du bureau de pilotage et de coordination du CNRS. Il présente une analyse du cadre technique, juridique et administratif de la signature électronique, illustrée de bonnes pratiques et permet ainsi de mesurer l’impact de ce cadre général sur le déploiement des outils de signature électronique au CNRS. Le rapport(PDF).


Manifestations

Consultez le site des associations fondatrices de l'Asti, où vous trouverez les manifestations qu'elles organisent.

Université d'été de la communication 2004

Du lundi 23 août au jeudi 26 août 2004, toujours à Hourtin en Gironde, l'UEC fêtera sa 25ème édition autour du thème "Territoires". Carrefour de réflexion, lieu d'échanges et de partage des savoirs, l'Université d'été de la communication a acquis une véritable légitimité, avec la participation de plus de 6000 participants en 2003, la présence de 200 journalistes pour couvrir l'événement, et la collaboration de 120 partenaires. 2004 proposera un cru exceptionnel, avec notamment la présence et l'intervention de 25 grands témoins nationaux et internationaux qui éclaireront et mettront en perspective les travaux. J.B.
Pour en savoir plus, cliquez sur le site du Crepac (Centre régional d'éducation permanente et d'action culturelle) d'Aquitaine, association regroupant les Ligues
de l'enseignement des cinq départements d'Aquitaine et la Ligue française de l'enseignement et de l'éducation permanente.

Le livre de la semaine

Calcul différentiel en logique !

Calcul différentiel pour les langues de la logique. Théorie et applications. Par André Thayse. Hermès Science. 222 pages.

Inattendu, au moins pour les non initiés : le calcul différentiel, a priori hôte exclusif du monde des fonctions continues, peut aussi se décliner dans l'univers, on ne peut plus discret, de la logique. Précisions de l'éditeur :
" L'objectif de cet ouvrage est de développer un calcul différentiel et intégral pour les langues de la logique, calcul fort semblable au calcul différentiel et intégral de l'analyse infinitésimale classique. Les applications de ce calcul différentiel et intégral logique se situent en théorie des circuits logiques (ou circuits de commutation) et en informatique. Ces applications sont, par exemple, la synthèse de circuits et de programmes, la détection des fautes de fixation dans les circuits, l'analyse de fautes de transition dans les circuits combinatoires et séquentiels".


Détente

Protection de la vie privée et droits de la femme

Problème à soumettre aux défenseurs des droits de l'homme (et de la femme) : peut-on aller jusque là pour protéger sa vie privée conte l'envahissement des technologies informatiques ?

 

Quant les forces de l'ordre diagonalisent leur logique...

Une personne a mis une annonce pour vendre sa voiture. Comme beaucoup le font, il a placé une affiche sur sa lunette arrière avec son numéro de portable.Il se rend au travail et roule tranquillement a 50 km/heure quand soudain le téléphone sonne :
- Bonjour. Gendarmerie nationale. Nous sommes derrière vous... Vous savez qu'il 'est interdit de répondre au téléphone en conduisant. Veuillez vous ranger sur le bas coté !


L'équipe de Stic-Hebdo : Directeur de la publication : Jean-Paul Haton. Rédacteur en chef : Pierre Berger. Secrétaire général de la rédaction : François Louis Nicolet, Chefs de rubrique : Jacques Baudé, Mireille Boris, Claire Rémy et Armand Berger. Stic-Hebdo est hébergé par le LRI et diffusé par l'Inist.