Association francophone |
Sommaire : Trois questions à François Bourdoncle, Exalead | L'actualité de la semaine | Théories et concepts | Enseignement | Dans les entreprises et les administrations | Manifestations | Détente
Colloque Creis - Revue Terminal.
Paris-30 Juin, 1er et 2 juillet 2004 |
"L'objectif est de monter une équipe qui bénéficie des cerveaux de l'ENS et qui, avec nos logiciels, dispose des moyens techniques nécessaires pour faire de la bonne recherche dans les domaines qui nous intéressent."
Stic-hebdo : Le succès de votre société est tel que l'on vous poserait presque en concurrent de Google. Or vous êtes à la base un chercheur, puisqu'en sortant de la filière X-Mines vous avez soutenu en 1992 une thèse intitulée "Sémantique des langage impératifs d'ordre supérieur et interprétation abstraite", avant d'entrer dans les laboratoires de Digital puis de fonder votre entreprise en septembre 2000. Votre engagement industriel ne va-t-il pas vous éloigner du monde académique ?
François Bourdoncle : Notre équipe de recherche et développement comprend trois doctorants et va continuer à faire véritablement de la recherche. L'annonce de notre version 3.0 marque le moment où l'investissement de base est derrière nous. Par exemple, nous allons étendre à un milliard de pages la couverture de notre serveur, pour prouver que notre technologie peut passer à l'échelle. Mais cela n'exige plus de gros investissement technologique : il suffit d'acheter les machines nécessaires.
En revanche, nous avons maintenant des clients à supporter, il nous faut donc une gestion plus rigoureuse des évolutions et des "roadmaps". Notre développement nous conduit donc à différencier des métiers que nous pratiquions, jusqu'à présent, dans le cadre des mêmes équipes.
Nous allons développer une ingénierie de type traditionnel, axée sur la maintenance et la stabilisation des produits, sur l'établissement de connecteurs.
Nous allons aussi développer le packaging et la verticalisation de nos produits. Par exemple nous travaillons en Italie avec le secteur bancaire, sur la détection du blanchiment d'argent sale, par l'étude des transactions bancaires en amont de leur chaîne de traitement.
S.H. : Que vont faire alors vos doctorants ? Et vous-même, continuez vous à mener des recherches et à enseigner ?
F.B. : Notre plate-forme est architecturée en deux niveaux. Le coeur technique, où les problèmes de performances sont critiques, est écrit en C (un million de lignes de code environ). Au dessus, nous avons créé une machine virtuelle, un compilateur et un langage qu nous est propre, Exascript. C'est une extension XML de Java. Pour faire simple, on peut dire que nous avons combiné le modèle de données d'XML et le modèle de programmation de Java avec sa syntaxe, pour obtenir un langage transparent par rapport à XML, depuis les entrées jusqu'aux sorties. Les quelque 300 000 lignes de notre produit Exalead sont écrites dans ce langage, qui est aussi notre outil de verticalisation.
Le choix d'une telle technologie découle des recherches que j'ai menées en génie logiciel et plus particulièrement en conception de langages (language design). La préparation des futures versions de nos produits (que nous n'avons aucune raison d'annoncer avant quelques 18 mois au moins), appelle des recherches qui relèvent de l'informatique linguistique (un de nos doctorants) ou de points particuliers comme le typage d'extensions de Java (notre deuxième doctorant). Le troisième se consacre à l'appariement de formes (pattern matching) en XML, pour le filtrage et la recherche de motifs. En tant que chercheurs, ils sont évalués chez nous sur la qualité des idées qu'ils génèrent, a la différence des ingénieurs, dont le rôle est de fournir en temps utiles les produits livrables dont nos clients ont besoin. Cela n'empêche pas nos ingénieurs de développement d'avoir des neurones, et chez nous ils ont le droit de s'en servir. Je pense en particulier à l'un d'entre eux, qui travaille sur l'analyse de pertinence.
Nous ne sommes pas les seuls à mener des recherches sur ce genre de questions. Mais nous avons l'avantage de disposer de toute la chaîne des traitements, et en vraie grandeur. Ce dernier point est important, car la recherche universitaire dans ce secteur n'a pas, en elle-même, les moyens de travailler à l'échelle. Or on ne passe pas impunément d'un fonds universitaire de 10 000 documents à un serveur qui doit en traiter des milliards.
C'est dans cet esprit qu'est née l'idée d'une collaboration avec l'Ecole normale supérieure, qui a ouvert un poste de professeur associé, sur un statut spécial permettant d'établir des relations avec l'industrie. Notre objectif, d'ici à deux ans, est de constituer une équipe qui bénéfice des cerveaux de l'ENS et des logiciels de type industriel que nous fournissons, autrement dit que dispose des moyens nécessaires pour faire de la bonne recherche dans les domaines qui nous intéressent.
Nous sommes par ailleurs attentifs à entretenir de bonnes relations avec les institutions de recherche et d'enseignement. Nous travaillons beaucoup avec l'université de Marne-la-Vallée, notamment sur le thème des automates. Nous veillons aussi à rester "en aval" des écoles d'ingénieurs, où nous recrutons par exemple des élève de l'Isia (Institut supérieur d'informatique et d'automatique, à Sophia Antipolis, une école d'application de l'Ecole des mines de Paris.
S.H. : Quels sont à votre avis les concepts-clés pour l'avenir ?
F.B. : Ma conviction est que le secteur informatique peut se comparer à celui de l'automobile. L'informatique se vend désormais comme les voitures : avec des toits ouvrants, des peintures métallisées, l'ABS... des gadgets, ou en tout cas du plaisir plus que des fonctionnalités utilitaires. S'il y a des "killer applications" pour nos technologies, elles joueront sur le contrôle, la mise en confiance, la relation, la personnalisation. Bref, le confort au sens large (et non péjoratif), en y incluant la sécurité, la prédictabilité et le "wysiwyg" (what you see is what you get). Ce dernier point se traduit par exemple, dans nos produits, par le fait que les outils données aux utilisateurs emploient les termes mêmes qui se trouvent dans les documents courants de l'entreprise. Ainsi, l'utilisateur conserve ses repères mentaux. Un fragment de phrase suffit pour qu'il "voie de quoi il s'agit". Et cette relation est renforcée par un mise en gras de ces termes dans les documents proposés.
Mais je ne crois pas qu'il y ait des concepts-clés. Je suis un créatif et un artisan. Je pars toujours de la pratique pour aller aux concepts, jamais l'inverse.
Propos recueillis par Pierre Berger
La page personnelle de François Bourdoncle.Le rapport annuel pour l'année 2003 du Forum des droits sur l'internet vient d'être publié. Remis au ministre délégué à l'Industrie, le rapport intègre à la fois l'ensemble des recommandations rendues publiques par le Forum au cours de l'année 2003 (administration électronique, loi sur l'économie numérique, liens hypertextes, données publiques, responsabilité des forums de discussion, vote électronique) mais aussi un avis concernant le projet de décret portant sur les actes authentiques électroniques. Un dossier central est dédié à la musique en ligne. Ce rapport de 400 pages est disponible à la vente, au prix de 23 euros (pour la France métropolitaine), auprès de La documentation française. Une version électronique devrait être prochainement disponible en téléchargement.
Gilles Kahn est nommé Président du conseil d'administration de
l'Inria par décret du président de la République daté
du 26 mai 2004. Plus
d'informations.
Rappelons que nous l'avons interviewé dans Asti-Hebdo no
25.
A noter dans le prochain séminaire du Linc (organisation Catherine Pelachaud, Université Paris 8) , ce mercredi 4 juin, de 14h30 à 17h, à l'IUT de Montreuil, 140 rue de la Nouvelle France, 93100 Montreuil, Bâtiment A, salle du conseil. Matthew Stone (Rutgers University) : Conversational animation as a research tool for dialogue. Voici la présentation de son intervention. Non anglophones s'abstenir.
"In face-to-face conversation, coverbal actions seem to play a pervasive role in regulating and advancing communication. Speakers' facial expressions and head movements can even add something new to the interpretation of their utterances. Explaining how this works is a challenge - indeed, it's hard enough to be precise about what meaningful actions participants make in conversation. In this talk, I explore animation as one research methodology that may help.
"I will describe a freely-available cross-platform real-time facial animation system, Ruth (Rutgers university talking head), that animates conversational facial signals in synchrony with speech and lip movements. Because Ruth takes annotated text as input, it enables researchers to experiment with meaningful ways of selecting intonation, facial expressions and head movements to complement simultaneous speech.
"For example, we can create templates for embodied conversational behavior by combining a specific pattern of marked-up text, specifying prosody and conversational signals as well as words, with similarly-annotated gaps to fill in. Ruth fleshes out these instructions flexibly into animation, using the inferred linguistic structure of utterances. Such techniques let designers realize specific combinations of behaviors in conversational utterances, and so to explore their effects for utterance meaning and conversational interaction. Such techniques are also crucial for allowing us to model and capture the expressive choices of skilled human performers."
Armand Berger signale ce site intéressant sur la lecture de textes en langue naturelle.
L'Alliance mondiale des réseaux scolaires est un réseau de réseaux nationaux et multinationaux consacré à l'enseignement secondaire et qui couvre les cinq continents. Elle a été lancée par European schoolnet et le Cyberschoolbus des Nations unies le 12 décembre 2003 lors du sommet mondial pour la société de l'information, à Genève. Les réseaux membres de l'Alliance collaboreront sur des questions relatives à l'enseignement dans le monde ainsi que sur des projets TIC internationaux liés aux Objectifs de développement des Nations Unies pour le Millénaire. (Pour l'instant, le site est en anglais uniquement. La version française est en préparation).
Thème : Les technologies de l'information et de la communication dans la formation des enseignants aux Etats-Unis et en France : état des lieux et perspectives. Maison des sciences de l'homme (MSH) 54, bd Raspail 75006 Paris, de 9h30 - 17h, salle 214.
Ce séminaire ouvert, organisé à l'initiative du programme Tématic en relation avec l'INRP, a pour objectif général d'organiser un débat sur la question des nouvelles modalités de formation des enseignants mettant en ouvre des Tice en France et aux Etats Unis. Il s'agit principalement, à partir de l'exposé d'un certain nombre de faits récents relatifs à la formation des enseignants aux Etats-Unis et en France, de débattre de problèmes de recherche qui lui sont actuellement liés. Les participants attendus sont en priorité des chercheurs et des responsables d'enseignement. Le programme prévisionnel.
L'archive ouverte (open archive) Archive-EduTice (2003) se présente comme une bibliothèque numérique recevant et diffusant les productions intellectuelles de la recherche internationale dans le domaine des sciences et technologies de l'information et de la communication (Stic) pour l'éducation, la formation et pour la recherche. Elle est l'une des composantes du programme TémaTice.
Ce portail s'inscrit dans l'esprit de "l'Open archives initiative" (OAI, 2003) dont les acteurs allient une tradition ancienne et une technologie récente pour le progrès du bien public. La tradition ancienne est la volonté des scientifiques, toutes disciplines confondues, de publier sans rétribution les fruits de leur recherche. La technologie récente est celle d'Internet et des standards accompagnant le développement de la Toile. Le bien public en question est la diffusion électronique à l'échelle mondiale de la littérature scientifique et technique avec accès complètement gratuit et sans restriction à tous les scientifiques, savants, enseignants, étudiants et autres esprits curieux (Appel de Budapest, 2002 ; Harnard, 2001 ; Guédon, 2001). Pour en savoir plus.
Rubrique animée par Jacques Baudé
Laurent Lachal, analyste du cabinet Ovum, met en garde les administrations contre
les écueils du choix de l'open source basé sur de mauvais critères.
(16/04/2004)"les réflexions menées aujourd'hui sur l'open source
permettront aux administrations d'être mieux préparées à
l'avenir lors de la mise en place
de solutions et d'envisager à cette occasion l'open source comme une alternative
opportune". A lire.
(voir dossier open source) J.B.
Consultez le site des associations fondatrices de l'Asti, où vous trouverez les manifestations qu'elles organisent.
Le prochain colloque de l'Afscet se tiendra au moulin d'Andé les 5-6 juin 2004. L''appel à communication est désormais clos, mais les inscriptions sont encore possibles. Mais il faut donner une réponse rapide, soit au président E. Nunez, soit à Gérard Donnadieu, soit à François Dubois.
Le salon-congrès Forum stockage se tiendra du 20 au 22 septembre 2004, Paris Porte de Versailles Hall 6. Thèmatiques actuelles : ILM (Gestion du cycle de vie de l’information), réduction des coûts et consolidation, virtualisation, archivage sécurisé et conformité réglementaire, plan de continuité de service et haute disponibilité.
De l'humour réservé aux passionnés de JEE : "Tales from the server side".
L'équipe de Stic-Hebdo : Directeur de la publication : Jean-Paul Haton. Rédacteur en chef : Pierre Berger. Secrétaire général de la rédaction : François Louis Nicolet, Chefs de rubrique : Mireille Boris, Claire Rémy et Armand Berger. Stic-Hebdo est hébergé par le LRI et diffusé par l'Inist.