Description du projet

Cadre d'exploitation et objectifs généraux

Les communautés virtuelles sur Internet ont pris une importance fondamentale dans nos sociétés. Elles vont des communautés de développement (open source) aux communautés culturelles (Wikipédia) en passant par des communautés de toute nature via les forums et les blogs qui se citent les uns les autres. Ces communautés sont toutes réunies par une ou plusieurs thématiques et, en fonction de ces thématiques, elles créent des informations, diffusent celles qui sont liées au sujet et les commentent. La diffusion de l’information thématique est fondamentale pour ces communautés quelle que soit leur nature ou leur durée (certaines sont éphémères comme celles qui se créent autour des présidentielles en ce moment). La difficulté pour toutes ces communautés est que l’information peut être pléthorique et qu’il est difficile à la fois de tout surveiller et de tout visualiser. Cela est d’autant plus vrai que désormais les podcasts audio et vidéo sont de plus en plus nombreux et qu’il est beaucoup plus difficile de parcourir en diagonale un flux audio ou vidéo qu’un texte.

Le projet RPM2 s’attache à la problématique du résumé dans le but de fournir une information condensée et la plus efficace possible. Les différents objectifs visés sont les suivants :

  • les résumés seront effectués sur tous les médias en jeu : texte, audio, image, vidéo
  • les résumés seront multi-documents, c'est-à-dire, par exemple, que la production d’un flux sur une journée (comportant plusieurs documents) sera condensée en un seul résumé ;
  • les résumés prendront en compte différentes opinions afin de faire apparaître les oppositions ;

Les résumés en question pourront soit ne contenir que l’essentiel (résumé par condensation), soit le maximum d’informations différentes (résumé par élimination des doublons mais conservation de toute information originale).
Les travaux devront être validés dans un contexte réel autour des communautés virtuelles.

Enjeux économiques

Les enjeux économiques du projet sont très importants :

  • les résumés automatiques sont la solution la plus logique à l’information pléthorique ;
  • le résumé plurimédia est une nécessité du fait de l’accroissement exponentiel des podcasts ;
  • des résumés prenant en compte des critères d’opinion pour donner la parole aux différents courants sont garants d’une diffusion éthique de l’information.

Les perspectives sont donc importantes, que ce soit dans les aspects industriels avec des potentialités commerciales importantes ou scientifiques avec les ouvertures apportées par de nouvelles méthodes de traitement et de résumé.

Verrous technologiques

Les verrous à lever sont importants et concernent chaque point de développement de RPM2 :

  • Le résumé est une technique difficile, même sur le texte. L’application à l’audio, la vidéo dans un contexte plurimédia complexifie grandement le projet. C’est cependant tout son intérêt car c’est bien à cela que nous sommes actuellement confrontés dans la société actuelle.
  • Fondamentalement, il s'agit de fournir des représentations synthétiques et cohérentes d'un ensemble déstructuré de documents hétérogènes ; une plus value scientifique du projet viendra des méthodes qui auront été développées pour évaluer la qualité expressive de chaque media et pour les combiner efficacement.
  • Évaluation : L’évaluation dans un contexte de résumé est toujours difficile. Dans un contexte multimédia, c’est encore plus difficile. Les métriques et méthodes parfois utilisées ne sont pas encore standardisées. Dans le cadre de résumé plurimédia, nous n’avons pas connaissance de travaux présentant des métriques d’évaluation. La problématique de l’évaluation sera donc abordée avec beaucoup de circonspections et de rigueur dans le cadre de RPM2. Des évaluations subjectives seront sans doute possibles grâce aux communautés virtuelles qui seront mises en place mais il conviendra de réfléchir à d’autres méthodes.
  • La classification par opinion est une démarche nouvelle pour laquelle nous devrons mettre en œuvre un certain nombre de techniques qui, même si elles sont connues, demanderont une Recherche conséquente pour leur combinaison. L’évaluation est là aussi problématique.
  • La prise en compte de paramètres externes dans la constitution des résumés apportera des difficultés supplémentaires. Nous visons le développement de méthodes permettant :
    • un résumé de tous les articles concernant un événement
    • un résumé de tous les événements d'une certaine période (thématique limitée)
    • un résumé dans lequel on veut voir apparaître les différentes opinions

Bibliographie

R. Benmokhtar, E. Dumont, B. Mérialdo, B. Huet - Eurecom in TrecVid 2006: high level features extractions and rushes study, TrecVid 2006, 10th International Workshop on Video Retrieval Evaluation, November 2006, Gaithersburg, USA.

R. Benmokhtar, B. Huet - Multi-level fusion for semantic indexing video content, AMR'07, International Workshop on Adaptive Multimedia Retrieval, 5-6 June 2007, Paris, France.

F. Boudin, J. M. Torres Moreno, M. El-Bèze - "Mixing Statistical and Symbolic Approaches for Chemical Names Recognition". In Proceedings of the conference CICLing 2008, Haifa (Israel), 2008 17-23 February. The Springer LNCS Proceedings 4919 - pages 334-349.

F. Boudin, B. Favre, F. Béchet, M. El-Bèze, L. Gillard, J.-M. Torres-Moreno - "The LIA-Thales summarization system at DUC-2007". In Proceedings of the Document Understanding Conference 2007, Rochester (USA), 2007 april 26-27.

F. Boudin, J. M. Torres Moreno - "A Cosine Maximization Minimization approach for User Oriented Multi-Document Update Summarization". In Proceedings of the conference RANLP 2007,    Borovets (Bulgaria), 2007 september 27-29.

F. Boudin, J. M. Torres Moreno - "NEO-CORTEX: a performant user-oriented multi document summarization system". In Proceedings of the conference CICLing 2007, Mexico DF (Mexico), 2007 18-24 February. The Springer LNCS Proceedings 4394, pages 551-562.

I. da Cunha, S. Fernandez, P. Velazquez Morales, J. Vivaldi, E. SanJuan, J. M. Torres Moreno - "A new hybrid summarizer based on Vector Space model, Statistical Physics and Linguistics". In proceedings of the conference MICAI 2007, Aguascalientes (México), 2007 4-10 november.

E. Dumont, B. Mérialdo - Split-screen dynamically accelerated video summaries, MM 2007, 15th International ACM Conference on Multimedia, 24-29 September 2007, Augsburg, Germany.

E. Dumont, B. Mérialdo - Video search using a visual dictionary, CBMI 2007, 5th International Workshop on Content-Based Multimedia Indexing, 25-27 June 2007, Bordeaux, France.

M. El-Bèze, J. M. Torres Moreno, F. Béchet - "Un duel probabiliste pour départager deux Présidents", RNTI à paraître, 2007.

M. El-Bèze, J. M. Torres-Moreno, F. Béchet - "Peut-on rendre automatiquement à César ce qui lui appartient ? Application au jeu du Chirand-Mitterrac", DEFT05 TAL/RECITAL 2005, vol 2 pp 125-134, 2005.

B. Favre, F. Béchet, P. Bellot, F. Boudin, M. El-Bèze, L. Gillard, G. Lapalme, J.-M. Torres-Moreno - "The LIA-Thales summarization system at DUC-2006". In Proceedings of the Document Understanding Conference 2006, New York (USA), 2006 8-9 june.

S. Fernandez, E. SanJuan, J. M. Torres-Moreno - "Energie textuelle de mémoires associatives". Conference TALN 2007, Toulouse (France), 2007 5-8 june. Pages 25-34.

S. Fernandez, E. SanJuan et J. M. Torres-Moreno - "Textual Energy of Associative Memories: performants applications of ENERTEX algorithm in text summarization and topic segmentation". In proceedings of the conference MICAI 2007, Aguascalientes (México), 2007 4-10 november.

S. Fernández, P. Velázquez, S. Mandin, J. M. Torres-Moreno - "Les systèmes de résumé automatique sont-ils vraiment des mauvais élèves ?". Conference JADT 2008. Lyon (France), 2008 12-14 march.

J. Jiten, B. Mérialdo - Video modeling using 3-D Hidden Markov Model, VISAPP 2007, 2nd International Conference on Computer Vision Theory and Applications, 8-11 March 2007, Barcelona, Spain.

J. Jiten, B. Huet, B. Mérialdo - Semantic feature extraction with multidimensional hidden Markov model, SPIE Conference on Multimedia Content Analysis, Management and Retrieval 2006, 17-19 January 2006, San Jose, USA - SPIE Proceedings Volume 6073, pp 211-221.

B. Mérialdo, B. Huet - Automatic video summarization, Chapter in "Interactive Video, Algorithms and Technologies" by Hammoud, Riad (Ed.), 2006, XVI, 250p., ISBN: 3-540-33214-6, pp 27-41.

M. Rouvier, G. Linares, B. Lecouteux - On-the-fly term spotting by phonetic filtering and request-driven decoding, 2008 IEEE Workshop on Spoken Language Technology, December 2008, Goa (India).

J. M. Torres-Moreno, M. El-Bèze, F. Béchet, N. Camelin - "Comment faire pour que l'opinion forgée à la sortie des urnes soit la bonne ? Application au défi DEFT 2007", DEFT07, pp 119-133, Plate-forme AFIA 2007, Grenoble, 2007.

J. M. Torres-Moreno, P. Velázquez-Morales, J. G. Meunier - "Condensés de textes par des méthodes numériques", JADT 2002, ISBN 2-7261-1198XC215 Vol. (2):723-734, A. Morin & P. Sébillot éditeurs, IRISA/INRIA., 2002.

J. M. Torres-Moreno, P. Velázquez-Morales, J. G. Meunier - "Cortex : un algorithme pour la condensation automatique des textes". La cognition entre individu et société ARCo 2001. Coord. Hélène Paugam-Moissy, Vincent Nyckees, Josiane Caron-Pargue Lyon, Hermès Science ISBN 2-746203588 France. pp 365 + vol 2. ISC-Lyon.

R. Trichet, B. Mérialdo - Fast video object selection for interactive television, ICME 2006, IEEE International Conference on Multimedia & Expo, 9-16 July 2006, Toronto, Canada.