Groupe de Travail de l'association EGC - https://www.egc.asso.fr/

Image

17_janv_2023.jpg

Présentation de TextMine

C'est une évidence que de dire que nous sommes entrés dans une ère ou la donnée textuelle sous toute ses formes submerge chacun de nous que ce soit dans son environnement personnel ou professionnel : l'augmentation croissante de documents nécessaires aux entreprises ou aux administrations, la profusion de données textuelles disponibles via Internet, le développement des données en libre accès (Open Data), les bibliothèques et archives en lignes, les media sociaux ne sont que quelques exemples illustrant l'évolution de la notion de texte, sa diversité et sa prolifération.

Face à cela les méthodes automatiques de fouille de données (data mining), et plus spécifiquement celles de fouille de textes (text mining) sont devenues incontournables. Récemment, les méthodes de deep learning ont créées de nouvelles possibilités de recherche pour traiter des données massives et de grandes dimensions. Cependant, de nombreuses questions restent en suspens, par exemple en ce qui concerne la gestion de gros corpus textuels multi-thématiques. Pouvoir disposer d’outils d’analyse textuelle efficaces, capables de s’adapter à de gros volumes de données, souvent de nature hétérogène, rarement structurés, dans des langues variées, des domaines très spécialisés ou au contraire de l'ordre du langage naturel reste un challenge.

La fouille de textes couvre de multiples domaines comme le traitement automatique des langues, l'intelligence artificielle, la linguistique, les statistiques, l'informatique...et les applications sont très diversifiées, que ce soit la recherche d'information, le filtrage de spam, le marketing, la veille scientifique ou économique, la lutte antiterroriste...

En France, des conférences comme TALN, CORIA, JADT par exemple sont centrées sur l'analyse et le traitement des textes, mais avec des approches plus ciblées soit TAL, soit RI, soit statistiques. TextMine se veut plus fédérateur autour d'approches et d'applications aussi diverses que possibles.

Le but de ce groupe de travail est de réunir des chercheurs sur la thématique large de la fouille de textes. Ce groupe vise à offrir une occasion de rencontres pour les universitaires et les industriels, appartenant aux différentes communautés de l'intelligence artificielle, l'apprentissage automatique, le traitement automatique des langues, pour discuter des méthodes de fouille de texte au sens large et de leurs applications.

Activités du groupe de travail TextMine

  • Fédérer la collectivité scientifique francophone autour de la fouille de textes au sens large (TAL, Machine Learning, Web sémantique, Traduction automatique...)
  • 1 journée d’échanges autour d’invités (monde académique et industriel) avec des conférenciers invités et des présentations d’étudiants,
  • 1 journée hackathon,
  • 1 journée démo outils / jeux de données,
  • Organisation de challenges,
  • Construire et animer l’atelier TextMine en conjonction avec la conférence EGC.
  • Être une pépinière pour la préparation de soumissions à appels à projets,
  • Communiquer autour de la fouille de textes et de nos activités,
  • Être présent tout le long de la conférence EGC sous forme de “stand”
  • Communication mail aux anciens auteurs de l’atelier, via des listes de diffusions, des réseaux sociaux...

Ce groupe de travail est ouvert à toute personne s'intéressant à la fouille de textes sous toutes ses
formes (TAL, ML, Web Sémantique...), venant du monde académique ou industriel, de France ou
d’autres pays.

Avec le soutien de :

Association EGC           CNRS Inist           Emvista

Personnes connectées : 2 Vie privée
Chargement...