APPEL à SOUMISSION + défi !
TextMine’25 - Atelier sur la Fouille de Textes #IA #NLP #textmining
Atelier de la conférence EGC'25
Journée du 28 janvier 2025 à Strasbourg
Résumé
Le groupe de travail TextMine organise cet atelier dans le but de réunir des chercheurs sur la thématique large de la fouille de textes. Cet atelier vise à offrir une occasion de rencontres pour les universitaires et les industriels, appartenant aux différentes communautés de l'intelligence artificielle, l'apprentissage automatique, le traitement automatique des langues, afin de discuter des méthodes de fouille de texte au sens large et de leurs applications.
Défi TextMine 2025
Cette année, le groupe de travail TextMine lance un défi qui porte sur l' "Extraction de relations pour l’analyse des rapports de renseignement" avec un prix de 500 € à la clé remis lors de la conférence EGC:
https://www.kaggle.com/competitions/defi-textmine-2025
Descriptif
C'est une évidence que de dire que nous sommes entrés dans une ère où la donnée textuelle sous toute ses formes submerge chacun de nous que ce soit dans son environnement personnel ou professionnel : l'augmentation croissante de documents nécessaires aux entreprises ou aux administrations, la profusion de données textuelles disponibles via Internet, le développement des données en libre accès (Open Data), les bibliothèques et archives en lignes, les media sociaux ne sont que quelques exemples illustrant l'évolution de la notion de texte, sa diversité et sa prolifération
Face à cela, les méthodes automatiques de fouille de données (data mining), et plus spécifiquement celles de fouille de textes (text mining) sont devenues incontournables. Récemment, les méthodes de deep learning ont créées de nouvelles possibilités de recherche pour traiter des données massives et de grandes dimensions. Cependant, de nombreuses questions restent en suspens, par exemple en ce qui concerne la gestion de gros corpus textuels multi-thématiques. Pouvoir disposer d’outils d’analyse textuelle efficaces, capables de s’adapter à de gros volumes de données, souvent de nature hétérogène, rarement structurés, dans des langues variées, des domaines très spécialisés ou au contraire de l'ordre du langage naturel reste un challenge.
La fouille de textes couvre de multiples domaines comme le traitement automatique des langues, l'intelligence artificielle, la linguistique, les statistiques, l'informatique...et les applications sont très diversifiées, que ce soit la recherche d'information, le filtrage de spam, le marketing, la veille scientifique ou économique, la lutte antiterroriste …
En France, des conférences telles que TALN, CORIA, JADT sont centrées sur l'analyse et le traitement des textes, mais avec des approches plus ciblées soit TAL, soit RI, soit statistiques. Cet atelier se veut plus fédérateur autour d'approches et d'applications aussi diverses que possibles.
Objectifs
L'objectif de cet atelier est de favoriser des présentations et des discussions. Peuvent être soumis :
• des résumés étendus (4 pages, hors bibliographie)
• des articles longs (maximum 12 pages, hors bibliographie)
• des propositions de démonstration logicielles (4 pages, hors bibliographie)
• dans le cadre du défi, les participants peuvent optionnellement soumettre des articles courts (2 pages, hors bibliographie) à remettre au plus tard le 20 novembre. Ces articles seront relus par le comité, les meilleurs participants auront la possibilité d’étendre leur article court à 12 pages pour publication dans les actes de TextMine.
Les contributions seront publiées sous forme d’actes en ligne. La soumission de prises de position bien articulées, d’expériences industrielles et de travaux en cours sont les bienvenus et privilégiés. Des contributions portant sur l'intérêt pratique des travaux, qu'elles viennent de l'industrie ou du monde académique, ou présentant des collaborations entre les deux seraient appréciées. Le but est le partage d’expérience et de savoir sur les problématiques liées à la fouille de textes.
Pour les démonstrations une présentation orale aménagée devra être préparée (temps de présentation plus court, et temps pour effectuer la démo sur projecteur en fin de présentation). Un temps sera prévu dans le programme pour les démos.
Principaux thèmes (liste non limitative)
Méthodes de traitement automatique de la langue (TAL)
Classifications statiques de textes
Classifications dynamiques de textes
Méthodes d'apprentissage
Approches par graphes
Recherche d'information
Indexation
Détection d'entités nommées
Résumé automatique
Détection de nouveautés
Analyse de sentiments
...
Liste des domaines d'application (liste non limitative)
Fouille de documents scientifiques
Données médicales
Brevets
Analyse d'opinions
Media sociaux (Twitter…)
Veille scientifiques
Intelligence économique
Appui au pilotage scientifique
Bibliométrie
Systèmes (à base) de dialogues
...
Modalités et déroulement de l'atelier
Introduction par les organisateurs
Exposé invité
Exposés selon articles reçus et sélectionnés
Table ronde
Dates importantes (dates prévisionnelles)
Date limite de soumission des articles courts dans le cadre du défi (voir plus haut) : 20/11/2024
Date limite de soumission des articles (hors défi) : 09/12/2024
Notification aux auteurs : 10/01/2024
Version finale : 20/01/2025
Atelier : 28/01/2025
Le format de soumission devra impérativement suivre le modèle LaTeX RNTI mis à jour en 2024. Merci de télécharger la dernière version du modèle RNTI.
Les articles peuvent ne pas être anonymisés.
Les articles doivent être rédigés en français ou en anglais.
Les soumissions sont à faire sur : https://easychair.org/conferences/?conf=textmine25