LIPN - Laboratoire d'Informatique de Paris Nord

owards Explainability for Interaction Network Analysis

Maria Malek

2025-05-09 13:00:00
Salle B107, bâtiment B, Université de Villetaneuse

Explainability is increasingly recognized as a critical component of machine learning, enabling a wide range of stakeholders—including data scientists, domain experts, managers, and end users—to understand, trust, and effectively use model outputs. This talk explores the development of explainability approaches tailored to interaction network analysis, where meaningful insights often emerge from both topological structures and contextual information. We propose approaches that combine these complementary sources to generate deeper, more actionable explanations—particularly valuable in decision-support contexts. Two use cases illustrate our approach: (1) explainable sentiment analysis, integrating sentiment data with complex network structures, and (2) an explainable graph-based recommender system using a multimodal Graph Neural Network (GNN) architecture. We conclude by discussing key challenges and open questions related to the deployment of adaptive explainable systems in complex, real-world environments. Particular emphasis is placed on the potential of hybrid (neuro-symbolic) learning and the incorporation of domain ontologies to enhance interpretability in interaction network tasks.

Un étude des méthodes de pré-entrainement pour l'apprentissage incrémental par classe

#SeminaireA3

Eva Feillet.

2025-05-09 12:00:00
Salle B107, bâtiment B, Université de Villetaneuse

L'apprentissage continu vise à intégrer, de manière adaptative, de nouvelles données à un modèle. Dans cette présentation, nous nous intéresserons au cas de l'apprentissage continu d'une classification d'images dans le cadre de l'apprentissage incrémental par classe "sans exemplaire" (exemplar-free class-incremental learning, EFCIL). Dans ce cadre, on considère un flux de données composé de lots correspondant à des ensembles disjoints de classes. L'objectif est d'entrainer, de manière itérative, un modèle à reconnaître un nombre croissant de classes, sans accès aux données passées. En effet, dans une perspective de confidentialité et/ou de frugalité, on part du principe que les données d'entrainement ne sont pas stockées de manière cumulative, d'où le terme d'apprentissage incrémental ? sans-exemplaire ?. Nous aborderons l'EFCIL sous l'angle du pré-entrainement des modèles, à travers deux études présentées à la conférence WACV. La première étude (Petit et al. 2024) propose de modéliser l'influence de la méthode de pré-entraînement, de l'algorithme EFCIL, du jeu de données et de la précision initiale sur la performance de divers modèles profonds dans le cadre de l'EFCIL. Nous verrons que le choix des stratégies de pré-entraînement a une plus grande influence sur la précision du modèle que le choix de l'algorithme EFCIL. En revanche, nos résultats montrent que l'algorithme EFCIL a une plus grande influence sur l'oubli des modèles (l'oubli étant calculé comme une perte de précision sur les classes apprises dans le passé). La deuxième étude s'intéresse plus particulièrement aux algorithmes d'EFCIL reposant sur des prototypes de classe (voir Feillet et al., 2025). Ces algorithmes, s'appuyant sur un encodeur fixe, tirent parti de modèles pré-entraînés pour entraîner de manière incrémentale un classifieur, tout en présentant un coût de calcul inférieur à celui d'un réglage fin (fine-tuning). Nous comparerons les stratégies de pré-entraînement en fonction de l'algorithme, du type d'image (réelles ou synthétiques) et de la quantité de données utilisées pour pré-entraîner l'encodeur. Nous discuterons de manière nuancée de l'utilité des différentes méthodes de pré-entrainement dans le cadre de l'EFCIL, suivant la quantité et le domaine des données d'intérêt, afin de fournir des recommandations pratiques permettant de faciliter la mise en place de l'apprentissage incrémental.

Fouille de motifs fréquents dans les graphes : l'essor de l’apprentissage profond et des architectures neuronales

#SeminaireA3

Assaad ZEGHINA

2025-03-27 12:00:00
Salle B107, bâtiment B, Université de Villetaneuse

L’utilisation de méthodes d’apprentissage automatique et apprentissage profond pour résoudre des problèmes jusque-là abordés par des techniques classiques suscite un intérêt grandissant, en particulier lorsqu’il s’agit de données massives et hétérogènes. Parmi ces problématiques, l’extraction de motifs fréquents dans les graphes spatio-temporels soulève de nombreux défis : la multiplicité des types d’arcs, la prise en compte simultanée des facteurs spatiaux et temporels, ainsi que la complexité combinatoire de l’énumération de sous-graphes récurrents. Les méthodes traditionnelles, souvent basées sur des approches d’exploration exhaustive, peinent à passer à l’échelle et à préserver des performances satisfaisantes quand la taille du graphe augmente ou que sa structure devient plus riche. Dans ce contexte, deux approches basées sur l’apprentissage automatique et l’apprentissage profond sont présentées pour répondre aux enjeux d’efficacité et d’évolutivité liés à l’extraction de motifs dans de grands graphes. La première, Multi-SPMiner, étend les capacités de l’extraction de motifs aux multigraphes et intègre un Multigraph Convolution Network. Cette architecture de réseau de neurones permet de projeter simultanément les nœuds et leurs voisinages dans un espace latent, tout en maintenant la structure hiérarchique des sous-graphes. Divers raffinements—dont l’incorporation de mécanismes d’attention—améliorent la capture des interactions complexes et la robustesse face aux données manquantes. La seconde méthode, Deep-QMiner, recourt à l’apprentissage par renforcement profond multi-agents pour reformuler l’exploration des graphes en une suite de décisions séquentielles. Cette approche rend possible une navigation plus dynamique et sélective parmi les sous-graphes potentiels, permettant de limiter l’explosion combinatoire typique des algorithmes d’exploration exhaustive. Les performances de ces deux méthodes ont été évaluées à la fois sur des jeux de données synthétiques et sur des données réelles, notamment issues des données environnementales. Les expériences montrent que Multi-SPMiner et Deep-QMiner peuvent traiter des graphes d’une taille allant jusqu’à 2000 nœuds et identifier des motifs dont la taille varie de 4 à 10 nœuds, tout en conservant une efficacité de calcul et une précision élevée. Les résultats soulignent également une capacité de généralisation marquée : un entraînement initial sur données synthétiques ne dégrade pas significativement les performances lors d’une application ultérieure à des jeux de données réels. En définitive, ces travaux illustrent le potentiel des approches neuronales et de l’apprentissage par renforcement pour faire face aux défis liés à la complexité et à la diversité des graphes, ouvrant la voie à de nombreuses applications dans des domaines aussi variés que les systèmes intelligents de transport, la biologie des réseaux ou la compréhension des dynamiques territoriales.

Détection de communautés disjointes : une nouvelle méthode basée sur ?-similarité structurell

#SeminaireA3

Motaz ben hassine

2025-03-20 12:00:00
Salle B107, bâtiment B, Université de Villetaneuse

L'analyse des réseaux sociaux est un domaine largement étudié en intelligence artificielle et très sollicité dans de nombreuses applications du monde réel. Par exemple, la détection de communautés permet d’identifier un public cible en marketing digital, d’améliorer les systèmes de recommandation, etc. Les approches existantes pour la détection de communautés reposent souvent sur des méthodes agglomératives exploitant des mesures de similarité basées sur les voisins communs. Dans ce contexte, une approche a été proposée, qui ne se limite pas au voisinage en commun, mais prend également en compte la sémantique des interactions entre les voisins en commun.

Intelligent Facilitation of Deliberation in Online Debates

#SeminaireA3

Caren Al Anaissy

2025-03-06 12:00:00
Salle B107, bâtiment B, Université de Villetaneuse

Deliberative processes are crucial for forming opinions, decisions, and policies within society. Unlike persuasive debates, deliberation seeks to enhance the understanding of conflicting perspectives among stakeholders. Online debate platforms provide a space where users can create debates, argue for or against specific topics by posting pro/con arguments, and vote on others’ arguments. Online collective discussions play an important role in enhancing the participants critical thinking, understanding the public opinion, they can help participants rationalise their thoughts in controversial topics and reduce the spread of fake news. While these discussions generate valuable insights, they also present challenges. Reading through all arguments requires a considerable amount of time, some discussions might shift from a topic to another and some arguments might even be maliciously used to spread fake news. Understanding the outcome of a debate would be beneficial for different stakeholders. Artificial Intelligence (AI) offers promising solutions to moderate and curate such debates, provided it operates in an intelligible and accountable manner. In this talk, I will present my ongoing project on facilitating deliberation in online debates. The project focuses on developing an AI-based system that interacts directly with participants to help them navigate and engage effectively in the discussion. This system will also provide explanations for its predictions about the debate’s outcome, based on the user’s moves. By offering insights into the possible outcomes of their choices and interactions, the system not only enhances participants' understanding of the debate but also empowers them to contribute more efficiently.

Quantification d'Incertitude en Apprentissage Automatique

#SeminaireA3

Arthur Hoarau

2025-01-23 12:00:00
Salle B107, bâtiment B, Université de Villetaneuse

La quantification d'incertitude est un vaste domaine dépassant celui de l'intelligence artificielle. À la frontière entre mathématiques et informatique, l'objectif est de modéliser et quantifier l'incertitude d'une source. D'abord, pour ce qui est des labels (étiquettes attribuées aux observations en classifciation), ils sont souvent obtenus auprès d'humains et il est parfois plus intéressant de modéliser l'incertitude dans les labels en entrée plutôt que de récolter des labels bruités, qui vont dégrader les performances des modèles. La difficulté réside donc dans le fait de modéliser au mieux ces labels. Ensuite, l'incertitude du modèle lui-même est cruciale pour toutes les taches suivantes (prédiction, prise de décision, apprentissage incrémental/actif...). L'hésitation du modèle peut s'avérer informative et de nombreuses techniques peuvent être appliquées pour modéliser cette incertitude, sous différentes formes. Comprendre et expliquer la prédiction d'un modèle fait partie des grands défis de l'intelligence artificielle.

Synergies between machine learning and reasoning

#SeminaireA3

Smail Baaj

2025-01-16 12:00:00
Salle B107, bâtiment B, Université de Villetaneuse

Aujourd'hui, l'accent est mis sur le développement de points de rencontre entre les deux principaux domaines de recherche de l'Intelligence Artificielle (IA) : l'apprentissage et le raisonnement. Outre la recherche de synergies et de complémentarités, un approfondissement de la recherche en représentation des connaissances et raisonnement et en matière d'apprentissage automatique est souhaité, ainsi que des moyens par lesquels les paradigmes de ces domaines pourraient interagir. Des discussions récentes ont mis en avant le besoin de développer un cadre qualitatif unifié qui permet à la fois un apprentissage de type “neuronal” et un raisonnement de type logique. Dans cette optique, nous distinguons deux problèmes d'apprentissage : l’apprentissage des paramètres des règles possibilistes qui permet de développer des approches neuro-symboliques basées sur la théorie des possibilités et l’apprentissage de capacités pour les intégrales de Sugeno couramment utilisées dans la théorie de la prise de décision multicritère. Nous montrons que ces deux problèmes d'apprentissage peuvent être formulés en termes de systèmes d'équations relationnelles floues. Plus précisément, on s'intéresse au développement d'outils pour traiter l'incompatibilité des systèmes d'équations relationnelles floues qui sont sous-jacents aux deux problèmes d'apprentissage avec des données réelles (qui peuvent être sujettes aux bruits et à des valeurs aberrantes). L'objectif est d'obtenir des solutions approchées des systèmes incompatibles s'appuyant sur des fondements théoriques solides.

Intelligent Facilitation of Deliberation in Online Debates

#SeminaireA3

Caren Al Anaissy

2024-12-05 12:15:00
Salle B107, bâtiment B, Université de Villetaneuse

Deliberative processes are crucial for forming opinions, decisions, and policies within society. Unlike persuasive debates, deliberation seeks to enhance the understanding of conflicting perspectives among stakeholders. Online debate platforms provide a space where users can create debates, argue for or against specific topics by posting pro/con arguments, and vote on others’ arguments. Online collective discussions play an important role in enhancing the participants critical thinking, understanding the public opinion, they can help participants rationalise their thoughts in controversial topics and reduce the spread of fake news. While these discussions generate valuable insights, they also present challenges. Reading through all arguments requires a considerable amount of time, some discussions might shift from a topic to another and some arguments might even be maliciously used to spread fake news. Understanding the outcome of a debate would be beneficial for different stakeholders. Artificial Intelligence (AI) offers promising solutions to moderate and curate such debates, provided it operates in an intelligible and accountable manner. In this talk, I will present my ongoing project on facilitating deliberation in online debates. The project focuses on developing an AI-based system that interacts directly with participants to help them navigate and engage effectively in the discussion. This system will also provide explanations for its predictions about the debate’s outcome, based on the user’s moves. By offering insights into the possible outcomes of their choices and interactions, the system not only enhances participants' understanding of the debate but also empowers them to contribute more efficiently.

L'AI Act quel impact sur l'enseignement et la recherche ?

#SeminaireA3

Marc Champesme

2024-11-21 12:00:00
Salle B107, bâtiment B, Université de Villetaneuse

Depuis une dizaine d'années, face à la place de plus en plus grande prise dans la société par les services numériques, dont l'intelligence artificielle, la demande de régulation se fait de plus en plus forte dans le monde. Discriminations, atteintes à la vie privée, effets sur l'emploi et les conditions de travail, surveillance généralisée, dégradation de l'environnement, propagation de fake news et de discours de haine ... les alertes sont nombreuses. Le règlement européen sur l'IA (AI Act) est une des premières initiatives de régulation gouvernementale au niveau international. Le but de cette présentation est d'en décrire les principales caractéristiques en mettant un focus sur ces éventuelles incidences sur nos pratiques professionnelles d'enseignants et/ou chercheurs. Dans ce cadre, seront également abordées, brièvement, les préoccupations et revendications des organisations syndicales de l'enseignement et de la recherche au niveau mondial par le biais des positions prises par l'Internationale de l'Éducation (http://www.ei-ie.org).

Explaining AI Decisions: Approximate Formal Explanations for Classifiers Using Greedy Algorithms

#SeminaireA3

Louenas BOUNIA

2024-10-24 12:15:00
Salle B107, bâtiment B, Université de Villetaneuse

Ce séminaire est consacré à l'Intelligence Artificielle Explicable (XAI), avec un focus particulier sur les explications formelles des classifieurs. Dans le contexte croissant de l'utilisation des systèmes d'IA dans des domaines critiques, il est devenu essentiel de rendre ces modèles explicables pour assurer la transparence, la confiance et l'interprétabilité des décisions qu'ils produisent. Dans ce séminaire, nous aborderons plus spécifiquement le problème de l'approximation des explications formelles pour les classifieurs. Calculer une explication abductive de taille minimale peut s'avérer une tâche très chronophage pour plusieurs raisons. D'une part, l'explosion combinatoire du nombre d'explications abductives rend la recherche de l'explication de taille minimale extrêmement coûteuse en temps. D'autre part, trouver une explication de taille minimale est souvent au moins problème NP-difficile, même pour des classifieurs restreints comme les arbres de décision (DP-complet pour les foréts aléatoires). Cela signifie que les approches exactes peuvent être très lentes, notamment pour des instances complexes ou des entrées de grande dimension. Face à ces défis, des approches approximatives ou heuristiques sont fréquemment employées pour réduire la charge computationnelle et obtenir des résultats plus rapidement, même si cela se fait au détriment de l'optimalité de la solution. Nous formulons le problème de la recherche d'une explication abductive de taille minimale pour une instance x, donnée un classifieur h, comme un problème de sélection d'un ensemble d'attributs leaders de taille minimale dans le cadre d'une fonction supermodulaire. Nous proposons un algorithme glouton avec des garanties d'approximation. Nos expérimentations montrent que, lorsque h est représenté par un arbre de décision ou une forêt aléatoire, notre algorithme constitue une alternative efficace aux méthodes exactes basées sur les encodages SAT, notamment dans le cas d'instances difficile.

Décomposition et recherche Monte Carlo en General Game Playing

#SeminaireA3

Nicolas Jouandeau

2020-04-16 12:15:00
Salle B107, bâtiment B, Université de Villetaneuse

Les jeux permettent de définir des problèmes non triviaux dans un cadre fini et maîtrisé, et offrent de fait un cadre intéressant pour l’étude des algorithmes de décision. Pour réduire l'influence de connaissances expertes spécifiques à un jeu et stimuler une analyse logique des problèmes, le General Game Playing (GGP) propose de jouer à des jeux inconnus en partant uniquement de la description logique de leurs règles. Dans ce contexte, nous proposons deux méthodes générales de décomposition des jeux décrits en Game Description Language (GDL), l'une s’appuyant sur une analyse logique des règles et l'autre sur une analyse statistique d’informations collectées pendant des simulations. Enfin nous présentons une variation de la méthode Monte Carlo Tree Search exploitant ces décompositions dans un joueur GGP et permettant de résoudre simplement certains jeux.

What (many kinds of) graphs can contribute to explainable machine learning

#SeminaireA3

Tiphaine Viard

2020-03-16 12:15:00
Salle B107, bâtiment B, Université de Villetaneuse

AI and machine learning are commonly described as "black boxes" that are efficient, but opaque. While complete opacity would be an exaggeration, it is true that many methods for explainability rely on forms of retro-engineering: we try to infer the model from its (partial, intermediary, final) results. These methods are typically based on large-scale, efficient matrix manipulation. Graphs and their extensions have shown to be visualisable and interpretable, even at large scales. In their classical formulation, they are also very similar to matrices, but also versatile: they can be directed, weighted, multilayered, temporal, etc. Each of those extensions giving rise to interesting algorithmic and data-driven questions. To date, few machine learning methods, harness the expressive power of graphs, in part due to the complexities of graph algorithms, typically having polynomial running times, which is incompatible with the scale of data at hand. However, the situation has changed: (i) the impact of AI on society makes it no longer acceptable to only favour efficiency despite explainability, and (ii) recent advances in algorithmic methods on graphs demonstrates that due to the nature of real-world graphs, even some NP-hard problems become tractable. The aim of this talk is to explore this avenue of research. We will discuss the state-of-the art as well as some past results in real-world (temporal) graph modeling and in explainability, and will then discuss some recent results on pattern mining on temporal graphs.

Equipe A3

Séminaires

owards Explainability for Interaction Network Analysis

Un étude des méthodes de pré-entrainement pour l'apprentissage incrémental par classe

Fouille de motifs fréquents dans les graphes : l'essor de l’apprentissage profond et des architectures neuronales

Détection de communautés disjointes : une nouvelle méthode basée sur ?-similarité structurell

Intelligent Facilitation of Deliberation in Online Debates

Quantification d'Incertitude en Apprentissage Automatique

Synergies between machine learning and reasoning

Intelligent Facilitation of Deliberation in Online Debates

L'AI Act quel impact sur l'enseignement et la recherche ?

Explaining AI Decisions: Approximate Formal Explanations for Classifiers Using Greedy Algorithms

Décomposition et recherche Monte Carlo en General Game Playing

What (many kinds of) graphs can contribute to explainable machine learning