# Graphes en Networkx

Nous allons utiliser une bibliothèque de graphes appelée NetworkX (mais toute autre bibliothèque fournira généralement des commandes équivalentes) 

Tout d'abord on importe nos bibliothèques. On utilise  ici un diminutif pour la bibliothèque (nx), ce n'est probablement pas une bonne idée de faire pareil avec les élèves, mais pour nous ce sera plus pratique.

In [None]:
import networkx as nx
import matplotlib.pyplot as plt

Créons maintenant un graphe vide et ajoutons deux noeuds et une arrête :

In [None]:
G = nx.Graph()
G.add_node(1)
G.add_node(2)
G.add_edge(1, 2)

Remarquons l'utilisation du paradigme objet : G est un graphe et dans ce graphe nous appliquons les fonctions add_node(1), add_node(2) et add_edge(1, 2).

Attention, le "." du ``nx.Graph`` n'indique pas de la programmation objet, mais l'utilisation de la fonction ``Graph`` du module ``networkx``. On doit le préciser car la fonction ``Graph`` existe aussi dans ``matplotlib.pyplot`` (en passant, le "." de ``matplotlib.pyplot`` a encore une autre signification, cela indique la sous-bibliothèque ``pyplot`` de ``matplotlib``).

On peut aussi ajouter un noeud à la volée : lorsque l'un (ou deux) des deux côté d'une arrête n'est pas connue, le noeud correspondant est ajouté automatiquement :

In [None]:
G.add_edge(1,7)

On peut aussi ajouter plusieurs arrêtes (ou/et noeuds) d'un coup :

In [None]:
G.add_edges_from([(5,6),(5,7),(5,8),(6,7),(6,8),(7,8)])

On voudrait maintenant l'afficher pour le visualiser

In [None]:
nx.draw_networkx(G)
plt.show()

On peut se débarrasser des axes en le précisant avant l'affichage :

In [None]:
nx.draw_networkx(G)
plt.axis('off')
plt.show()

Remarquez la disposition du graphe qui change : ce n'est pas parce que l'on a effacé les axes, mais parce que la disposition est aléatoire (avec pondération par la connexité de manière à ce que les points peu connexes soient positionnés loin les uns des autres, selon l'algorithme Fruchterman-Reingold : https://schneide.blog/tag/fruchterman-reingold/). 

Attention, le module matplotlib de jupyter est très malin : il n'affichera pas une image qui n'aura pas changée et ne réécrira pas sur une image existantes. Si vous l'utilisez hors de jupyter (en particulier en lignes de commandes), ``draw_networkx`` va dessiner par dessus le graphe courant, il faut donc régulièrement réinitialiser le graphe courant avec ``subplot``.

Par contre, changer le graphe ne réécrit pas l'image, il faut préciser que l'on veut actualiser l'image.

In [None]:
G.add_edge(2,5)
plt.show()

In [None]:
nx.draw_networkx(G)
plt.axis('off')
plt.show()

On peut maintenant récupérer des infos sur l'arbre pour travailler avec :

In [None]:
[noeud for noeud in G]

In [None]:
G[5]

In [None]:
[voisin for voisin in G[5]]

In [None]:
G.has_node(10) or G.has_edge(2,5)

Il y a beaucoup d'autres options. Vous pouvez étudier la doc (https://networkx.github.io/documentation/stable/_downloads/networkx_reference.pdf) mais les commandes ci-dessus sont généralement suffisantes. Dans certains cas on peut aussi vouloir utiliser des noeuds d'autres types ou des couleurs/poids sur les arrêtes, malheureusement, ces dernier ne sont pas dessinés par la bibliothèque...

In [None]:
G.add_edge("toto",1,weight=4.7,color='blue')
G.add_node('A',label=0)
nx.draw_networkx(G)
plt.axis('off')
plt.show()

**Exercice :** Écrire une fonction qui prend une liste de noeud, crée un graphe qui chaîne ces noeud et affiche la chaîne.

**Exercice :** Écrire une fonction qui prend un arbre, le transforme en graphe et l'affiche.

**Exercice :** Écrire une fonction qui prend un graphe, calcule un arbre couvrant minimal (utiliser Kruskal sans poids) et l'affiche.

Pour les tests, on peut utiliser ``thresholded_random_geometric_graph`` qui construit un graphe aléatoire en fonction de 3 paramètres : le nombre de noeuds, et deux autres paramètres gérant les arrêtes (le premier augmente le nombre d'arrêtes et le second le diminue, mais de manière différente...) 

Pour plus de lisibilité, nous diminuons la taille des noeuds et enlevons les labels.

In [None]:
H = nx.thresholded_random_geometric_graph(50, 0.30, 0.1)
nx.draw_networkx(H,node_size=25,with_labels=False)
plt.axis('off')
plt.show()

Si on veut afficher l'arbre couvrant trouvé sur le graphe même, c'est possible, mais complexe. Il faut définir, dans ``nx.draw_networkx``, deux paramètres appelés ``edgelist`` et ``edge_color`` comportant, respectivement, la liste de toutes les arrêtes et la liste des couleurs pour chaque arrête (dans le même ordre). Ce n'est pas du tout idéal, mais on est limité par la bibliothèque utilisée. Pour un TP, il faudra écrire une fonction annexe comme la fonction suivante :

In [None]:
def afficher_en_couleur (G,liste_a_colorer) :
  liste_arretes = [e for e in G.edges]
  def choisir_couleur (arrete) :
     if(arrete in liste_a_colorer):
        return "blue"
     else:
        return "grey"
  liste_couleurs = map(choisir_couleur,liste_arretes)
  nx.draw_networkx(H,node_size=25,with_labels=False,
                   edgelist=liste_arretes,
                   edge_color=liste_couleurs)
  plt.axis('off')
  plt.show()

afficher_en_couleur(H,[(1,n) for n in range(50)])

**Commentaire sur les paradigmes (à relire après le cours idoine) :** Dans ce petit TP, nous avons croisé plusieurs paradigmes de programmation :
- Nous avons vu qu'un graphe était ici un objet, sur lequel on peut appliquer des méthodes (comme ``add_edge`` ou ``has_edge``). Mais il y a aussi des constructions surchargées (comme ``G[5]`` ou ``5 in G``) qui ne sont que du sucre syntaxique pour l'utilisation d'une méthode (respectivement les méthode ``__getitem__(5)`` et ``__contains__(5)``); en python, la grande majorité des constructions correspondent à l'appel d'une méthode "invisibe" qui commence et finit par "__".  
- Le canevas du dessin sur lequel on écrit est traité de manière très impérative : il s'agit d'une variable global sur laquelle on écrit des choses les unes après les autres et que l'on nettoie à chaque affichage. 
- Enfin, dans la fonction ``afficher_en_couleur``, j'ai utilisé un style éminemment fonctionnel : je définit une sous fonction ``choisir_couleur`` qui prend une arrête et dit de quelle couleur elle doit être (remarquez qu'il s'agit vraiment d'une sous fonction, je n'aurais pas pu la définir hors de la fonction principal puisque elle utilise ``liste_a_colorer``), puis j'applique cette fonction à tous les noeuds de la liste d'arrêtes grâce à la fonction d'ordre supérieur ``map``. Petite remarque en passant : le paramètre ``edge_color`` a été mal conçu dans la librairie networkx, il aurait été plus élégant d'avoir un paramètre d'ordre supérieur qui attend une fonction des arrêtes dans les couleurs, dans notre cas on aurait directement donné la fonction ``choisir_couleur`` en paramètre.
- On n'a pas utilisé de paradigme logique, mais la manière dont on trace le graphe peut s'en rapprocher (de très loin), au sens où l'on définit nos contraintes (le graphe et les condition d'éloignement des points topologiquement distants) et on demande à l'ordinateur d'en trouver une résolution.

**Autres petits exercices possibles :**
- Présenter informellement le lien entre graphe et matrice en utilisant la section 6.1 du manuel de référence de networkx (https://networkx.github.io/documentation/stable/_downloads/networkx_reference.pdf)
- Montrer comment le graphe peut se sérialiser (n'utilisez pas cet anglicisme :) en utilisant les interfaces JSON (section 9.8), YAML (section 9.10) ou autre (section 9)
- Si vous voulez enlever l'aléatoire, vous pouvez utiliser les graphes prédéfinis (section 5.17 et 5.2) et des algorithmes d'affichage déterministes (utiliser ``draw_planar`` ou ``draw_kamada_kawai`` au lieu de ``draw_networkx``, le premier si votre graphe est planaire, le second sinon).

**Projet possible :** En deux étapes : d'abord montrer que l'on peut sérialiser une structure objet complexe dans un JSON (ou XML) avec des ``%Ref`` qui permettent à des champs de contenir des références à d'autres objets. Puis écrire une fonction qui prend un tel fichier JSON et affiche le graphe de la structure objet (on peut même essayer d'ajouter de la couleur ?).  

Cette bibliothèque est loin d'être idéal, et il existe probablement mieux. Vous pouvez essayer d'en chercher d'autre, mais attention, cela peut vite prendre beaucoup de temps.

Équipe pédagogique DIU EIL, ressource éducative libre distribuée sous [Licence Creative Commons Attribution - Pas d’Utilisation Commerciale - Partage dans les Mêmes Conditions 4.0 International](http://creativecommons.org/licenses/by-nc-sa/4.0/) ![Licence Creative Commons](https://i.creativecommons.org/l/by-nc-sa/4.0/88x31.png)