# Didactique de l'informatique
## Psychologie de la programmation - Les variables

### RENAN SAMURCAY, SIGNIFICATION ET FONCTIONNEMENT DU CONCEPT DE VARIABLE INFORMATIQUE CHEZ DES ELEVES DEBUTANTS
Educational Studies in Mathematics 16 (1985) 143-161

Dans ce travail, R. Samurçay étudie avec le point de vue de la psychologie de l'apprentissage, les acquisitions des élèves débutants et les difficultés rencontrées.

> Dans la résolution d'un problème informatique, concernant les variables, le
sujet est confronté à plusieurs activités distinctes. On peut en distinguer deux
types:
- la construction de la signification et des opérations sur les variables: la
déclaration, l'affectation des valeurs, l'entrée et la sortie des données
sur l'écran,
- le contrôle des valeurs particulières qui doivent être prises par les variables
lors de l'éxécution du programme: ce contrôle intervient dans la planification des instructions par les structures que sont la répétition, le choix
et la séquentialité.

> Dans la structuration d'une boucle les variables interviennent dans trois opérations:
- la mise à jour
- le test d'arrêt
- l'initialisation.

> Notre hypothèse générale est que plus les variables à traiter s'éloignent du
modèle familier de l'exécution "à la main" qui constitue le traitement du problème par le sujet lui-même, plus leur construction est difficile. C'est le cas
notamment pour les variables qui sont constitutives de l'invariant de boucle.

L'exemple ci-dessous (traduit en Python) a été utilisé parmi une série d'exercices pour mesurer les acquisitions. Il concerne le calcul de $x^n - y^n$.
```python
x = input()
y = input()
n = input()
# manque-t-il des instructions ?
while cpt < n :
    expx = expx * x
    expy = expy * y
    cpt = cpt + 1
print (expx - expy)
```

In [None]:
x = float(input())
y = float(input())
n = int(input())
cpt = 0
expx = 1
expy = 1
while cpt < n :
    expx = expx * x
    expy = expy * y
    cpt = cpt + 1
print (expx - expy)

La solution attendue était la bonne initialisation des variables.
Les résultats ont été analysés en fonction du rôle des variables dans le programme : `cpt` est ici une variable compteur. `expx` et `expy` sont des accumulateurs. `x`, `y` et `n` sont des données.

#### Classification des rôles des variables

La typologie introduite par Samurçay distingue :
- les variables qui sont des données explicite du problème, et ne varient pas,
- les variables nécessitées par la résolution informatique, avec parmi elles :
   - les variables compteurs
   - les variables accumulateurs
   - les variables intermédiaires

* **Activité** : Compléter le programme ci-dessous pour calculer le nombre de multiples de 3 consécutifs à additionner pour obtenir un résultat supérieur à 1000.

    ```python
    multiple = 
    resultat = 
    while resultat < 1000:
        multiple = 
        resultat = 
    ```
    Quels sont les rôles des variables nécessaires à ce calcul ? 

In [None]:
multiple = 0
resultat = 0
cpt = 0
while resultat < 1000:
    multiple = multiple + 3
    resultat = resultat + multiple
    cpt = cpt + 1
print(cpt)

Un des résultats de l'étude est de quantifier la réussite des élèves aux différents tests en fonction du rôle de la variable.
> En ce qui concerne le traitement des différents types de variables, on note que
la variable COMPTEUR est toujours mieux traitée que les autres variables
lorsqu'elle obéit au modèle canonique: "elle s'initialise à zéro, elle s'incrémente
de 1". Lorsque la variable qui joue le rôle de compteur ne correspond pas
explicitement à ce modèle, les réussites chutent de moitié comme par exemple
dans la tache de construction du test d'arrêt. Les variables d'accumulation et de
résultats intermédiaires sont dans tous les cas, plus difficiles à traiter.

### La notion de variable en informatique et en mathématique

**Acquisition de savoirs et de savoir-faire en informatique**, Janine Rogalski, CDM 43, mai 1987.

J. Rogalski a analysé les conditions d'acquisition de la variable informatique (pendant l'option info des lycées des années 80) chez des élèves ayant déjà la notion de variable mathématique.

> Deux voies possibles de constitution de nouvelles connaissances :
- le fonctionnement crée du sens
- la construction par accomodation/assimilation 

> La variable a comme précurseur possible la variable mathématique. Les précurseurs ont un double rôle : producteur et réducteur.

> Le caractère statique de la variable mathématique peut constituer un obstacle à la représentation de la modification possible de la valeur d'une variable lors de l'exécution d'un programme.

> [..] L'existence de la représentation symbolique = de l'égalité des variables numériques joue un rôle producteur dans les acquisitions initiales des tests en programmation... mais peut rendre difficile le changement de point de vue qui consiste non pas à comparer... mais à tester si une certaine propriété est vraie.

> [..] Les acquisitions sur la variable informatique :
- peuvent concerner les opérations que l'élève maîtrise ... affectation, tests...
- peuvent concerner le type de variable... chaînes de caractères, utilisation de variables booléennes.
- la capacité à traiter comme des variables des objets de niveau différent... par exemple des procédures passées en paramètres."

Ces trois niveaux d'acquisition sont cités par difficulté croissante, d'abord les opérations sur des variables numériques, puis sur des variables d'autres types et enfin sur des objets plus abstraits. 

### De la variable mathématique à la variable informatique
(D'après Briant 2013 cité par Rogalski Lagrange 2017)

L'extrait suivant consiste à analyser des productions d'élèves. 
La tâche est la suivante : résoudre l'équation : $ a x + b = c$

Les activités d'élèves ont été traduites en Python :

* Attention : certaines propositions sont erronées et provoquent des erreurs d'exécution.

In [None]:
# solution élève 1
a = float(input())
b = float(input())
c = float(input())
x = (c - b)/a
print(x)

In [None]:
# solution élève 2
a = int(input())
b = int(input())
c = a * x + b

In [None]:
# solution élève 3
if a * x + b == c:
    print(x)

In [None]:
# solution élève 4
a = float(input())
b = float(input())
I = float(input())
I = I - b
I = I / a
x = I
print(x)

### Interprétation des propositions d'élèves
Rogalski interprète les solutions élèves de la manière suivante :
> La solution attendue est proche de la solution « élève » n°1 [..]
Elle témoigne d’une prise de conscience de la
capacité du dispositif à traiter une formule écrite dans une syntaxe très proche de
l’algèbre habituelle, en instanciant les trois paramètres selon les valeurs données en
entrée. D’autres élèves produisent des solutions du type de celles numérotées 2 et 3 : ils essaient de traduire l’équation avec les éléments syntaxiques du
langage, soit par une affectation (Solution « élève » n°2), soit par une condition
(Solution « élève » n°3) puis « délèguent » au dispositif la résolution et
l’expression des solutions. Les solutions du type de celle numérotée 4 dans le
tableau sont aussi très souvent rencontrées : la variable I prend les valeurs
successives du « second membre » quand on résout l’équation en papier/crayon.

* **Activité** : pour essayer de donner du sens à la solution 3 :

In [None]:
for a in range(10):
    for b in range(10):
        for c in range(10):
            for x in range(10):
                if a * x + b == c:
                    print(a,"*", x, "+",b,"=",c)

Effectivement, formuler `a * x + b == c` comme un test peut avoir du sens pour trouver les solutions, dans un contexte où les variables sont instanciées par un programme qui énumère des valeurs possibles à la recherche de solutions satisfaisables.

### Egalité, équation et affectation

Un obstacle didactique est le risque de confusion entre égalité et affectation. 
Leurs notations sont proches et varient selon les langages.
En particulier le symbole `=` peut dénoter l'affectation dans un langage et l'égalité dans un autre.

En langage Python, la distinction est explicite entre :
- Affectation : `c = a * x + b`
- Egalité : `a * x + b == c`

### Difficulté à utiliser des variables booléennes

Plusieurs auteurs ont remarqué la difficulté pour les élèves à manipuler des variables autres que numériques, avec une difficulté particulière pour les variables booléennes.

> Lagrange (1991) montre une difficile progression. Les élèves restent attachés aux alternatives et très réticents à l’emploi de variables booléennes. Une progression souvent constatée est l’emploi d’un type connu pour « contourner » le problème. Par exemple les élèves déclarent une chaîne à laquelle ils affectent « OUI » ou
« NON », ou une variable numérique à laquelle ils affectent 0 ou 1.

### Conclusion 

Le concept de variable reste ainsi un obstable pour les élèves. On peut ainsi conclure avec
Rogalski et Lagrange :
> Confrontant des observations dans l’enseignement de l’algorithmique et de la
programmation – revenu en France dans le curriculum du lycée depuis quelques
années – à l’expérience acquise antérieurement, nous avons montré la persistance
de difficultés conceptuelles chez les élèves débutants, souvent mal connues des
acteurs du terrain ou institutionnels. Il apparaît que l’enjeu central est, pour les
élèves que nous avons observés, de comprendre la construction d’un programme ou
d’un algorithme comme l’organisation d’un traitement sur un dispositif ; ils doivent
percevoir ce dispositif comme un ensemble de variables, et concevoir ces variables
comme des objets « calculables » et le traitement comme l’évolution de leurs
valeurs.

Un enjeu pour l'enseignant est de savoir analyser a priori la difficulté des situations proposées, pour les graduer et permettre à tous les élèves de dépasser cet obstacle.

En programmation Python, il convient aussi le moment venu de passer d'un modèle de dispositif basé uniquement sur les variables en mémoire - modèle étudié ici - à un modèle incluant l'environnement et la mémoire. Cette étape est nécessaire pour bien comprendre les données mutables et les mécanismes de passage de paramètres.

### Références :
* SAMURÇAY , R. (1985). Signification et fonctionnement du concept de variable
informatique chez des élèves débutants. Educational Studies in Mathematics, 16.2,
143-161.
* LAGRANGE , J-B. (1991) Des situations connues aux traitements sur des données
codifiées : représentations mentales et processus d’acquisition dans les premiers
apprentissages en informatique. Thèse de Doctorat. Université Paris 7.
* BRIANT , N. (2013). Étude didactique de la reprise de l’algèbre par l’introduction
de l’algorithmique au niveau de la classe de seconde du lycée français. Thèse
Université Montpellier II - Sciences et Techniques du Languedoc.
* LAGRANGE J.B., ROGALSKI J. (2017) Savoirs, concepts et situations dans les premiers apprentissages en programmation et en algorithmique. Annales de Didactiques et de Sciences Cognitives.

Equipe pédagoqique DIU EIL, ressource éducative libre distribuée sous [Licence Creative Commons Attribution - Pas d’Utilisation Commerciale - Partage dans les Mêmes Conditions 4.0 International](http://creativecommons.org/licenses/by-nc-sa/4.0/) ![Licence Creative Commons](https://i.creativecommons.org/l/by-nc-sa/4.0/88x31.png)