<img style = "float: left" src="https://mirrors.creativecommons.org/presskit/buttons/88x31/png/by-nc-nd.png" width="120"> &copy; 2024-2025 Roger Villemaire, [villemaire.roger@uqam.ca](mailto:villemaire.roger@uqam.ca)  
[Creative Commons Paternité - Pas d'Utilisation Commerciale - Pas de Modification 3.0 non transcrit](http://creativecommons.org/licenses/by-nc-nd/3.0/)

# Entrées-sorties

Cette semaine nous allons travailler avec la lecture, et l'écriture, de fichiers, ainsi que sur l'entrée et la sortie standards.

## Fichiers texte

Il y a deux types de fichiers en informatique :
  * les *fichiers texte* contenant des lignes formées de caractères imprimables : minuscules, majuscules, espaces, signe de ponctuation etc.,
  * les *fichiers binaires* pouvant contenir n'importe quels *octets* (suites de 8 bits).
  
Par exemple, un fichier *.txt* ou *.csv* est un fichier texte, tandis que les fichiers *.xlsx*, *.docx*, ou les fichiers exécutables *.exe* sont des fichiers binaires.

Bien qu'il soit possible de lire et décrire des fichiers binaires en Python, il est tout probablement préférable d'utiliser une bibliothèque comme par exemple *pandas* pour les fichier *.xlsx*.

Pour les fichiers texte d'un format particulier, comme les fichiers *.csv*, il est aussi tout probablement préférable d'utiliser une bibliothèque. Mais, sinon, pour un fichier texte général, il est très facile de le lire ou de l'écrire, ligne par ligne en Python. Ceci peut servir pour conserver de l'information dans un format qu'on définit soi-même, donc adapté aux circonstances.

### Lecture dans un fichier

Avant de pouvoir lire dans un fichier texte, il faudra s'en créer un ! Ceci peut se faire avec un *éditeur*, par exemple *Bloc-Note* ou encore *Jupyter-lab*, qui peut sauvergarder des fichiers *.txt*, comme nous allons le voir. 

Dans *Jupyter-lab*, à gauche, faire +, choisissez *text file*, écrivez deux lignes quelconques et renommez le fichier en *bidon.txt*. Jupyter-lab sauvegarde les fichiers automatiquement, selon une politique qui lui appartient ! Il est donc parfois nécessaire de faire *File -> Save Text* pour que le fichier soit écrit.

Pour faire la lecture du fichier en Python, il faut d'abord l'ouvrir, en indiquant son *nom* qui est une chaîne de caractères.  
Ceci se fait de la façon suivante :


In [None]:
flot = open("bidon.txt")

**Remarque :** Si jamais le fichier texte n'est pas dans le même répertoire que ce fichier JupyterLab, il faut donner son nom complet, comme "/home/abc/bidon.txt" sous Linux ou 'C:Users\\\\\abc\\\\\bidon.txt' sous Windows.

On peut toujours importer le module os (operating system, système d'exploitation)
   * import os  
et faire
   * os.getcwd()
pour obtenir le répertoire courant où l'environnement Python s'exécute et donc voir la syntaxe du chemin d'accès.

Pour reprendre, dès que le fichier est ouvert, il est possible d'y lire, par exemple une ligne complète avec

In [None]:
ligne = flot.readline()

In [None]:
ligne

Il y a deux choses importantes ici :
  * tout d'abord, ce qui est retourné par la fonction *open()* est un *flot* (*stream*) de lecture sur le fichier,
  * de plus, *readline()* retourne le contenu de la ligne, **incluant** le retour à la ligne '\n'.

On peut lire les lignes, une par une, avec *readline()*. Lorsque la lecture du fichier est terminée, *readline()* retourne une chaîne vide. Ceci est d'ailleurs à distinguer de la valeur *\n* retournée pour la lecture d'une ligne vide.

In [None]:
flot.readline()

Lorsqu'on a terminé avec le fichier, il est important de le fermer. Ceci indique au système d'exploitation qu'on a terminé avec ce fichier.

In [None]:
flot.close()

Dès que le fichier est fermé, il est impossible d'y lire. Il faut donc toujours faire les opérations dans l'ordre suivant :
  * ouvrir le fichier,
  * lire (ou écrire comme on le verra plus tard),
  * fermer le fichier.
  
Conformément à ses principes généraux, Python offre des façons très convivales d'opérer avec les fichiers. Tout d'abord, la structure *with ... as ...:* permet d'ouvrir un fichier
tout en s'assurant qu'il sera automatiquement fermé lorsque cette structure sera quittée.  
De plus, une boucle *for* sur un flot permet de lire les lignes une par une.

In [None]:
nom_fichier="bidon.txt"
with  open(nom_fichier) as flot:
    for ligne in flot:
        print(len(ligne),"charactères :",ligne)

Il est largement préférable d'utiliser *with ... as ...:* pour gérer l'ouverture/fermeture du fichier. C'est plus simple et on est assuré que le fichier sera fermé,
même si une exception se produit. Sinon, vous devez récupérer l'exception et vous assurer de fermer le fichier, comme nous le verrons bientôt.

Normalement un fichier texte sera lu ligne par ligne. Il est néanmoins possible d'avancer d'un nombre précis de caractères de la façon suivante.

In [None]:
flot = open(nom_fichier)
flot.seek(5) # avancer passé le cinquième caractère. Voir l'argument *whence* pour se déplacer relativement 
             # à la position courante ou la fin du fichier.

L'appel suivant continue simplement la lecture à l'endroit où nous en sommes maintenant rendu.

In [None]:
flot.readline()

Il ne faut pas oublier de fermer le fichier, comme toujours.

In [None]:
flot.close()

**Exercice** 1. Créez un fichier texte contenant quelques nombres, un par ligne. Écrivez le code Python nécessaire pour lire ces nombres, en faire la somme et afficher ce total.

**Remarque :** Si on remplace un des nombres de notre fichier par une chaîne contenant autre chose que des chiffres, une *exception* va se produire. Essayez-le !

## Les exceptions

Une exception se produit lorsqu'une fonction ne peut pas s'exécuter correctement. Il peut s'agir d'un argument incorrect,

In [None]:
int("abc")

d'un accès incorrect,

In [None]:
"abc"[3]

d'un fichier inexistant,

In [None]:
open("blablabla.txt")

ou d'en fait n'importe quelle situation qui ne permet pas à la fonction de s'exécuter normalement.

Par défaut, lorsqu'une exception se produit, le programme se termine et un message s'affiche avec le nom de l'exception, qui se termine usuellement par **Error**.

Il est possible de *récuper* l'exception en faisant exécuter du code Python plutôt que de laisse le programme se terminer avec le message d'erreur. Par exemple, 

In [None]:
def convertir_entier(c):
    "retourne l'entier correspondant à la chaine 'c' et 0 si 'c' n'est pas uniquement formée de chiffre"
    try:
        return int(c)
    except ValueError:
        return 0

In [None]:
convertir_entier("506")

In [None]:
convertir_entier("ab")

Dans la fonction précédente le code entre *try:* et *except* est exécuté de façon normale, tant qu'il n'y a pas d'exception de *levée*. Si une exception se produit dans ce bloc de code, on passe directement au bloc après le *except* correspondant à l'exception. Il faut donc y mettre quelque chose qui compensera pour la situation exceptionnelle, si c'est possible, sinon qui affichera un message plus parlant pour un usager que celui par défaut. 

De façon générale, si le programme ne peut plus continuer, il est important de laisser une dernière chance à l'usager de sauvegarder son travail, avant de fermer les fichiers qui pourraient encore être ouverts.

On peut traiter plusieurs exceptions en utilisant plusieurs blocs *except*, en donnant plusieurs exceptions dans un tuplet, ou encore 
en utilisant l'exception *Exception* qui est la plus générale possible.

**Exercice** 2. Modifiez le code de votre programme pour faire la somme des nombres d'un fichier pour simplement ne pas considérer les lignes contenant autre chose que des chiffres.

## Programme Python

Jusqu'à maintenant nous avons toujours développé et exécuté nos programmes Python dans l'environnement Jupyter-lab, mais, en fait, il faut distinguer :
  * Jupyter-lab qui est un environnement permettant de développer du code (dans plusieurs langages d'ailleurs) combiné avec avec du texte sous la forme d'un *Jupyter-Notebook*,
  * l'interpréteur *python* qui est un programme qui lit et exécute le code Python.
  
L'interpréteur Python est complètement indépendant de Jupyter-lab. Vous pouvez donc vous en servir directement pour exécuter vos programmes Python.

Recopier le code complet nécessaire pour votre solution de l'exercice 2. dans un fichier texte de nom *somme.py*. De façon conventionnelle, l'extension *.py* est utilisée pour du code Python.

Il est maintenant possible de faire exécuter votre programme, sur la ligne de commande en tapant  
python somme.py

Si vous exécutez Python de cette façon, il n'est pas indispensable de terminer le nom par *.py*. Néanmoins, sous Windows, si vous voulez double-cliquer sur le fichier *somme.py* pour le faire s'exécuter, c'est nécessaire. Essayez-le !

Évidemment, il y un inconvénient, la fenêtre se referme dès que l'exécution est terminée et on n'a pas le temps de vraiment voir le résultat !

Une petite astuce est de terminer votre programme avec

In [None]:
input("Appuyez sur entrée pour terminer")

Ajoutez cette instruction à la fin du programme du fichier "somme.py" et vérifiez en double-cliquant dessus que vous obtenez bien le résultat escompté.

## Entrée et sortie standards

Lorsqu'un programme s'exécute, il y a automatiquement deux flots d'ouverts, un d'entrée et l'autre de sortie :
  * l'entrée standard, normalement le clavier,
  * la sortie standard, normalement le terminal.
  
Dans Jupyter-lab, l'entrée standard sera une petite case ouverte sous la cellule, comme le montre l'exemple suivant.

In [None]:
reponse = input("écrivez quelque chose et faites entrée : ")

Ce que vous avez écrit est retourné par la fonction *input()* comme on peut le voir ci-dessous.

In [None]:
reponse

Dans un terminal, il y aura une invite de commande, normalement clignotante, comme dans les films ! Vérifiez-le en copiant l'instruction suivante

In [None]:
reponse=input("écrivez quelque chose et faites entrée : ")

dans un fichier de nom "entree.py" et en le faisant s'exécuter en double-cliquant dessus.

Pour afficher sur la sortie standard, c'est encore plus simple, il suffit de faire

In [None]:
print("ceci est affiché")

Ajoutez la ligne suivante

In [None]:
print(reponse)

au fichier "entree.py" et vérifiez le résultat !

Évidemment, le terminal se referme brutalement dès que l'affichage est terminé, ce qui n'est pas très agréable ! On peut donc, ici encore ajouter la ligne

In [None]:
input("Appuyez sur entrée pour terminer")

Faites-le et vérifiez qu'on a bien le résultat escompté. Notre programme lit et réécrit une chaîne, ce qui est un comportement fondamental qu'on peut bien sûr bonifier
en ajoutant un traitement entre les deux et en répétant la lecture tant que l'entrée n'est pas fermée (avec CTRL-Z-entrée sur Windows et CTRL-D sur Linux/MacOSX).

On comprend maintenant que l'instruction 

In [None]:
input("Appuyez sur entrée pour terminer")

affiche simplement le message, et lit sur l'entrée standard. Cette lecture sera terminée lorsqu'on appuiera sur la touche 'entrée' ! La valeur retournée peut être quelconque, mais elle sera de toute façon ignorée puisqu'il n'y a pas d'affectation dans une variable !

En fait, si le terminal est déjà ouvert, comme lorqu'on exécute  
python entree.py  
cette astuce n'est pas nécessaire.

Il y a donc un flot
  * d'entrée : sys.stdin
  * et de sortie : sys.stdout

qui sont automatiquement ouverts au démarrage du programme et fermés à la fin de l'exécution.

Pour accéder directement ces flots, il faut tout d'abord importer

In [None]:
import sys

et puis s'en servir comme n'importe quel autre flot qu'au aurait obtenu de l'ouverture d'un fichier. L'environnement Jupyter-lab ne permet néanmoins pas la lecture de *sys.stdin*, il faut donc s'en servir plutôt dans un programme Python (dans un fichier *.py*).

## Fichiers texte : écriture

L'écriture dans un fichier texte s'effectue d'un façon similaire à la lecture :
  * il faut tout d'abord ouvrir le fichier *en mode lecture*,
  * on peut y écrire avec les fonctions *write()* ou même *print()*,
  * il ne faut pas oublier de fermer le fichier lorsqu'on a terminé.

Par exemple, on ouvre un fichier en mode écriture avec l'instruction suivante.

In [None]:
nom_fichier="sortie.txt"
flot = open(nom_fichier,mode="w")

On peut remarquer que dès que l'instruction précédente est exécutée, le fichier est créé dans le répertoire courant.

On peut maintenant y écrire :

In [None]:
flot.write("bonjour")

La fonction *write()* retourne le nombre de caractères écrits dans le fichier, ce qui est nécessairement égal à la longueur de la chaîne passée en paramètre.

Si on ouvre le fichier destination, par exemple avec Jupyter-lab en double-cliquant à gauche, il se peut très bien qu'il soit vide, malgré qu'on y ait écrit quelque chose. Ce qui est important de comprendre, c'est que les fichiers sont gérés par le système d'exploitation. Pour des raisons d'efficacité, le contenu du fichier n'est pas immédiatement écrit, mais est plutôt conservé dans un tampon en mémoire. Ceci explique pourquoi il est possible de perdre de l'information lorsqu'un programme ne se termine pas de façon normale.

Il reste qu'en général, le fichier est écrit dès qu'on y insère un retour à la ligne, un nombre important de caractères, ou qu'on le ferme. Il est donc important de fermer le fichier dès que l'on a terminé avec l'écriture.

In [None]:
flot.close()

Vous pouvez maintenant vérifier que le fichier contient bien la chaîne qu'on y avait écrite.

En fait, on voit qu'il n'y a pas de retour à la ligne '\n' d'ajouté. Si on veut terminer la ligne, il faut donc ajouter ce caractère dans notre chaîne.

Il reste qu'il est aussi possible de simplement utiliser la fonction *print()*, qui par défaut ajoute des espaces entre ses arguments et un retour à la ligne à la fin, comme
on peut le vérifier en exécutant le code suivant.

In [None]:
flot = open(nom_fichier,mode="w")
print("blabla",file=flot)
flot.close()

Il est en général nécessaire de fermer et de réouvrir le fichier destination pour voir le changement, car ceci forcera la relecture du fichier par Jupyter-lab.

On peut en profiter pour explorer la *docstring* de la fonction *print()* et réaliser les exercices suivants.

**Exercice** 3. Utilisez la fonction *print()* pour écrire dans le fichier "sortie.txt" les chaînes d'un tuplet, par exemple,

In [None]:
t = ("un","deux","trois")

**séparés** par des **;**.

On remarque qu'à chaque fois qu'on réouvre le fichier de sortie ceci efface sont contenu ! En fait, il s'agit là du sens du mode "w" et on peut voir de la docstring
de *open()* que les modes possibles sont les suivants :
  * 'r'       open for reading (default)
  * 'w'       open for writing, truncating the file first
  * 'x'       create a new file and open it for writing
  * 'a'       open for writing, appending to the end of the file if it exists
  
Pour être sûr de bien comprendre le sens de la documentation, complétez les exercices suivants avec le fichier "sortie.txt".

**Exercices**

4. En mode "w" ouvrez et fermer le fichier, sans rien y écrire, et vérifier que son contenu est bien vide.

5. En mode "w" ouvrez le fichier, faites écrire une ligne et fermez-le. Réouvrez le fichier en mode "a", ajoutez une nouvelle ligne et fermez-le. Vérifier que la deuxième ligne 
a bien été **ajoutée** à la première.

**Note :** Si jamais il y a un problème avec l'encodage, par exemple votre version du système d'exploitation utilise par défaut un encodage comme "latin-1" pour les caractères accentués alors
que Jupyter-lab préfère l'"utf-8", il suffit d'indiquer *encoding="utf-8"* dans les paramètres de la fonction *open()*.

6. Vérifiez que si un fichier n'existe pas, le mode "x" fait la même chose que le mode "w", soit de créer le fichier, mais que si le fichier existe déjà le mode "w" l'efface alors
que le mode "x" lève une exception.

In [None]:
flot = open(nom_complet_fichier,mode="x")

7. Par défaut le fichier est considéré comme étant dans le répertoire courant, c.-à-d. celui dans lequel le programme est démarré. 

Sur la ligne de commande, vous pouvez avec  
dir C:  
voir le contenu du disque C: (sous windows). Explorez un peu pour trouver où est situé le "bureau". Il s'agit d'un chemin d'accès de la forme  
dir C:\Users\mon_nom\Desktop
    
Avec Python créez un fichier sur votre bureau (il faut donc ajouter le nom du fichier, préfixé par une "\\" au nom du bureau) contenant une ligne quelconque et vérifiez que le fichier apparaît effectivement sur le bureau !

**Attention** Sous windows les chemins d'accès contiennent des "\\" qui doivent être doublés dans une chaîne Python !

## Le module *sys*

Le module *sys* contient un ensemble d'autres fonctions relatives au système d'exploitation.

### Identification
Par exemple, on peut obtenir le nom rudimentaire du système d'exploitation, par ex. 'win32', 'linux', avec

In [None]:
import sys

In [None]:
sys.platformAutres

Le module *platform* permet d'aller plus loin dans l'identification du système d'exploitation. En général, on essaie de faire du code *portable*, donc pouvant
s'exécuter sans changement sur un système d'exploitation quelconque. Lorsque ce n'est pas possible, ce type de module peut être utile. Il est évidemment largement
nécessaire de consulter la document et les interactions à ce sujet sur l'internet !

### Instructions pour l'interaction avec la ligne de commande

Lorsqu'un programme Python est exécuté sur la ligne de commande, par exemple en l'appelant avec  
python prog.py  
il  y a en fait deux sorties qui sont ouvertes automatiquement
  * la sortie standard, *sys.stdout*, que nous avons déjà vue,
  * l'erreur standard, *sys.stderr*.
  
La différence est qu'il est possible, sur la ligne de commande, de rediriger la sortie standard, qui contient normalement le résultat produit par le programme,
vers un fichier, tout en laissant l'erreur standard, qui contient normalement des messages d'erreur pour l'usager, s'afficher sur le terminal. Nous n'irons pas
plus loin dans cette direction car ceci est utilisé surtout sous linux.

In [None]:
sys.stderr

Une chose plus importante est qu'un programme va normalement lire des arguments sur la ligne de commande. Il s'agit de chaînes de caractères qui suivent le nom
du programme et représentent très souvent les noms des fichiers à traiter.

Il est possible d'obtenir ces arguments de ligne de commande avec

In [None]:
sys.argv

Dans le cas de Jupyter-lab, ces arguments ne sont pas tellement d'intérêt. Complétez plutôt l'exercice suivant pour découvrir comment s'en servir sur la ligne de commande.

**Exercice** 8. Dans un fichier de nom "prog.py" écrivez le code Python nécessaire pour faire afficher *sys.argv*. En appelant votre programme, sur la ligne de commande,
avec plusieurs possibilité d'arguments, comme  
python prog.py arg1 "argument 2"  
ou même seulement  
python prog.py  
etc., vérifiez qu'on obtient bien ces arguments !

### Code de retour

La convention Unix/Linux veut qu'un programme qui se termine normalement retourne un *code* de 0 et anormalement un code différent de 0. Sur linux, il est possible de tester ce code. Ceci est nettement moins utilisé dans l'environmment Windows.

L'appel suivant termine par exemple le programme avec un code donné en argument, la valeur de 0 est utilisée par défaut.  
sys.exit()  
Ceci ne peut pas être utilisé dans l'environment Jupyter-lab, seulement dans un programme.