Evaluation de la quantité de travail (in)utile dans l’exécution des programmes

Rapport de stage de DEA
Évaluation de la quantité de travail utile
dans l’exécution des programmes
Benjamin Vidal
Responsable de stage : Pierre Michaud
Projet CAPS

Sujet de stage
La recherche en architecture de processeur est confrontée actuellement à des contraintes qui
rendent de plus en plus difficile l’augmentation des performances des processeurs. Ces contraintes
sont multiples : consommation électrique, latence de propagation des signaux sur les connexions,
temps et coût de developpement, etc. . . Pour espérer trouver d’éventuelles solutions permettant
d’augmenter les performances de manière significative sur une large gamme d’applications, il faut
trouver de nouveaux paradigmes d’architecture. Pour cela, il faut d’abord avoir une bonne compré-hension
du comportement des programmes.
Le sujet proposé a pour but d’évaluer la quantité de travail réellement utile dans l’exécution des
programmes. L’idée sous-jacente est que si une fraction importante de l’exécution d’un programme
consiste en du travail inutile, il peut être intéressant de chercher un paradigme architectural per-mettant
d’exploiter cette propriété.
Le problème consiste à donner une définition de l’utilité d’un travail. Par exemple, dans la
référence [1], un résultat intermédiaire est considéré inutile s’il est écrit dans un registre et est
écrasé sans avoir été utilisé. Dans la référence [5], un store à une adresse mémoire est considéré
inutile s’il écrit une valeur égale à la valeur déjà stockée à cette adresse. Nous proposons d’étudier
une autre définition, selon laquelle une instruction dynamique est considérée utile si
– Elle produit un résultat émis en sortie du programme (ex. printf)
– Elle produit un résultat utilisé comme opérande d’une instruction utile
– C’est un branchement dominant une instruction utile
La partie recherche du stage consiste à concevoir un algorithme efficace en temps et en mémoire
permettant d’évaluer la quantité d’instructions dynamiques utiles. La partie mise-en-oeuvre consiste
à écrire le programme correspondant, et à l’utiliser pour obtenir des statistiques sur la fraction de
travail utile, et d’autres statistiques, à définir, permettant de mieux appréhender le comportement
des programmes. La mise en oeuvre se fera à l’aide des outils développés au sein du projet CAPS.
On travaillera sur des traces d’exécution des programmes de la suite SPEC CPU2000.
2

Remerciements
Au cours de ce stage au sein de l’équipe CAPS de l’IRISA, il m’a été possible de rencontrer
un grand nombre de personnes qui m’ont aidé à comprendre le fonctionnement d’un laboratoire de
recherche en informatique et surtout à acquérir le recul nécessaire pour mieux appréhender le monde
de l’architecture des microprocesseurs. Je voudrais donc remercier Ronan Amicel, Laurent Bertaux,
Fran¸cois Bodin, Henri-Pierre Charles, Assia Djabelkhir, Romain Dolbeau, Antony Fraboulet, Karine
Heydemann, Thierry Lafage, Antoine Monsifrot, Laurent Morin, Gilles Pokam, Olivier Rochecouste,
André Seznec et Éric Toullec.
Je tiens aussi à remercier Yannos Sazeides (Enseignant à l’université de Chypre) avec qui j’ai eu
l’occasion d’échanger des idées sur la fa¸con d’élaborer automatiquement un graphe de dépendance
de donnée à partir de l’exécution d’un programme.
Et enfin je tiens à remercier très chaleureusement mon maˆıtre de stage, Pierre Michaud, qui m’a
donné la liberté de travail que j’aurais aimé trouver tout au long de mon expérience universitaire
et professionnelle et m’a permis ainsi de suivre les pistes que je souhaitais. Je tiens également à le
remercier pour tous les conseils qu’il a pu me donner concernant le monde de la recherche (publique
ou privée) et de m’avoir fait partager sa vision des choses sur de nombreux sujets.
3

Table des matières
1 Bibliographie 9
1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.2 Compilation et travail inutile . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.2.1 Vous avez dit « instructions inutiles » ? . . . . . . . . . . . . . . . . . . . . . 10
1.2.2 Instructions statiques inutiles . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.3 Première approche :
Instructions inutiles détectées dynamiquement . . . . . . . . . . . . . . . . . . . . . . 11
1.3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.3.2 Description du principe de détection et d’élimination des instructions inutiles 11
1.3.3 Idées d’implémentation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.3.4 Conclusion sur cette approche . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.4 Deuxième approche :
Écritures silencieuses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.4.2 Le phénomène d’écriture silencieuse . . . . . . . . . . . . . . . . . . . . . . . 13
1.4.3 Les conséquences de l’élimination des écritures silencieuses . . . . . . . . . . . 14
1.4.4 Idées d’implémentation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
4

1.5 Troisième approche :
Travail inutile global lors de l’exécution d’un programme . . . . . . . . . . . . . . . . 16
1.5.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.5.2 Evaluer l’utilité d’une instruction ? . . . . . . . . . . . . . . . . . . . . . . . . 16
1.5.3 Mise en oeuvre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2 Compte rendu du stage 20
2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.1.1 Le travail inutile, qu’est ce que c’est ? . . . . . . . . . . . . . . . . . . . . . . 20
2.1.2 Notre protocole de test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.2 La méthode utilisée . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.2.1 L’algorithme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.2.2 L’optimisation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.2.3 Le résultat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.3 L’environnement de travail : Les choix de mise en oeuvre . . . . . . . . . . . . . . . . 29
2.3.1 Les Outils . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.3.2 L’instrumentation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.3.3 Le choix de la Plateforme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.3.4 SPARC : Le Meilleur des Mondes ? . . . . . . . . . . . . . . . . . . . . . . . . 32
2.3.5 S’affranchir de la numérotation des registres faite par Salto . . . . . . . . . . 34
2.3.6 Les expressions régulières . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
2.3.7 La gestion des fonctions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
5

2.4 Résultats & Analyse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
2.4.1 Les chiffres. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
2.4.2 Le doute. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
2.4.3 La répartition du travail inutile . . . . . . . . . . . . . . . . . . . . . . . . . . 39
2.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
3 Annexes 46
3.1 Petit historique du stage. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.2 A propos de la description machine Salto du Sparc . . . . . . . . . . . . . . . . . . . 47
3.2.1 Gestion des instructions Save et Restore . . . . . . . . . . . . . . . . . . . . . 47
3.2.2 L’instruction call & link . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
3.2.3 L’instruction addx . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
3.2.4 Un détail : les instructions nop, ba et bn . . . . . . . . . . . . . . . . . . . . . 47
3.3 Résultat de l’évaluation du travail inutile sur un exemple simple . . . . . . . . . . . 49
3.3.1 Code source en C de l’exemple . . . . . . . . . . . . . . . . . . . . . . . . . . 49
3.3.2 Code source en assembleur Sparc de l’exemple . . . . . . . . . . . . . . . . . 49
3.3.3 Identifiant d’instruction statique . . . . . . . . . . . . . . . . . . . . . . . . . 51
3.3.4 Trace d’exécution dynamique . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
3.3.5 Graphe de dépendance de donnée . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.3.6 Trace d’exécution dynamique 2 . . . . . . . . . . . . . . . . . . . . . . . . . . 57
3.4 Exemple de données stockées en cours d’exécution . . . . . . . . . . . . . . . . . . . 59
3.5 Code source du programme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
6

Table des figures
1.1 Mise en évidence de l’inutilité des instructions ne produisant des résultats utilisés
que par des instructions inutiles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.1 La structure de donnée d’un noeud du graphe . . . . . . . . . . . . . . . . . . . . . . 24
2.2 Exemple de graphe généré par l’algorithme 1 & 3 . . . . . . . . . . . . . . . . . . . . 25
2.3 Du code source en langage de haut niveau au graphe de dépendance de donnée
dynamique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.4 Instrumentation de code source en assembleur . . . . . . . . . . . . . . . . . . . . . . 30
2.5 Principe de l’instrumentation faite par le programme d’évaluation de la quantité de
travail inutile . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.6 Le principe de la fenêtre de registres du Sparc . . . . . . . . . . . . . . . . . . . . . . 33
2.7 Quantité d’instructions assembleurs inutiles lors de l’exécution de gzip dans différentes
conditions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
2.8 Mise en évidence d’un problème d’implémentation par divergence du flot de contrôle 38
2.9 Évolution de la quantité de travail inutile en fonction du temps . . . . . . . . . . . . 40
3.1 Graphe d’exemple généré par l’utilitaire « dot » . . . . . . . . . . . . . . . . . . . . . 56
3.2 Les structures de données utilisées par le programme pour construire le graphe de
dépendance de donnée . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
7

Liste des Algorithmes
1 Construction du graphe de dépendance de donnée . . . . . . . . . . . . . . . . . . . 23
2 Parcours du graphe (Noeud) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
3 Détection des instructions inutiles . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
8

Chapitre 1
Bibliographie
1.1 Introduction
Aujourd’hui, pour améliorer les performances d’un programme, il ne suffit plus seulement d’ajou-ter
du matériel dans un système donné. Il faut avant tout étudier le comportement de ce programme
afin d’adapter au mieux les ajouts qui doivent être faits au système. De ce constat, les architectes
des microprocesseurs ont tiré des idées aujourd’hui fondamentales (tels les différents niveaux de
mémoires caches qui exploitent la propriété de localité temporelle et spatiale d’accès aux données
dans les programmes).
En ce sens, certains travaux de recherche s’intéressent aujourd’hui au problème du travail ef-fectu
é inutilement par un microprocesseur. Ils mettent en évidence une quantité non négligeable
de travail inutile. Dans cette bibliographie, trois approches principales de travail inutile ont été
retenues.
1. Une instruction produisant un résultat jamais utilisé par une autre instruction est considérée
comme inutile (approche de « l’instruction morte » retenue par l’article [1]).
2. Une instruction d’écriture est considérée comme inutile si cette dernière ne modifie pas l’état
de la mémoire (i.e. la même valeur est écrite à la même adresse mémoire) (approche de
« l’écriture silencieuse » retenue dans de nombreux articles [5, 3, 7]).
3. Une instruction est considérée comme utile si elle produit un résultat en sortie (affichage d’un
résultat par exemple) ou qu’elle est elle même utile à une instruction utile (approche retenue
pour le stage).
Après un bref tour d’horizon des travaux déjà effectués dans le domaine au niveau des compila-teurs,
chacun des trois aspects décrits ci-dessus du travail inutile sera développé dans un paragraphe
de cette bibliographie. S’en suivra un paragraphe de discussion sur la possibilité de mêler ces deux
approches pour essayer d’obtenir une coopération compilation/exécution dans l’élimination des
instructions inutiles.
9

1.2 Compilation et travail inutile
1.2.1 Vous avez dit « instructions inutiles » ?
Il peut paraˆıtre surprenant au premier abord d’entendre parler de travail inutile dans un pro-gramme.
En effet, à partir du moment ou le programmeur demande d’effectuer un travail à la
machine, (encore que celui-ci ne soit pas infaillible. . .) ce travail doit avoir une utilité (au sens
informatique du terme bien entendu. . .). Cependant, au delà du programmeur, il existe toute une
chaˆıne de mécanismes permettant de passer du langage de haut niveau (i.e. langage de program-mation
classique) au code machine exécutable. Ainsi ce programme va passer par toute sortes de
transformations qui vont introduire du travail inutile. De plus, il est possible de trouver, dans la
fa¸con dont sont con¸cus les programmes, du travail inutile (redondance de calculs par exemple).
1.2.2 Instructions statiques inutiles
Pour commencer, il est important de rappeler ce que sont les instructions statiques et les ins-tructions
dynamiques. Une instruction statique est une instruction telle qu’on peut la trouver dans
le code source d’un programme. Une instruction dynamique est une instance d’instruction statique.
A chaque instruction statique peut correspondre plusieurs instructions dynamiques (autant que de
fois où l’on exécute cette instruction statique).
Exemple simple :
pour i de 1 à n faire
t[i] := 0;
fpour
Instruction statique : t[i] := 0
Instructions dynamiques associées : t[1] := 0, t[2] := 0, …, t[n] := 0
Dans l’exemple suivant, il est important de noter que si n n’est pas fixé lors de la compilation, la
seule connaissance du compilateur est l’instruction statique. Il ne pourra donc pas, à priori se servir
de la valeur de n à des fins d’optimisation. Supposons maintenant qu’un programme ne soit composé
que des instructions de l’exemple et n’affiche aucun résultat. Le compilateur peut en déduire que
l’ensemble du travail à effectuer pour exécuter cette boucle est inutile. Cependant, il suffit d’ajouter
une instruction qui utilise t[m] en lecture (m étant un paramètre d’entrée du programme inconnu
à la compilation) pour que, potentiellement, l’ensemble du travail de la boucle devienne utile. En
effet, le compilateur ne sachant pas quelle case du tableau t va être accédé, il est obligé de considérer
que l’ensemble de la boucle fournit du travail utile.
Il existe de nombreuses autres manières d’éliminer du travail inutile lors de la compilation [2, 4]
que nous n’aborderons pas ici car seul l’aspect décrit ci-dessus se rapproche des travaux visés dans
cette étude.
Dans la suite de cette bibliographie, nous ne nous intéresserons qu’aux instructions inutiles
dynamiques (i.e. qui ne peuvent pas être détectées par le compilateur puisqu’elles dépendent de
valeurs d’entrées du programme non connues au moment de la compilation).
10

1.3 Première approche :
Instructions inutiles détectées dynamiquement
1.3.1 Introduction
Les auteurs de l’article [1] se sont aper¸cus que le réarrangement des instructions fait par les com-pilateurs
lors des phases d’optimisations créé des instructions inutiles. En effet, comme le montre
leurs résultats, une compilation faite sans optimisations montre un niveau faible d’instructions in-utiles
alors qu’une compilation avec un fort niveau d’optimisation montre un taux d’instructions
inutiles relativement élevé (parfois supérieur à 10 %). Cependant, malgré ce travail effectué inuti-lement,
il est bon de rappeler que globalement, le temps d’exécution de ces programmes diminue
(i.e. on a bien l’effet désiré). La question qui vient alors est :
« Comment conserver ces optimisations tout en réduisant le travail inutile qui leur est associé ? »
1.3.2 Description du principe de détection et d’élimination des instructions
inutiles
Dans un premier temps, l’important est d’analyser les instructions exécutées inutilement afin
de savoir comment les détecter. Les auteurs de l’article [1] se sont ainsi aper¸cus que les instructions
dynamiques inutiles étaient très souvent des instances d’un nombre réduit d’instructions statiques.
Ces instructions statiques sont appelées des instructions partiellement inutiles. En marquant ces
instructions particulières comme étant propices à générer des instructions dynamiques inutiles,
il est possible de ne faire un traitement particulier que sur ces dernières afin de savoir si une
instance précise sera réellement inutile. Lors de l’exécution, pour chaque instance d’une instruction
partiellement inutile, une estimation de l’utilité de cette instruction dynamique sera faite. De cette
estimation découlera son exécution ou non. Dans le cas d’une mauvaise prédiction, un mécanisme
de récupération permet de lancer l’exécution de cette instruction au moment ou l’on apprend que
la prédiction est érronée.
1.3.3 Idées d’implémentation
Les auteurs de l’article [1] ont donné quelques idées d’implémentation qui pourraient être mises
en oeuvre pour la détection de ce type d’instructions. La plus simple consiste à mémoriser dans un
cache totalement associatif les instructions statiques ayant déjà généré des résultats inutiles par le
passé. Du fait qu’un faible nombre de ces instructions génèrent un grand nombre des instructions
dynamiques inutiles, ce cache permettra de « suspecter » la prochaine instance d’une instruction
statique ayant déjà généré des résultats inutiles.
Par la suite, lors de la détection d’une instruction dynamique « suspectée » d’être inutile, son
exécution sera suspendue jusqu’au « verdict » final permettant de savoir si il était juste de la sus-pecter.
Si tel est le cas, cette instruction ne sera pas exécutée, dans le cas contraire, cette instruction
sera exécutée ajoutant ainsi un surcoût dû au retard d’exécution pris par cette instruction. Il est
11

donc très important d’avoir une estimation la plus fine possible afin d’éviter ce genre de cas et afin
d’augmenter le nombre d’instruction inutiles suspectées à juste titre. Pour cela, des optimisations
sont proposées : utilisation de l’information de flot de contrôle et ajout d’un compteur deux bits à
saturation principalement.
Il est important de noter que ces implémentations ne tiennent pas compte des résultats calculés
qui ne servent qu’à des instructions inutiles. Autrement dit, cette implémentation ne prend pas en
compte le caractère transitif que peuvent avoir certaines instructions inutiles.
Instruction
produisant un résultat R
Instruction
utilisant R et produisant R’
Instruction
utilisant R’ et produisant R’’
Si R’’ est un résultat inutile R’ et R auront été produits inutilement
Fig. 1.1 – Mise en évidence de l’inutilité des instructions ne produisant des résultats utilisés que
par des instructions inutiles
1.3.4 Conclusion sur cette approche
En conclusion, nous pouvons dire que les auteurs de l’article [1] ont mis en évidence une quantité
non négligeable de travail inutile même si elle reste, aujourd’hui, difficile à exploiter. En effet, dans
un environnement où les ressources sont peu limitées, l’efficacité de l’implémentation décrite ci-dessus
offre des gains en performance négligeables. En revanche, dans des conditions de ressources
plus limitées, les gains peuvent atteindre 10 % d’amélioration des performances. De plus le fait
d’exécuter moins d’instructions permet une diminution de la charge des Unités Arithmétiques et
Logiques (UAL) et de la consommation électrique relativement importante. D’après les auteurs, un
mécanisme matériel diminuant l’impact des instructions inutiles sur la performance et la consom-mation
électrique permettrait d’appliquer des optimisations de code plus poussées à la compilation.
12

1.4 Deuxième approche :
Écritures silencieuses
1.4.1 Introduction
D’après les auteurs de l’article [5], il existe principalement deux types d’écritures silencieuses.
D’une part les mises à jours de valeurs silencieuses (qui ne changent pas l’état de la mémoire dans
laquelle elles écrivent) et d’autre part les écritures silencieuses stochastiques qui mettent à jour la
mémoire de manière prévisible. Dans la suite de ce chapitre, nous nous concentrerons sur les mises
à jour de valeurs silencieuses et parlerons, par abus de langage, d’écritures silencieuses pour les
désigner.
1.4.2 Le phénomène d’écriture silencieuse
Au vu de la définition de ce qu’est une écriture silencieuse, il parait difficile de croire que ces
instructions puissent avoir un impact négatif important sur les performances d’un programme.
Pourtant, les articles sur le sujet montrent que souvent plus de 30 % des écritures sont silencieuses
dans les applications testées. En effet, il existe de nombreux cas où, lors du parcours des éléments
d’un tableau, les modifications apportées par ce parcours ne concernent qu’un petit nombre des
éléments de ce tableau.
Exemples simples :
b := (b & t[i]);
fpour
t[i] := (t[i] & b);
fpour
(a) (b) (c)
t étant un tableau de booléens
b étant un booléen
l'opération & étant un "ET" logique
t[i] := t[i] + e(i);
fpour
t étant un tableau d'entiers
e étant une fonction
Dans l’exemple (a), nous pouvons voir que pour chaque case du tableau t dont le booléen est à
vrai, l’exécution du corps de la boucle ne produit aucun travail utile (la même valeur sera ré-écrite
dans b). Dans l’exemple (b), le simple fait que b soit égal à vrai entraˆıne une inutilité de l’ensemble
de la boucle. Dans l’exemple (c), lorsque "(i) renvoi zéro, le corps de la boucle peut-être considéré
comme inutile. Un autre cas assez fréquent de travail inutile est celui où un tableau est initialisé
après avoir été utilisé une première fois. Si lors de la première utilisation de ce tableau, toutes ses
valeurs n’ont pas été modifiées, il est inutile de ré-initialiser l’ensemble des cases de ce tableau.
Il existe d’autres situations dans lesquelles un grand nombre d’écritures silencieuses peuvent être
observées : lors de l’appel d’un sous-programme, si les registres sauvegardés n’ont pas été utilisés
dans ce sous-programme, leur restauration sera inutile. Ce même phénomène peut-être observé lors
de la sauvegarde/restauration de contexte d’un processus par un système d’exploitation.
13

1.4.3 Les conséquences de l’élimination des écritures silencieuses
Au delà du gain évident que provoquerait un mécanisme fiable de suppression des écritures
silencieuses, un tel système permettrait également de supprimer une certaine quantité de travail
assez importante liée à ces instructions. En premier lieu, les informations de contrôle liées à ces
instructions ne sont plus nécessaires (Ex : si une série d’écritures silencieuses se trouve dans une
boucle, il est inutile d’exécuter la boucle). De plus, lors de l’exécution d’une instruction de range-ment
en mémoire, tout un mécanisme lourd de rapatriement de la ligne de cache concernée vers la
mémoire est mis en place (écriture de la donnée dans le cache, marquage de la ligne de cache comme
étant modifiée puis, lors du chargement de nouvelles données dans cette ligne de cache, écriture
de l’ancienne ligne de cache considérée comme modifiée en mémoire). De fait, la suppression d’une
écriture évite d’avoir à passer par toute ces opérations d’accès à la mémoire très coûteuses. Comme
expliqué dans l’article [3], cette remarque prend encore plus d’importance dans un système multi-processeur
puisque à chaque écriture mémoire est associé un message d’invalidation à destination
des autres processeurs provoquant un défaut de cache lors du prochain accès à ces données. . . Il
est également important de noter que si certaines écritures ne sont pas effectuées, de fait, certaines
dépendances de données n’existent plus. De cette fa¸con, le processeur n’est plus obligé d’attendre
que ces valeurs soient écrites pour pouvoir les utiliser. Le rendement du pipeline du processeur est
alors amélioré.
1.4.4 Idées d’implémentation
Les auteurs de l’article [5] ont proposé une implémentation basique permettant de supprimer
les écritures silencieuses. Cette implémentation consiste à remplacer toute les opérations de ran-gement
en mémoire par trois opérations : Chargement de l’ancienne valeur présente en mémoire,
comparaison avec la valeur qui doit y être écrite et enfin, dans le cas où ces deux valeurs ne seraient
pas égales, écriture de la nouvelle valeur en mémoire. Cette méthode est sûre et permet de détecter
l’ensemble des écritures silencieuses. De plus, les lectures pouvant être servies en parallèles, il peut
être intéressant de remplacer les écritures par des lectures suivies de comparaisons. Cependant,
dans la mesure ou le nombre d’écritures silencieuses ne représente pas la majorité des écritures
mémoire, les auteurs ont ajouté une « implémentation parfaite » dans laquelle un mécanisme per-met
de savoir si une écriture va être utile et, dans ce cas, n’effectuera que l’écriture en mémoire
sans avoir à comparer la nouvelle valeur à la valeur précédente.
D’autres idées d’implémentations apparaissent également dans l’article [5] comme par exemple
la possibilité que la ligne de cache ne soit pas marquée comme modifiée lorsqu’elle re¸coit une écriture
silencieuse évitant ainsi d’avoir à propager l’écriture en mémoire centrale (avantage principal de
l’élimination des écriture silencieuses).
L’implémentation retenue pour les simulations faites par les auteurs de [5] est la première
proposée avec pour caractéristique supplémentaire que seules les écritures mises en attente vont
subir une vérification de leur utilité. Ce qui veut dire qu’une écriture survenant à un moment où au
moins un port d’écriture de la mémoire est disponible sera servie avant que la vérification de son
utilité n’ai pu être faite. De cette fa¸con, les performances des écritures ne sont jamais dégradées
puisque le mécanisme n’agit que sur la file d’attente des écritures afin de la réduire.
14

Les auteurs de l’article [5] ont mis en évidence une grande quantité de travail inutile à travers les
écritures silencieuses. En effet, les proportions d’écritures silencieuses obtenues lors des tests sont
parfois très importantes et laissent penser qu’elles pourraient avoir une influence très importante
sur les performances, notamment dans les systèmes dont la purge des lignes de cache en mémoire est
un goulet d’étranglement. Les auteurs mettent également en avant la réduction du trafic sur le bus
d’un système multiprocesseur à mémoire partagée qui est souvent un point critique dans ce type de
systèmes (ce trafic limite le nombre de processeurs sur un même bus). D’autres travaux élargissant le
thème de l’écriture silencieuse ont également été présentés comme celui sur les écritures silencieuses
temporaires [6] considérant que si une valeur en mémoire est modifiée puis remise à son ancienne
valeur et qu’aucune lecture ne soit intervenue sur la valeur transitoire, elle peut-être considérée
comme silencieuse. Ce modèle semble bien s’adapter aux cas décrits ci-dessus de sauvegarde et
de restauration de contexte fréquents (appel de sous-programmes, passage d’un processus à un
autre. . .).
15

1.5 Troisième approche :
Travail inutile global lors de l’exécution d’un programme
1.5.1 Introduction
Dans cette approche, la problématique est un peu différente de celle vue dans les deux premiers
paragraphes. En effet, le but de ces deux approches était de détecter (soit par prévision, soit de
manière dynamique) une catégorie d’instructions inutiles afin d’éviter leur exécution « au vol ».
Dans l’approche retenue pour le stage, il s’agit d’abord de regarder quelle est la quantité de travail
inutile de fa¸con globale (essayer d’évaluer l’ensemble du travail fait inutilement par un programme)
afin d’avoir ensuite une idée du type de comportement ou d’application exécuté par un processeur
qui produit le plus de travail inutile. De cette fa¸con, si certains résultats montrent une quantité non
négligeable de travail inutile dans certains types d’applications, il sera ensuite possible d’étudier
pourquoi ce travail inutile est si important et si il peut être évité d’une manière ou d’une autre.
1.5.2 Evaluer l’utilité d’une instruction ?
La méthode retenue ici pour évaluer l’utilité d’une instruction est assez simple : Une valeur qui
est affichée en sortie d’un programme est considérée comme un résultat utile. Toute instruction
ayant servi à calculer ce résultat est une instruction utile. Ainsi, les instructions utiles à un résultat
peuvent être représentées par un arbre de dépendance entre ces dernières dont la racine est le
résultat lui-même et chaque noeud représente les instructions utiles au calcul de ce résultat (aussi
bien les instructions de rangement/récupération en mémoire, de calcul et de branchement). Les
feuilles seront alors les valeurs d’entrées (paramètres fixés lors de la compilation ou de l’exécution)
du programme. En regroupant l’ensemble des arbres ainsi obtenus pour chaque résultat en un graphe
orienté dont les sources sont les résultats et les puits sont les valeurs d’entrée du programme, il
est possible d’identifier quelles sont les instructions réellement utiles au programme. En effet, les
instructions et les valeurs d’entrées inutiles au programme n’appartiendront pas à ce graphe et
seront ainsi mises en évidence.
16

Exemple simple :
a := lire();
b := VRAI;
c := 0;
si a=0 faire
b := FAUX;
c := 5;
fsi
si b alors écrire(c)
sinon écrire(a)
Exemple de graphe d’exécution si a vaut 0 :
écrire(a)
nécessite b
b := FAUX
branchement
correspondant
Test a=0
nécessite a
nécessite a
a := lire()
Valeur d’entrée
du programme
a := lire()
Valeur d’entrée
du programme
c := 5
c := 0
b := VRAI
Instructions exécutées
inutilement
Exemple de graphe d’exécution si a vaut 1 :
nécessite b nécessite c
Test a=0
nécessite a
a := lire()
Valeur d’entrée
du programme
écrire(c)
c := 0
Valeur d’entrée
du programme
Aucune instruction n’est
exécutée inutilement
b := VRAI
Valeur d’entrée
du programme
Cet exemple permet de mettre en évidence le fait que selon les valeurs d’entrées du programme,
il peut y avoir du travail inutile ou pas. De plus, il met en lumière (dans le cas où a vaut 1) le
fait que le test a=0 correspondant au branchement du « si » doit être pris en compte comme étant
du travail utile puisque de ce branchement vont dépendre les instructions qui vont suivre (Nous
pouvons dire que ces instructions « exigent » l’exécution de ce branchement et donc du test qui
permet de savoir si ce branchement doit être pris).
Cette méthode d’identification des instructions inutiles semble parfaite (même si elle ne prend
pas en compte certaines écritures silencieuses). Cependant, elle nécessite le déroulement complet du
programme afin de savoir si oui ou non une instruction dynamique du programme sera utile pour
un résultat final. De fait, cette méthode ne peut pas être utilisée directement pour éliminer « au
vol » les instructions inutiles. En revanche, elle permet d’exhiber de nombreux cas d’instructions
inutiles que les autres méthodes ne détectent pas. Par exemple, le cas d’une instruction inutile par
transitivité mis en évidence figure 1.1 sera détecté par cette méthode.
1.5.3 Mise en oeuvre
Comme décrit dans le sujet de stage, la mise en oeuvre de cette approche du travail inutile consis-tera
à élaborer un programme permettant de détecter les instructions dynamiques inutiles, d’après
la définition donnée ci-dessus, afin de faire des statistiques sur la quantité de travail inutile dans un
ensemble de programmes à tester. Différentes catégories de travail inutile pourront également être
mises en évidence (Ex : chargements inutiles, rangements en mémoire inutiles, calculs inutiles. . .).
Une fois les tests effectués, un travail de regroupement des applications testées selon les résultats
pourra être fait afin de dégager, éventuellement, des « motifs » de comportements permettant en-suite
de savoir quelles applications sont le plus concernées par quel type de travail inutile. Nous
pouvons imaginer, à partir de là, que des ébauches de solutions matérielles et/ou logicielles ne soient
17

trouvées pour réduire cette quantité de travail inutile. Cependant, l’objet du stage reste celui-ci :
« Concevoir et écrire un programme permettant de calculer la quantité de travail inutile dans un
programme particulier après son exécution » .
Dans ce sens, le travail à effectuer en stage sera, dans un premier temps, de réfléchir à la manière
de détecter quelles sont les instructions qui ont été exécutées inutilement lorsque l’exécution d’un
programme sera terminée (algorithme de construction puis d’exploration du graphe de dépendance
des instructions décrit dans cette section). Ces résultats devront ensuite être mis en forme afin de
dégager des statistiques sur la quantité de travail inutile (pourcentage d’instructions inutiles) et
sur la nature de ces instructions (de quel type d’instructions s’agit-il ?). Une fois cet algorithme
implémenté, il sera intéressant de le tester sur différent type de programme afin de savoir quelle
est la quantité de travail réellement inutile (d’après la définition donnée en introduction de cette
section) dans ces programmes.
En conclusion nous pouvons dire que l’approche retenue pour le stage est une démarche scien-tifique
expérimentale permettant de savoir quelle est la proportion globale de travail inutile dans
un programme. Si les résultats révèlent une grande quantité de travail inutile, de nombreuses
ouvertures paraissent possibles : Détection de ces instructions grâce à des compilateurs « intel-ligents
», détection de ces instructions « au vol » (approche déjà retenue par [1]), coopération
compilateur/matériel ou encore ajout de nouvelles instructions afin de faciliter leur détection.
18

1.6 Conclusion
En conclusion, nous pouvons dire que plusieurs manières d’éliminer le travail inutile ont déjà été
abordées (tant dans le domaine de la compilation qu’en architecture). En effet, lors de la compila-tion,
une certaine quantité de travail inutile peut déjà être supprimée (en fonction des informations
que le compilateur peut exploiter). Cependant, nous avons également vu que certaines optimisa-tions
de ces mêmes compilateurs génèrent des instructions inutiles. De fait, différentes méthodes ont
été proposées pour éliminer ce travail inutile lors de l’exécution (instructions dynamiques inutiles).
Une autre approche intéressante consistait à éliminer les écritures silencieuses, une autre forme de
travail inutile.
Après ce tour d’horizon global, il est assez difficile de savoir de manière précise quelle est la
quantité de travail inutile effectuée par un microprocesseur lors de l’exécution d’un programme.
C’est à cette question que va tenter de répondre le travail à venir en stage. . .
19

Chapitre 2
Compte rendu du stage
2.1 Introduction
2.1.1 Le travail inutile, qu’est ce que c’est ?
Le travail inutile est une notion difficile à cerner. Il existe différentes approches pour traiter le
problème du travail effectué inutilement par un programme. Tout d’abord, le travail inutile peut-
être de nature statique (détectable et supprimable lors de la compilation) ou de nature dynamique
(visible uniquement lors de l’exécution). L’élimination du travail inutile statique est déjà bien
connue et fait partie intégrante de toute chaˆıne de compilation optimisée digne de ce nom. Ici nous
nous intéresserons seulement au travail inutile de nature dynamique puisque ce dernier n’est pas
exploité par les processeurs ou les langages de programmation actuels.
Une fois le cadre du travail inutile dynamique posé, il est nécessaire de se donner une définition
précise du travail inutile afin de pouvoir en évaluer la quantité lors de l’exécution d’un programme
sur un jeu de données particulier de fa¸con automatique. Cette définition, dans un premier temps
très large, a été restreinte pour des raisons d’implémentation.
La définition prise comme base de départ à cette évaluation était la suivante :
Tout travail qui ne sert, ni directement, ni indirectement, à produire un résultat est jugé inutile.
De fa¸con plus précise :
Une instruction dynamique est considérée comme utile si
- Elle produit un résultat émis en sortie du programme (ex : affichage à l’écran).
- Elle produit un résultat utilisé comme opérande d’une instruction utile.
- C’est un branchement dominant une instruction utile.
20

Exemple simple :
instruction 1;
si booléen faire
instruction 2;
instruction 3;
fpour
instruction 4;
Dans cet exemple, le branchement conditionnel « domine » les instructions 2 et 3. Si le booléen
est vrai et que les instructions 2 et 3 sont inutiles, alors on peut considérer le branchement comme
inutile.
Note
Par abus de langage, dans la suite de ce document, nous désignerons toutes les instructions de
transfert de contrôle (branchement conditionnels et inconditionnels, sauts, appels de fonctions. . .)
par l’expression « instruction de branchement ».
En regardant cette définition de plus près, un problème se pose dans le cas général : Supposons
que l’instruction 2 soit un « store » qui range une valeur à une adresse mémoire, que l’instruction
4 soit un « load » et que le booléen soit à faux. Dans ce cas, si l’instruction 4 est considérée
comme utile et si les deux accès pointent sur la même adresse mémoire, alors le branchement devra
être considéré comme utile. Cependant, l’adresse de l’accès à la mémoire qui aurait pu être fait
par l’instruction 2 n’est pas connue puisque cette instruction n’a pas été exécutée. A cause de ce
type d’accès à la mémoire (dont l’adresse accédée n’est connue qu’à l’exécution) nous avons du
faire l’hypothèse conservatrice suivante : Toutes les instructions de branchements sont considérées
comme utiles.
Ce qui nous donne la définition suivante :
Une instruction dynamique est considérée comme utile si
- Elle produit un résultat émis en sortie du programme (ex : affichage à l’écran).
- Elle produit un résultat utilisé comme opérande d’une instruction utile.
- C’est un branchement.
Note
Par abus de langage, dans la suite de ce document, nous utiliserons le mot « ressource » pour
désigner soit un registre soit un emplacement mémoire.
Partant de cette nouvelle définition, l’objectif était de construire un graphe de dépendance de
donnée en reliant les instructions lisant une ressource à la dernière instruction ayant écrit dans cette
même ressource. De cette fa¸con, lorsqu’une ressource apparaˆıt comme utile (lorsque sa valeur est
écrite en sortie ou qu’elle est utilisée par une instruction de branchement), il devient possible, en
parcourant les arcs de ce graphe, de trouver toutes les instructions qui ont été utiles pour produire
21

ce résultat (le résultat est un graphe ressemblant à la figure 2.2 page 25).
2.1.2 Notre protocole de test
A partir de cette définition, nous avons essayé de mesurer la quantité de travail inutile dans des
petits programmes d’exemple, puis, une fois ces exemples validés, nous avons testé notre protocole
pour mesurer le travail inutile sur un programme plus conséquent et surtout n’ayant pas été con¸cu
dans le but d’en mesurer la quantité de travail inutile. Pour faire nos tests, nous avons choisi
l’utilitaire de compression/décompression de données gzip.
22

2.2 La méthode utilisée
2.2.1 L’algorithme
Pour construire notre graphe de dépendance de donnée, nous avons choisi d’instrumenter chaque
instruction assembleur afin de contrôler de fa¸con précise les entrées et les sorties de chacune d’elles.
Les entrées étant les opérandes d’une instruction (les ressources étant lues par l’instruction) et les
sorties étant les résultats d’une instruction (les ressources étant écrites par l’instruction).
Dans le cas général, notre implémentation de la détection de dépendance de donnée peut se
résumer par l’algorithme 1.
Algorithme 1: Construction du graphe de dépendance de donnée
Entrée : Programme dont on veut évaluer la quantité de travail inutile.
Données à fournir en entrée à ce programme.
Sortie : Graphe de dépendance de donnée dynamique.
1 pour chaque instruction exécutée faire
2 Créer une représentation interne de cette instruction;
3 L’ajouter à la liste des instructions dynamiques exécutées;
{Cette représentation interne contient des informations concernant l’instruction : son
numéro dynamique, le fichier source auquel elle appartient, son numéro statique dans ce
fichier, son type. . . }
4 pour chaque opérande de l’instruction {ressource lue} faire
5 Lire dans la table des ressources quelle est la dernière instruction qui a écrit dans
cette ressource;
6 Créer un lien de dépendance {arc dans le graphe} entre l’instruction courante et la
dernière instruction ayant écrit dans la ressource en question;
{Associe à l’opérande le numéro de l’instruction dynamique qui l’a produit}
fin
7 pour chaque résultat de l’instruction {ressource écrite} faire
8 Ecrire dans la table des ressources que l’instruction courante a modifiée l’état de
cette ressource;
fin
fin
Une fois cet algorithme exécuté sur un programme particulier, il est possible de connaˆıtre les
dépendances directes entre les instructions grâce aux arcs construits mais aussi les dépendances
indirectes grâce aux chemins formés par des suites d’arcs dans le graphe (le graphe de la figure 2.2
page 25 en est un exemple).
En ajoutant à l’algorithme précédent une condition dans la boucle principale permettant de
parcourir le graphe construit lorsqu’on rencontre une instruction de sortie (affichage), il devient
23

possible de connaˆıtre les instructions utiles lors de l’exécution d’un programme (d’après la première
définition donnée ci-dessus) (cf. algorithme 3).
Procédure Parcours du graphe (Noeud)
1 si le noeud est marqué inutile alors
2 Marquer ce noeud {représentant une instruction} comme étant utile;
pour chaque noeud opérande de ce noeud faire
3 Appeler la procédure Parcours du graphe (Noeud opérande);
fin
fin
Algorithme 3: Détection des instructions inutiles
Entrée : Graphe de dépendance de donnée dynamique.
Sortie : Quantité d’instructions dynamiques inutiles.
Localisation de ces instructions dans le code source.
pour chaque noeud du graphe faire
si le noeud représente une instruction de sortie ou de branchement alors
Appeler la procédure Parcours du graphe (Noeud);
fin
fin
Numéro d'instruction dynamique
Identificateur d'instruction statique
Type de l'instruction
Nombre d'opérandes
Liste des instructions ayant écrit en dernier dans les opérandes
Fig. 2.1 – La structure de donnée d’un noeud du graphe
Un point intéressant de cet algorithme, dont nous nous sommes rendu compte une fois l’implé-mentation
opérationnelle, est qu’il permet de détecter les accès fait en lecture à une zone mémoire
non initialisée préalablement. Par exemple, si un tableau de taille n est déclaré et initialisé, le fait
de tenter d’accéder à l’adresse de la zone mémoire n+1, qui n’a donc pas était initialisée, provoque
une incohérence dans l’algorithme puisqu’il est impossible de trouver la dernière instruction ayant
écrit dans cette zone mémoire (ligne 5 dans l’algorithme 1 page précédente). De cette fa¸con, il est
possible de trouver, lors de l’exécution, une erreur d’accès à la mémoire.
24

39
40 38
36
37
35
34
3
14
33
0
13
25
24
32
31
30
29
28
26
27
23
17
16
22
21
20 19
18
15
9
12 11
8
10
7
2
6
5
4
1
Dans ce graphe, les noeuds sont étiquetés par les numéros dynamiques des instructions (ordre
d’exécution). Les noeuds en gris sont des instructions inutiles alors que les noeuds en noir sont des
instructions utiles.
Les instructions dynamiques 4, 12 et 20 sont issues d’une seule et même instruction statique de
rangement en mémoire dont seulement une instance est utile : l’instruction dynamique numéro 12.
Fig. 2.2 – Exemple de graphe généré par l’algorithme 1 & 3
25

2.2.2 L’optimisation
Le gros problème de cette approche est que le graphe devient très rapidement énorme, même
avec des programmes de petite taille. En effet, étant donné qu’il faut conserver des informations
concernant chaque instruction dynamique jusqu’à la fin de l’exécution, seule une exécution ayant
un nombre réduit d’instructions dynamiques peut être envisagée (aux alentours de 300 000 dans
notre implémentation).
Nous avons donc tenté de réduire le graphe au maximum en éliminant au cours de l’exécution
les informations qui ne nous étaient plus nécessaires.
Ce qui est fait. . .
Dans un premier temps, pour réduire ce graphe et donc augmenter la taille des programmes
testables, nous avons décidé de supprimer à la volée les informations concernant les instructions
« certifiées » utiles. Ces informations étant le noeud représentant cette instruction et les arcs sor-tant
de celle-ci. Ces informations ne sont plus d’aucune utilité une fois que le parcours de l’arbre
dont cette instruction est la racine est effectué. Il est alors possible de les supprimer sans perdre
d’information utile à notre calcul de quantité de travail inutile. Cette méthode permet, à mesure
que le programme se déroule et envoi des informations en sortie, (affichage. . .) de réduire le graphe.
Il est alors d’autant plus réduit que la quantité de travail utile est importante (sur nos tests, le gain
réel en occupation mémoire est d’un facteur trois à quatre ce qui permet de tester des programmes
dépassant le million d’instructions dynamiques sans avoir un temps d’exécution rédhibitoire).
La courbe de l’occupation mémoire de l’algorithme au cours du temps devient alors identique
(à quelques détails d’implémentation près) à la courbe représentant la quantité de travail inutile
cumulé (figure 2.9 page 40).
Quelques petites optimisations ont aussi étaient apportées au programme concernant le temps
d’exécution. Bien que ce facteur ne soit pas le point crucial de notre algorithme, il semblait
intéressant de s’y pencher pour éviter d’avoir des durées de tests trop importantes.
Nous avons par exemple, à la ligne 1 de la procédure Parcours du graphe page 24, supprimé le
parcours d’une branche lorsque cette dernière possède comme racine une instruction utile. En effet,
si tel est le cas, cela signifie que cette branche a déjà été entièrement explorée et qu’il est inutile de
la parcourir à nouveau.
Ce qu’il reste à faire. . .
Dans un second temps, il est intéressant de voir que si une instruction écrit dans une ou plu-sieurs
ressources, puis que ces ressources sont de nouveau écrites sans être lues entre temps, les
informations concernant cette instruction inutile ne nous serviront jamais puisque cette instruction
ne sera jamais rendue utile (notion de « valeur morte »). De cette fa¸con, il est possible, ici encore,
26

de réduire notre graphe en supprimant les noeuds représentant ce type d’instructions ainsi que leurs
arcs sortants.
Une manière simple d’implémenter un tel mécanisme serait de considérer que chaque instruction
inutile est un objet et que les ressources (registres et zones mémoire) sont des moyens d’accéder à ces
objets. Si une instruction est accessible depuis au moins une ressource, alors il n’est pas possible
de supprimer les informations concernant cette instruction. En revanche, si aucune ressource ne
« référence » l’objet, alors cet objet est inaccessible depuis les ressources et le restera jusqu’à la fin
de l’exécution du programme. Cet objet peut donc être supprimé (noeud ainsi que ses arcs sortants).
Cette méthode s’apparente à un système de ramasse-miettes comme il est souvent mis en place dans
un environnement d’exécution pour libérer des zones mémoires n’étant plus référencées par aucun
pointeur.
2.2.3 Le résultat
La figure 2.3 page suivante est un exemple simple permettant de comprendre comment est
construit le graphe de dépendance de donnée à partir du code assembleur du programme dont on
veut évaluer la quantité de travail inutile.
Dans la figure 2.3 page suivante, les noeuds sources sont les instruction utiles par hypothèse (en
caractère gras). Ces instructions sont soit des instructions de sortie (print %valeur dans l’exemple)
soit des instructions de branchement (bne boucle dans l’exemple). Une fois ces instructions jugées
comme étant utile au programme, nous pouvons appliquer la définition récursive permettant de
trouver toutes les instructions ayant servi à produire les valeurs utiles à ces instructions. Ainsi,
dans notre exemple, l’instruction dynamique numéro 18 (print %valeur) possède comme entrée le
registre %valeur. Il est donc nécessaire de trouver la dernière instruction ayant écrit dans ce registre.
Cette instruction est l’instruction dynamique numéro 17 (load [@tab+2],%valeur). Ainsi de suite
récursivement, l’instruction dynamique numéro 17 possède comme entrée la seconde case du tableau
rangé à l’adresse mémoire @tab dont la dernière écriture a été faite par l’instruction dynamique
numéro 8 et ainsi de suite jusqu’à n’arriver qu’à des instructions n’ayant aucune entrée (copie
d’une constante dans un registre (mov 1,%indice dans l’exemple), instruction d’entrée au clavier
par l’utilisateur. . .).
De cette manière, en parcourant le graphe, il est possible d’identifier le travail utile. Les ins-tructions
n’étant accessible depuis aucune des sources (instructions de sorties ou de branchement)
sont identifiées comme étant du travail inutile (instructions dynamiques 2, 3, 12 et 13 dans notre
exemple).
Grâce à cet exemple, nous avons mis en évidence un cas simple comportant peu de travail inutile.
En revanche, il est facile de prendre conscience de l’importance que peut atteindre ce travail inutile
dès lors que le traitement à l’intérieur d’une boucle du type de celle présentée dans l’exemple devient
important. En effet, dans notre exemple, seule la multiplication par 10 et le rangement en mémoire
sont inutiles mais si la valeur à ranger dans le tableau avait été un calcul effectué par une fonction
comportant 10 000 instructions, les chiffres auraient été différents. De même, si la taille du tableau
avait été de 10 000 cases dont seulement une aurait été utilisée, la quantité de travail inutile aurait
été beaucoup plus importante. En revanche si, dans notre exemple, les trois cases du tableau avaient
27

1: mov 1,%indice
boucle:
2: mul %indice,10,%valeur
3: store %valeur,[%indice+@tab-1]
4: add %indice,1,%indice
5: cmp 4,%indice
6: bne boucle
7: load [@tab+2],%valeur
8: print %valeur
Code en assembleur RISC
(code statique)
Dépendances de données permettant d’identifier le travail
utile (arcs du graphe parcourus par l’algorithme).
Dépendance de donnée n’étant pas parcourues par
l'algorithme.
Trace d’exécution des instructions
(dynamique)
1ère itération de la boucle
2ème itération de la boucle
3ème itération de la boucle
Numéro
Dynamique
Numéro
Statique
123456789
10
11
12
13
14
15
16
17
18
123456234562345678
n Numéro d’instruction statique utile par essence
(instructions de sorties ou de branchement).
n Numéro d’instruction statique utile après parcours du
graphe de dépendance (définition récursive).
n Numéro d’instruction dynamique (indique l’ordre
d’éxécution des instructions dans le temps)
n
Numéro d’instruction statique jugés comme étant inutile
d’après la définition (instruction n’appartenant pas au
graphe de dépendance de données).
Compilation
Pour i de 1 à 3 faire
t[i] := i*10;
Finpour
Ecrire (t[2]);
Code source original
Fig. 2.3 – Du code source en langage de haut niveau au graphe de dépendance de donnée dynamique
été affichées (instruction print), la quantité de travail inutile aurait été nulle.
Un exemple plus complet montrant dans le détail comment l’algorithme a été implémenté est
en annexe (figure 3.2 page 59).
28

2.3 L’environnement de travail : Les choix de mise en oeuvre
2.3.1 Les Outils
Pour la mise au point de notre programme d’évaluation de la quantité de travail inutile, plusieurs
outils ont été mis à contribution :
- Salto : Salto est une bibliothèque de fonctions permettant d’analyser du code source en
assembleur pour en extraire les informations sémantiques sous une forme exploitable en C++.
Ces informations peuvent être de différentes natures : Il est possible de connaˆıtre le découpage
en blocs de base du code source, les ressources utilisées par une instruction précise (dans notre
cas, ce qui nous intéresse sont les accès à la mémoire et aux différents registres). De plus,
une des fonctionnalité indispensable à notre réalisation disponible dans Salto est la possibilité
d’instrumenter le code source (figure 2.4 page suivante).
- Le compilateur GCC pour processeur Sparc : Compilateur C/C++ gratuit sous licence GNU.
- Le compilateur CC pour processeur Sparc : Compilateur C propriétaire de Sun disponible
seulement pour la plateforme Sparc.
- Les expressions régulières en C.
2.3.2 L’instrumentation
L’instrumentation c’est quoi ?
L’instrumentation d’instruction est un mécanisme qui consiste à insérer des instructions supplé-mentaires
entre les instructions du code source d’un programme déjà établi afin « d’ausculter » ce
dernier. Les informations qu’il est possible de récupérer par ce mécanisme sont de nature dynamique
puisque les instructions rajoutées par instrumentation sont exécutées autant de fois que le sont les
instructions appartenant au code source d’origine. Prenons comme exemple le cas d’une boucle
dont le corps est exécuté n fois, alors le code rajouté par instrumentation du code source d’origine
dans le corps de cette boucle sera lui aussi exécuté n fois. Ceci permet de savoir de fa¸con précise
quelles sont les instructions statiques qui ont été exécutées par le processeur séquentiellement. De
plus, l’instrumentation permet de récupérer d’autres informations dynamiques comme les adresses
des accès à la mémoire.
Dans l’exemple de la figure 2.4 page suivante, le code source original est instrumenté afin de
récupérer la valeur du résultat produit par l’instruction à instrumenter et pour le traiter dans la
fonction fct (tmp étant par exemple un registre de débuggage dont le code source original ne fait
jamais usage mais qui peut être utilisé par la fonction fct pour effectuer son traitement).
29

mov r1,r2
add r2,3,r2
store r2,[a0]
Code source
mov r1,r2
mov r2,tmp
call fct
add r2,3,r2
mov r2,tmp
call fct
store r2,[a0]
load [a0],tmp
call fct
Code source
instrumenté
instrumentation
Fig. 2.4 – Instrumentation de code source en assembleur
Note
Dans l’exemple de la figure 2.4, les instructions sont instrumentées après leur exécution, ce
qui n’est pas le cas dans notre implémentation : l’instrumentation se trouve avant l’exécution de
l’instruction pour des raisons de suivi des branchements (pour pouvoir instrumenter correctement
les branchements, il est nécessaire de placer le code d’instrumentation avant ceux-ci).
L’instrumentation dans notre programme
L’instrumentation, dans le cas général, permet d’insérer des instructions dans un programme. A
partir de ce concept simple, nous avons décidé d’utiliser l’instrumentation pour insérer des appels
de fonctions (écrites en C et compilées par ailleurs). De fait, les appels de fonctions en assembleur
ne faisant pas de sauvegarde des registres globaux (accessible de n’importe où dans le programme).
Il nous a fallu ajouter à cette instrumentation une sauvegarde de contexte avant l’appel à cette
fonction puis une restauration après (figure 2.5 page suivante). Mais ce n’est pas tout : Chaque
instruction assembleur ayant un nombre variable d’opérandes et de résultats, il nous a fallu ajouter
une instruction d’appel à une fonction pour chaque opérande et pour chaque résultat. De plus,
chaque accès à la mémoire nécessitant la récupération de l’adresse de cet accès, il nous a fallu
récupérer des informations sur la valeur des registres utilisés par l’instruction à instrumenter afin
de savoir quelle était l’adresse de cet accès mémoire.
L’instrumentation d’une instruction dans notre programme d’évaluation de la quantité de travail
inutile peut-être résumée en sept phases :
– Sauvegarde : Une phase de sauvegarde du contexte (registres globaux, décalage de la fenêtre
de registres. . .).
– Début : Une phase de création de la structure de donnée représentant une instruction (fi-gure
2.1 page 24).
– Opérandes : Une phase permettant de créer les arcs vers les instructions ayant écrit en
dernier dans les ressources opérandes de l’instruction.
30

inst1
inst2
inst3
Code source
sauvegarde
call fct
restauration
inst1
sauvegarde
call fct
restauration
inst2
sauvegarde
call fct
restauration
inst3
Code source
instrumenté
instrumentation
Fig. 2.5 – Principe de l’instrumentation faite par le programme d’évaluation de la quantité de
travail inutile
– Milieu : Une phase, utile seulement pour les instruction « save » et « restore », permettant
de mettre à jour le niveau de la fenêtre de registres.
– Résultats : Une phase permettant de mettre à jour l’état des ressources en fonction des
résultats produits par l’instruction.
– Fin : Une phase permettant d’évaluer l’utilité de l’instruction courante. Si cette dernière est
utile, on parcour son arbre de dépendance de donnée.
– Restauration : Une phase de restauration du contexte.
2.3.3 Le choix de la Plateforme
Pour choisir notre plateforme de travail, nous avons pris en compte plusieurs paramètres. Nous
avions le choix entre le jeu d’instruction x86 (CISC) et le jeu d’instruction Sparc (RISC). En premier
lieu, l’outil mis à notre disposition (Salto) semblait plus adapté à un jeu d’instruction réduit.
En effet, Salto étant basé sur la reconnaissance des instructions assembleur par des expressions
régulières, il est très difficile de supporter un jeu d’instruction aussi vaste que le x86 d’Intel (CISC).
De fait, le support d’un tel jeu d’instruction par Salto est apparu comme étant insuffisant. De plus,
le travail à effectuer étant, entre autre, d’identifier les accès à la mémoire, un jeu d’instruction
réduit avec seulement une instruction pour le chargement et une pour le rangement en mémoire
nous est apparu plus simple à manipuler. Cependant, le Sparc possède quelques inconvénients qui,
nous le verrons plus loin, ne nous ont pas facilité la tâche. Nous avons donc décidé de travailler
avec un jeu d’instruction RISC pleinement supporté par Salto : le Sparc de Sun.
31

2.3.4 SPARC : Le Meilleur des Mondes ?
Le Sparc est une architecture RISC assez classique ce qui signifie que le nombre d’instructions
est assez réduit, qu’elles ont toutes la même taille (quatre octets pour le Sparc) et que, chose
relativement importante pour notre implémentation, les instructions d’accès à la mémoire sont au
nombre de deux (load pour charger une valeur de la mémoire vers un registre et store pour ranger
une valeur d’un registre vers la mémoire). Tout aurait été parfait si la description du Sparc s’était
arrêtée là. . .
- Le delay slot est une des particularités de l’architecture Sparc. Il s’agit d’exécuter l’instruc-tion
qui suit immédiatement une instruction de branchement avant que cette instruction de
branchement ne modifie le flot de contrôle de l’exécution du programme. Pour résumer, l’ins-truction
qui se trouve dans le delay slot d’un branchement (elle se trouve juste après dans le
code source) se comporte comme si elle se trouvait avant le branchement pour ce qui est du
contrôle mais comme si elle était après pour ce qui est des données.
- L’annul bit est une autre particularité « amusante » du Sparc qui est en relation directe avec le
delay slot. Lorsqu’une instruction se trouve dans le delay slot d’un branchement dont l’annul
bit est activé, (be,a : la virgule et le a indique que l’annul bit est activé) cette instruction ne
s’exécute que lorsque le branchement est pris. Dans le cas contraire, l’instruction se trouvant
dans le delay slot n’est pas exécutée (on dit qu’elle est annulée).
- La fenêtre de registres tournante est une fa¸con de pallier à la lenteur des accès à la pile lors du
passage de paramètres à une fonction. En effet, le Sparc se propose de résoudre le problème
du passage de paramètres à une fonction de manière originale au moyen de cette fenêtre de
registres tournante. Il s’agit de ranger les valeurs que l’on souhaite passer en paramètres à
la fonction qui va être appelée dans des registres spéciaux nommés registres de sortie (%o0
à %o5) qui, une fois la fonction appelée, seront renommés en registres d’entrée (%i0 à %i5)
(cf. figure 2.6 page suivante). De cette fa¸con, la fonction appelée peut se servir de ces valeurs
sans qu’elles n’aient été recopiées dans une quelconque pile (à l’exception du cas où la taille
de la fenêtre de registres tournante n’est pas suffisante).
Le delay slot
Dans notre implémentation, nous avons du prendre en compte cette particularité de l’archi-tecture
Sparc. En effet, afin d’instrumenter les instructions se trouvant dans le delay slot d’un
branchement, nous avons du utiliser différentes techniques consistant à « remonter » notre instru-mentation
de ce type d’instructions avant le branchement. Ceci à conduit à pas mal de problèmes
de cohérence entre la représentation des instructions créées par l’instrumentation et les instructions
réellement exécutées.
Mais le cas où le delay slot nous a posé le plus de problème est celui où il nous a fallu ajouter des
sauts afin d’éviter l’exécution de certaines instructions. En effet, dans ce cas, si l’instruction que l’on
veut « sauter » se trouve dans le delay slot d’un branchement, il faut dupliquer cette instruction
des branchement : mettre dans le code source une version normale avec l’instruction qui se trouvait
dans son delay slot dans le code source d’origine et une seconde version du même branchement
contenant un nop dans son delay slot. De cette fa¸con, selon que l’instruction se trouvant dans le
32

delay slot de ce branchement doit être exécutée ou non, le flot de contrôle est aiguillée vers l’une
ou l’autre des deux versions de ce branchement. Il faut ensuite faire converger les deux versions en
un même point représentant la suite du programme.
La fenêtre de registres du Sparc
La fenêtre de registre tournante est une des particularité du processeur Sparc. Nous allons en
expliquer rapidement le principe afin d’exposer la manière dont nous avons traité cette particularité
dans notre programme.
Registres de sortie
%o0 à %o7
Registres locaux
%l0 à %l7
Registres d’entrée
%i0 à %i7
Registres accessibles
au niveau n+1
niveau n
Registres de sortie
%o0 à %o7
Registres locaux
%l0 à %l7
%i0 à %i7
Désigne les mêmes
registres physiques
Registres de sortie
%o0 à %o7
Registres locaux
%l0 à %l7
%i0 à %i7
niveau n+2
Désigne les mêmes
registres physiques
L’instruction « save » permet de passer d’un niveau n à un niveau n+1 (utilisé généralement comme
une sauvegarde de contexte avec en plus la possibilité de passer des paramètres d’un contexte à
l’autre au niveau de la zone de recouvrement de la fenêtre n et n+1).
L’instruction « restore » permet de passer d’un niveau n à un niveau n-1 (utilisé généralement
comme une restauration de contexte avec en plus la possibilité de passer des résultats d’un contexte
à l’autre au niveau de la zone de recouvrement de la fenêtre n et n-1).
Fig. 2.6 – Le principe de la fenêtre de registres du Sparc
Lorsque le nombre de registres utilisés dépasse le nombre de registres physiques réellement
présents dans le processeur, un mécanisme invisible pour l’utilisateur utilise une pile en mémoire
pour sauvegarder la fenêtre de registres la plus ancienne et réutiliser ainsi cette dernière comme
une nouvelle fenêtre vierge. De cette fa¸con, le nombre de registres virtuellement utilisables par
l’utilisateur n’est limité que par la taille de la pile et non par la taille du fichier de registres dans le
processeur. Cette fenêtre est souvent représentée, dans les différentes documentations sur le Sparc,
de fa¸con circulaire pour montrer que la plus ancienne fenêtre et la plus récente peuvent se recouvrir
si le nombre de fenêtres disponibles dans le fichier de registres est insuffisant pour l’exécution d’un
programme donné.
33

2.3.5 S’affranchir de la numérotation des registres faite par Salto
Les registres du Sparc s’organisent en deux parties. D’une part, des registres dit globaux qui se
comportent de manière classique, et d’autre part une fenêtre de registres coulissante comme décrit
sur la figure 2.6 page précédente. Pour les registres globaux, nous avons utilisé la numérotation
proposée par Salto qui convenait tout à fait étant donné qu’un nom de registre désigne toujours le
même registre physique.
En revanche, pour la fenêtre de registres coulissante, nous avons du mettre en place notre propre
système d’identification de registres :
En effet, Salto étant un outil qui travaille sur du code assembleur, il lui est impossible d’avoir
accès à des informations concernant l’exécution du programme (les seules informations disponible
au niveau de Salto sont les informations statiques sur le programme). De fait, les informations
que nous donne Salto concernant les accès aux registres sont les noms de ces registres. Il lui est
impossible de connaˆıtre le niveau de la fenêtre de registre en un point donné du code et donc de
désigner un registre physique de manière unique. Afin d’identifier de manière unique chacun des
registres physiques, il a donc fallu s’affranchir du système de numérotation des registres proposé
par Salto pour le remplacer par un calcul fait de manière dynamique (au cours de l’exécution du
programme) permettant de savoir à quel registre physique correspondait chaque accès à un registre
appartenant à la fenêtre de registre courante.
Pour ce faire, nous avons instrumenté les instructions save qui décalent la fenêtre de registre
vers le haut et les instructions restore qui décalent la fenêtre de registre vers le bas (cf. figure 2.6
page précédente). De cette fa¸con, il est possible de tenir à jour une variable globale indiquant le
niveau actuel de la fenêtre de registre. En utilisant ce niveau comme décalage par rapport à un
point de référence, (la première fenêtre disponible lors du lancement du programme) il est possible
de savoir dans quelle fenêtre de registre seront fait les accès aux registres de la fenêtre courante
indiqués par Salto.
Grâce à cette méthode, il est possible d’identifier de manière unique chacun des registres d’une
fenêtre précise même si celle-ci peut avoir été sauvegardée dans la pile par manque de place dans
le fichier de registres. Les accès à ces registres restent ce qu’ils sont puisque cette opération est
transparente pour l’utilisateur du processeur (en l’occurrence notre programme).
2.3.6 Les expressions régulières
L’utilisation des expressions régulières est particulièrement utile pour analyser une chaˆıne de
caractères ayant un motif fixe et une partie variable. C’est justement le cas d’une instruction
assembleur dont la partie fixe est le mnémonique de cette instruction et dont les parties variables
sont les arguments.
De cette fa¸con, nous avons utilisé les expressions régulières pour « découper » les instructions
load et store en plusieurs parties : le mnémonique d’une part (permettant de connaˆıtre la taille de
l’accès à la mémoire : octet, mot, double mot ou quadruple mot) et les arguments d’autre part. Une
34

fois chaque argument récupéré, il est possible d’accéder aux valeurs contenues dans les registres
et aux éventuelles constantes. Il est donc possible de connaˆıtre de fa¸con exacte à quelle adresse
mémoire va accéder l’instruction et à combien d’octets elle va accéder.
De plus, les expressions régulières nous ont été utiles pour récupérer les étiquettes des appels
de fonctions afin de savoir si ces fonctions étaient définies en local (dans le code source du pro-gramme
étudié) ou si elles appartenaient à une bibliothèque externe au programme (stdio en C
par exemple).
2.3.7 La gestion des fonctions
Une fois notre définition implémentée et testée, il reste encore de nombreux problèmes à résoudre
pour pouvoir confronter cet algorithme au « monde réel » (à des programmes classiques tel que
gzip). En effet, ce modèle théorique serait parfait si l’ensemble du code source assembleur d’une
application était visible par le programme d’évaluation. Or les programmes classiques utilisent des
fonctions définies dans des bibliothèques dont on n’a pas le code source (Un programme en C
travaillant sur des fichiers utilisera par exemple stdio pour lire et écrire dans un fichier). Afin de
régler cette difficulté, nous avons du utiliser l’options de compilation -SO de cc permettant de savoir
quels sont les registres du Sparc et les adresses mémoires utilisées dans la pile comme paramètres
lors de l’appel à une fonction. Ainsi, il nous a été possible de rajouter « artificiellement » des arcs
de dépendance entre l’appel à une fonction définie dans une bibliothèque externe (call printf
par exemple) et les paramètres passés à cette fonction. Pour cette raison, cc pour Sparc est apparu
comme étant idéal dans notre protocole de test.
Afin de résoudre ce problème, les fonctions appelées par le programme étudié ont été classées
en trois catégories, chacune correspondant à un traitement particulier à faire pour les prendre en
compte correctement :
Les fonctions « internes »
Les fonctions internes sont les fonctions dont le code source est disponible (peut-être utilisé par
notre programme d’évaluation). Les appels à ce type de fonctions peuvent donc être traités comme
de simple branchements inconditionnels puisque les arcs du graphe de dépendance peuvent très bien
relier une instruction appartenant à cette fonction à une instruction appartenant au programme
appelant. Le graphe de dépendance de donnée n’est donc pas interrompu par un tel appel de
fonction.
Les fonctions « externes » utilisant des pointeurs
Les fonctions externes sont les fonctions dont le code source n’est pas disponible (code source
d’une bibliothèque d’entrée/sortie par exemple). Dans ces cas là, il est nécessaire de considérer que
les paramètres passés à la fonction sont lus par l’instruction d’appel de la fonction et que le résultat
35

est écrit par cette instruction.
Cependant, dans le cas général, il est nécessaire de détourner l’appel à une telle fonction pour
faire ajouter « artificiellement » des arcs de dépendance de donnée pour traiter les données qui
vont être lues et écrites à l’intérieur de cette fonction. En effet, notre programme est incapable
de connaˆıtre le type des paramètres d’une fonction (si il s’agit d’entiers, de pointeurs. . .) et donc,
de savoir si une fonction définie dans une bibliothèque dont on n’a pas le code source accède ou
non à une zone mémoire dont l’adresse est un de ses paramètres. De plus, même en sachant qu’un
paramètre est un pointeur, rien ne dit si la fonction dont on n’a pas le code source va y accéder
en lecture, en écriture ou pire encore, à combien d’éléments elle va accéder ! (Il ne faut pas oublier
qu’en C les tableaux sont implicites et que, par conséquent, on ne connaˆıt pas leur taille simplement
en connaissant l’adresse de leur premier élément). Afin de régler cette difficulté, nous avons choisi de
détourner les appels à ces fonctions (au nombre de trente cinq dans gzip) afin de leur faire exécuter
du code permettant de simuler leur comportement en matière d’accès à la mémoire. Ces fonctions
sont, le plus souvent des fonctions d’entrées/sorties (ex : read, write, fflush. . .), des fonctions de
lecture/écriture dans des chaˆınes de caractères (ex : strcat, strcpy, strcmp. . .) ou des fonctions
de lecture/écriture de zones mémoire en général (ex : memset, memcpy, memcmp. . .).
Exemple simple :
char *my_strcpy(char *c1, const char *c2)
{
/* On simule un accès en lecture à une zone mémoire débutant à l’adresse
contenue dans le pointeur c2 et de longueur strlen(c2)+1 (taille de la
cha^ıne de caractère à lire avec son terminateur) */
instrumentationEntreeMemoire((int)c2, strlen(c2)+1);
/* On simule un accès en écriture à une zone mémoire débutant à l’adresse
contenue dans le pointeur c1 et de longueur strlen(c2)+1 (taille de la
cha^ıne de caractère à copier avec son terminateur) */
instrumentationSortieMemoire((int)c1, strlen(c2)+1);
/* On retourne la valeur retournée par la vraie fonction strcpy */
return strcpy(c1, c2);
}
Les fonctions « externes » n’utilisant pas de pointeurs
Les fonctions externes n’utilisant pas de pointeurs sont des fonctions dites externes d’après la
définition ci-dessus à la différence qu’elles ne font pas d’accès à la mémoire à partir de pointeur.
Elles peuvent donc être traitées simplement en considérant que les paramètres passés à la fonction
sont lus et que le résultat est écrit.
36

2.4 Résultats & Analyse
2.4.1 Les chiffres. . .
Une fois l’évaluation de la quantité de travail inutile effectuée de cette manière, nous obtenons
les chiffres suivants (cf. figure 2.7).
gzipa gzipb gzipc
O0d 11.03 % 9.53 % 11.03 %
O1 12.05 % 10.73 % 16.44 %
O2 11.40 % 10.28 % 16.17 %
O3 12.77 % 12.10 % 21.83 %
O4 12.66 % 12.55 % 23.35 %
O5 12.66 % 12.55 % 23.35 %
gunzipe gunzipf gunzipg
O0 1.09 % 1.14 % 0.21 %
O1 2.94 % 3.10 % 0.29 %
O2 3.51 % 4.28 % 0.41 %
O3 10.01 % 10.51 % 0.47 %
O4 9.83 % 10.26 % 0.52 %
O5 9.83 % 10.26 % 0.52 %
aCompression d’un fichier texte (RTF) de 2127 octets avec gzip (fort taux de compression (facteur : 1.9))
bCompression d’un fichier image (GIF) de 1704 octets avec gzip (faible taux de compression (facteur : 1.4))
cRe-compression d’un fichier compressé par gzip de 1506 octets avec gzip (taux de compression nul (facteur : 0.98))
dSeuls ces résultats ont été validés avec le programme de vérification pour des raisons d’implémentation
eDécompression du fichier texte de 2127 octets
fDécompression du fichier image de 1704 octets
gDécompression du fichier compressé deux fois par gzip de 1506 octets
Conditions de test : gzip version 1.2.4 recompilé avec cc de Sun pour le processeur Sparc version
v8plus. Ces chiffres s’entendent en ne comptant pas les éventuelles instructions nop qui se trouvent
dans le delay slot de certaines instructions de branchement.
Fig. 2.7 – Quantité d’instructions assembleurs inutiles lors de l’exécution de gzip dans différentes
conditions
2.4.2 Le doute. . .
Introduction
Ces chiffres n’étant qu’une évaluation, rien ne permet de dire avec certitude que ce travail est
effectivement inutile. D’autant plus que l’implémentation laisse souvent apparaˆıtre des failles que
l’on n’imagine pas lorsqu’on raisonne de fa¸con abstraite sur les dépendances de données (la gestion
des fonctions dont on n’a pas le code source en est un exemple). Afin de valider notre programme
et d’avoir la certitude que le travail inutile évalué en était bien, nous avons mis au point un second
programme ré-exécutant exactement le même programme de test (gzip dans notre cas) sur le même
jeu de données (avec le même fichier en entrée) en n’exécutant pas les instructions qui avaient été
jugées comme étant inutiles lors de la première exécution. Ainsi, si la seconde exécution donne
rigoureusement le même résultat que la première (le même fichier compressé dans le cas de gzip),
nous pouvons dire que les deux exécutions sont équivalentes et que, par conséquent, les instructions
qui n’ont pas été exécutées lors de la seconde exécution n’étaient effectivement pas utiles.
37

somewhere :
sub r3,r4,r5
...
mov r1,r2
add r2,3,r2
cmp 0,r2
be somewhere
store r2,(a0)
...
Code source
mov r1,r2
add r2,3,r2
cmp 0,r2
be somewhere
sub r3,r4,r5
...
Trace dynamique de la
première exécution
(détection du travail inutile)
mov r1,r2
add r2,3,r2
cmp 0,r2
be somewhere
store r2,(a0)
...
Trace dynamique de la
deuxième exécution (non
exécution du travail inutile)
L'instruction add est jugée inutile :
elle ne sera donc pas exécutée
lors de la seconde exécution
Fig. 2.8 – Mise en évidence d’un problème d’implémentation par divergence du flot de contrôle
Note
Reproduire une exécution à l’identique ne fonctionne que sur un programme déterministe : deux
exécutions successives sur un même jeu de donnée doivent s’exécuter rigoureusement de la même
manière. De fait, il serait complexe de traiter des programmes utilisant des fonctions de tirages
aléatoires ou conservant des informations d’une exécution sur l’autre (cache dans un fichier par
exemple). Ce n’est pas le cas de gzip ce qui nous a permis de mener nos tests de fa¸con correcte
sur ce programme.
L’intérêt
Un aspect très intéressant de l’utilisation de ce programme de vérification est qu’il a permis
d’affiner le programme d’évaluation de la quantité de travail inutile. En effet, en observant les
divergences entre la première et la seconde exécution (figure 2.8), il a été possible de trouver les
points faibles du programme d’évaluation de la quantité de travail inutile et de les consolider afin de
rendre les deux exécutions équivalentes. Par exemple, lorsque la seconde exécution du programme
de test divergeait de la première (un branchement pris alors qu’il n’aurait pas du par exemple), cela
signifiait qu’une instruction utile au flot de contrôle avait était jugée comme étant inutile à tort. De
cette manière, il a été possible de trouver les incorrections du programme d’évaluation du travail
inutile et surtout de mettre en lumière les lacunes d’une implémentation trop « na¨ıve » par rapport
aux appels de fonctions définies dans des bibliothèques dont le code source n’est pas disponible.
Dans l’exemple de la figure 2.8, le branchement be (branch if equal) est pris lors de la première
exécution alors qu’il n’est pas pris lors de la seconde, ce qui entraˆıne une incohérence entre les deux
38

exécutions qui ne sont alors plus équivalentes. Ceci se produit en raison d’un mauvais jugement
porté sur l’instruction add. En effet, celle-ci est utile au bon déroulement du programme alors
qu’elle a été jugée comme ne l’étant pas par le programme de détection du travail inutile. Grâce à
ce système, il est facile de corriger les incorrections et imprécisions que comporte le programme de
détection du travail inutile. Par processus incrémental, il est alors possible de corriger ces erreurs
une à une jusqu’à l’obtention d’un programme qui ne juge inutile que du travail réellement inutile
(Ce qui ne prouve pas pour autant qu’il détecte tout le travail inutile que peut comporter un
programme).
La Méthode
Pour pouvoir mettre au point ce deuxième programme, il faut tout d’abord que le programme
d’évaluation de la quantité de travail inutile laisse une trace des instructions inutiles dans un
fichier qui sera utilisé par le programme de vérification. Pour la mise au point de ce programme de
vérification, Salto a, là encore, été sollicité afin d’instrumenter chaque instruction. Lorsque cette
instruction est jugée inutile (d’après la trace de la première exécution) alors cette instruction est
sautée au moyen d’un jump d’une valeur constante puisque, dans les processeurs Sparc, toutes les
instructions ont une taille de quatre octets (« merci » les jeux d’instructions RISC). De cette fa¸con,
il est assez facile de « sauter » une instruction lorsqu’elle apparaˆıt dans la trace des instructions
inutiles.
Conclusion
Ce programme à permis, sur des exemples simples, de vérifier que la quantité de travail inutile
évaluée était bien du travail inutile quelque soit le niveau d’optimisation utilisé et les cas de figure
rencontrés. Cependant, par manque de temps, nous n’avons réussi à le faire fonctionner que sur gzip
compilé avec un niveau d’optimisation de 0. Néanmoins, cette vérification nous à permis d’accroˆıtre
la confiance en nos résultats (figures 2.7 page 37 et 2.9 page suivante).
2.4.3 La répartition du travail inutile
Une fois les informations sur le travail inutile lors de l’exécution d’un programme récupérées,
il est nécessaire de les organiser afin de pouvoir analyser d’ou provient ce travail inutile. Dans
un premier temps, nous avons essayé de voir à quelles instructions statiques correspondaient nos
instructions dynamiques inutiles. Nous avons trouvé, sans surprise étant donné les résultats de
l’article [1], que seul un petit nombre d’instructions statiques étaient concernées. Ce qui signifie
que la plupart des instructions dynamiques inutiles sont concentrées sur un nombre d’instructions
statiques réduit (de l’ordre de 12.4 % des instructions statiques totales génèrent au moins une
instance dynamique inutile). Une fois ces instructions statiques en assembleur identifiées, nous
avons cherché à « remonter », lorsque c’était possible, au code source en C correspondant afin
de mieux comprendre la raison pour laquelle ce travail est jugé comme étant inutile par notre
définition.
39

108876.0
90730.0
72584.0
54438.0
36292.0
18146.0
0.0
Compression d’un fichier RTF de 2127 octets
Algorithme GZIP compile avec cc et un niveau d’optimisation de 0
0.0 268685.0 537370.0 806055.0 1074740.0
(a) Sans optimisations de compilation
53388.0
44490.0
35592.0
26694.0
17796.0
8898.0
0.0
Compression d’un fichier RTF de 2127 octets
Algorithme GZIP compile avec cc et un niveau d’optimisation de 5
0.0 105695.0 211390.0 317085.0 422780.0
(b) Avec optimisations de compilation
Abscisse : Numéro d’instruction dynamiques : représente le temps écoulé en nombre d’instructions
Ordonnée : Quantité d’instructions inutiles (cumulées)
Fig. 2.9 – Évolution de la quantité de travail inutile en fonction du temps
Travail inutile algorithmique
Introduction En observant les courbes de la figure 2.9 on s’aper¸coit que l’algorithme de gzip,
dans nos conditions de test, se décompose en plusieurs phases générant chacune des quantités de
travail inutile différentes. En premier lieu, il est intéressant de noter que la phase d’initialisation
comporte une grande proportion de travail inutile (presque 50 % avec un niveau d’optimisation
de 0 et plus de 50 % avec un niveau de 5). Ensuite, vient une courte phase durant laquelle aucun
travail inutile n’est présent (quelque soit le niveau d’optimisation).
Vient ensuite un ensemble de phases que nous appellerons le coeur de l’algorithme durant lequel
on observe une quantité de travail inutile moyen non négligeable avec un niveau d’optimisation de
0 (de l’ordre de 6,9 %) et plus important encore avec un niveau d’optimisation de 5 (de l’ordre de
9,9 %).
La phase d’initialisation Dans certains cas, le travail inutile semble être d’origine algorith-mique.
En effet, en observant le code source en C de gzip, il apparaˆıt parfois du travail inutile qu’il
serait simple d’éviter en modifiant une petite partie du code. De fait, nous pouvons dire que ce
travail inutile est inhérent à la fa¸con dont l’algorithme de gzip est implémenté.
De plus, étant donné une très forte proportion de travail inutile durant la phase d’initialisation
des structures de données utiles à l’algorithme de gzip (aux alentours de 50%), il semble raisonnable
de penser qu’une très grande partie de ces structures de données sont initialisées puis jamais utilisées
ou réutilisées pour être écrites (ce qui génère des valeurs mortes). Ce type de travail inutile semble
40

être réellement inhérent à l’algorithme et non du à une mauvaise implémentation de celui-ci.
Exemple simple :
Dans la fonction local void gen codes (tree, max code), on observe que le code source
suivant est inutile la plupart du temps (lors de l’exécution sur un fichier de test) :
for (bits = 1; bits <= MAX_BITS; bits++) {
next_code[bits] = code = (code + bl_count[bits-1]) << 1;
}
L’affectation dans le tableau next code est inutile 52 fois sur 60 dans l’exemple testé (le nombre
d’itérations de la boucle est MAX BITS et est égal à 60). Le fait que cette affectation soit inutile un
certain nombre de fois engendre qu’une partie des calculs fait dans la boucle devient inutile. Ce
qui nous donne, pour l’ensemble de la boucle, un nombre de 824 instructions inutiles pour 1440 au
total (soit une proportion de 57 %).
Etant donné ces résultats, il est intéressant de se pencher sur le cas de l’initialisation des
structures de données en général. En effet, le premier réflexe d’un programmeur, lorsqu’il déclare
une structure de donnée (tableau, liste. . .) est de l’initialiser pour éviter, par la suite, d’y faire
un accès en lecture sans y avoir préalablement rangé une valeur. Or ce réflexe de programmation
est probablement ce que nous observons ici étant donné que les structures de données de gzip
n’échappent apparemment pas à cette règle.
Le coeur de l’algorithme Au coeur de l’algorithme, nous observons différents cas d’instructions
dynamiques inutiles. Parfois, nous observons que le travail inutile est du à l’initialisation de va-riables
locales dont le contenu est, la plupart du temps, ré-écrit avant d’être lu. Parfois, il s’agit de
paramètres passés à une fonction et qui ne servent que dans certaines conditions. Et enfin, un cas
assez fréquent également est celui des variables globales qui sont maintenues à jour de fa¸con inutile.
En effet, si une telle variable reflète une valeur lors du dernier passage dans une certaine fonction,
il est possible que cette fonction soit appelée plusieurs fois sans que cette valeur n’ai été lue entre
temps.
Exemples :
L’affectation prev match = match start ; peut-être inutile car la seule utilisation de la variable
prev match en lecture est le cas suivant :
if (prev_length >= MIN_MATCH && match_length <= prev_length) {
check_match(strstart-1, prev_match, prev_length);
flush = ct_tally(strstart-1-prev_match, prev_length - MIN_MATCH);
...
}
41

Ce qui signifie que lorsque la condition ci-dessus sera fausse, l’affectation de la variable prev match
sera inutile (c’est le cas 78 fois 82 dans notre test). En supposant que le calcul de la valeur de la
variable match start puisse être coûteux, et que cette variable ne soit pas ré-utilisée en lecture
entre temps, on prend conscience de la portée que peut avoir le travail inutile.
Note
Dans l’exemple précédent, il est intéressant de noter que le déplacement de l’instruction d’affec-tation
prev match = match start ; dans le corps de la conditionnelle aurait suffit à éliminer
ce travail inutile (dans la mesure où on ne fait pas d’écriture dans match start entre temps).
En effet, la variable prev match n’étant utilisée que dans ce bloc, il est inutile de faire cette
affectation si la condition n’est pas vraie.
Une macro un peu particulière a également retenu notre attention. Elle se trouve au coeur de
l’algorithme de compression, dans la fonction deflate(). Il s’agit de la macro INSERT STRING qui
insère une chaˆıne de caractère dans la liste des chaˆınes de caractères qu’utilise gzip pour trouver
les chaˆınes les plus fréquemment présentes dans le fichier à compresser.
Voici le code de cette macro après passage du pré-processeur :
((ins_h = (((ins_h)<<((15+3-1)/3)) ^
( window[(strstart) + 3-1])) &
((unsigned)(1<<15)-1)),
prev[(strstart) & (0x8000-1)] = hash_head = (prev+0x8000)[ins_h],
(prev+0x8000)[ins_h] = (strstart));
Pour des raisons de lisibilité, nous avons ré-écrit ce code :
ins_h = ( ins_h<<5 ^ window[strstart+2] & (unsigned)(1<<15)-1 );
hash_head = (prev+0x8000)[ins_h];
prev[strstart & (0x8000-1)] = hash_head;
(prev+0x8000)[ins_h] = strstart;
Dans cette macro, qui se trouve au coeur de l’algorithme de compression, les deux dernières
instructions (remplissage du tableau prev) se trouvent être très souvent inutile (77 fois sur 82 dans
notre exemple). Ceci tend à montrer que l’algorithme de compression utilisé par gzip contient, par
nature, du travail inutile.
Travail inutile introduit par le compilateur. . .
. . . lors des phases d’optimisation de compilation On observe également que la version
compilée avec un niveau d’optimisation de 0 présente une quantité globale de travail inutile moins
important (proportionnellement) à la version compilée avec un niveau d’optimisation de 5. De plus,
42

l’écart entre les deux versions s’accentue dans le coeur de l’algorithme. En effet, durant la phase
d’initialisation, les deux versions se comportent à peu près de la même fa¸con (aux alentours de
50 % de travail inutile) alors que dans le coeur de l’exécution, la version non optimisée comporte en
moyenne 6.9 % de travail inutile à comparer aux 9.9 % observé dans le cas de la version optimisée.
Ce phénomène avait déjà été constaté dans l’article [1] mais uniquement au sujet des valeurs mortes.
. . . du au jeu d’instruction du processeur Cette étude n’est absolument pas exhaustive sur
les diverses causes que peut avoir le travail inutile. Cependant, même si cet aspect n’a pu être
exploré pour des raisons de temps, il parait raisonnable de penser qu’une partie du travail inutile
pourrait avoir été introduit en raison des contraintes imposées par le jeu d’instructions utilisé. En
effet, dans un jeu d’instruction RISC (comme le Sparc) une instruction de haut niveau (en langage
C par exemple) peut être convertie par le compilateur en une suite très importante d’instructions
comme en une seule. Ceci dépend de l’éloignement de cette instruction en langage C par rapport aux
instructions disponibles dans le jeu d’instruction assembleur utilisé. A contrario, un jeu d’instruction
CISC (comme le x86) aura des instructions assembleur plus proche des instructions en langage de
haut niveau. De cette fa¸con, les proportions d’instructions assembleur inutiles peuvent ne pas être
identiques aux proportions d’instructions inutiles de haut niveau (en langage C par exemple).
De plus, certaines optimisations de compilation effectuant un ré-ordonnancement des instructions
assembleur, il est parfois difficile de savoir quel ensemble d’instructions assembleur représente quelle
instruction de haut niveau.
Conclusion
En conclusion, nous pouvons dire que les proportions de travail inutile trouvées se rattachent
majoritairement au travail inutile présent dans l’algorithme en langage de haut niveau. De fait, une
piste qui pourrait être intéressante pour réduire ce travail inutile serait de signaler au programmeur,
lors des premières exécutions d’un prototype de programme, que certaines parties de l’algorithme
génèrent une grande quantité de travail inutile et que, par conséquent, une ré-écriture en prenant en
compte cet état de fait pourrait éviter ce travail. Il est même possible d’imaginer un outil proposant
au programmeur une ébauche de solution pour l’aider à restructurer une partie de son code afin
d’éviter ce travail inutile. Cependant, ce type d’outils ne peut rien pour aider à éliminer le travail
inutile intrinsèque à l’algorithme.
43

2.5 Conclusion
Cette étude est, en premier lieu, une étude permettant de comprendre un phénomène, à priori,
contre intuitif : Le travail inutile. Pour ce faire, nous nous sommes basé sur des résultats existants
qui ont déjà été publiés et qui montre que le travail inutile existe bel et bien dans des programmes
classiques.
Le but de ce stage était d’élargir les définitions données dans ces articles afin d’avoir une
idée du travail inutile global qui peut se trouver dans un programme. Cette étude, contrairement
à celles citées ci-contre, n’avait pas pour but de trouver un moyen d’exploiter ce travail inutile
pour en réduire l’impact sur le temps d’exécution ou la consommation électrique mais seulement
de comprendre ce phénomène et de savoir pourquoi ce travail inutile est présent (est-ce du au
compilateur ?, au programmeur ?. . .).
En conclusion, nous pouvons dire que cette étude à permis de confirmer l’existence du travail
inutile et de comprendre, en partie, d’où il provient.
44

Bibliographie
[1] G. Sohi A. Butt. Dynamic dead-instruction detection and elimination. ASPLOS X, October
2002.
[2] Jeffrey D. Ullman Alfred V. Aho, Ravi Sethi. Compilers : Principles, Techniques and Tools.
Addison-Wesley, 1986.
[3] Gordon B. Bell. Characterization of silent stores. Submitted in partial fulfillment of the M.S.
Degree in Electrical and Computer Engineering, May 2001.
[4] F. Bodin. Cours d’optimisation : Transformer pour la performance. Septembre 2002.
[5] M. Lipasti K. Lepak, G. Bell. Silent stores and store value locality. IEEE Transactions on
Computers, 50(11), November 2001.
[6] Mikko H. Lipasti Kevin M. Lepak. Temporally silent stores. ASPLOS X, October 2002.
[7] Kevin M. Lepak. Silent stores for free : Reducing the cost of store verification. Submitted in
partial fulfillment of the M.S. Degree in Electrical and Computer Engineering, December 2000.
[8] Charles N. Fischer Milo M. Martin, Amir Roth. Exploiting dead value information. Proceedings
of Micro-30, December 1997.
45

Chapitre 3
Annexes
3.1 Petit historique du stage. . .
11/2002 : Elaboration de la bibliographie : Recherche et lecture d’articles sur le travail inutile.
12/2002 : Elaboration de la bibliographie : Rédaction du rapport bibliographique et réflexion
autour de la partie personnelle à ajouter (Troisième approche du chapitre Bibliographie).
02/2003 : Début du stage : Prise en main de l’environnement de travail (C++, gcc, cc, concept
généraux de compilation. . .) et de l’outils Salto mis à disposition par l’équipe.
03/2003 : Elaboration du squelette de l’application d’évaluation du travail inutile et mise au
point d’un programme simple permettant de construire le graphe de dépendance de donnée
en utilisant l’outil Salto.
04/2003 : Implémentation et test sur gzip du programme d’évaluation de la quantité de travail
inutile et mise au point du programme de vérification que ce travail est bien inutile.
05/2003 : Test du protocole, optimisation, collecte des résultats, et écriture du rapport de stage.
06/2003 : Fin du rapport et présentation orale du travail effectué en stage
46

3.2 A propos de la description machine Salto du Sparc
3.2.1 Gestion des instructions Save et Restore
Les instructions save et restore du Sparc possèdent trois arguments (généralement save
%sp,constante,%sp et restore %g0,%g0,%g0). Ces deux instructions font glisser la fenêtre de
registre dans le sens positif pour save (création d’un nouveau contexte) et dans le sens négatif
pour restore (restauration de l’ancien contexte). De plus, ces instructions se comportent comme
l’instruction add à un détail près : les registres lus (deux premiers arguments) sont lus dans l’an-cienne
fenêtre de registres alors que le registre écrit (troisième argument) est écrit dans la nouvelle
fenêtre (après la création ou la restauration du contexte). Or la description machine Salto du Sparc
considère que les trois registres passés en argument des instructions save et restore sont lus alors
que le troisième est écrit (erreur invisible dans la mesure ou save et restore écrivent aussi tous les
registres de la fenêtre. . . sauf lorsqu’on utilise comme troisième argument un registre n’appartenant
pas à la fenêtre (registre global par exemple)).
3.2.2 L’instruction call & link
L’instruction call sert à faire un appel de fonction. Cette instruction effectue deux actions :
elle branche à l’adresse passée en paramètre (constante sur 30 bits) et elle sauvegarde la valeur
du PC au moment de son exécution dans le registre %o7 (registre 15 dans le manuel du Sparc),
permettant ainsi à la fonction appelée de revenir à la suite dans le code source une fois la fonction
exécutée au moyen de l’instruction ret. Or cette deuxième fonction n’est pas vue par la description
machine Salto du Sparc. Il faut donc rajouter une écriture dans le registre %o7 dans la définition
de l’instruction call pour la rendre correcte.
3.2.3 L’instruction addx
L’instruction addx à le même effet que l’instruction add à ceci prêt qu’elle utilise le registre des
codes conditions pour ajouter, si elle est positionnée, la retenue de celui-ci (bit carry) au résultat
de l’addition. Or dans la description machine Salto du Sparc, l’instruction addx est vue comme
étant équivalente à l’instruction addcc qui, elle, positionne le bit carry en fonction des arguments
passés à l’instruction addcc. Donc, l’instruction addx lit le registre des codes condition alors que
l’instruction addcc le modifie. L’instruction addx n’est utilisée par les compilateurs que lorsqu’on
active les optimisations de compilation.
3.2.4 Un détail : les instructions nop, ba et bn
D’après la description machine Salto du Sparc, l’instruction nop (No opération) consommerait
un registre en entrée (dont le numéro d’identification dans la description machine est 39). Or,
d’après la documentation sur le Sparc, l’instruction nop ne fait aucune action donc elle ne devrait
47

pas utiliser de ressources en entrée. De plus, les instructions ba (Branch always) et bn (Branch
never) utilisent, d’après la description machine du Sparc, le registre des codes condition en entrée.
Or, si les instructions de branchement conditionnel utilisent en effet le registre des codes condition,
les instructions ba et bn peuvent être considérées comme des instructions de branchement incon-ditionnel
puisque le fait que le branchement ai lieu ne dépend pas des bits activés dans le registre
des codes condition.
48

3.3 Résultat de l’évaluation du travail inutile sur un exemple
simple
3.3.1 Code source en C de l’exemple
1 #include <stdio.h>
2
3
4 int main(void)
5 {
6 int tab[3],i;
7
8
9 for(i=0; i<3; i++) tab[i]=i*10;
10
11 printf("%d",tab[1]);
12
13 exit(0);
14 }
3.3.2 Code source en assembleur Sparc de l’exemple
Ce code est généré par le compilateur cc avec les options ”-SO” et ”-XO0” (niveau d’optimisation
égal à 0).
! FILE exemple.c
! 1 !#include <stdio.h>
! 4 !int main(void)
! 5 !{
!
! SUBROUTINE main
!
! OFFSET SOURCE LINE LABEL INSTRUCTION
.global main
main:
/* 000000 5 */ save %sp,-120,%sp
! 6 ! int tab[3],i;
! 9 ! for(i=0; i<3; i++) tab[i]=i*10;
49

.L90:
/* 0x0004 9 */ or %g0,0,%g2
/* 0x0008 */ st %g2,[%fp-20]
/* 0x000c */ ld [%fp-20],%g3
/* 0x0010 */ cmp %g3,3
/* 0x0014 */ bl .L95
/* 0x0018 */ nop
/* 0x001c */ ba .L94
/* 0x0020 */ nop
.L95:
.L92:
/* 0x0024 9 */ ld [%fp-20],%g2
/* 0x0028 */ sll %g2,2,%g3
/* 0x002c */ add %g3,%g2,%g4
/* 0x0030 */ sll %g4,1,%o2
/* 0x0034 */ ld [%fp-20],%o3
/* 0x0038 */ sll %o3,2,%o4
/* 0x003c */ add %fp,-16,%o3
/* 0x0040 */ st %o2,[%o4+%o3] ! volatile
/* 0x0044 */ ld [%fp-20],%o4
/* 0x0048 */ add %o4,1,%o5
/* 0x004c */ st %o5,[%fp-20]
/* 0x0050 */ ld [%fp-20],%o7
/* 0x0054 */ cmp %o7,3
/* 0x0058 */ bl .L92
/* 0x005c */ nop
/* 0x0060 */ ba .L96
/* 0x0064 */ nop
.L96:
! 10 ! printf("%dn",tab[1]);
.L94:
/* 0x0068 10 */ sethi %hi(.L97),%g2
/* 0x006c */ add %g2,%lo(.L97),%g3
/* 0x0070 */ or %g0,%g3,%g4
/* 0x0074 */ or %g0,%g4,%o0
/* 0x0078 */ ld [%fp-12],%o2
/* 0x007c */ or %g0,%o2,%o1
/* 0x0080 */ call printf ! params = %o0 %o1 ! Result =
/* 0x0084 */ nop
! 11 !
! 12 ! exit(0);
/* 0x0088 12 */ or %g0,0,%o3
/* 0x008c */ or %g0,%o3,%o0
/* 0x0090 */ call exit ! params = %o0 ! Result =
50

/* 0x0094 */ nop
/* 0x0098 */ ba .L89
/* 0x009c */ nop
.L89:
/* 0x00a0 */ ret ! Result =
/* 0x00a4 */ restore %g0,%g0,%g0
/* 0x00a8 0 */ .type main,2
/* 0x00a8 0 */ .size main,(.-main)
/* 0x00a8 0 */ .global __fsr_init_value
/* 0x00a8 */ __fsr_init_value=0
3.3.3 Identifiant d’instruction statique
Ce fichier texte est obtenu apr`es passage de Salto sur le code source en assembleur de notre
exemple. Le num´ero statique permettant d’identifier une instruction se trouve entre crochets.
Salto rev. 1.4.2beta1 (built with g++ on sun4u)
Copyright (C) 1997 Inria, France
Machine description file ok.
CFG (0) :
BB (0) :
INST (0) [1] : save %o6,-120,%o6 in : 55 out : 55
BB (1) :
INST (0) [2] : or %g0,0,%g2 in : 41 out : 43
INST (1) [3] : st %g2,[%i6-20] in : 71 in : 43 out : 113
INST (2) [4] : ld [%i6-20],%g3 in : 71 in : 113 out : 44
INST (3) [5] : subcc %g3,3,%g0 in : 44 out : 74 out : 41
INST (4) [6] : bl .L95 in : 74
BB (2) :
INST (0) [7] : nop in : 39
INST (1) [8] : ba .L94 in : 74
BB (3) :
INST (0) [9] : nop in : 39
BB (4) :
INST (0) [10] : ld [%i6-20],%g2 in : 71 in : 113 out : 43
INST (1) [11] : sll %g2,2,%g3 in : 43 out : 44
INST (2) [12] : add %g3,%g2,%g4 in : 44 in : 43 out : 45
INST (3) [13] : sll %g4,1,%o2 in : 45 out : 51
INST (4) [14] : ld [%i6-20],%o3 in : 71 in : 113 out : 52
INST (5) [15] : sll %o3,2,%o4 in : 52 out : 53
INST (6) [16] : add %i6,-16,%o3 in : 71 out : 52
INST (7) [17] : st %o2,[%o4+%o3] in : 53 in : 52 in : 51 out : 113
INST (9) [19] : add %o4,1,%o5 in : 53 out : 54
51

INST (10) [20] : st %o5,[%i6-20] in : 71 in : 54 out : 113
INST (12) [22] : subcc %o7,3,%g0 in : 56 out : 74 out : 41
INST (13) [23] : bl .L92 in : 74
BB (5) :
INST (0) [24] : nop in : 39
INST (1) [25] : ba .L96 in : 74
BB (6) :
INST (0) [26] : nop in : 39
BB (7) :
INST (0) [27] : sethi %hi(.L97),%g2 out : 43
INST (1) [28] : add %g2,%lo(.L97),%g3 in : 43 out : 44
INST (2) [29] : or %g0,%g3,%g4 in : 41 in : 44 out : 45
INST (3) [30] : or %g0,%g4,%o0 in : 41 in : 45 out : 49
INST (5) [32] : or %g0,%o2,%o1 in : 41 in : 51 out : 50
BB (8) :
INST (0) [33] : call printf out : 56
BB (9) :
INST (0) [34] : nop in : 39
INST (1) [35] : or %g0,0,%o3 in : 41 out : 52
INST (2) [36] : or %g0,%o3,%o0 in : 41 in : 52 out : 49
BB (10) :
INST (0) [37] : call exit out : 56
BB (11) :
INST (0) [38] : nop in : 39
INST (1) [39] : ba .L89 in : 74
BB (12) :
INST (0) [40] : nop in : 39
BB (13) :
INST (0) [41] : jmpl %i7+8,%g0 in : 72 out : 41
BB (14) :
INST (0) [42] : restore %g0,%g0,%g0 in : 41 in : 41 out : 41
3.3.4 Trace d’exécution dynamique
La trace d’exécution dynamique de ce programme de test est donnée par le programme d’évaluation
de la quantité de travail inutile.
I.Dynamic 66 -- I.Static 38 -- File 1 -- nop -- Dépend de 0
I.Dynamic 65 -- I.Static 37 -- File 1 -- utile -- Dépend de 64
I.Dynamic 63 -- I.Static 35 -- File 1 -- utile
I.Dynamic 61 -- I.Static 33 -- File 1 -- utile -- Dépend de 58,60
52

I.Dynamic 59 -- I.Static 31 -- File 1 -- utile -- Dépend de 0,30,30,30,30
I.Dynamic 45 -- I.Static 17 -- File 1 -- INUTILE -- Dépend de 43,44,41
I.Dynamic 44 -- I.Static 16 -- File 1 -- INUTILE -- Dépend de 0
I.Dynamic 42 -- I.Static 14 -- File 1 -- INUTILE -- Dépend de 0,33,33,33,33
I.Dynamic 40 -- I.Static 12 -- File 1 -- INUTILE -- Dépend de 39,38
I.Dynamic 30 -- I.Static 17 -- File 1 -- utile -- Dépend de 28,29,26
I.Dynamic 15 -- I.Static 17 -- File 1 -- INUTILE -- Dépend de 13,14,11
53

I.Dynamic 10 -- I.Static 12 -- File 1 -- INUTILE -- Dépend de 9,8
Table des registres fixes :
Registre 39 : Modifié par l’instruction 0 et lu depuis par 7 instruction(s)
Table des registres tournants (niveau actuel : 1) :
Liste des adresses mémoires :
Adresse -4261820 : Modifié par l’instruction 48 et lu depuis par 13 instruction(s)
54

Calcul prenant en compte les "nop" :
Nombre d’instructions inutiles : 16/66 soit 24.242424 %
Nombre d’instructions utiles : 44/66 soit 66.666664 %
Nombre de nop : 6/66 soit 9.090909 %
Calcul ne prenant pas en compte les "nop" :
Nombre d’instructions inutiles : 16/60 soit 26.666666 %
Nombre d’instructions utiles : 44/60 soit 73.333336 %
Nombre d’ocurences d’instructions inutiles pour une instruction statique :
1 : 0/1
2 : 0/1
3 : 0/1
4 : 0/1
5 : 0/1
6 : 0/1
7 : 0/1
8 :
9 :
10 : 2/3
11 : 2/3
12 : 2/3
13 : 2/3
14 : 2/3
15 : 2/3
16 : 2/3
17 : 2/3
18 : 0/3
19 : 0/3
20 : 0/3
21 : 0/3
22 : 0/3
23 : 0/3
24 : 0/3
25 : 0/1
26 : 0/1
27 : 0/1
28 : 0/1
29 : 0/1
30 : 0/1
31 : 0/1
32 : 0/1
33 : 0/1
34 : 0/1
55

35 : 0/1
36 : 0/1
37 : 0/1
38 : 0/1
3.3.5 Graphe de dépendance de donnée
Les noeuds de ce graphe sont étiquetés avec les numéros dynamiques des instructions. Les noeuds
en gris représente les instructions inutiles alors que les noeuds en noir représente les instructions
utiles.
65
64 1
63
0
61
58 60
57 59
30
28
29
26
53
56
55
50
49
51
48
47
46
45
43
33
32
44
41
42
40
39
38
36
35
34
31
18
17
27
25
24
23
21
20
19
16
3
2
15
13
14
11
12
10
9
8
6
5
4
Fig. 3.1 – Graphe d’exemple généré par l’utilitaire « dot »
56

3.3.6 Trace d’exécution dynamique 2
La trace d’exécution dynamique de ce programme est donnée par le programme de vérification
que ce travail est bien inutile (Seconde exécution avec le même jeu de données).
I.Dynamic 1 -- I.Static 1 -- File 1
I.Dynamic 6 -- I.Static 6 -- File 1 -- Branch
I.Dynamic 8 -- I.Static 10 -- File 1 -- Non exécutée
57

58

3.4 Exemple de données stockées en cours d’exécution
Instruction dynamique :
Instruction statique :
Numéro de fichier :
Type de l'instruction :
n
mf
add
n+1
m+1
f
store
n+2
m’
f
bra
n+3
m’+1
f
load
n+4
m’+2
f
mul
Liste chainée des instructions dynamiques
(représente l'ordre d'exécution)
%g0
%g1
%g2
%g3
%g4
%g5
%g6
%g7
Table des registres globaux
%o0
%o1
%o2
%o3
%o4
%o5
%o6
%o7
%l0
%l1
%l2
%l3
%l4
%l5
%l6
%l7
%o0
%o1
%o2
%o3
%o4
%o5
%o6
%o7
%i0
%i1
%i2
%i3
%i4
%i5
%i6
%i7
%l0
%l1
%l2
%l3
%l4
%l5
%l6
%l7
Table de la fenêtre de registres
%i0
%i1
%i2
%i3
%i4
%i5
%i6
%i7
0x0000
0x0001
0x0002
0x0003
0x0004
0x0005
0x0006
0x0007
…
Table des adresses mémoires
Pointeur sur l’instruction dynamique précédente (structure de la liste chainée)
Pointeur sur les instructions ayant produits les opérandes de l’instruction
Pointeur sur la dernière instruction ayant écrit dans la ressource
Fig. 3.2 – Les structures de données utilisées par le programme pour construire le graphe de
dépendance de donnée
59

3.5 Code source du programme
60

12 mai 03 13:40 instrumentation.h Page 1/2
/* Défini le nom du fichier contenant les fonction définies localement par rappo
rt au programme (pas dans une bibliothèques) */
#define NOM_FICHIER_FONCTIONS_INTERNES "fonctions.txt"
/* Défini le nom du fichier contenant les fonction définies hors du programme (b
ibliothèques) mais non redéfinies dans le fichier redefinition.c */
#define NOM_FICHIER_FONCTIONS_EXTERNES_SPECIALES "fonctions_externes_speciales.txt"
void appelDeFonctionInstDebut(BB *bb, int position, unsigned int *nbInstructions
Ajoutees, int numeroInst, int typeInst, char *chaineAnnulBit);
void appelDeFonctionInstMilieu(BB *bb, int position, unsigned int *nbInstruction
sAjoutees, char *chaineAnnulBit);
void appelDeFonctionInstFin(BB *bb, int position, unsigned int *nbInstructionsAj
outees, char *chaineAnnulBit);
void appelDeFonctionReg(BB *bb, int position, unsigned int *nbInstructionsAjoute
es, int es, int indentificateurRessource, char *chaineAnnulBit);
int tailleAccesMemoire(INST *inst);
void appelDeFonctionMem(BB *bb, INST *inst, int position, unsigned int *nbInstru
ctionsAjoutees, int es, char *acces1, char *acces2, char *chaineAnnulBit, int ta
illeAccesMemoire);
void appelDeFonctionCopierInstDelay(BB *bb, int position, unsigned int *nbInstru
ctionsAjoutees);
void appelDeFonctionEchangerInstDelay(BB *bb, int position, unsigned int *nbInst
ructionsAjoutees);
int rechercheChaine(char *chaine, FILE *fichier);
int estPresent(char *motif, char *chaine);
int typeInstruction(INST *inst);
void operandeMemoire(char *instruction, char *acces1, char *acces2);
// Fonction permettant de sauvagarder le contexte du programme (registres généra
ux et codes conditions) afin de ne pas
// intervenir sur les valeurs des registres et codes conditions utilisés par le
programme
void sauvegardeContexte(BB *bb, int position, unsigned int *nbInstructionsAjoute
es);
// Fonction permettant de restaurer le contexte du programme (registres généraux
et codes conditions) afin de ne pas
programme
void restaurationContexte(BB *bb, int position, unsigned int *nbInstructionsAjou
tees);
int registreSalto(char *acces);
void blancSuivant(char **ptr);
// Insère le code permettant d’instrumenter en fonction des entrées produites pa
r inst
void appelDeFonctionsEntrees(INST *inst, BB *bb, int position, unsigned int *nbI
nstructionsAjoutees, char *chaineAnnulBit);
// Ajout de l’instrumentation représentant les entrées fictives des call externe
s
void appelDeFonctionsEntreesAppelExterne(INST *inst, BB *bb, int position, unsig
ned int *nbInstructionsAjoutees);
// Insère le code permettant d’instrumenter en fonction des sorties produites pa
r inst
void appelDeFonctionsSorties(INST *inst, BB *bb, int position, unsigned int *nbI
nstructionsAjoutees, char *chaineAnnulBit);
// Ajout de l’instrumentation représentant les sorties fictives des call externe
s
void appelDeFonctionsSortiesAppelExterne(INST *inst, BB *bb, int position, unsig
ned int *nbInstructionsAjoutees);
void instrumenter(INST *inst, BB *bb, BB *bbSuivant, int position, unsigned int
*nbInstructionsAjoutees, int numeroInst);
void ajouterCommentaireAppelExterne(INST *inst);
void Salto_hook();
12 mai 03 13:40 instrumentation.h Page 2/2
void Salto_init_hook(int argc, char *argv[]);
void Salto_end_hook();
Imprimé par Benjamin Vidal
mercredi 18 juin 2003 instrumentation.h 1/37

03 jun 03 16:11 instrumentation.cc Page 1/23
#include <stdio.h>
#include <fcntl.h>
#include <errno.h>
#include <fstream>
#include <iostream>
#include <sys/types.h>
#include <regex.h>
#include <stdlib.h>
#include <string.h>
#include "salto.h"
#include "instrumentation.h"
#include "instrument.h"
#define FICHIER_SOURCE_ASSEMBLEUR ".s$"
#define REPERTOIRE_FICHIER_INSTRUMENTES "instrumente/"
#define IN 0
#define OUT 1
#define EXP_REGISTRE "^%[golisf][0−7p]$"
#define EXP_MEMOIRE "[[−+%a−zA−Z0−9_.()]+]"
#define EXP_FONCTION "[ ]+call[ ]+"
#define EXP_SAVE "[ ]+save[ ]+"
#define EXP_RESTORE "[ ]+restore[ ]+"
#define EXP_ANNUL_BIT ",a"
#define EXP_LOAD "ld[usd]?[bh]?"
#define EXP_STORE "st[bhd]?"
#define ETIQUETTE_FONCTION_NOP "f_nop"
#define PREFIXE_FONCTIONS_EXTERNES "my_"
#define SAVE "save %sp,−136,%sp"
#define RESTORE "restore %g0,%g0,%g0"
#define NOP "nop"
// Pointeur sur le fichier dans lequel sera écrit le code instrumenté
FILE *fichierSInstrumente;
// Pointeur sur le fichier contenant le code original (non instrumenté)
FILE *fichierSOriginal;
// Permet d’identifier de manière unique le fichier en cours de traitement
unsigned char numeroFichier;
void appelDeFonctionInstDebut(BB *bb, int position, unsigned int *nbInstructions
Ajoutees, int numeroInst, int typeInst, char *chaineAnnulBit)
{
char chaine[20],tmp[100];
// On empile un paramètre de type entier à passer à la fonction (équivaut à m
ov typeInst,%o0)
sprintf(chaine,"or %%g0,%d,%%o0",typeInst);
bb−>insertAsm(*nbInstructionsAjoutees+position, newAsm(chaine));
(*nbInstructionsAjoutees)++;
// Si la constante numeroInst à ranger dans %o1 peut être codée sur 13 bits (
i.e. est entre −4096 et 4095)
if(numeroInst <= 4095)
{
// On empile un paramètre de type entier à passer à la fonction (équivaut à
mov numeroInst,%o1)
sprintf(chaine,"or %%g0,%d,%%o1",numeroInst);
}
else
{
// On empile ce même paramètre mais en deux fois (les 22 premiers bits du r
egistre d’abbord)
sprintf(chaine,"sethi %%hi(%d),%%o1",numeroInst);
// Puis les 10 derniers bits ensuite
sprintf(chaine,"or %%o1,%%lo(%d),%%o1",numeroInst);
}
// On empile un paramètre de type entier à passer à la fonction (équivaut à m
ov numeroFichier,%o1)
sprintf(chaine,"or %%g0,%d,%%o2",numeroFichier);
// Si l’instruction que l’on instrumente est un branchement avec un annulBit
(ex : bl,a ...) on insère une instruction qui
// va inhiber l’effet du call suivant lorsque l’annulation de l’exécution de
l’instruction se trouvant dans le DelaySlot
// sera effective (cela ne peut être vu qu’à l’exécution et donc ne peut être
fait statiquement)
if (chaineAnnulBit != NULL)
{
INST *inst_br_nop;
inst_br_nop = newAsm(NOP);
inst_br_nop−>addAttribute(UNPARSE_ATT, chaineAnnulBit, strlen(chaineAnnulBi
t)+1);
bb−>insertAsm(*nbInstructionsAjoutees+position, inst_br_nop);
strcpy(tmp,"b ");
}
else strcpy(tmp,"call ");
bb−>insertAsm(*nbInstructionsAjoutees+position, newAsm(strcat(tmp,NOM_FCT_DEB
UT_INST)));
// On ajoute un nop afin de combler le delay slot
bb−>insertAsm(*nbInstructionsAjoutees+position, newAsm(NOP));
}
void appelDeFonctionInstMilieu(BB *bb, int position, unsigned int *nbInstruction
sAjoutees, char *chaineAnnulBit)
{
mercredi 18 juin 2003 instrumentation.cc 2/37

char tmp[100];
fait statiquement)
{
INST *inst_br_nop;
t)+1);
strcpy(tmp,"b ");
}
bb−>insertAsm(*nbInstructionsAjoutees+position, newAsm(strcat(tmp,NOM_FCT_MIL
IEU_INST)));
}
void appelDeFonctionInstFin(BB *bb, int position, unsigned int *nbInstructionsAj
outees, char *chaineAnnulBit)
{
char tmp[100];
fait statiquement)
{
INST *inst_br_nop;
t)+1);
strcpy(tmp,"b ");
}
bb−>insertAsm(*nbInstructionsAjoutees+position, newAsm(strcat(tmp,NOM_FCT_FIN
_INST)));
}
void appelDeFonctionReg(BB *bb, int position, unsigned int *nbInstructionsAjoute
es, int es, int indentificateurRessource, char *chaineAnnulBit)
{
// On empile le paramètre de type entier à passer à la fonction (équivaut à m
ov %d,%o0)
sprintf(chaine,"or %%g0,%d,%%o0",indentificateurRessource);
fait statiquement)
{
INST *inst_br_nop;
t)+1);
strcpy(tmp,"b ");
}
// Appel de la fonction définie "ailleurs" (fichier instrument.c)
// Si le paramètre de l’instruction à instrumentée est un paramètre d’entrée
if (es==IN)
{
// On appelle la fonction de traitement spécifique aux paramètres d’entrée
bb−>insertAsm(*nbInstructionsAjoutees+position, newAsm(strcat(tmp,NOM_FCT_I
N_REG)));
}
// Si le paramètre de l’instruction a instrumenter est un paramètre de sortie
else
{
// On appelle la fonction de traitement spécifique aux paramètres de sortie
bb−>insertAsm(*nbInstructionsAjoutees+position, newAsm(strcat(tmp,NOM_FCT_O
UT_REG)));
}
}

int tailleAccesMemoire(INST *inst)
{
regex_t *preg = new regex_t();
size_t nmatch = 1;
regmatch_t pmatch[nmatch];
// Compilation de l’expression régulière permettant de détecter si une instruc
tion est un load
if (regcomp(preg, EXP_LOAD, REG_EXTENDED))
{
fprintf(STDERR,"Erreur lors de la compilation de l’expression régulière ""EXP_LOAD""n");
exit(4);
}
// Si l’instruction est un load
if (regexec(preg, inst−>unparse(), nmatch, pmatch, 0) != REG_NOMATCH)
{
regfree(preg);
// Si le dernier caractère de l’expression est un b, alors le load est un lo
ad byte
if(inst−>unparse()[pmatch[0].rm_eo−1] == ’b’) return 1;
// Si le dernier caractère de l’expression est un h, alors le load est un lo
ad half−word
if(inst−>unparse()[pmatch[0].rm_eo−1] == ’h’) return 2;
// Si le dernier caractère de l’expression est un d et que ce caractère est
en deuxième position, alors le load est un load word
if(inst−>unparse()[pmatch[0].rm_eo−1] == ’d’ && pmatch[0].rm_eo == 3) return
4;
// Si le dernier caractère de l’expression est un d et que ce caractère est
en troisième position, alors le load est un load double−word
if(inst−>unparse()[pmatch[0].rm_eo−1] == ’d’ && pmatch[0].rm_eo == 4) return
8;
fprintf(STDERR,"Impossible de reconnaitre la taille des données lues par l’instruction "%s"n",inst−>
unparse());
fprintf(STDERR,"Fonction tailleAccesMemoire du fichier instrumentation.ccn");
exit(7);
}
tion est un store
if (regcomp(preg, EXP_STORE, REG_EXTENDED))
{
fprintf(STDERR,"Erreur lors de la compilation de l’expression régulière ""EXP_STORE""n");
exit(4);
}
// Si l’instruction est un store
{
regfree(preg);
// Si le dernier caractère de l’expression est un b, alors le store est un s
tore byte
if(inst−>unparse()[pmatch[0].rm_eo−1] == ’b’) return 1;
// Si le dernier caractère de l’expression est un h, alors le store est un s
tore half−word
if(inst−>unparse()[pmatch[0].rm_eo−1] == ’h’) return 2;
// Si le dernier caractère de l’expression est un t, alors le store est un s
tore word
if(inst−>unparse()[pmatch[0].rm_eo−1] == ’t’) return 4;
// Si le dernier caractère de l’expression est un d, alors le store est un s
tore double−word
if(inst−>unparse()[pmatch[0].rm_eo−1] == ’d’) return 8;
fprintf(STDERR,"Impossible de reconnaitre la taille des données lues par l’instruction "%s"n",inst−>
unparse());
fprintf(STDERR,"Fonction tailleAccesMemoire du fichier instrumentation.ccn");
exit(7);
}
}
void appelDeFonctionMem(BB *bb, INST *inst, int position, unsigned int *nbInstru
ctionsAjoutees, int es, char *acces1, char *acces2, char *chaineAnnulBit, int ta
illeAccesMemoire)
{
// * Sauvegarde de la valeur stockée dans %i0 dans la pile afin de pouvoir la
récupérer par la suite
bb−>insertAsm(*nbInstructionsAjoutees+position, newAsm("st %i0,[%sp+124]"));
// Cette instruction permet de récupérer l’état des registres tels qu’ils éta
it au moment
// ou l’appel de l’instruction instrumentée était iminent (on descend d’un cr
an le contexte)
restaurationContexte(bb, position, nbInstructionsAjoutees);
// Insertion de l’instruction permettant de faire passer le résultat du calcu
l au contexte supérieure
// (fenêtre de registre placée au dessus)
sprintf(chaine,"add %s,%s,%%o0",acces1,acces2);
// Puis on repasse dans le contexte supérieur
sauvegardeContexte(bb, position, nbInstructionsAjoutees);
// En fin on récupère le résultat calculé par l’addition pour le passer en pa
ramètre à la fonction
// qui va être appellée (mov %i0,%o0)
bb−>insertAsm(*nbInstructionsAjoutees+position, newAsm("or %g0,%i0,%o0"));
// * Restauration de la valeur stockée dans %o0 (valeur qui avait été sauvega
rdée par "st %i0,[%sp+124]")
bb−>insertAsm(*nbInstructionsAjoutees+position, newAsm("ld [%sp+124],%i0"));
// On range dans %o1 la taille de l’acces mémoire effectué (nombre d’octets l
us ou écrits par l’instruction
sprintf(chaine,"or %%g0,%d,%%o1",tailleAccesMemoire);
// va inhiber l’effet du "call suivant" lorsque l’annulation de l’exécution d
e l’instruction se trouvant dans le DelaySlot
fait statiquement)
{

INST *inst_br_nop;
t)+1);
strcpy(tmp,"b ");
}
// Appel de la fonction définie "ailleurs" (fichier instrument.c)
// Si le paramètre de l’instruction à instrumentée est un paramètre d’entrée
if (es==IN)
{
// On appelle la fonction de traitement spécifique aux paramètres d’entrée
bb−>insertAsm(*nbInstructionsAjoutees+position, newAsm(strcat(tmp,NOM_FCT_I
N_MEM)));
}
// Si le paramètre de l’instruction à instrumentée est un paramètre de sortie
else
{
// On appelle la fonction de traitement spécifique aux paramètres de sortie
bb−>insertAsm(*nbInstructionsAjoutees+position, newAsm(strcat(tmp,NOM_FCT_O
UT_MEM)));
}
// On comble le delay slot de l’appel de fonction précédent par un nop
}
void appelDeFonctionCopierInstDelay(BB *bb, int position, unsigned int *nbInstru
ctionsAjoutees)
{
bb−>insertAsm(*nbInstructionsAjoutees+position, newAsm("call copierInstDelay"));
}
void appelDeFonctionEchangerInstDelay(BB *bb, int position, unsigned int *nbInst
ructionsAjoutees)
{
bb−>insertAsm(*nbInstructionsAjoutees+position, newAsm("call echangerInstDelay"));
}
int rechercheChaine(char *chaine, FILE *fichier)
{
char chaine2[100];
while (!feof(fichier))
{
fscanf(fichier,"%s",chaine2);
if(!strcmp(chaine,chaine2)) return 1;
}
return 0;
}
int estPresent(char *motif, char *chaine)
{
int i;
size_t nmatch = 10;
// Compilation de l’expression régulière
if (regcomp(preg, motif, REG_EXTENDED))
{
fprintf(STDERR,"Erreur lors de la compilation de l’expression régulière "%s"n",motif);
exit(4);
}
// Exécution de l’expression régulière et renvoi du résultat en fonction
if (regexec(preg, chaine, nmatch, pmatch, 0) == REG_NOMATCH)
{
regfree(preg);
return 0;
}
for(i=0; i<nmatch && pmatch[i].rm_so!=−1; i++);
regfree(preg);
return i;
}
int typeInstruction(INST *inst)
{
int i,j;
char tmp[100];
size_t nmatch = 1;
FILE *fichier;
// Si l’instruction est une instruction "save", on retourne la valeur T_SAVE
if (estPresent(EXP_SAVE,inst−>unparse())) return T_SAVE;
// Si l’instruction est une instruction "restore", on retourne la valeur T_RES
TORE
if (estPresent(EXP_RESTORE,inst−>unparse())) return T_RESTORE;
tion est une instruction de sortie
// (printf entre autre)

if (regcomp(preg, EXP_FONCTION, REG_EXTENDED))
{
fprintf(STDERR,"Erreur lors de la compilation de l’expression régulière ""EXP_FONCTION""n");
exit(4);
}
// Si l’instruction est un call
{
// On récupère dans la chaine tmp l’étiquette à laquelle on va brancher en e
xécutant le call
for(i=0,j=pmatch[0].rm_eo; j<strlen(inst−>unparse()); j++)
if((inst−>unparse())[j]!=’ ’ && (inst−>unparse())[j]!=’t’) tmp[i++]=(inst−
>unparse())[j];
tmp[i] = ’0’;
regfree(preg);
fichier = fopen(NOM_FICHIER_FONCTIONS_INTERNES, "r");
if(fichier == NULL)
{
fprintf(STDERR,"Problème lors de l’ouverture du fichier ""NOM_FICHIER_FONCTIONS_INTERNE
S"" ");
fprintf(STDERR,"(fonction typeInstruction dans le fichier instrumentation.cc)n");
exit(11);
}
// On recherche dans notre base de nom de fonctions définies localement si l
a fonction désignée par l’étiquette
// fait partie du code qui à était instrumenté ou non
if(rechercheChaine(tmp,fichier))
{
fclose(fichier);
return T_APPEL_INTERNE;
}
fclose(fichier);
fichier = fopen(NOM_FICHIER_FONCTIONS_EXTERNES_SPECIALES,"r");
if(fichier == NULL)
{
fprintf(STDERR,"Problème lors de l’ouverture du fichier ""NOM_FICHIER_FONCTIONS_EXTERNE
S_SPECIALES"" ");
fprintf(STDERR,"(fonction typeInstruction dans le fichier instrumentation.cc)n");
exit(11);
}
if(rechercheChaine(tmp,fichier))
{
fclose(fichier);
return T_APPEL_EXTERNE_SPECIAL;
}
fclose(fichier);
return T_APPEL_EXTERNE;
}
// Si l’instruction est un "nop", on retourne la valeur T_NOP
if (inst−>isNop()) return T_NOP;
// Si l’instruction est un branchement, on retourne la valeur T_BRANCHEMENT
if (inst−>isCTI())
if(estPresent(EXP_ANNUL_BIT,inst−>unparse()))
return T_BRANCHEMENT_ANNUL_BIT;
else return T_BRANCHEMENT;
// Si l’instruction est une instruction "ld", on retourne la valeur T_LOAD
if (estPresent(EXP_LOAD,inst−>unparse())) return T_LOAD;
// Si l’instruction est une instruction "st", on retourne la valeur T_STORE
if (estPresent(EXP_STORE,inst−>unparse())) return T_STORE;
return T_AUTRE;
}
void operandeMemoire(char *instruction, char *acces1, char *acces2)
{
int i,j;
char tmp[10];
regex_t *preg_mem = new regex_t();
regex_t *preg_signe = new regex_t();
size_t nmatch = 1;
regmatch_t pmatch_mem[nmatch];
regmatch_t pmatch_signe[nmatch];
// Compilation de l’expression régulière permettant de détecter un acces mémoi
re d’une instruction
if (regcomp(preg_mem, EXP_MEMOIRE, REG_EXTENDED))
{
fprintf(STDERR,"Erreur lors de la compilation de l’expression régulière ""EXP_MEMOIRE""n");
exit(4);
}
if (regcomp(preg_signe, "[−+]", REG_EXTENDED))
{
fprintf(STDERR,"Erreur lors de la compilation de l’expression régulière "[−+]"n");
exit(4);
}
if (regexec(preg_mem, instruction, nmatch, pmatch_mem, 0) == REG_NOMATCH)
{
fprintf(STDERR,"Erreur lors de l’exécution de l’expression régulière ""EXP_MEMOIRE"" : impossible d
e ");
fprintf(STDERR,"trouver un motif correspondant à cette expression dans l’instruction "%s"n",instru
ction);
exit(4);
}
if (regexec(preg_signe, instruction, nmatch, pmatch_signe, 0) == REG_NOMATCH)
{
// On récupère la chaine de caractère correspondant au nom du registre auque
l on accède
for(i=0,j=pmatch_mem[0].rm_so+1; j<pmatch_mem[0].rm_eo−1; j++) acces1[i++]=i
nstruction[j];
acces1[i] = ’0’;
strcpy(acces2,"0");
}
else
{
// On récupère la chaine de caractère correspondant au nom du premier regist
re auquel on accède
for(i=0,j=pmatch_mem[0].rm_so+1; j<pmatch_signe[0].rm_so; j++) acces1[i++]=i

nstruction[j];
acces1[i] = ’0’;
i=0;
// Si le signe reconnu par l’expression régulière [−+] est un moins, on le r
ejoute en début de chaine
// possible seulement si le deuxième acces est une constante (ex : ld [%i6−6
0],%o0)
if (instruction[pmatch_signe[0].rm_so] == ’−’) acces2[i++] = ’−’;
// On récupère la chaine de caractère correspondant au nom du deuxième regis
tre auquel on accède ou à la constante
for(j=pmatch_signe[0].rm_eo; j<pmatch_mem[0].rm_eo−1; j++)
acces2[i++] = instruction[j];
acces2[i] = ’0’;
}
regfree(preg_mem);
regfree(preg_signe);
}
programme
es)
{
INST *inst_ccr;
char *lectureCodesConditions = "trd %ccr,%l0n";
// "Empilement" du contexte du programme (création d’un contexte intermédiaire
artificiel entre l’exécution du
// programme et l’exécution des fonctions d’instrumentation du code. Ce contex
te permet de travailler avec
// les registres %o[0−5] afin de faire passer les paramètres aux fonctions d’i
nstrumentations.
bb−>insertAsm(*nbInstructionsAjoutees+position, newAsm(SAVE));
inst_ccr = newAsm(NOP);
inst_ccr−>addAttribute(UNPARSE_ATT, lectureCodesConditions, strlen(lectureCode
sConditions)+1);
bb−>insertAsm(*nbInstructionsAjoutees+position, inst_ccr);
// Sauvegarde en mémoire (dans la pile) des registres globaux
for(int i=1; i<=4; i++)
{
char tmp[20];
// Sauvegarde du registre (%gi) (ex : "st %g1,[%sp+92]")
sprintf(tmp,"st %%g%d,[%%sp+%d]",i,88+(4*i));
bb−>insertAsm(*nbInstructionsAjoutees+position, newAsm(tmp));
}
}
programme
tees)
{
INST *inst_ccr;
char *ecritureCodesConditions = "twr %l0,%ccrn";
// Récupération des registres globaux depuis la mémoire (depuis la pile)
for(int i=1; i<=4; i++)
{
char tmp[20];
// Restauration du registre (%gi) (ex : "ld [%sp+92],%g1")
sprintf(tmp,"ld [%%sp+%d],%%g%d",88+(4*i),i);
}
inst_ccr = newAsm(NOP);
inst_ccr−>addAttribute(UNPARSE_ATT, ecritureCodesConditions, strlen(ecritureCo
desConditions)+1);
bb−>insertAsm(*nbInstructionsAjoutees+position, inst_ccr);
// "Dépilement" du contexte du programme
bb−>insertAsm(*nbInstructionsAjoutees+position, newAsm(RESTORE));
}
int registreSalto(char *acces)
{
size_t nmatch = 1;
// Compilation de l’expression régulière permettant de détecter un registre
if (regcomp(preg, EXP_REGISTRE, REG_EXTENDED))
{
fprintf(STDERR,"Erreur lors de la compilation de l’expression régulière ""EXP_REGISTRE""n");
exit(4);
}
if (regexec(preg, acces, nmatch, pmatch, 0) == REG_NOMATCH)
{
regfree(preg);
return 0;
}
regfree(preg);
// Traitement des cas particuliers : %sp et %fp (correspondant à %o6 et %i6)
if (!strcmp(acces,"%sp")) return ID_REG_SALTO_O+6;
if (!strcmp(acces,"%fp")) return ID_REG_SALTO_I+6;
// Traitement du cas général
switch (acces[1])
{
case ’g’ : return ID_REG_SALTO_G+atoi(&(acces[2]));
case ’o’ : return ID_REG_SALTO_O+atoi(&(acces[2]));
case ’l’ : return ID_REG_SALTO_L+atoi(&(acces[2]));

case ’i’ : return ID_REG_SALTO_I+atoi(&(acces[2]));
default : fprintf(STDERR,"Passage impossible : fonction registreSalto dans instrumentation.ccn")
;
}
}
void blancSuivant(char **ptr)
{
while ((*ptr)[0]!=’ ’ && (*ptr)[0]!=’t’ && (*ptr)[0]!=’n’ && (*ptr)[0]!=’0’) (
*ptr)++;
while ((*ptr)[0]==’ ’ || (*ptr)[0]==’t’ || (*ptr)[0]==’n’) (*ptr)++;
}
// Insère le code permettant d’instrumenter en fonction des entrées produites pa
r inst
void appelDeFonctionsEntrees(INST *inst, BB *bb, int position, unsigned int *nbI
nstructionsAjoutees, char *chaineAnnulBit)
{
ResourceDataBase &rdb = xxx_server −> GetResT();
res_ref* in;
ResId_T identificateurRessource;
// Ajout de l’instrumentation représentant les entrées de l’instruction fourni
e par salto (lectures)
for (int i=0; i < inst−>numberOfInput(); i++)
{
in = inst−>getInput(i);
identificateurRessource = in−>get_res_id();
// Traitement fait pour chaque opérandes d’entrée
switch ((rdb.get_res(identificateurRessource))−>getType())
{
case MEMORY_RTYPE :
char acces1[100],acces2[100];
operandeMemoire(inst−>unparse(), acces1, acces2);
appelDeFonctionMem(bb, inst, position, nbInstructionsAjoutees, IN, acces
1, acces2, chaineAnnulBit, tailleAccesMemoire(inst));
break;
case REGISTER_RTYPE :
appelDeFonctionReg(bb, position, nbInstructionsAjoutees, IN, identificat
eurRessource, chaineAnnulBit);
break;
default :
fprintf(STDERR,"Passage impossible : fonction appelDeFonctionsEntrees dans instrumentation.ccn"
);
}
}
}
// Ajout de l’instrumentation représentant les entrées fictives des call externe
s
void appelDeFonctionsEntreesAppelExterne(INST *inst, BB *bb, int position, unsig
ned int *nbInstructionsAjoutees)
{
char acces[20];
char *ptr = (char *)(inst−>attributeValue(IN,COMMENT_ATT));
int identificateurRessource;
sscanf(ptr,"%s",acces);
// Tant qu’on n’a pas atteint la fin de la chaine de caractère contenant les e
ntrées effectuées par le call traité
while (ptr[0] != ’0’)
{
blancSuivant(&ptr);
identificateurRessource = registreSalto(acces);
if(identificateurRessource != 0)
appelDeFonctionReg(bb, position, nbInstructionsAjoutees, IN, identificateu
rRessource, NULL);
else
{
char tmp[20],acces1[100],acces2[100];
strcpy(tmp,"[");
strcat(tmp,acces);
strcat(tmp,"]");
operandeMemoire(tmp, acces1, acces2);
appelDeFonctionMem(bb, inst, position, nbInstructionsAjoutees, IN, acces1,
acces2, NULL, 4);
}
sscanf(ptr,"%s",acces);
}
// Les fonctions définies hors du fichier local font toujours un accès en lect
ure à %o6 (pointeur de pile)
// et à %o7 (adresse de retour)
/*appelDeFonctionReg(bb, position, nbInstructionsAjoutees, IN, ID_REG_SALTO_O+
6, NULL);
appelDeFonctionReg(bb, position, nbInstructionsAjoutees, IN, ID_REG_SALTO_O+7,
NULL);*/
}
// Insère le code permettant d’instrumenter en fonction des sorties produites pa
r inst
void appelDeFonctionsSorties(INST *inst, BB *bb, int position, unsigned int *nbI
nstructionsAjoutees, char *chaineAnnulBit)
{
ResourceDataBase &rdb = xxx_server −> GetResT();
res_ref* out;
int identificateurRessource;
// Ajout de l’instrumentation représentant les sorties de l’instruction fourni
e par salto (écritures)
for (int i=0; i < inst−>numberOfOutput(); i++)
{
out = inst−>getOutput(i);
identificateurRessource = out−>get_res_id();
// Traitement fait pour chaque opérandes de sortie
switch ((rdb.get_res(identificateurRessource))−>getType())
{
case MEMORY_RTYPE :
char acces1[100],acces2[100];

operandeMemoire(inst−>unparse(), acces1, acces2);
appelDeFonctionMem(bb, inst, position, nbInstructionsAjoutees, OUT, acce
s1, acces2, chaineAnnulBit, tailleAccesMemoire(inst));
break;
case REGISTER_RTYPE :
appelDeFonctionReg(bb, position, nbInstructionsAjoutees, OUT, identifica
teurRessource, chaineAnnulBit);
break;
default :
fprintf(STDERR,"Passage impossible : fonction appelDeFonctionsSorties dans instrumentation.ccn"
);
}
}
}
// Ajout de l’instrumentation représentant les sorties fictives des call externe
s
void appelDeFonctionsSortiesAppelExterne(INST *inst, BB *bb, int position, unsig
ned int *nbInstructionsAjoutees)
{
char *acces = (char *)(inst−>attributeValue(OUT,COMMENT_ATT));
ResId_T identificateurRessource = registreSalto(acces);
if(identificateurRessource == 0)
{
fprintf(STDERR,"Erreur : la chaine "%s" n’est pas reconnue comme étant un registre par la fonction ",a
cces);
fprintf(STDERR,"registreSalto(char*) (fonction appelDeFonctionsSortiesAppelExterne dans instrumentatio
n.cc)n");
exit(9);
}
appelDeFonctionReg(bb, position, nbInstructionsAjoutees, OUT, identificateurRe
ssource, NULL);
}
*nbInstructionsAjoutees, int numeroInst)
{
static unsigned char flagDelaySlot = 0;
// Si l’instruction est une instruction d’appel externe, on remplace "call tar
tampion" par "call my_tartempion"
// pour détourner l’appel "normal" à la fonction de la librairie en un appel à
une fonction redéfinie permettant de
// rendre compte des accès mémoires fait par ces fonctions
if(typeInstruction(inst) == T_APPEL_EXTERNE)
{
char chaine[100],chaine2[100], *tmp;
sscanf(inst−>unparse(),"%s %s",chaine,chaine2);
strcpy(chaine, "tcall "PREFIXE_FONCTIONS_EXTERNES);
// Allocation d’une nouvelle chaine de caractère contenant la nouvelle repré
sentation de l’instruction
tmp = (char *)malloc((strlen(chaine)+strlen(chaine2)+2)*sizeof(char));
strcpy(tmp,chaine);
strcat(tmp,chaine2);
strcat(tmp,"n");
inst−>addAttribute(UNPARSE_ATT, tmp, strlen(tmp)+1);
}
// Si on n’a pas à faire à une instruction se trouvant dans un DelaySlot
if(flagDelaySlot == 0)
// Si l’instruction n’est pas un branchement, alors, on instrumente cette in
struction normalement
if(!inst−>isCTI())
{
appelDeFonctionInstDebut(bb, position, nbInstructionsAjoutees, numeroInst,
typeInstruction(inst), NULL);
appelDeFonctionsEntrees(inst, bb, position, nbInstructionsAjoutees, NULL);
if(typeInstruction(inst)==T_SAVE || typeInstruction(inst)==T_RESTORE)
appelDeFonctionInstMilieu(bb, position, nbInstructionsAjoutees, NULL);
appelDeFonctionsSorties(inst, bb, position, nbInstructionsAjoutees, NULL);
appelDeFonctionInstFin(bb, position, nbInstructionsAjoutees, NULL);
}
// Si l’instruction courante est un branchement, alors, on l’instrumente ain
si que son DelaySlot
else
{
char *chaineAnnulBit = (char *)malloc(100*sizeof(char));
INST *instDelaySlot = bbSuivant−>getAsm(0);
/*fprintf(STDERR,"Inst <%s>tttDelay <%s>n",inst−>unparse(),instDelaySl
ot−>unparse());*/
// On met le flag à 1 pour indiquer que l’instrumentation de l’instruction
se trouvant dans le DelaySlot
// du branchement que l’on est en train de traiter a déjà été instrumentée
flagDelaySlot = 1;
// On traite le début de l’instruction de branchement
appelDeFonctionInstDebut(bb, position, nbInstructionsAjoutees, numeroIns
t, typeInstruction(inst), NULL);
// On traite les lectures de l’instruction de branchement
appelDeFonctionsEntrees(inst, bb, position, nbInstructionsAjoutees, NULL
);
// On traite les écritures de l’instruction de branchement
appelDeFonctionsSorties(inst, bb, position, nbInstructionsAjoutees, NULL
);
appelDeFonctionCopierInstDelay(bb, position, nbInstructionsAjoutees);
// Si le branchement est un brachement avec annul_bit (ex : bl,a ...
) alors on rempli la chaine de caractère
// chaineAnnulBit en conséquence (on y met les instructions pour tra
iter ce cas correctement)
if(typeInstruction(inst) == T_BRANCHEMENT_ANNUL_BIT)

{
int i;
char tmp[20];
size_t nmatch = 1;
if (regcomp(preg, EXP_ANNUL_BIT, REG_EXTENDED))
{
fprintf(STDERR,"Erreur lors de la compilation de l’expression régulière ""EXP_ANNUL
_BIT""n");
exit(4);
}
if (regexec(preg, inst−>unparse(), nmatch, pmatch, 0) == REG_NOMAT
CH)
{
fprintf(STDERR,"Erreur lors de l’exécution de l’expression régulière ""EXP_ANNUL_B
IT"" :n");
fprintf(STDERR,"Impossible de trouver l’expression régulière dans l’instruction "%s"n
",inst−>unparse());
exit(4);
}
regfree(preg);
for(i=0; i<pmatch[0].rm_eo; i++)
tmp[i] = (inst−>unparse())[i];
tmp[i] = ’0’;
strcpy(chaineAnnulBit,"trd %pc,%o7n");
strcat(chaineAnnulBit,"tadd %o7,16,%o7n");
strcat(chaineAnnulBit,"twr %l0,%ccrn");
strcat(chaineAnnulBit,tmp);
strcat(chaineAnnulBit," "ETIQUETTE_FONCTION_NOP"n");
}
else chaineAnnulBit = NULL;
// On traite le début de l’instruction qui se trouve dans le DelaySl
ot
appelDeFonctionInstDebut(bb, position, nbInstructionsAjoutees, numer
oInst+1, typeInstruction(instDelaySlot), chaineAnnulBit);
// On traite les lectures de l’instruction se trouvant dans le Delay
Slot du branchement
appelDeFonctionsEntrees(instDelaySlot, bb, position, nbInstructionsA
joutees, chaineAnnulBit);
appelDeFonctionInstMilieu(bb, position, nbInstructionsAjoutees, chai
neAnnulBit);
// On traite les écritures de l’instruction se trouvant dans le Dela
ySlot du branchement
appelDeFonctionsSorties(instDelaySlot, bb, position, nbInstructionsA
joutees, chaineAnnulBit);
// On traite la fin de l’instruction qui se trouve dans le DelaySlot
appelDeFonctionInstFin(bb, position, nbInstructionsAjoutees, chaineA
nnulBit);
appelDeFonctionEchangerInstDelay(bb, position, nbInstructionsAjoutees);
// Si l’instruction est un call externe, on lui ajoute comme entrées et
sorties les paramètres consommés
// et produits par cette fonction
if(typeInstruction(inst) == T_APPEL_EXTERNE || typeInstruction(inst) ==
T_APPEL_EXTERNE_SPECIAL)
{
switch (inst−>numberOfAttributes(COMMENT_ATT))
{
case 1 :
appelDeFonctionsEntreesAppelExterne(inst, bb, position, nbInstruct
ionsAjoutees);
break;
case 2 :
appelDeFonctionsEntreesAppelExterne(inst, bb, position, nbInstruct
ionsAjoutees);
appelDeFonctionsSortiesAppelExterne(inst, bb, position, nbInstruct
ionsAjoutees);
break;
default :
fprintf(STDERR,"Passage impossible : fonction instrumenter dans instrumentation.ccn");
}
}
// On traite la fin de l’instruction de branchement seulment si on n’a p
as à faire à un appel externe interceptées par les
// fonctions redéfinies dans redefinition.c
if(typeInstruction(inst)!=T_APPEL_EXTERNE) appelDeFonctionInstFin(bb, po
sition, nbInstructionsAjoutees, NULL);
appelDeFonctionEchangerInstDelay(bb, position, nbInstructionsAjoutees);
}
// Si l’instruction se trouve dans un DelaySlot, on remet le flag correspondan
t à 0
else flagDelaySlot = 0;
}
void ajouterCommentaireAppelExterne(INST *inst)
{
int i,j;
char etiquette[100], ligneCourante[200];
regex_t *preg_fct = new regex_t();
regex_t *preg_etiquette = new regex_t();
regex_t *preg_params = new regex_t();
regex_t *preg_result = new regex_t();
size_t nmatch = 1;
regmatch_t pmatch_params[nmatch];
regmatch_t pmatch_result[nmatch];
tion est une fonction
if (regcomp(preg_fct, EXP_FONCTION, REG_EXTENDED))
{
fprintf(STDERR,"Erreur lors de la compilation de l’expression régulière ""EXP_FONCTION""n");
exit(4);
}
regexec(preg_fct, inst−>unparse(), nmatch, pmatch, 0);
// On récupère dans la chaine etiquette l’étiquette associée au call traité
for(i=0,j=pmatch[0].rm_eo; j<strlen(inst−>unparse()); j++)

if((inst−>unparse())[j]!=’ ’ && (inst−>unparse())[j]!=’t’) etiquette[i++]=(i
nst−>unparse())[j];
etiquette[i] = ’0’;
if (regcomp(preg_etiquette, etiquette, REG_EXTENDED))
{
fprintf(STDERR,"Erreur lors de la compilation de l’expression régulière "%s"n",etiquette);
exit(4);
}
if (regcomp(preg_params, "[ ]+! params =[ ]+", REG_EXTENDED))
{
fprintf(STDERR,"Erreur lors de la compilation de l’expression régulière "[ t]+! params =[ t]+"n");
exit(4);
}
if (regcomp(preg_result, "[ ]+! Result =[ ]+", REG_EXTENDED))
{
fprintf(STDERR,"Erreur lors de la compilation de l’expression régulière "[ t]+! Result =[ t]+"n");
exit(4);
}
// On cherche, dans le fichier assembleur original, la ligne contenant l’appel
à la fonction traitée
do
{
char c;
i=0;
do
{
c = fgetc(fichierSOriginal);
ligneCourante[i++] = c;
}
while(c != ’n’);
ligneCourante[i] = ’0’;
}
while (regexec(preg_fct, ligneCourante, nmatch, pmatch, 0) == REG_NOMATCH ||
regexec(preg_etiquette, ligneCourante, nmatch, pmatch, 0) == REG_NOMATC
H ||
regexec(preg_params, ligneCourante, nmatch, pmatch_params, 0) == REG_NO
MATCH ||
regexec(preg_result, ligneCourante, nmatch, pmatch_result, 0) == REG_NO
MATCH ||
feof(fichierSOriginal));
regfree(preg_fct);
regfree(preg_etiquette);
regfree(preg_params);
regfree(preg_result);
if(feof(fichierSOriginal))
{
fprintf(STDERR,"Erreur : fin du fichier .s original atteinte ");
fprintf(STDERR,"(fonction ajouterCommentaireAppelExterne dans instrumentation.cc)n");
exit(7);
}
// Ici, la variable ligneCourante contient la ligne du fichier assembleur corr
espondant à l’appel
// de la fonction traitée (qui contient donc aussi en commentaire les paramètr
es de cette fonction)
char liste[100],*tmp;
// On récupère la liste des paramètres d’entrée
for(i=0,j=pmatch_params[0].rm_eo; j<pmatch_result[0].rm_so; j++) liste[i++]=li
gneCourante[j];
liste[i] = ’0’;
// Puis on la range dans les attributs à mettre en commentaire dans le fichier
généré
// NOTE : ces commentaires servent aussi par la suite à identifier quels sont
les accès fait par la fonction externe
tmp = (char *)malloc((strlen(liste)+1)*sizeof(char));
strcpy(tmp,liste);
inst−>addAttribute(COMMENT_ATT, tmp, strlen(liste)+1);
// On récupère la liste contenant le résultat (paramètre de sortie)
for(i=0,j=pmatch_result[0].rm_eo; ligneCourante[j]!=’!’ &&
ligneCourante[j]!=’ ’ &&
ligneCourante[j]!=’t’ &&
ligneCourante[j]!=’n’; j++) liste[i++]=lign
eCourante[j];
liste[i] = ’0’;
// Puis, si la chaine n’est pas vide, on la range dans les attributs à mettre
en commentaire dans le fichier généré
// NOTE : ces commentaires servent aussi par la suite à identifier quels sont
les accès fait par la fonction externe
if(liste[0] != ’0’)
{
tmp = (char *)malloc((strlen(liste)+1)*sizeof(char));
strcpy(tmp,liste);
inst−>addAttribute(COMMENT_ATT, tmp, strlen(tmp)+1);
}
}
void Salto_hook()
{
CFG *proc;
BB *bb,*bbSuivant;
INST *inst;
int numeroInst;
unsigned int nbInstructionsAjoutees;
// Parcours du programme permettant de récupérer les paramètres des fonctions
définies à
// l’extérieur des fichiers .s locaux
for (int i=0; i < numberOfCFG(); i++)
{
proc = getCFG(i);
for (int j=0; j < proc−>numberOfBB(); j++)
{
bb = proc−>getBB(j);
for (int k=0; k < bb−>numberOfAsm(); k++)
{
inst = bb−>getAsm(k);
if(typeInstruction(inst) == T_APPEL_EXTERNE ||

typeInstruction(inst) == T_APPEL_EXTERNE_SPECIAL) ajouterCommentaireA
ppelExterne(inst);
}
}
}
// Parcours du programme permettant d’insérer le code d’instrumentation des in
structions
numeroInst = 0;
{
proc = getCFG(i);
{
bbSuivant = proc−>getBB(j+1);
int nbAsm = bb−>numberOfAsm();
nbInstructionsAjoutees = 0;
for (int k=0; k < nbAsm; k++)
{
numeroInst++;
inst = bb−>getAsm(k+nbInstructionsAjoutees);
instrumenter(inst, bb, bbSuivant, k, &nbInstructionsAjoutees, numeroInst
);
}
}
}
// Parcours du programme permettant d’insérer le code pour l’initialisation de
s variables globales
// et d’affichage de ces variables en fin d’exécution du programme.
{
proc = getCFG(i);
if(!strcmp(proc−>getName(),"main"))
{
// Insertion d’un appel à la procédure initialisant les variables globales
(proc−>getBB(0))−>insertAsm(0, newAsm("call initVariablesGlobales"));
(proc−>getBB(0))−>insertAsm(1, newAsm(NOP));
{
for (int k=0; k < bb−>numberOfAsm(); k++)
{
inst = bb−>getAsm(k);
// Insertion d’un appel à la procédure d’affichage des structures de d
onnées juste avant l’instruction "call exit"
if(estPresent("call",inst−>unparse()) && estPresent("exit",inst−>unparse(
)))
{
bb−>insertAsm(k, newAsm("call afficherSdd"));
bb−>insertAsm(k+1, newAsm(NOP));
break;
}
}
}
break;
}
}
// Envoi du code instrumenté vers la sortie standard
produceCode(fichierSInstrumente);
}
void Salto_init_hook(int argc, char *argv[])
{
int i,j,k;
char nomFichierSortie[100];
// Récupération dans la ligne de commande entrée par l’utilisateur du nom du f
ichier original
for(i=1; i<argc && !estPresent("−i",argv[i]); i++);
if(i == argc−1)
{
fprintf(STDERR,"Erreur, votre ligne de commande ne comporte pas l’option "−i"n");
exit(6);
}
// On ouvre le fichier .s original à traiter pour pouvoir s’en servir dans sal
to_hook()
fichierSOriginal = fopen(argv[i+1],"r");
if(fichierSOriginal == NULL)
{
fprintf(STDERR,"Problème lors de l’ouverture du fichier "%s" ",argv[i+1]);
fprintf(STDERR,"(fonction Salto_init_hook dans le fichier instrumentation.cc)n");
exit(11);
}
nomFichierSortie[0]=’0’;
strcat(nomFichierSortie,REPERTOIRE_FICHIER_INSTRUMENTES);
strcat(nomFichierSortie,argv[i+1]);
// On ouvre le fichier .s instrumenté en écriture à traiter pour pouvoir s’en
servir dans salto_hook()
fichierSInstrumente = fopen(nomFichierSortie,"w");
if(fichierSInstrumente == NULL)
{
fprintf(STDERR,"Problème lors de l’ouverture du fichier "%s" ",nomFichierSortie);
fprintf(STDERR,"(fonction Salto_init_hook dans le fichier instrumentation2.cc)n");
exit(11);
}
// Recherche de l’expression "−−" dans la ligne de commande
for(; i<argc && !estPresent("−−",argv[i]); i++);
// Si cette expression n’est pas présente, on ne numérote pas les fichiers
if(i == argc−1) numeroFichier = 0;
else numeroFichier=atoi(argv[i+1]);
}

void Salto_end_hook()
{
exit(0);
}

16 jun 03 17:02 instrument.h Page 1/1
#define STDERR stdout
#define TRACE_INSTRUCTIONS_INUTILES "../trace_inutile.txt"
#define TRACE_INSTRUCTIONS_STATIQUES_INUTILES "../trace_statiques_inutile.txt"
#define TRACE_EVOLUTION_INUTILES "../evolution_inutile.txt"
#define TRACE_VALEURS_MORTES "../evolution_valeurs_mortes.txt"
/* Défini le nom de la fonction à appeler à chaque début de bloc de base */
#define NOM_FCT_IN_MEM "instrumentationEntreeMemoire"
#define NOM_FCT_OUT_MEM "instrumentationSortieMemoire"
#define NOM_FCT_IN_REG "instrumentationEntreeRegistre"
#define NOM_FCT_OUT_REG "instrumentationSortieRegistre"
#define NOM_FCT_DEBUT_INST "instrumentationInstructionDebut"
#define NOM_FCT_MILIEU_INST "instrumentationInstructionMilieu"
#define NOM_FCT_FIN_INST "instrumentationInstructionFin"
#define NOM_FCT_INST "instrumentationInstruction"
/* Défini les différentes valeur que peut prendre la variable
typeInstruction dans la structure instruction */
#define T_APPEL_EXTERNE 0
#define T_APPEL_EXTERNE_SPECIAL 1
#define T_APPEL_INTERNE 2
#define T_BRANCHEMENT 3
#define T_BRANCHEMENT_ANNUL_BIT 4
#define T_SAVE 5
#define T_RESTORE 6
#define T_LOAD 7
#define T_STORE 8
#define T_NOP 9
#define T_AUTRE 10
/* Identifiant Salto du registre %g0 */
#define ID_REG_SALTO_G 41
/* Identifiant Salto du registre %o0 */
#define ID_REG_SALTO_O 49
/* Identifiant Salto du registre %l0 */
#define ID_REG_SALTO_L 57
/* Identifiant Salto du registre %i0 */
#define ID_REG_SALTO_I 65
/* Décalage, en nombre de registres, entre une fenêtre et la suivante */
#define OFFSET_FENETRE 16
/* A virer dans la version optimisée */
#define MAX_NB_INST_DYNAMIQUE 10000000
void instrumentationInstructionDebut(int typeInstruction, int numeroInst, int nu
meroFichier);
void instrumentationInstructionMilieu(void);
void instrumentationInstructionFin(void);
void copierInstDelay(void);
void echangerInstDelay(void);
void instrumentationEntreeRegistre(int identificateurRessource);
void instrumentationSortieRegistre(int identificateurRessource);
void instrumentationEntreeMemoire(int adresseMemoire, int nbOctetsLus);
void instrumentationSortieMemoire(int adresseMemoire, int nbOctetsEcrits);
mercredi 18 juin 2003 instrument.h 14/37

18 jun 03 17:55 instrument.c Page 1/13
#include <stdio.h>
#include <stdlib.h>
#define NB_REGISTRES 115
#define NB_REGISTRES_TOURNANTS 100000
/* MAX_NB_OPERANDES doit etre égal au maximum d’opérandes que peuvent avoir les
instruction +1 ! */
#define MAX_NB_OPERANDES 150
/* Défini les différentes valeur que peuvent prendre les variables utiliteInst[i
], i allant de 0 à MAX_NB_INST_DYNAMIQUE.*/
#define INUTILE 0
#define UTILE 1
#define NOP 2
#define GENERER_FICHIER_DOT 1
#define FICHIER_TRACE_DOT "graphe_dependances.dot"
#define MAX_NB_INST_STATIQUES 11000
#define MAX_INST_STATIQUES_TOTAL 250000
#define NB_FICHIERS 15
typedef unsigned char flag;
typedef struct instru {
unsigned int numeroStatique;
unsigned int numeroDynamique;
flag typeInstruction;
struct instru *origineOperandes[MAX_NB_OPERANDES];
struct instru *precedent;
} instruction;
typedef struct mem {
int adresse;
unsigned int nbLecture;
instruction *derniereEcriture;
struct mem *suivant;
} elementMemoire;
/* Définition des registres généraux */
instruction *tableRegistres[NB_REGISTRES];
unsigned int tableLectureRegistres[NB_REGISTRES];
/* Définition des registres tournants */
instruction *tableRegistresTournants[NB_REGISTRES_TOURNANTS];
unsigned int tableLectureRegistresTournants[NB_REGISTRES_TOURNANTS];
unsigned int niveauFenetreRegistre = 0;
/* Définition des zones mémoires (point d’entrée dans la liste chainée) */
elementMemoire *adresseInitiale = NULL;
/* Définition des instructions (point d’entrée dans la liste chainée et tableau
de flag) */
flag utiliteInst[MAX_NB_INST_DYNAMIQUE];
flag valeursMortes[MAX_NB_INST_DYNAMIQUE];
instruction *instInitiale;
instruction *instCourante = NULL;
instruction *instCouranteDelay = NULL;
unsigned int occurencesInutileInstStatiques[MAX_NB_INST_STATIQUES][NB_FICHIERS];
unsigned int occurencesInstStatiques[MAX_NB_INST_STATIQUES][NB_FICHIERS];
unsigned int allocation=0;
/* Utile uniquement pour la version donnant la proportion d’instruction statique
s inutiles */
int cptInstStatiquesTraitees;
void initVariablesGlobales(void)
{
int i,j;
/* Création d’une instruction initiale fictive sur laquelle vont pointer celle
s qui
utilisent des registres déjà initialisés lors du lancement du programme */
instInitiale = malloc(sizeof(instruction));
allocation++;
if(instInitiale == NULL)
{
fprintf(stderr,"Taille mémoire maximale allouable dépassée !! ");
fprintf(stderr,"(fonction initVariablesGlobales dans le fichier instrument.c)n");
exit(10);
}
instInitiale−>numeroStatique = 0;
instInitiale−>numeroDynamique = 0;
instInitiale−>numeroFichier = 0;
for(i=0; i<MAX_NB_OPERANDES; i++) instInitiale−>origineOperandes[i] = NULL;
instInitiale−>typeInstruction = T_AUTRE;
instInitiale−>precedent = NULL;
instCourante = instInitiale;
for(i=0; i<NB_REGISTRES; i++)
{
tableRegistres[i] = instInitiale;
tableLectureRegistres[i] = 0;
}
for(i=0; i<NB_REGISTRES_TOURNANTS; i++)
{
tableRegistresTournants[i] = instInitiale;
tableLectureRegistresTournants[i] = 0;
}
for(i=0; i<MAX_NB_INST_DYNAMIQUE; i++)
{
utiliteInst[i] = INUTILE;
valeursMortes[i] = 0;
}
for(i=0; i<MAX_NB_INST_STATIQUES; i++)
mercredi 18 juin 2003 instrument.c 15/37

for(j=0; j<NB_FICHIERS; j++)
{
occurencesInstStatiques[i][j]=0;
occurencesInutileInstStatiques[i][j]=0;
}
}
void remonterArbre(instruction *inst)
{
int i;
/* Si on n’a pas encore parcouru l’arbre de dépendance de l’instuction inst,
on le parcours pour pour positionner les flag d’utilité utiliteInst[inst−>n
umeroDynamique] */
if(utiliteInst[inst−>numeroDynamique]!=UTILE)
{
utiliteInst[inst−>numeroDynamique] = UTILE;
for(i=0; inst−>origineOperandes[i]!=NULL; i++) remonterArbre(inst−>origineOp
erandes[i]);
}
}
insert(float *tableauInstStatiqueInutiles, float valeur)
{
int i,j,k;
for(i=0; tableauInstStatiqueInutiles[i]>valeur; i++);
for(k=cptInstStatiquesTraitees; k!=i; k−−) tableauInstStatiqueInutiles[k]=tabl
eauInstStatiqueInutiles[k−1];
tableauInstStatiqueInutiles[i] = valeur;
cptInstStatiquesTraitees++;
}
/* Fonction de debug permettant d’afficher la liste chainée des instructions,
la table des registres et enfin le pourcentage d’instructions utile et inutil
es */
void afficherSdd(void)
{
instruction *i;
elementMemoire *a;
int j,k,cptUtile=0,cptInutile=0,cptNop=0,cptInstStatique=0,cptInstStatiqueOccu
rencesInutile=0,
cptLoadInutile=0,cptLoad=0,cptStoreInutile=0,cptStore=0,cptMortes=0,nbTotalIns
tructions;
unsigned int instInutileArtificiel;
float tableauInstStatiqueInutiles[MAX_INST_STATIQUES_TOTAL];
/* Définition du fichier contenant la trace (numéro) des instructions inutiles
) */
FILE *traceInstructionsInutiles = fopen(TRACE_INSTRUCTIONS_INUTILES,"w");
FILE *traceInstructionsStatiquesInutiles = fopen(TRACE_INSTRUCTIONS_STATIQUES_
INUTILES,"w");
FILE *fichierEvolutionQtValeursMortes = fopen(TRACE_VALEURS_MORTES,"w");
FILE *fichierDot;
if(GENERER_FICHIER_DOT)
{
fichierDot = fopen(FICHIER_TRACE_DOT,"w");
if(fichierDot==NULL)
{
fprintf(stderr,"Problème lors de l’ouverture du fichier ""FICHIER_TRACE_DOT"" ");
fprintf(stderr,"(fonction afficherSdd dans le fichier instrument.c)n");
exit(11);
}
fprintf(fichierDot,"digraph G {n");
}
if(traceInstructionsInutiles==NULL)
{
fprintf(stderr,"Problème lors de l’ouverture du fichier ""TRACE_INSTRUCTIONS_INUTILES"" "
);
fprintf(stderr,"(fonction afficherSdd dans le fichier instrument.c)n");
exit(11);
}
/* Affichage des dépendances entre les instructions dynamiques
(stockées dans la liste chainée d’instructions dynamiques) */
for(i=instCourante; i!=NULL; i=i−>precedent)
{
if(GENERER_FICHIER_DOT && utiliteInst[i−>numeroDynamique]!=NOP)
{
if(utiliteInst[i−>numeroDynamique]==INUTILE)
fprintf(fichierDot,"t%d [color=".0 .0 .8",fontcolor=".0 .0 .8"];n", i−>numeroDynamiq
ue);
}
fprintf(stdout,"I.Dynamic %dt−− I.Static %dt−− File %d",i−>numeroDynamique,i−>numeroS
tatique,i−>numeroFichier);
if(utiliteInst[i−>numeroDynamique]==UTILE) fprintf(stdout,"t−− utile");
else if(utiliteInst[i−>numeroDynamique]==INUTILE) fprintf(stdout,"t−− INUTILE
");
else if(utiliteInst[i−>numeroDynamique]==NOP) fprintf(stdout,"t−− nop");
if(i−>origineOperandes[0]!=NULL)
{
fprintf(stdout,"t−− Dépend de %d",(i−>origineOperandes[0])−>numeroDynamique)
;
{
fprintf(fichierDot,"t%d −> %d", i−>numeroDynamique, (i−>origineOperandes
[0])−>numeroDynamique);
if(utiliteInst[i−>numeroDynamique]==INUTILE) fprintf(fichierDot," [color=".
0 .0 .8"]");
fprintf(fichierDot,";n");
}
}
for(j=1; j<MAX_NB_OPERANDES; j++)
if(i−>origineOperandes[j]!=NULL)
{
fprintf(stdout,",%d",(i−>origineOperandes[j])−>numeroDynamique);
{
fprintf(fichierDot,"t%d −> %d", i−>numeroDynamique, (i−>origineOperand
es[j])−>numeroDynamique);
if(utiliteInst[i−>numeroDynamique]==INUTILE) fprintf(fichierDot," [color
=".0 .0 .8"]");
fprintf(fichierDot,";n");

}
}
fprintf(stdout,"n");
if(utiliteInst[i−>numeroDynamique]==INUTILE)
{
/* Ecriture dans le fichier traceInstructionsInutiles du numéro des instru
ctions dynamiques inutiles */
fprintf(traceInstructionsInutiles,"%un",i−>numeroDynamique);
occurencesInutileInstStatiques[i−>numeroStatique][i−>numeroFichier]++;
}
occurencesInstStatiques[i−>numeroStatique][i−>numeroFichier]++;
switch (i−>typeInstruction)
{
case T_LOAD :
cptLoad++;
if(utiliteInst[i−>numeroDynamique]==INUTILE) cptLoadInutile++;
break;
case T_STORE :
cptStore++;
if(utiliteInst[i−>numeroDynamique]==INUTILE) cptStoreInutile++;
}
}
fclose(traceInstructionsInutiles);
if(GENERER_FICHIER_DOT)
{
fprintf(fichierDot,"}");
fclose(fichierDot);
}
/* Affichage de la table des registres fixes avec les informations qui lui son
t relatives */
fprintf(stdout,"nTable des registres fixes :n");
for(j=0; j<NB_REGISTRES; j++)
{
if(tableRegistres[j]−>numeroDynamique != 0 || tableLectureRegistres[j] != 0)
{
fprintf(stdout,"Registre numéro %dt",j);
fprintf(stdout,": Modifié par l’instruction %dt",tableRegistres[j]−>numeroDynamique)
;
fprintf(stdout,"et lu depuis par %d instruction(s)n",tableLectureRegistres[j]);
}
}
/* Affichage de la table des registres tournants avec les informations qui lui
sont relatives */
fprintf(stdout,"nTable des registres tournants (niveau actuel : %d) :n",niveauFenetreRegistre);
for(j=0; j<NB_REGISTRES_TOURNANTS; j++)
{
if(tableRegistresTournants[j]−>numeroDynamique != 0 || tableLectureRegistres
Tournants[j] != 0)
{
fprintf(stdout,"Registre tournant numéro %dt",j);
fprintf(stdout,": Modifié par l’instruction %dt",tableRegistresTournants[j]−>numeroD
ynamique);
fprintf(stdout,"et lu depuis par %d instruction(s)n",tableLectureRegistresTournants[j
]);
}
}
/* Affichage de la liste chainée contenant les adresses mémoire */
fprintf(stdout,"nListe des adresses mémoires :n");
for(a=adresseInitiale; a!=NULL; a=a−>suivant)
{
fprintf(stdout,"Adresse mémoire %dt",a−>adresse);
fprintf(stdout,": Modifié par l’instruction %dt",a−>derniereEcriture−>numeroDynamique)
;
fprintf(stdout,"et lu depuis par %d instruction(s)n",a−>nbLecture);
}
/* On compte le nombre d’instructions utiles et inutiles afin de l’afficher */
for(j=0; j<instCourante−>numeroDynamique; j++)
{
switch (utiliteInst[j])
{
case UTILE : cptUtile++; break;
case INUTILE : cptInutile++; break;
case NOP : cptNop++; break;
default : fprintf(stderr,"Passage impossible : fonction afficherSdd dans instrument.cn"
);
}
if(valeursMortes[j] == 0) cptMortes++;
if(valeursMortes[j] == 0 && utiliteInst[j] != INUTILE)
{
fprintf(stderr,"Instruction %d !!!!n",j);
}
if(j%20 == 0) fprintf(fichierEvolutionQtValeursMortes,"%dt%dn",j,cptMortes)
;
}
fclose(fichierEvolutionQtValeursMortes);
nbTotalInstructions = instCourante−>numeroDynamique;
fprintf(stdout,"nCalcul prenant en compte les "nop" :n");
fprintf(stdout,"Nombre d’instructions inutiles : %d/%d soit %f %%n",
cptInutile,nbTotalInstructions,(float)(cptInutile*100)/(float)nbTotalInstructi
ons);
fprintf(stdout,"Nombre d’instructions utiles : %d/%d soit %f %%n",
cptUtile,nbTotalInstructions,(float)(cptUtile*100)/(float)nbTotalInstructions)
;
fprintf(stdout,"Nombre de nop : %d/%d soit %f %%nn",
cptNop,nbTotalInstructions,(float)(cptNop*100)/(float)nbTotalInstructions);
nbTotalInstructions = instCourante−>numeroDynamique − cptNop;
fprintf(stdout,"nCalcul ne prenant pas en compte les "nop" :n");
ons);
fprintf(stdout,"Nombre d’instructions utiles : %d/%d soit %f %%nn",
;
fprintf(stdout,"Nombre d’instructions dont le résultat est mort : %d/%d soit %f %%nn",
cptMortes,nbTotalInstructions,(float)(cptMortes*100)/(float)nbTotalInstruction
s);
fprintf(stdout,"nnNombre d’ocurences d’instructions inutiles pour une instruction statique : n");

tableauInstStatiqueInutiles[0] = 0.0;
/* Lignes de la matrice */
for(k=0; k<MAX_NB_INST_STATIQUES; k++)
{
if(k==0)
fprintf(stdout," t%d",j);
else
{
fprintf(stdout,"n%d :t",k);
/* Colonnes de la matrice */
{
if(occurencesInstStatiques[k][j]!=0)
{
fprintf(stdout,"%u/%ut",occurencesInutileInstStatiques[k][j],occurence
sInstStatiques[k][j]);
cptInstStatique++;
if(occurencesInutileInstStatiques[k][j]!=0) cptInstStatiqueOccurencesI
nutile++;
insert(tableauInstStatiqueInutiles,(float)occurencesInutileInstStatiqu
es[k][j]/(float)occurencesInstStatiques[k][j]);
}
else fprintf(stdout," t");
}
}
}
for(j=0; j<cptInstStatiquesTraitees; j++)
fprintf(traceInstructionsStatiquesInutiles,"%dt%fn",cptInstStatiquesTraitee
s,tableauInstStatiqueInutiles[j]);
fclose(traceInstructionsStatiquesInutiles);
fprintf(stdout,"nNombre d’instructions statique ayant des occurences inutiles / Nombre d’instructions stati
ques utilisées : %d/%d soit %f %%n",
cptInstStatiqueOccurencesInutile, cptInstStatique, (float)(cptInstStatiqueOccu
rencesInutile*100)/(float)cptInstStatique);
fprintf(stdout,"nNombre de load inutiles / Nombre de load dynamique total : %d/%d soit %f %%n",
cptLoadInutile,cptLoad,(float)(cptLoadInutile*100)/(float)cptLoad);
fprintf(stdout,"nNombre de store inutiles / Nombre de store dynamique total : %d/%d soit %f %%n",
cptStoreInutile,cptStore,(float)(cptStoreInutile*100)/(float)cptStore);
fprintf(stdout,"Nombre de noeuds total dans le graphe : %dn",allocation);
}
/* Création de la représentation des instructions dynamiques en mémoire */
/* !!!!! Attention, cette fonction est différente selon qu’on utilise le program
me sur Sparc ou x86 (DelaySlot) */
meroFichier)
{
int i;
instruction *tmp = malloc(sizeof(instruction));
allocation++;
if(tmp == NULL)
{
fprintf(stderr,"(fonction instrumentationInstructionDebut dans le fichier instrument.c)n");
exit(10);
}
if(instCourante−>numeroDynamique >= MAX_NB_INST_DYNAMIQUE)
{
fprintf(stderr,"Nombre maximum d’instruction dépassé, veulliez augmenter la valeur de la constante ")
;
fprintf(stderr,"MAX_NB_INST_DYNAMIQUE dans le fichier instrument.cn");
exit(1);
}
tmp−>numeroStatique = numeroInst;
tmp−>numeroFichier = numeroFichier;
tmp−>typeInstruction = typeInstruction;
/* On passe pour la première fois dans cette fonction */
if(instCourante == NULL)
{
tmp−>numeroDynamique = 1;
tmp−>precedent = instInitiale;
}
else
{
tmp−>numeroDynamique = instCourante−>numeroDynamique+1;
tmp−>precedent = instCourante;
}
for(i=0; i<MAX_NB_OPERANDES; i++) tmp−>origineOperandes[i] = NULL;
instCourante = tmp;
/*fprintf(stderr,"Début statique %d dynamique %d fichier %d >",numeroInst,tmp−
>numeroDynamique,tmp−>numeroFichier);*/
}
/* !!!!! Attention, cette fonction n’est utile que pour les machines utilisant u
n DelaySolt (Sparc) */
void instrumentationInstructionMilieu(void)
{
/* Si l’instruction est un save, on incrémente le niveau de la fenetre de regi
stres */
if(instCourante−>typeInstruction == T_SAVE) niveauFenetreRegistre++;
/* Si c’est un restore, on décrémente le niveau de la fenetre de registres */
else if(instCourante−>typeInstruction == T_RESTORE) niveauFenetreRegistre−−;
}
void instrumentationInstructionFin(void)
{
/* Si l’instruction courante est un branchement quelconque, un save ou un rest
ore, on la marque comme utile
et on marque comme utile toute les instructions dont elle dépend (appel réc
ursif à remonterArbre) */
if(instCourante−>typeInstruction == T_BRANCHEMENT ||
instCourante−>typeInstruction == T_BRANCHEMENT_ANNUL_BIT ||

instCourante−>typeInstruction == T_SAVE ||
instCourante−>typeInstruction == T_RESTORE ||
instCourante−>typeInstruction == T_APPEL_INTERNE ||
instCourante−>typeInstruction == T_APPEL_EXTERNE ||
instCourante−>typeInstruction == T_APPEL_EXTERNE_SPECIAL) remonterArbre(ins
tCourante);
if(instCourante−>typeInstruction == T_NOP) utiliteInst[instCourante−>numeroDyn
amique] = NOP;
/*fprintf(stderr,"< Fin statique %d dynamique %d fichier %dn",instCourante−>n
umeroStatique,instCourante−>numeroDynamique,instCourante−>numeroFichier);*/
}
void copierInstDelay(void)
{
instCouranteDelay = instCourante;
}
void echangerInstDelay(void)
{
instruction *tmp = instCourante;
instCourante = instCouranteDelay;
instCouranteDelay = tmp;
}
/* Traitement fait lorsqu’on rencontre une instruction qui accède à la mémoire o
u à des registres (en entrée) */
me sur Sparc ou x86 (registres) */
void instrumentationEntreeRegistre(int identificateurRessource)
{
int i;
unsigned int identificateurRegistreTournant;
/* identificateurRessource numéro ID_REG_SALTO_G = trou noir (%g0) */
if(identificateurRessource != ID_REG_SALTO_G)
{
/* Si le registre accédé fait partie de la fenêtre de registres tournante */
if(identificateurRessource>=ID_REG_SALTO_O && identificateurRessource<=ID_RE
G_SALTO_I+7)
{
identificateurRegistreTournant = (72−identificateurRessource)+(niveauFenet
reRegistre*OFFSET_FENETRE);
if(identificateurRegistreTournant>=NB_REGISTRES_TOURNANTS)
{
fprintf(stderr,"Nombre maximum de registres tournants dépassé, veulliez augmenter la valeur de
");
fprintf(stderr,"la constante NB_REGISTRES_TOURNANTS dans le fichier instrument.cn");
exit(1);
}
tableLectureRegistresTournants[identificateurRegistreTournant]++;
for(i=0; (instCourante−>origineOperandes)[i]!=NULL; i++)
if (i >= MAX_NB_OPERANDES)
{
fprintf(stderr,"Nombre maximum d’opérandes pour une instruction dépassé, veulliez augmente
r la valeur de ");
fprintf(stderr,"la constante MAX_NB_OPERANDES dans le fichier instrument.cn");
exit(8);
}
instCourante−>origineOperandes[i] = tableRegistresTournants[identificateur
RegistreTournant];
}
/* Sinon, on le considère comme un registre fixe */
else
{
tableLectureRegistres[identificateurRessource]++;
{
r la valeur de ");
exit(8);
}
instCourante−>origineOperandes[i] = tableRegistres[identificateurRessource
];
}
}
}
u à des registres (en sortie) */
me sur Sparc ou x86 (registre %g0) */
void instrumentationSortieRegistre(int identificateurRessource)
{
/* Mise à jour du compteur de résultat : le registre identificateurRessource e
st considéré comme un résultat
de l’instruction instCourante */
valeursMortes[instCourante−>numeroDynamique]++;
/* Si le registre dans lequel on écrit est le numéro 41 (correspondant à %g0),
on n’en tient pas compte car ce
registre est un trou noir (quelque soit ce qui y est écrit, on lit toujours
la valeur 0 dans ce registre) */
{
G_SALTO_I+7)
{
{

");
exit(1);
}
if(tableLectureRegistresTournants[identificateurRegistreTournant] == 0)
valeursMortes[(tableRegistresTournants[identificateurRegistreTournant])−
>numeroDynamique]−−;
tableRegistresTournants[identificateurRegistreTournant] = instCourante;
tableLectureRegistresTournants[identificateurRegistreTournant] = 0;
}
else
{
if(tableLectureRegistres[identificateurRessource] == 0)
valeursMortes[(tableRegistres[identificateurRessource])−>numeroDynamique
]−−;
tableRegistres[identificateurRessource] = instCourante;
tableLectureRegistres[identificateurRessource] = 0;
}
}
}
void lectureMemoireOctet(int adresseMemoire)
{
int i;
elementMemoire *a;
for(a=adresseInitiale; a==NULL || adresseMemoire>a−>adresse; a=a−>suivant)
if(a==NULL)
{
/*fprintf(stderr,"Accès à l’adresse mémoire non initialisée %d par l’instr
uction %d (fichier %d)n",
adresseMemoire, instCourante−>numeroStatique, instCourante−>numeroFichier)
;*/
return;
}
if(adresseMemoire != a−>adresse)
{
/*fprintf(stderr,"Accès à l’adresse mémoire non initialisée %d par l’instruc
tion %d (fichier %d)n",
adresseMemoire, instCourante−>numeroStatique, instCourante−>numeroFichier);*
/
return;
}
{
fprintf(stderr,"Nombre maximum d’opérandes pour une instruction dépassé, veulliez augmenter la va
leur de ");
exit(8);
}
instCourante−>origineOperandes[i] = a−>derniereEcriture;
a−>nbLecture++;
}
void instrumentationEntreeMemoire(int adresseMemoire, int nbOctetsLus)
{
int offset;
for(offset=0; offset<nbOctetsLus; offset++) lectureMemoireOctet(adresseMemoire
+offset);
}
void ecritureMemoireOctet(int adresseMemoire)
{
elementMemoire *nouveau, *tmp = adresseInitiale;
/* Mise à jour du compteur de résultat : la case mémoire adresseMemoire est co
nsidéré comme un résultat
valeursMortes[instCourante−>numeroDynamique]++;
/* Cas ou la liste chainée est vide : premier accès en écriture à la mémoire *
/
if(adresseInitiale == NULL)
{
adresseInitiale = malloc(sizeof(elementMemoire));
{
fprintf(stderr,"(fonction ecritureMemoireOctet dans le fichier instrument.c)n");
exit(10);
}
adresseInitiale−>adresse = adresseMemoire;
adresseInitiale−>nbLecture = 0;
adresseInitiale−>derniereEcriture = instCourante;
adresseInitiale−>suivant = NULL;
}
else
{
/* Cas ou l’insertion de données concerne le premier élément de la liste cha
inée */
if(adresseMemoire <= adresseInitiale−>adresse)
{
if(adresseInitiale−>adresse == adresseMemoire)
{
if(adresseInitiale−>nbLecture == 0)
valeursMortes[(adresseInitiale−>derniereEcriture)−>numeroDynamique]−−;
}
else
{
nouveau = malloc(sizeof(elementMemoire));
if(nouveau == NULL)
{
exit(10);
}
nouveau−>adresse = adresseMemoire;

nouveau−>nbLecture = 0;
nouveau−>derniereEcriture = instCourante;
nouveau−>suivant = adresseInitiale;
adresseInitiale = nouveau;
}
}
/* Cas général d’insertion d’un élément dans la liste chainée */
else
{
/* On parcours la liste chainée jusqu’a trouver l’endroit ou il faut insér
er la donnée */
while(tmp−>suivant != NULL && adresseMemoire >= tmp−>suivant−>adresse) t
mp = tmp−>suivant;
/* Si l’adresse mémoire à déjà était accédée par le passé, on modifie le p
ointeur sur
l’instruction qui a écrit dernièrement dans cette zone mémoire */
if(tmp−>adresse == adresseMemoire)
{
if(tmp−>nbLecture == 0)
valeursMortes[(tmp−>derniereEcriture)−>numeroDynamique]−−;
tmp−>nbLecture = 0;
tmp−>derniereEcriture = instCourante;
}
/* Sinon, on créé une nouvelle cellule représentant cette zone mémoire et
on l’insère dans la liste chainée */
else
{
if(nouveau == NULL)
{
exit(10);
}
nouveau−>suivant = tmp−>suivant;
tmp−>suivant = nouveau;
}
}
}
}
void instrumentationSortieMemoire(int adresseMemoire, int nbOctetsEcrits)
{
int offset;
for(offset=0; offset<nbOctetsEcrits; offset++) ecritureMemoireOctet(adresseMem
oire+offset);
}

18 jun 03 14:19 instrument_optim.c Page 1/10
#include <stdio.h>
#include <stdlib.h>
#define NB_REGISTRES 115
#define NB_REGISTRES_TOURNANTS 100000
/* MAX_NB_OPERANDES doit etre égal au maximum d’opérandes que peuvent avoir les
instruction +1 ! */
#define MAX_NB_OPERANDES 1400
/* Défini les différentes valeur que peuvent prendre les variables utiliteInst[i
], i allant de 0 à MAX_NB_INST_DYNAMIQUE.*/
#define INUTILE 0
#define UTILE 1
#define NOP 2
struct donnees_instruction {
unsigned int numeroStatique;
flag typeInstruction;
flag valeurMorte;
struct instru *origineOperandes[MAX_NB_OPERANDES];
};
flag utiliteInst;
struct donnees_instruction *donnees;
} instruction;
typedef struct mem {
int adresse;
unsigned int nbLecture;
instruction *derniereEcriture;
struct mem *suivant;
} elementMemoire;
/* Définition des registres généraux */
instruction *tableRegistres[NB_REGISTRES];
unsigned int tableLectureRegistres[NB_REGISTRES];
/* Définition des registres tournants */
instruction *tableRegistresTournants[NB_REGISTRES_TOURNANTS];
unsigned int tableLectureRegistresTournants[NB_REGISTRES_TOURNANTS];
unsigned int niveauFenetreRegistre = 0;
/* Définition des zones mémoires (point d’entrée dans la liste chainée) */
elementMemoire *adresseInitiale = NULL;
/* Définition des instructions (point d’entrée dans la liste chainée et tableau
de flag) */
instruction *instCouranteDelay = NULL;
unsigned int numeroDynamiqueCourant;
int cptUtile = 0, cptInutile = 0, cptNop = 0;
unsigned int allocation=0;
{
int i;
struct donnees_instruction *donnees = malloc(sizeof(struct donnees_instruction
));
allocation++;
numeroDynamiqueCourant=0;
s qui
if(donnees == NULL || instInitiale == NULL)
{
fprintf(stderr,"(fonction initVariablesGlobales dans le fichier instrument.c)n");
exit(10);
}
donnees−>numeroFichier = 0;
donnees−>numeroStatique = 0;
donnees−>numeroDynamique = numeroDynamiqueCourant; /* 0 ici */
donnees−>typeInstruction = T_AUTRE;
donnees−>valeurMorte = 0;
for(i=0; i<MAX_NB_OPERANDES; i++) donnees−>origineOperandes[i] = NULL;
instInitiale−>utiliteInst = INUTILE;
instInitiale−>donnees = donnees;
for(i=0; i<NB_REGISTRES; i++)
{
tableRegistres[i] = instInitiale;
tableLectureRegistres[i] = 0;
}
for(i=0; i<NB_REGISTRES_TOURNANTS; i++)
{
tableRegistresTournants[i] = instInitiale;
tableLectureRegistresTournants[i] = 0;
}
}
/* Fonction de debug permettant d’afficher la liste chainée des instructions,
la table des registres et enfin le pourcentage d’instructions utile et inutil
es */
void afficherSdd(void)
{
instruction *i;
elementMemoire *a;
mercredi 18 juin 2003 instrument_optim.c 22/37

int j,nbTotalInstructions,cptInutile2=0,cptMortes=0,cptMortes2=0;
/* Définition du fichier contenant la trace (numéro) des instructions inutiles
) */
FILE *traceInstructionsInutiles = fopen(TRACE_INSTRUCTIONS_INUTILES,"w");
FILE *fichierEvolutionQtTravailInutile = fopen(TRACE_EVOLUTION_INUTILES,"w");
FILE *fichierEvolutionQtValeursMortes = fopen(TRACE_VALEURS_MORTES,"w");
/* Affichage des dépendances entre les instructions dynamiques (stockées dans
la liste chainée d’instructions dynamiques) */
/* Version optimisée : ne sont disponible que les données sur les instructions
inutiles */
fprintf(stdout,"Liste des instructions dynamiques inutiles :n");
for(i=instCourante; i!=NULL; i=i−>precedent)
{
if(i−>utiliteInst==INUTILE)
{
struct donnees_instruction *d = i−>donnees;
fprintf(stdout,"I.Dynamic %dt−− I.Static %dt−− File %dn",d−>numeroDynamique,d−>num
eroStatique,d−>numeroFichier);
/*if(d−>origineOperandes[0]!=NULL) fprintf(stdout,"t−− Dépend de %d",(d−>
origineOperandes[0])−>donnees−>numeroDynamique);
for(j=1; j<MAX_NB_OPERANDES; j++)
if(d−>origineOperandes[j]!=NULL) fprintf(stdout,",%d",(d−>origineOperand
es[j])−>donnees−>numeroDynamique);
fprintf(stdout,"n");*/
/* Ecriture dans le fichier traceInstructionsInutiles du numéro des instru
ctions dynamiques inutiles */
fprintf(traceInstructionsInutiles,"%un",d−>numeroDynamique);
cptInutile++;
if(d−>valeurMorte == 0) cptMortes++;
}
}
for(i=instCourante,j=numeroDynamiqueCourant; i!=NULL; i=i−>precedent,j−−)
{
if(i−>utiliteInst == INUTILE)
{
cptInutile2++;
if(i−>donnees−>valeurMorte == 0) cptMortes2++;
}
if(j%20 == 0)
{
fprintf(fichierEvolutionQtTravailInutile,"%dt%dn",j,cptInutile−cptInutile
2);
fprintf(fichierEvolutionQtValeursMortes,"%dt%dn",j,cptMortes−cptMortes2);
}
}
fclose(fichierEvolutionQtTravailInutile);
fclose(fichierEvolutionQtValeursMortes);
nbTotalInstructions = cptUtile + cptInutile + cptNop;
fprintf(stdout,"nCalcul prenant en compte les "nop" :n");
ons);
fprintf(stdout,"Nombre d’instructions utiles : %d/%d soit %f %%n",
;
fprintf(stdout,"Nombre de nop : %d/%d soit %f %%nn",
cptNop,nbTotalInstructions,(float)(cptNop*100)/(float)nbTotalInstructions);
nbTotalInstructions = cptUtile + cptInutile;
fprintf(stdout,"nCalcul ne prenant pas en compte les "nop" :n");
ons);
fprintf(stdout,"Nombre d’instructions utiles : %d/%d soit %f %%nn",
;
fprintf(stdout,"Nombre de noeuds dans le graphe : %dn",allocation);
}
void remonterArbre(instruction *inst)
{
int i;
/* Si on n’a pas encore parcouru l’arbre de dépendance de l’instuction inst,
on le parcours pour pour positionner les flag d’utilité utiliteInst[inst−>n
umeroDynamique] */
if(inst−>utiliteInst == INUTILE)
{
inst−>utiliteInst = UTILE;
cptUtile++;
for(i=0; inst−>donnees−>origineOperandes[i]!=NULL; i++) remonterArbre(inst−>
donnees−>origineOperandes[i]);
/* On libère la zone mémoire allouée au champ de donnée lorsqu’on est sur qu
e l’instruction est utile
(ce champ de donnée ne nous sert plus à rien dans ce cas la) */
free(inst−>donnees);
allocation−−;
inst−>donnees = NULL;
}
}
me sur Sparc ou x86 (DelaySlot) */
meroFichier)
{
int i;
instruction *inst = malloc(sizeof(instruction));
struct donnees_instruction *d = malloc(sizeof(struct donnees_instruction));
allocation++;
if(inst==NULL || d==NULL)
{
fprintf(stderr,"(fonction instrumentationInstructionDebut dans le fichier instrument.c)n");
exit(10);
}

d−>numeroFichier = numeroFichier;
d−>numeroStatique = numeroInst;
d−>numeroDynamique = ++numeroDynamiqueCourant;
d−>typeInstruction = typeInstruction;
if(typeInstruction == T_NOP) cptNop++;
for(i=0; i<MAX_NB_OPERANDES; i++) d−>origineOperandes[i] = NULL;
inst−>utiliteInst = INUTILE;
inst−>donnees = d;
inst−>precedent = instCourante;
instCourante = inst;
/*fprintf(stderr,"Début inst statique %d, inst dynamique %d fichier %dn",nume
roInst,tmp−>numeroDynamique,tmp−>numeroFichier);*/
}
void instrumentationInstructionMilieu(void)
{
/* Si l’instruction est un save, on incrémente le niveau de la fenetre de regi
stres */
if(instCourante−>donnees−>typeInstruction == T_SAVE) niveauFenetreRegistre++;
/* Si c’est un restore, on décrémente le niveau de la fenetre de registres */
else if(instCourante−>donnees−>typeInstruction == T_RESTORE) niveauFenetreRegi
stre−−;
}
void instrumentationInstructionFin(void)
{
/*fprintf(stderr,"Fin inst statique numéro %d, inst dynamique numéro %dn",ins
tCourante−>numeroStatique,instCourante−>numeroDynamique);*/
/* Si l’instruction courante est un branchement quelconque, un save ou un rest
ore, on la marque comme utile
et on marque comme utile toute les instructions dont elle dépend (appel réc
ursif à remonterArbre) */
if(instCourante−>donnees−>typeInstruction == T_BRANCHEMENT ||
instCourante−>donnees−>typeInstruction == T_BRANCHEMENT_ANNUL_BIT ||
instCourante−>donnees−>typeInstruction == T_SAVE ||
instCourante−>donnees−>typeInstruction == T_RESTORE ||
instCourante−>donnees−>typeInstruction == T_APPEL_INTERNE ||
instCourante−>donnees−>typeInstruction == T_APPEL_EXTERNE ||
instCourante−>donnees−>typeInstruction == T_APPEL_EXTERNE_SPECIAL) remonter
Arbre(instCourante);
/* Si l’instruction courante est un nop, on la marque comme tel et on libère l
’espace mémoire qui avait était alloué
pour sa représentation interne dans le programme */
else if(instCourante−>donnees−>typeInstruction == T_NOP)
{
instCourante−>utiliteInst = NOP;
free(instCourante−>donnees);
allocation−−;
instCourante−>donnees = NULL;
}
}
void copierInstDelay(void)
{
instCouranteDelay = instCourante;
}
void echangerInstDelay(void)
{
instruction *tmp = instCourante;
instCourante = instCouranteDelay;
instCouranteDelay = tmp;
}
u à des registres (en entrée) */
me sur Sparc ou x86 (registres) */
void instrumentationEntreeRegistre(int identificateurRessource)
{
int i;
/* identificateurRessource numéro ID_REG_SALTO_G = trou noir (%g0) */
{
G_SALTO_I+7)
{
{
");
exit(1);
}
tableLectureRegistresTournants[identificateurRegistreTournant]++;
for(i=0; (instCourante−>donnees−>origineOperandes)[i]!=NULL; i++)
{
r la valeur de ");
exit(8);
}
(instCourante−>donnees−>origineOperandes)[i] = tableRegistresTournants[ide
ntificateurRegistreTournant];
}
else

{
tableLectureRegistres[identificateurRessource]++;
{
r la valeur de ");
exit(8);
}
(instCourante−>donnees−>origineOperandes)[i] = tableRegistres[identificate
urRessource];
}
}
}
u à des registres (en sortie) */
me sur Sparc ou x86 (registre %g0) */
void instrumentationSortieRegistre(int identificateurRessource)
{
/* Mise à jour du compteur de résultat : le registre identificateurRessource e
st considéré comme un résultat
instCourante−>donnees−>valeurMorte++;
/* Si le registre dans lequel on écrit est le numéro 41 (correspondant à %g0),
on n’en tient pas compte car ce
registre est un trou noir (quelque soit ce qui y est écrit, on lit toujours
la valeur 0 dans ce registre) */
{
G_SALTO_I+7)
{
{
");
exit(1);
}
if(tableLectureRegistresTournants[identificateurRegistreTournant] == 0 &&
tableRegistresTournants[identificateurRegistreTournant]−>utiliteInst ==
INUTILE)
tableRegistresTournants[identificateurRegistreTournant]−>donnees−>val
eurMorte−−;
tableRegistresTournants[identificateurRegistreTournant] = instCourante;
tableLectureRegistresTournants[identificateurRegistreTournant] = 0;
}
else
{
if(tableLectureRegistres[identificateurRessource] == 0 &&
tableRegistres[identificateurRessource]−>utiliteInst == INUTILE)
tableRegistres[identificateurRessource]−>donnees−>valeurMorte−−;
tableRegistres[identificateurRessource] = instCourante;
tableLectureRegistres[identificateurRessource] = 0;
}
}
}
void lectureMemoireOctet(int adresseMemoire)
{
int i;
elementMemoire *a;
/*static elementMemoire *lecturePrecedente = NULL;*/
/* Si l’adresse accédée est consécutive à la précédente, alors on initialise a
à lecturePrecedente−>suivant */
/* Sinon, on parcourt la liste chainée pour trouver l’élément mémoire corespon
dant */
/*if((lecturePrecedente−>adresse)+1 == adresseMemoire) a=lecturePrecedente−>su
ivant;
else*/
for(a=adresseInitiale; a==NULL || adresseMemoire>a−>adresse; a=a−>suivant)
if(a==NULL)
{
/*fprintf(stderr,"Accès à l’adresse mémoire non initialisée %d par l’ins
truction %d (fichier %d)n",
adresseMemoire, instCourante−>donnees−>numeroStatique, instCourante−>don
nees−>numeroFichier);*/
return;
}
if(adresseMemoire != a−>adresse)
{
/*fprintf(stderr,"Accès à l’adresse mémoire non initialisée %d par l’instruc
tion %d (fichier %d)n",
adresseMemoire, instCourante−>donnees−>numeroStatique, instCourante−>donnees
−>numeroFichier);*/
return;
}
{
fprintf(stderr,"Nombre maximum d’opérandes pour une instruction dépassé, veulliez augmenter la va
leur de ");
exit(8);
}
(instCourante−>donnees−>origineOperandes)[i] = a−>derniereEcriture;
a−>nbLecture++;
/*lecturePrecedente = a;*/
}

void instrumentationEntreeMemoire(int adresseMemoire, int nbOctetsLus)
{
int offset;
for(offset=0; offset<nbOctetsLus; offset++) lectureMemoireOctet(adresseMemoire
+offset);
}
void ecritureMemoireOctet(int adresseMemoire)
{
elementMemoire *nouveau, *tmp = adresseInitiale;
/* Mise à jour du compteur de résultat : la case mémoire adresseMemoire est co
nsidéré comme un résultat
instCourante−>donnees−>valeurMorte++;
/* Cas ou la liste chainée est vide : premier accès en écriture à la mémoire *
/
{
adresseInitiale = malloc(sizeof(elementMemoire));
{
exit(10);
}
adresseInitiale−>adresse = adresseMemoire;
adresseInitiale−>suivant = NULL;
}
else
{
/* Cas ou l’insertion de données concerne le premier élément de la liste cha
inée */
if(adresseMemoire <= adresseInitiale−>adresse)
{
if(adresseInitiale−>adresse == adresseMemoire)
{
if(adresseInitiale−>nbLecture == 0 && (adresseInitiale−>derniereEcriture
)−>utiliteInst == INUTILE)
(adresseInitiale−>derniereEcriture)−>donnees−>valeurMorte−−;
}
else
{
if(nouveau == NULL)
{
exit(10);
}
nouveau−>suivant = adresseInitiale;
adresseInitiale = nouveau;
}
}
/* Cas général d’insertion d’un élément dans la liste chainée */
else
{
/* On parcours la liste chainée jusqu’a trouver l’endroit ou il faut insér
er la donnée */
while(tmp−>suivant != NULL && adresseMemoire >= tmp−>suivant−>adresse) t
mp = tmp−>suivant;
/* Si l’adresse mémoire à déjà était accédée par le passé, on modifie le p
ointeur sur
l’instruction qui a écrit dernièrement dans cette zone mémoire */
if(tmp−>adresse == adresseMemoire)
{
if(tmp−>nbLecture == 0 && (tmp−>derniereEcriture)−>utiliteInst == INUTIL
E)
(tmp−>derniereEcriture)−>donnees−>valeurMorte−−;
tmp−>nbLecture = 0;
tmp−>derniereEcriture = instCourante;
}
/* Sinon, on créé une nouvelle cellule représentant cette zone mémoire et
on l’insère dans la liste chainée */
else
{
if(nouveau == NULL)
{
exit(10);
}
nouveau−>suivant = tmp−>suivant;
tmp−>suivant = nouveau;
}
}
}
}
void instrumentationSortieMemoire(int adresseMemoire, int nbOctetsEcrits)
{
int offset;
for(offset=0; offset<nbOctetsEcrits; offset++) ecritureMemoireOctet(adresseMem
oire+offset);
}

19 mai 03 17:16 instrumentation2.cc Page 1/9
#include <stdio.h>
#include <fcntl.h>
#include <errno.h>
#include <fstream>
#include <iostream>
#include <regex.h>
#include <stdlib.h>
#include <string.h>
#include "salto.h"
#define FICHIER_SOURCE_ASSEMBLEUR ".s$"
#define REPERTOIRE_FICHIER_INSTRUMENTES "instrumente2/"
#define SAVE "save %sp,−136,%sp"
#define RESTORE "restore %g0,%g0,%g0"
#define NOP "nop"
#define OFFSET_INSTRUMENTATION "16"
#define OFFSET_INSTRUMENTATION_2 "28"
#define OFFSET_INSTRUMENTATION_DELAY_SLOT "64"
#define OFFSET_2_INSTRUMENTATION_DELAY_SLOT "44"
#define OFFSET_INSTRUMENTATION_ANNUL_BIT "76"
#define EXP_ANNUL_BIT ",a[ ]+"
#define ETIQUETTE_FONCTION_NOP "f_nop"
// Pointeur sur le fichier dans lequel sera écrit le code instrumenté
FILE *fichierSInstrumente;
// Pointeur sur le fichier contenant le code original (non instrumenté)
FILE *fichierSOriginal;
// Permet d’identifier de manière unique le fichier en cours de traitement
programme
es)
{
INST *instCCR;
char *lectureCodesConditions = "trd %ccr,%l0n";
// "Empilement" du contexte du programme (création d’un contexte intermédiaire
artificiel entre l’exécution du
// programme et l’exécution des fonctions d’instrumentation du code. Ce contex
te permet de travailler avec
// les registres %o[0−5] afin de faire passer les paramètres aux fonctions d’i
nstrumentations.
bb−>insertAsm(*nbInstructionsAjoutees+position, newAsm(SAVE));
instCCR = newAsm(NOP);
instCCR−>addAttribute(UNPARSE_ATT, lectureCodesConditions, strlen(lectureCodes
Conditions)+1);
bb−>insertAsm(*nbInstructionsAjoutees+position, instCCR);
// Sauvegarde en mémoire (dans la pile) des registres globaux
for(int i=1; i<=4; i++)
{
char tmp[20];
// Sauvegarde du registre (%gi) (ex : "st %g1,[%sp+92]")
sprintf(tmp,"st %%g%d,[%%sp+%d]",i,88+(4*i));
}
}
programme
tees)
{
INST *instCCR;
char *ecritureCodesConditions = "twr %l0,%ccrn";
// Récupération des registres globaux depuis la mémoire (depuis la pile)
for(int i=1; i<=4; i++)
{
char tmp[20];
// Restauration du registre (%gi) (ex : "ld [%sp+92],%g1")
sprintf(tmp,"ld [%%sp+%d],%%g%d",88+(4*i),i);
}
instCCR = newAsm(NOP);
instCCR−>addAttribute(UNPARSE_ATT, ecritureCodesConditions, strlen(ecritureCod
esConditions)+1);
bb−>insertAsm(*nbInstructionsAjoutees+position, instCCR);
// "Dépilement" du contexte du programme
bb−>insertAsm(*nbInstructionsAjoutees+position, newAsm(RESTORE));
}
int estPresent(char *motif, char *chaine)
{
int i;
size_t nmatch = 10;
mercredi 18 juin 2003 instrumentation2.cc 27/37

// Compilation de l’expression régulière
if (regcomp(preg, motif, REG_EXTENDED))
{
fprintf(STDERR,"Erreur lors de la compilation de l’expression régulière "%s"n",motif);
exit(4);
}
// Exécution de l’expression régulière et renvoi du résultat en fonction
if (regexec(preg, chaine, nmatch, pmatch, 0) == REG_NOMATCH)
{
regfree(preg);
return 0;
}
for(i=0; i<nmatch && pmatch[i].rm_so!=−1; i++);
regfree(preg);
return i;
}
int typeInstruction(INST *inst)
{
if(inst−>isCTI())
if(estPresent(EXP_ANNUL_BIT,inst−>unparse())) return T_BRANCHEMENT_ANNUL_BIT
;
else return T_BRANCHEMENT;
return T_AUTRE;
}
void appelDeFonctionInst(INST *inst, BB *bb, int position, unsigned int *nbInstr
uctionsAjoutees, int numeroInst)
{
static unsigned char flagDelaySlot=0;
char chaine[20],tmp[100], *lecturePC = "trd %pc,%o1n";
static INST *dernierBranchement;
if(!flagDelaySlot) sauvegardeContexte(bb, position, nbInstructionsAjoutees);
// On empile un paramètre de type entier à passer à la fonction (équivaut à mo
v typeInst,%o0)
sprintf(chaine,"or %%g0,%d,%%o0",typeInstruction(inst));
// Si la constante numeroInst à ranger dans %o1 peut être codée sur 13 bits (i
.e. est entre −4096 et 4095)
if(numeroInst <= 4095)
{
// On empile un paramètre de type entier à passer à la fonction (équivaut à
mov numeroInst,%o1)
sprintf(chaine,"or %%g0,%d,%%o1",numeroInst);
}
else
{
// On empile ce même paramètre mais en deux fois (les 22 premiers bits du re
gistre d’abbord)
sprintf(chaine,"sethi %%hi(%d),%%o1",numeroInst);
// Puis les 10 derniers bits ensuite
sprintf(chaine,"or %%o1,%%lo(%d),%%o1",numeroInst);
}
// On empile un paramètre de type entier à passer à la fonction (équivaut à mo
v numeroFichier,%o2)
sprintf(chaine,"or %%g0,%d,%%o2",numeroFichier);
// Si le branchement est un brachement avec annul_bit (ex : bl,a ...
) alors on rempli la chaine de caractère
// chaineAnnulBit en conséquence (on y met les instructions pour tra
iter ce cas correctement)
if(flagDelaySlot && typeInstruction(dernierBranchement)==T_BRANCHEME
NT_ANNUL_BIT)
{
int i;
char *chaineAnnulBit = (char *)malloc(100*sizeof(char));
size_t nmatch = 1;
INST *inst_br_nop;
if (regcomp(preg, EXP_ANNUL_BIT, REG_EXTENDED))
{
fprintf(STDERR,"Erreur lors de la compilation de l’expression régulière ""EXP_ANNUL
_BIT""n");
exit(4);
}
if (regexec(preg, dernierBranchement−>unparse(), nmatch, pmatch, 0
) == REG_NOMATCH)
{
fprintf(STDERR,"Erreur lors de l’exécution de l’expression régulière ""EXP_ANNUL_B
IT"" :n");
fprintf(STDERR,"Impossible de trouver l’expression régulière dans l’instruction "%s"n
",dernierBranchement−>unparse());
exit(4);
}
regfree(preg);
for(i=0; i<pmatch[0].rm_eo; i++)
tmp[i] = (dernierBranchement−>unparse())[i];
tmp[i] = ’0’;
strcpy(chaineAnnulBit,"trd %pc,%o7n");
strcat(chaineAnnulBit,"tadd %o7,"OFFSET_INSTRUMENTATION_2",%o7n");
strcat(chaineAnnulBit,"twr %l0,%ccrn");
strcat(chaineAnnulBit,tmp);
strcat(chaineAnnulBit," "ETIQUETTE_FONCTION_NOP"n");

inst_br_nop−>addAttribute(UNPARSE_ATT, chaineAnnulBit, strlen(chai
neAnnulBit)+1);
strcpy(tmp,"b ");
}
bb−>insertAsm(*nbInstructionsAjoutees+position, newAsm(strcat(tmp,NOM_FCT_INST
)));
if(flagDelaySlot && typeInstruction(dernierBranchement)==T_BRANCHEME
NT_ANNUL_BIT)
{
INST *instLecturePC;
instLecturePC = newAsm(NOP);
instLecturePC−>addAttribute(UNPARSE_ATT, lecturePC, strlen(lectur
ePC)+1);
bb−>insertAsm(*nbInstructionsAjoutees+position, instLecturePC);
bb−>insertAsm(*nbInstructionsAjoutees+position, newAsm("jmpl %o1+"
OFFSET_INSTRUMENTATION_ANNUL_BIT",%g0"));
}
if(!flagDelaySlot)
{
{
INST *instLecturePC;
instLecturePC−>addAttribute(UNPARSE_ATT, lecturePC, strlen(lecturePC)+1);
// A ce stade, %o0 contient le resultat de la fonction NOM_FCT_INST et %o1
contient le PC à l’instant t−1
// (instruction précédente à celle−ci)
bb−>insertAsm(*nbInstructionsAjoutees+position, newAsm("add %o1,%o0,%o0"));
bb−>insertAsm(*nbInstructionsAjoutees+position, newAsm("jmpl %o0+"OFFSET_IN
STRUMENTATION",%g0"));
}
else
{
// On met le flagDelaySlot à 1 pour signaler que la prochaine instruction
se trouvera dans
// le DelaySlot de celle−ci
flagDelaySlot=1;
// On conserve dans une variable statique un pointeur sur l’instruction en
cours de traitement
dernierBranchement = inst−>copy();
}
}
else
{
// On traite l’instruction se trouvant dans le DelaySlot du précédent CTI (b
ranchement)
INST *instLecturePC, *instBranchement;
// On remet le flagDelaySlot à zéro pour le prochain passage
flagDelaySlot=0;
// Dans le registre %o0, se trouve 0 si on n’a pas à annuler l’instruction e
t 52 si on doit l’annuler (inutile)
// subcc %o0,0,%g0 <=> cmp %o0,0
bb−>insertAsm(*nbInstructionsAjoutees+position, newAsm("subcc %o0,0,%g0"));
bb−>insertAsm(*nbInstructionsAjoutees+position, newAsm("be,a f_nop"));
// On utilise un jmpl dans le delay slot du brnz,a pour pouvoir brancher sur
une adresse contenue dans un registre
// (impossible si l’on utilise brnz,a directement car il faut lui fournir un
e étiquette)
bb−>insertAsm(*nbInstructionsAjoutees+position, newAsm("jmpl %o1+"OFFSET_INST
RUMENTATION_DELAY_SLOT",%g0"));
// A mon avis, ce nop n’est jamais exécuté puisque l’instruction se trouvant
dans un delay slot d’une instruction
// se trouvant elle même dans un delay slot n’est jamais exécutée...

// Insertion d’une instruction équivalente à celle représentant le brancheme
nt dont on est en train de traiter
// le DelaySlot
bb−>insertAsm(*nbInstructionsAjoutees+position, dernierBranchement);
// On insère un nop dans le Delay Slot puisque l’instruction se trouvant nor
malement dans le delay slot de ce
// branchement est jugée inutile
// On lit le PC
// Et on branche après sur la suite du programme en sautant le branchement e
t son delay slot dans le cas utile
bb−>insertAsm(*nbInstructionsAjoutees+position, newAsm("jmpl %o1+"OFFSET_2_IN
STRUMENTATION_DELAY_SLOT",%g0"));
}
}
*nbInstructionsAjoutees, int numeroInst)
{
static unsigned char flagDelaySlot = 0;
// Si on n’a pas à faire à une instruction se trouvant dans un DelaySlot
if(!flagDelaySlot)
// Si l’instruction n’est pas un branchement, alors, on instrumente cette in
struction normalement
appelDeFonctionInst(inst, bb, position, nbInstructionsAjoutees, numeroInst
);
// Si l’instruction courante est un branchement, alors, on l’instrumente ain
si que son DelaySlot
else
{
INST *instDelaySlot = bbSuivant−>getAsm(0);
// On met le flag à 1 pour indiquer que l’instrumentation de l’instruction
se trouvant dans le DelaySlot
// du branchement que l’on est en train de traiter a déjà été instrumentée
flagDelaySlot = 1;
/*fprintf(STDERR,"Inst <%s>tttDelay <%s>n",inst−>unparse(),instDelaySl
ot−>unparse());*/
// On traite l’instruction de branchement
appelDeFonctionInst(inst, bb, position, nbInstructionsAjoutees, numeroInst
);
// On traite l’instruction qui se trouve dans le DelaySlot
appelDeFonctionInst(instDelaySlot, bb, position, nbInstructionsAjoutees, n
umeroInst+1);
}
else flagDelaySlot = 0;
}
void Salto_hook()
{
CFG *proc;
BB *bb, *bbSuivant;
INST *inst;
int numeroInst = 0;
unsigned int nbInstructionsAjoutees;
// Parcours du programme permettant d’insérer le code d’instrumentation des in
structions
{
proc = getCFG(i);
{
bbSuivant = proc−>getBB(j+1);
int nbAsm = bb−>numberOfAsm();
nbInstructionsAjoutees = 0;
for (int k=0; k < nbAsm; k++)
{
numeroInst++;
inst = bb−>getAsm(k+nbInstructionsAjoutees);
instrumenter(inst, bb, bbSuivant, k, &nbInstructionsAjoutees, numeroInst
);
}
}
}
// Parcours du programme permettant d’insérer le code pour l’initialisation de
s variables globales
{
proc = getCFG(i);
if(!strcmp(proc−>getName(),"main"))
{
// Insertion d’un appel à la procédure initialisant les variables globales
(proc−>getBB(0))−>insertAsm(0, newAsm("call initVariablesGlobales"));
(proc−>getBB(0))−>insertAsm(1, newAsm(NOP));
}
}
// Envoi du code instrumenté vers la sortie standard
produceCode(fichierSInstrumente);
}

void Salto_init_hook(int argc, char *argv[])
{
int i,j,k;
char nomFichierSortie[100];
// Récupération dans la ligne de commande entrée par l’utilisateur du nom du f
ichier original
for(i=1; i<argc && !estPresent("−i",argv[i]); i++);
if(i == argc−1)
{
fprintf(STDERR,"Erreur, votre ligne de commande ne comporte pas l’option "−i"n");
exit(6);
}
// On ouvre le fichier .s original à traiter pour pouvoir s’en servir dans sal
to_hook()
fichierSOriginal = fopen(argv[i+1],"r");
if(fichierSOriginal == NULL)
{
fprintf(STDERR,"Problème lors de l’ouverture du fichier "%s" ",argv[i+1]);
exit(11);
}
nomFichierSortie[0]=’0’;
strcat(nomFichierSortie,REPERTOIRE_FICHIER_INSTRUMENTES);
strcat(nomFichierSortie,argv[i+1]);
// On ouvre le fichier .s instrumenté en écriture à traiter pour pouvoir s’en
servir dans salto_hook()
fichierSInstrumente = fopen(nomFichierSortie,"w");
if(fichierSInstrumente == NULL)
{
fprintf(STDERR,"Problème lors de l’ouverture du fichier "%s" ",nomFichierSortie);
exit(11);
}
// Recherche de l’expression "−−" dans la ligne de commande
for(; i<argc && !estPresent("−−",argv[i]); i++);
// Si cette expression n’est pas présente, on ne numérote pas les fichiers
if(i == argc−1) numeroFichier = 0;
else numeroFichier = atoi(argv[i+1]);
}
void Salto_end_hook()
{
exit(0);
}

19 mai 03 15:50 instrument2.c Page 1/3
#include <stdio.h>
#include <stdlib.h>
/* Constantes utiles pour inhiber l’action des instructions dynamiques inutiles
:
Si l’on doit annuler l’instruction, on renvoit la constante 68 permettant de
sauter l’instruction inutile
ainsi que son instrumentation. Si l’on ne doit pas annuler l’instruction, on
renvoit la constante 16 permettant
de faire sauter le PC à la suite du programme (instruction à ne pas annuler e
t son instrumentation) */
#define ANNUL 52
#define NON_ANNUL 0
} instruction;
unsigned int tailleListeInstInutile;
unsigned int *listeInstInutile;
{
int i;
char c;
FILE *traceInstructionsInutiles;
s qui
if(instInitiale == NULL)
{
fprintf(stderr,"(fonction initVariablesGlobales dans le fichier instrument2.c)n");
exit(10);
}
instInitiale−>numeroDynamique = 0;
tailleListeInstInutile = 0;
traceInstructionsInutiles = fopen(TRACE_INSTRUCTIONS_INUTILES,"r");
if(traceInstructionsInutiles == NULL)
{
);
exit(11);
}
/* On compte le nombre de lignes dans le fichier */
do if(fgetc(traceInstructionsInutiles)==’n’) tailleListeInstInutile++;
while(!feof(traceInstructionsInutiles));
listeInstInutile = malloc(tailleListeInstInutile*sizeof(unsigned int));
traceInstructionsInutiles = fopen(TRACE_INSTRUCTIONS_INUTILES,"r");
if(traceInstructionsInutiles == NULL)
{
);
exit(11);
}
for(i=tailleListeInstInutile−1; i>=0; i−−) fscanf(traceInstructionsInutiles, "
%u", &listeInstInutile[i]);
}
int instrumentationInstruction(int typeInstruction, int numeroStatique, int nume
roFichier)
{
int i;
static int indiceListeInstructions = 0;
instruction *tmp = malloc(sizeof(instruction));
if(tmp == NULL)
{
fprintf(stderr,"(fonction instrumentationInstruction dans le fichier instrument2.c)n");
exit(10);
}
if(instCourante−>numeroDynamique >= MAX_NB_INST_DYNAMIQUE)
{
fprintf(stderr,"Nombre maximum d’instruction dépassé, veulliez augmenter la valeur de la constante ")
;
fprintf(stderr,"MAX_NB_INST_DYNAMIQUE dans le fichier instrument.hn");
exit(1);
}
tmp−>numeroDynamique = instCourante−>numeroDynamique+1;
tmp−>precedent = instCourante;
instCourante = tmp;
fprintf(stderr,"I.Dynamic %dt−− I.Static %dt−− File %d",instCourante−>numeroDynamique,n
umeroStatique,numeroFichier);
if(typeInstruction == T_BRANCHEMENT)
{
mercredi 18 juin 2003 instrument2.c 32/37

fprintf(stderr,"t−− Branchn");
return NON_ANNUL;
}
if(typeInstruction == T_BRANCHEMENT_ANNUL_BIT)
{
fprintf(stderr,"t−− Branch annul bitn");
return NON_ANNUL;
}
/* Si le numéro de l’instruction dynamique en cours de traitement est le même
que le dernier numéro
testé comme étant une instruction inutile, alors on retourne la valeur ANNU
L */
if(instCourante−>numeroDynamique == listeInstInutile[indiceListeInstructions]
&&
indiceListeInstructions < tailleListeInstInutile)
{
indiceListeInstructions++;
fprintf(stderr,"t−− Non exécutéen");
return ANNUL;
}
fprintf(stderr,"n");
return NON_ANNUL;
}
mercredi 18 juin 2003 instrument2.c 33/37

21 avr 03 16:53 redefinition.c Page 1/7
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <signal.h>
#include <ctype.h>
#include <errno.h>
#include <sys/stat.h>
void *my_memset(void *p, int i, size_t taille)
{
echangerInstDelay();
instrumentationSortieMemoire((int)p, taille);
instrumentationInstructionFin();
return memset(p, i, taille);
}
void *my_memcpy(void *p1, const void *p2, size_t taille)
{
instrumentationEntreeMemoire((int)p2, taille);
instrumentationSortieMemoire((int)p1, taille);
return memcpy(p1, p2, taille);
}
int my_memcmp(const void *p1, const void *p2, size_t taille)
{
return memcmp(p1, p2, taille);
}
int my_strcmp(const char *c1, const char *c2)
{
return strcmp(c1, c2);
}
int my_strncmp(const char *c1, const char *c2, size_t taille)
{
instrumentationEntreeMemoire((int)c1, taille);
return strncmp(c1, c2, taille);
}
size_t my_strlen(const char *c)
{
instrumentationEntreeMemoire((int)c, strlen(c)+1);
return strlen(c);
}
char *my_strncpy(char *c1, const char *c2, size_t taille)
{
instrumentationSortieMemoire((int)c1, taille);
return strncpy(c1, c2, taille);
}
char *my_strcpy(char *c1, const char *c2)
{
return strcpy(c1, c2);
}
char *my_strcat(char *c1, const char *c2)
{
instrumentationSortieMemoire(((int)c1)+strlen(c1), strlen(c2)+1);
return strcat(c1, c2);
}
char *my_strrchr(const char *c, int i)
{
return strrchr(c, i);
}
size_t my_strcspn(const char *c1, const char *c2)
{
mercredi 18 juin 2003 redefinition.c 34/37

return strcspn(c1, c2);
}
size_t my_strspn(const char *c1, const char *c2)
{
return strspn(c1, c2);
}
void *my_malloc(size_t taille)
{
return malloc(taille);
}
void *my_calloc(size_t taille1, size_t taille2)
{
return calloc(taille1, taille2);
}
void my_free(void *p)
{
free(p);
}
char *my_getenv(const char *c)
{
char *c2 = getenv(c);
if(c2!=NULL) instrumentationSortieMemoire(((int)c2), strlen(c2)+1);
return c2;
}
int my_atoi(const char *c)
{
return atoi(c);
}
int my_fileno(FILE *f)
{
return fileno(f);
}
/* Cette fonction ne comportant aucun pointeur, elle ne fait aucun
accès à la mémoire utilisable par l’appelant */
int my_isatty(int i)
{
return isatty(i);
}
int my_fstat(int i, struct stat *s)
{
instrumentationEntreeMemoire((int)s, sizeof(s));
instrumentationSortieMemoire((int)s, sizeof(s));
return fstat(i, s);
}
int my_close(int i)
{
return close(i);
}
void my_perror(const char *c)
{
perror(c);
}
int my_unlink(const char *c)
{

return unlink(c);
}
int my_lstat(const char *c, struct stat *s)
{
return lstat(c, s);
}
int my_stat(const char *c, struct stat *s)
{
return stat(c, s);
}
off_t my_lseek(int i, off_t off, int j)
{
return lseek(i, off, j);
}
ssize_t my_read(int i, void *p, size_t taille)
{
int taille_reelle = read(i, p, taille);
instrumentationSortieMemoire((int)p, taille_reelle);
return taille_reelle;
}
ssize_t my_write(int i, const void *p, size_t taille)
{
int taille_reelle = write(i, p, taille);
instrumentationEntreeMemoire((int)p, taille_reelle);
return taille_reelle;
}
char *my_ctime(const time_t *time)
{
char *c = ctime(time);
instrumentationEntreeMemoire((int)time, sizeof(time));
instrumentationSortieMemoire((int)c, 26);
return c;
}
int my_fflush(FILE *f)
{
return fflush(f);
}
char *my_fgets(char *c, int i, FILE *f)
{
char *c2 = fgets(c, i, f);
return c2;
}
int my_chmod(const char *c, mode_t mode)
{
return chmod(c, mode);
}
int my_utime(const char *c, const void *buf)
{
/*instrumentationEntreeMemoire((int)buf, sizeof(struct utimbuf));*/
return utime(c, buf);
}
int my_chown(const char *c, uid_t uid, gid_t gid)
{

return chown(c, uid, gid);
}
void my_exit(int i)
{
exit(i);
}

Evaluation de la quantité de travail (in)utile dans l’exécution des programmes

Contenu connexe

Tendances

En vedette

Similaire à Evaluation de la quantité de travail (in)utile dans l’exécution des programmes

Dernier

Evaluation de la quantité de travail (in)utile dans l’exécution des programmes