Deep learning.pdf

Réalisé par :
NOUSSAIR Abdelghaffar
BENHAMZA Sofiane
Encadré par :
Prof. R. BABALAHCEN

Petites choses a savoir :
Les images sont des ensembles des pixels combines l’un près de l’autre.
Le qualité d’image depend de pixels.
La taille d’une image est depend de sa qualité , type
de codage,, etc ...
Une Pixel est le plus petit element d une image
pixel

les formats utilisés
Il y a deux de formats qu’il sont utilisé par les designers .
Format vectorial
format matriciel

Format matriciel
L’image matricielle Est une combainison des pixels
Une adaptation parfait du monde
Grace à le nombre important du pixels le changement
du couleur vont etre douce progressivement .
Affichage realist
Une image matriciel sont lourdes en terme de stockage .

Comment on peut calculer coder une image noir et blanche ?
=0
=1
Donc notre code (ligne par ligne) est
1110000111 1101111011 1011111101
1010110101
1011111101 1010110101 1011001101
1101111011
1110000111 1111111111
10 ligne x 10 colone = 100 pixel
100= 96+4 = 8*12 + 4
100 Pixel = 100 bits = 12 octet et 4bits =12,5 Octet
synthese
Taille d’une photo ( en Octet ) = nbr_ligne x nbr_colone x nbr_bits/pixel

Format victoriel
L’image victorial Est une combainison de segments
Image sont de resultat des formules mathematique
Qui donne un grandissement infinie

Format vectorial
Exemple
Application lensa qui convertir des photos real en des photo
vectriel
Ce photo est generé par AI = des algorithms mathematique

Le deep learning ou apprentissage profond dérivé
du machine learning où la machine est capable
d'apprendre par elle-même, contrairement à la
programmation où elle se contente d'exécuter des règles
prédéterminées.

Classification binaire est une transformation de
données qui vise à répartir les membres d'un
ensemble dans deux groupes disjoints, par exemple si
les photos contient une maison ou none !

CREATION D UN MODELE POUR LA
RECONNAISSANCE DES CHATS !

Notre modele sera un peu faible car on pris un faible numero des exemples d apprentissage,
mais ca marche bien pour comprendre le principe, On prend 5 exemples pour l apprentissage
P(y=1 | x)=1 dans toutes les images de notre modele
1 pour indiquer
que la photo est
d une chatte
0 pour le cas
inverse
Systeme avec une image
comme entree est 2
valeurs de sortie.
Systeme a
construire

On cherche a construire une function f avec une image
comme entre est une vecteur comme sortie, soit E dans F
64 pixel
64 pixel
Ces photo peut etre traduit par 64*64 pixel
Chaque pixel sur trois octet , donc l image en rgb est
tricanal, chaque canal depend d un des trois couleur
primaire R, V, B. prend 1Octect par pixel des (valeurs
en 0 a 255 chaque pixel).

64 valeur
64 valeur
204
207
…
205
208
…
204
205
…
…
…
167
170
…
168
171
…
164
165
…
…
…
224
227
…
225
228
…
223
224
…
…
…
224
227
…
225
228
…
223
224
…
…
204
207
…
205
208
…
204
205
…
…
167
170
…
168
171
…
164
165
…
…

64x64x3
=12288 valeurs
64
pixel
224
227
…
225
228
…
223
224
…
…
204
207
…
205
208
…
204
205
…
…
167
170
…
168
171
…
164
165
…
…
64 pixel
U
g 𝑈 = ቐ
𝑣𝑎𝑙𝑒𝑢𝑟 𝑠𝑖
𝑖𝑚𝑎𝑔𝑒 𝑐𝑜𝑛𝑡𝑖𝑒𝑛𝑡 𝑢𝑛𝑒 𝑐ℎ𝑎𝑡𝑡𝑒
𝑢𝑛𝑒 𝑎𝑢𝑡𝑟𝑒 𝑠𝑖𝑛𝑜𝑛
f( )
Rick > En utilisant numpy sous python, pour generer U a partir d une image il suffit d utiliser la commande
U = np.array(image)

224
227
…
225
228
…
223
224
…
…
204
207
…
205
208
…
204
205
…
…
167
170
…
168
171
…
164
165
…
…
U
g 𝑈 = ቐ
𝑣𝑎𝑙𝑒𝑢𝑟 𝑞𝑢𝑖 𝑖𝑛𝑑𝑖𝑞𝑢𝑒 𝑠𝑖
𝑙 𝑖𝑚𝑎𝑔𝑒 𝑐𝑜𝑛𝑡𝑖𝑒𝑛𝑡 𝑢𝑛𝑒 𝑐ℎ𝑎𝑡𝑡𝑒
generalement dans la regression lineare, on a la forme suivante pour g
g(U) = A*U + b = V A, b sont des constantes
b est monodimensionnelle
A est bidimensionnelle 1x12288
dans les grands calculs, On doit choisir des valeurs pour A, b, qui minimisent les
erreurs, mais ici on va prend des valeurs quelconque sans entrée aux details.
Produit vectoriel

224
227
…
225
228
…
223
224
…
…
204
207
…
205
208
…
204
205
…
…
167
170
…
168
171
…
164
165
…
…
U
g 𝑈 = ቐ
𝑣𝑎𝑙𝑒𝑢𝑟 𝑞𝑢𝑖 𝑖𝑛𝑑𝑖𝑞𝑢𝑒 𝑠𝑖
𝑙 𝑖𝑚𝑎𝑔𝑒 𝑐𝑜𝑛𝑡𝑖𝑒𝑛𝑡 𝑢𝑛𝑒 𝑐ℎ𝑎𝑡𝑡𝑒
Le problem maintenant c est que le system doit donner une valeur entre 0
et 1, mais V est tres tres grand par rapport a ca
Solution : Segmoid fonction 𝑆 𝑧 =
1
1 + 𝑒−𝑧
0
0
1
h(V) = Segmoid(V)
h est la probabilite qu une photo est d une chatte ou non.

h est la probabilite qu une photo est d une chatte ou non.
h(V)=
1
1+𝑒−𝑉
Pour la derniere fonction I(x), on doit avoir soit 1 pour une chatte
ou bien 0 sinon
logiquement, si h < 50% on donne 0
sinon on donne 1
𝐼 𝑥 = ቊ
1 𝑠𝑖 ℎ ≥ 0,5
0 𝑠𝑖 ℎ < 0,5

En fin, on est en besoin d une seule fonction pour completer le system,
La fonction qui va prend une Valeur entre 1 et 0 rt va returner 1 ou 0
Soit I(W)
𝐼 𝑊 = ൜
1 𝑠𝑖 𝑊 > 0,5
0 𝑠𝑖 𝑊 ≤ 0,5
Donc la shema de notre system est
f( ) = U g(U) = V
Vecteur colone A*U + b
1
1 + 𝑒−𝑉
h(V) = W I(W) = x
൜
1 𝑠𝑖 𝑊 > 0,5
0 𝑠𝑖 𝑊 ≤ 0,5
L’image
contient
une chat
ou non

= a
= b
= c
= d
= e
a, b, c, d, e sont des vecteurs colonnes.
On prend une Valeur arbitraire pour N (1x12288)
M = 0 pour l’instant
g(U) = N*U + M
g(a) = 38042
g(b) = 38063
g(c) = 37390
g(d) = 39694
g(e) = 36363
g(e) est la plus petite valeur
Pour minimiser les erreurs on prend
M = - g(e) + 1
f( )
f( )
f( )
f( )
f( )
M = 0

a, b, c, d, e sont des vecteurs colonnes.
On prend a fixee N (1x12288) et M pour notre modele
, tous changements va donner une resultat indesirable.
g(U) = N*U + M
g(a) = 38042 – 36364 + 1 = 1679
g(b) = 38063 – 36364 + 1 = 1700
g(c) = 37390 – 36364 + 1 = 1027
g(d) = 39694 – 36364 + 1 = 3331
g(e) = 36364 – 36364 + 1 = 1

g(a) = 38042 – 36364 + 1 = 1679
g(b) = 38063 – 36364 + 1 = 1700
g(c) = 37390 – 36364 + 1 = 1027
g(d) = 39694 – 36364 + 1 = 3331
g(e) = 36364 – 36364 + 1 = 1
h(g(a) ) = 1
h(g(b)) = 1
h(g(c)) = 1
h(g(d)) = 1
h(g(e)) = 0.73
Toutes les valeurs
sont
> 0,5 il y a une
chatte

Testons notre model
0.63
0.74
0.23
Ce qui indique une chatte
Ce qui indique une chatte
Ce qui indique que ce n”est pas une chatte

Il faut faire attention, puisque la
regression lineare n est pas
toujours vrai, ce qui indique le
besoin des autre techniques dans
le machine Learning.

Deep learning.pdf

Recommandé

Recommandé

Contenu connexe

Similaire à Deep learning.pdf

Similaire à Deep learning.pdf (20)

Dernier

Dernier (20)

Deep learning.pdf