Codage et représetation de
l'information
Taha Zerrouki
MI, semestre 1
• Université de Bouira
Programme
• Représentation des nombres
●
BCD
●
Exces 3
●
Code Gray
• Représentation des caractères
●
ASCII
●
Unicode
Codage des caractères
‫الحروف‬ ‫ترميز‬
Codage d’information
65A 01000001
Codage d’information
Ada b
65 100 97 32 98
A d a b
01000001 01100100 01100001 00100000 01100010
Codage des caractères
Un nombre correspond à une Lettre
65 <===> A
66 <===> B
Codage des caractères
Un nombre correspond à une Lettre
65 <===> A
66 <===> B
Code ASCII
American Standard Code for Information
Interchange
‫المعلومات‬ ‫لتبادل‬ ‫المريكي‬ ‫المعياري‬ ‫الترميز‬
ASCII
● 7 bits => 128 caractères
● + 1 bit de vérification
ASCII
!"#$%&'()*+,-./0123456789:;<=>?
@ABCDEFGHIJKLMNOPQRSTUVWXYZ[
]^_
`abcdefghijklmnopqrstuvwxyz{|}
codes
Caractères spéciaux
Caractères spéciaux
● SP : 20 espace
● CR : 13 retour à la ligne
● HT : 09 Tabulation
● BS ; 08 Back space
● BEL : 07 sonn...
Exercice
● Décoder le message suivant
● 42 6f 75 69 72 61 20 31 30
Exercice
● Décoder le message suivant
● 42 6f 75 69 72 61 20 31 30
● B o u i R a 1 0
Exercice
● Coder le message suivant
● L'Algérie
Exercice
● Coder le message suivant
● L ' A l g é r i e
● 4c 27 41 6c 67 ?? 72 69 65
Problèmes
● Il Représente que l'anglais
● Manque des caractères accentués
● Pas des caractères multilingues
●‫فقط‬ ‫الجنجل...
● Utiliser 8 bits
● 8 bits = 256 caractères
● 0-127 => ascii
● 128-255 => extension ‫توسيع‬
ASCII étendu
ASCII étendu
ASCII étendu Arabe
ASCII étendu russe
ASCII étendu thaïlandais
Problèmes
● Multitude des codes ‫الترميزات‬ ‫تعدد‬
● Langues avec des nombreux caractères
●‫الكثيرة‬ ‫الحروف‬ ‫ذات‬ ‫اللغا...
Problèmes
● Multitude des codes ‫الترميزات‬ ‫تعدد‬
● Langues avec des nombreux caractères
●‫الكثيرة‬ ‫الحروف‬ ‫ذات‬ ‫اللغا...
Différents codes
Différents codes
‫حد‬‫ح‬ ‫المو‬ ‫العالمي‬ ‫الترميز‬
Unicode
Unicode
16 bits = 65 535 caractères
Multilingue
Unicode
A 65
‫ض‬ 1560
11619
40201
Unicode
Unicode
• Codage multilingue ‫اللغات‬ ‫متعدد‬ ‫ترميز‬
• 2 octets = 16 bits
• Extensible ‫للرثراء‬ ‫قابل‬
Unicode.org
Unicode
Unicode chinois
Tifinagh
The Unicode Standard,
Version 6.3
Unicode Math
Unicode symboles
Unicode Hiéroglyphique
L'arabe et l'Unicode
Arabe standard ‫الساسية‬ ‫العربية‬
Coranique Marques ‫القرآجنية‬ ‫العلمات‬
Arabe étendue ‫الموسعة‬ ‫ا...
Unicode arabe
Exercice
• Décoder le message suivant
•062c 0627 0645 0650
0639 0629 064c
Exercice
• Décoder le message suivant
• 062c 0627 0645 0650 0639 0629 064c
•
‫ا‬ ‫ج‬
62c 627 645 650 639 629 64c
‫ج‬ ‫ا‬ ‫...
Exercice
• Coder le message suivant
‫يرة‬‫ي‬ ‫البو‬
Exercice
• Coder le message suivant
‫يرة‬‫ي‬ ‫البو‬
u0627 0644 0628 0648
064a 0652 0631 0629
‫اليوجنيكود‬ ‫في‬ ‫القرآجنية‬ ‫العلمات‬
Caractères de contrôle
Affichage
•‫التجاه‬ ‫رثنائية‬
•‫الحروف‬ ‫تشبيك‬
Bidirectionalité
Directions
• ‫المنغولية‬
• Mongolien
Directions
• ‫الصينية‬
• ‫الياباجنية‬
• ‫الكورية‬
Caractères de contrôle
Exemple
• <title>‫ ‫المشروع)تجريبي‬( ‬
</title>
PDFRLE
Affichage
•‫التجاه‬ ‫رثنائية‬
•‫الحروف‬ ‫تشبيك‬
Attachement des lettres
Attachement
•‫السياق‬ ‫حسب‬ ‫المناسب‬ ‫الحرف‬ ‫شكل‬ ‫اختيار‬
•‫الخط‬ ‫مستوى‬ ‫على‬ ‫عادة‬ ‫يجرى‬
Hindu
‫الهندية‬ ‫في‬ ‫الحروف‬ ‫تشابك‬
Représentation BiDi
0 1 2 3 4 5 6
‫ا‬ ‫ل‬ ‫ع‬ ‫ر‬ ‫ب‬ ‫ي‬ ‫ة‬
Dans la mémoire
Affichage
‫العربية‬Traitement
Caractères de contrôle
d'attachement
• : ‫الهجري‬ ‫التاريخ‬ ‫كتابة‬1436‫هـ‬
•= ‫ـ‬ + ‫ه‬‫ه‬‫ـ‬
•+ ‫ه‬ZWJ=‫ه‬
• Zero width ...
Exemple d'attachement
•‫تبرا‬ ‫الكيس‬ ‫ملت‬ ‫ـت‬ ‫كنـ‬ ‫ما‬ ‫الصبر‬ ‫لول‬ ‫ويك‬
Interdire l'attachement
‫الشعبية‬ ‫الديقراطية‬ ‫الجزائرية‬ ‫الجمهورية‬
‫ججدش‬
‫ج.ج.دش‬
‫ج‬ZWNJ‫ج‬ZWNJ‫دش‬‫ج‬‫ج‬ <= ‫دش‬
ZW...
Représentation
• Unicode utilise 3 représentation :
• UTF-8
• Un octet pour l'ascii, 2à 4 octets pour les autres
• ‫يستخدم...
UTF
A ‫א‬ 好
Code point U+0041 U+05D0 U+597D U+233B4
UTF-8 41 D7 90 E5 A5 BD F0 A3 8E B4
UTF-16 00 41 05 D0 59 7D D8 4C DF ...
UTF
Prochain SlideShare
Chargement dans…5
×

Info1 cours 4-alphanum-v4

749 vues

Publié le

Université de Bouira, Mathématique et informatique
Cours codage et représentation de l'information
S1

Publié dans : Formation
0 commentaire
0 j’aime
Statistiques
Remarques
  • Soyez le premier à commenter

  • Soyez le premier à aimer ceci

Aucun téléchargement
Vues
Nombre de vues
749
Sur SlideShare
0
Issues des intégrations
0
Intégrations
26
Actions
Partages
0
Téléchargements
20
Commentaires
0
J’aime
0
Intégrations 0
Aucune incorporation

Aucune remarque pour cette diapositive

Info1 cours 4-alphanum-v4

  1. 1. Codage et représetation de l'information Taha Zerrouki MI, semestre 1 • Université de Bouira
  2. 2. Programme • Représentation des nombres ● BCD ● Exces 3 ● Code Gray • Représentation des caractères ● ASCII ● Unicode
  3. 3. Codage des caractères ‫الحروف‬ ‫ترميز‬
  4. 4. Codage d’information 65A 01000001
  5. 5. Codage d’information Ada b 65 100 97 32 98 A d a b 01000001 01100100 01100001 00100000 01100010
  6. 6. Codage des caractères Un nombre correspond à une Lettre 65 <===> A 66 <===> B
  7. 7. Codage des caractères Un nombre correspond à une Lettre 65 <===> A 66 <===> B
  8. 8. Code ASCII American Standard Code for Information Interchange ‫المعلومات‬ ‫لتبادل‬ ‫المريكي‬ ‫المعياري‬ ‫الترميز‬
  9. 9. ASCII ● 7 bits => 128 caractères ● + 1 bit de vérification
  10. 10. ASCII !"#$%&'()*+,-./0123456789:;<=>? @ABCDEFGHIJKLMNOPQRSTUVWXYZ[ ]^_ `abcdefghijklmnopqrstuvwxyz{|}
  11. 11. codes
  12. 12. Caractères spéciaux
  13. 13. Caractères spéciaux ● SP : 20 espace ● CR : 13 retour à la ligne ● HT : 09 Tabulation ● BS ; 08 Back space ● BEL : 07 sonnette ● NUL : 00 null ● DEL : 127 supprimer ●
  14. 14. Exercice ● Décoder le message suivant ● 42 6f 75 69 72 61 20 31 30
  15. 15. Exercice ● Décoder le message suivant ● 42 6f 75 69 72 61 20 31 30 ● B o u i R a 1 0
  16. 16. Exercice ● Coder le message suivant ● L'Algérie
  17. 17. Exercice ● Coder le message suivant ● L ' A l g é r i e ● 4c 27 41 6c 67 ?? 72 69 65
  18. 18. Problèmes ● Il Représente que l'anglais ● Manque des caractères accentués ● Pas des caractères multilingues ●‫فقط‬ ‫الجنجليزية‬ ‫يمثل‬ ●‫منقطة‬ ‫حروف‬ ‫ل‬ ●‫لتينية‬ ‫غير‬ ‫لغات‬ ‫من‬ ‫حروف‬ ‫ل‬
  19. 19. ● Utiliser 8 bits ● 8 bits = 256 caractères ● 0-127 => ascii ● 128-255 => extension ‫توسيع‬ ASCII étendu
  20. 20. ASCII étendu
  21. 21. ASCII étendu Arabe
  22. 22. ASCII étendu russe
  23. 23. ASCII étendu thaïlandais
  24. 24. Problèmes ● Multitude des codes ‫الترميزات‬ ‫تعدد‬ ● Langues avec des nombreux caractères ●‫الكثيرة‬ ‫الحروف‬ ‫ذات‬ ‫اللغات‬ ‫مشكلة‬
  25. 25. Problèmes ● Multitude des codes ‫الترميزات‬ ‫تعدد‬ ● Langues avec des nombreux caractères ●‫الكثيرة‬ ‫الحروف‬ ‫ذات‬ ‫اللغات‬ ‫مشكلة‬
  26. 26. Différents codes
  27. 27. Différents codes
  28. 28. ‫حد‬‫ح‬ ‫المو‬ ‫العالمي‬ ‫الترميز‬ Unicode
  29. 29. Unicode 16 bits = 65 535 caractères Multilingue
  30. 30. Unicode A 65 ‫ض‬ 1560 11619 40201
  31. 31. Unicode
  32. 32. Unicode • Codage multilingue ‫اللغات‬ ‫متعدد‬ ‫ترميز‬ • 2 octets = 16 bits • Extensible ‫للرثراء‬ ‫قابل‬ Unicode.org
  33. 33. Unicode
  34. 34. Unicode chinois
  35. 35. Tifinagh The Unicode Standard, Version 6.3
  36. 36. Unicode Math
  37. 37. Unicode symboles
  38. 38. Unicode Hiéroglyphique
  39. 39. L'arabe et l'Unicode Arabe standard ‫الساسية‬ ‫العربية‬ Coranique Marques ‫القرآجنية‬ ‫العلمات‬ Arabe étendue ‫الموسعة‬ ‫العربية‬ • ‫الفارسية‬ • ‫الردو‬ • ‫البشتو‬ • ‫الكردية‬ • ‫الفريقية‬ ‫اللغات‬ Ligature ‫مثل‬ ‫التراكيب‬‫لم‬ ، ‫ل‬
  40. 40. Unicode arabe
  41. 41. Exercice • Décoder le message suivant •062c 0627 0645 0650 0639 0629 064c
  42. 42. Exercice • Décoder le message suivant • 062c 0627 0645 0650 0639 0629 064c • ‫ا‬ ‫ج‬ 62c 627 645 650 639 629 64c ‫ج‬ ‫ا‬ ‫م‬ ِِ ‫كسرة‬ ‫ع‬ ‫ة‬ ٌِ ‫ضمتان‬
  43. 43. Exercice • Coder le message suivant ‫يرة‬‫ي‬ ‫البو‬
  44. 44. Exercice • Coder le message suivant ‫يرة‬‫ي‬ ‫البو‬ u0627 0644 0628 0648 064a 0652 0631 0629
  45. 45. ‫اليوجنيكود‬ ‫في‬ ‫القرآجنية‬ ‫العلمات‬
  46. 46. Caractères de contrôle
  47. 47. Affichage •‫التجاه‬ ‫رثنائية‬ •‫الحروف‬ ‫تشبيك‬
  48. 48. Bidirectionalité
  49. 49. Directions • ‫المنغولية‬ • Mongolien
  50. 50. Directions • ‫الصينية‬ • ‫الياباجنية‬ • ‫الكورية‬
  51. 51. Caractères de contrôle
  52. 52. Exemple • <title>‫ ‫المشروع)تجريبي‬( ‬ </title> PDFRLE
  53. 53. Affichage •‫التجاه‬ ‫رثنائية‬ •‫الحروف‬ ‫تشبيك‬ Attachement des lettres
  54. 54. Attachement •‫السياق‬ ‫حسب‬ ‫المناسب‬ ‫الحرف‬ ‫شكل‬ ‫اختيار‬ •‫الخط‬ ‫مستوى‬ ‫على‬ ‫عادة‬ ‫يجرى‬
  55. 55. Hindu ‫الهندية‬ ‫في‬ ‫الحروف‬ ‫تشابك‬
  56. 56. Représentation BiDi 0 1 2 3 4 5 6 ‫ا‬ ‫ل‬ ‫ع‬ ‫ر‬ ‫ب‬ ‫ي‬ ‫ة‬ Dans la mémoire Affichage ‫العربية‬Traitement
  57. 57. Caractères de contrôle d'attachement • : ‫الهجري‬ ‫التاريخ‬ ‫كتابة‬1436‫هـ‬ •= ‫ـ‬ + ‫ه‬‫ه‬‫ـ‬ •+ ‫ه‬ZWJ=‫ه‬ • Zero width joiner • U+200D
  58. 58. Exemple d'attachement •‫تبرا‬ ‫الكيس‬ ‫ملت‬ ‫ـت‬ ‫كنـ‬ ‫ما‬ ‫الصبر‬ ‫لول‬ ‫ويك‬
  59. 59. Interdire l'attachement ‫الشعبية‬ ‫الديقراطية‬ ‫الجزائرية‬ ‫الجمهورية‬ ‫ججدش‬ ‫ج.ج.دش‬ ‫ج‬ZWNJ‫ج‬ZWNJ‫دش‬‫ج‬‫ج‬ <= ‫دش‬ ZWNJ = Zero width non joiner
  60. 60. Représentation • Unicode utilise 3 représentation : • UTF-8 • Un octet pour l'ascii, 2à 4 octets pour les autres • ‫يستخدم‬ ‫حيث‬ ، ‫الويب‬ ‫مبرمجي‬ ‫لدى‬ ‫المفضل‬ ‫وهو‬1‫كاجنت‬ ‫إذا‬ ‫بايت‬ ‫ترميز‬ ‫في‬ ‫موجودة‬ ‫الرموز‬ ASCII ، ‫وتستخدم‬2‫إلى‬4‫للرموز‬ ‫بايت‬ ‫.المعقدة‬ • UTF-16 ‫إما‬ ‫يستخدم‬ ‫الترميز‬ ‫هذا‬2‫موجودة‬ ‫الرموز‬ ‫كاجنت‬ ‫إذا‬ ‫للترميز‬ ‫بايت‬ ‫في‬ Basic Multilingual Plane) BMP) ‫و‬4‫الغير‬ ‫للرموز‬ ‫بايت‬ ‫.موجودة‬ • UTF-32 : ‫يستخدم‬4‫الدوام‬ ‫على‬ ‫بايت‬ utilise 4 octets toujours .
  61. 61. UTF A ‫א‬ 好 Code point U+0041 U+05D0 U+597D U+233B4 UTF-8 41 D7 90 E5 A5 BD F0 A3 8E B4 UTF-16 00 41 05 D0 59 7D D8 4C DF B4 UTF-32 00 00 00 41 00 00 05 D0 00 00 59 7D 00 02 33 B4
  62. 62. UTF

×