Ce diaporama a bien été signalé.
Nous utilisons votre profil LinkedIn et vos données d’activité pour vous proposer des publicités personnalisées et pertinentes. Vous pouvez changer vos préférences de publicités à tout moment.

Unicodeの似た字体の⽂字

872 vues

Publié le

Unicodeは字形を区別して登録されません。つまりボールド体でもイタリック体でもaはaです。でも、あれ?インターネット上では似たような⽂字よく
⾒ますよね。。🤔🤔🤔

Publié dans : Technologie
  • Soyez le premier à commenter

Unicodeの似た字体の⽂字

  1. 1. Unicodeの似た字体の⽂字                                   raintrees.net 1
  2. 2. ⾃⼰紹介 HN : kanata Twitter : @kanata201612 Web : https://raintrees.net CTFとシェル芸と温泉好きなおっさん 仕事は何やっているかよくわからない 難読化シェル芸 本書いた https://amzn.to/2UKNQfI raintrees.net 2
  3. 3. 以前シェル芸勉強会で教わった Unicodeは字形を区別して登録しない つまり a は、 a としても a としても、全て同じ U+0041 でも、あれ?インターネット上では似たような⽂字よく ⾒るよね。。 ABC𝐀𝐁𝐂𝐴𝐵𝐶𝑨𝑩𝑪𝓐𝓑𝓒𝔸𝔹𝕬𝕭𝕮𝖠𝖡𝖢𝗔𝗕𝗖𝘈𝘉𝘊𝘼𝘽𝘾𝙰𝙱𝙲🄐🄑🄒🄰🄱🄲🅐🅑🅒 🅰🅱🅲 ⒶⒷⒸABC                                        raintrees.net 3
  4. 4. 似たような⽂字の整理( /2) そこで、似たような字形のものを整理してみた めっちゃ字形を区別して登録してるのではwww 詳細︓https://bit.ly/39mlujD U+0041 - U+005A ABCDEFGHIJKLMNOPQRSTUVWXYZ U+0061 - U+007A abcdefghijklmnopqrstuvwxyz U+249C - U+24B5 ⒜⒝⒞⒟⒠⒡⒢⒣⒤⒥⒦⒧⒨⒩⒪⒫⒬⒭⒮⒯⒰⒱⒲⒳⒴⒵ U+24B6 - U+24CF ⒶⒷⒸⒹⒺⒻⒼⒽⒾⒿⓀⓁⓂⓃⓄⓅⓆⓇⓈⓉⓊⓋⓌⓍⓎⓏ U+24D0 - U+24E9 ⓐⓑⓒⓓⓔⓕⓖⓗⓘⓙⓚⓛⓜⓝⓞⓟⓠⓡⓢⓣⓤⓥⓦⓧⓨⓩ U+FF21 - U+FF3A ABCDEFGHIJKLMNOPQRSTUVWXYZ U+FF41 - U+FF5A abcdefghijklmnopqrstuvwxyz U+1D400 - U+1D419 𝐀𝐁𝐂𝐃𝐄𝐅𝐆𝐇𝐈𝐉𝐊𝐋𝐌𝐍𝐎𝐏𝐐𝐑𝐒𝐓𝐔𝐕𝐖𝐗𝐘𝐙 U+1D41A - U+1D433 𝐚𝐛𝐜𝐝𝐞𝐟𝐠𝐡𝐢𝐣𝐤𝐥𝐦𝐧𝐨𝐩𝐪𝐫𝐬𝐭𝐮𝐯𝐰𝐱𝐲𝐳 U+1D434 - U+1D44D 𝐴𝐵𝐶𝐷𝐸𝐹𝐺𝐻𝐼𝐽𝐾𝐿𝑀𝑁𝑂𝑃𝑄𝑅𝑆𝑇𝑈𝑉𝑊𝑋𝑌𝑍 U+1D44E - U+1D467 U+1D468 - U+1D481 𝑨𝑩𝑪𝑫𝑬𝑭𝑮𝑯𝑰𝑱𝑲𝑳𝑴𝑵𝑶𝑷𝑸𝑹𝑺𝑻𝑼𝑽𝑾𝑿𝒀𝒁 U+1D482 - U+1D49B 𝒂𝒃𝒄𝒅𝒆𝒇𝒈𝒉𝒊𝒋𝒌𝒍𝒎𝒏𝒐𝒑𝒒𝒓𝒔𝒕𝒖𝒗𝒘𝒙𝒚𝒛 U+1D49C - U+1D4B5 U+1D4B6 - U+1D4CF U+1D4D0 - U+1D4E9 𝓐𝓑𝓒𝓓𝓔𝓕𝓖𝓗𝓘𝓙𝓚𝓛𝓜𝓝𝓞𝓟𝓠𝓡𝓢𝓣𝓤𝓥𝓦𝓧𝓨𝓩 raintrees.net 4
  5. 5. 似たような⽂字の整理( /2) U+1D4EA - U+1D503 𝓪𝓫𝓬𝓭𝓮𝓯𝓰𝓱𝓲𝓳𝓴𝓵𝓶𝓷𝓸𝓹𝓺𝓻𝓼𝓽𝓾𝓿𝓿𝔀𝔁𝔂𝔃 U+1D504 - U+1D51D U+1D51E - U+1D537 𝔞𝔟𝔠𝔡𝔢𝔣𝔤𝔥𝔦𝔧𝔨𝔩𝔪𝔫𝔬𝔭𝔮𝔯𝔰𝔱𝔲𝔳𝔴𝔵𝔶𝔷 U+1D538 - U+1D551 U+1D552 - U+1D56B 𝕒𝕓𝕔𝕕𝕖𝕗𝕘𝕙𝕚𝕛𝕜𝕝𝕞𝕟𝕠𝕡𝕢𝕣𝕤𝕥𝕦𝕧𝕨𝕩𝕪𝕫 U+1D56C - U+1D585 𝕬𝕭𝕮𝕯𝕰𝕱𝕲𝕳𝕴𝕵𝕶𝕷𝕸𝕹𝕺𝕻𝕼𝕽𝕾𝕿𝖀𝖁𝖂𝖃𝖄𝖅 U+1D586 - U+1D59F 𝖆𝖇𝖈𝖉𝖊𝖋𝖌𝖍𝖎𝖏𝖐𝖑𝖒𝖓𝖔𝖕𝖖𝖗𝖘𝖙𝖚𝖛𝖜𝖝𝖞𝖟 U+1D5A0 - U+1D5B9 𝖠𝖡𝖢𝖣𝖤𝖥𝖦𝖧𝖨𝖩𝖪𝖫𝖬𝖭𝖮𝖯𝖰𝖱𝖲𝖳𝖴𝖵𝖶𝖷𝖸𝖹 U+1D5BA - U+1D5D3 𝖺𝖻𝖼𝖽𝖾𝖿𝗀𝗁𝗂𝗃𝗄𝗅𝗆𝗇𝗈𝗉𝗊𝗋𝗌𝗍𝗎𝗏𝗐𝗑𝗒𝗓 U+1D5D4 - U+1D5ED 𝗔𝗕𝗖𝗗𝗘𝗙𝗚𝗛𝗜𝗝𝗞𝗟𝗠𝗡𝗢𝗣𝗤𝗥𝗦𝗧𝗨𝗩𝗪𝗫𝗬𝗭 U+1D5EE - U+1D607 𝗮𝗯𝗰𝗱𝗲𝗳𝗴𝗵𝗶𝗷𝗸𝗹𝗺𝗻𝗼𝗽𝗾𝗿𝘀𝘁𝘂𝘃𝘄𝘅𝘆𝘇 U+1D608 - U+1D621 𝘈𝘉𝘊𝘋𝘌𝘍𝘎𝘏𝘐𝘑𝘒𝘓𝘔𝘕𝘖𝘗𝘘𝘙𝘚𝘛𝘜𝘝𝘞𝘟𝘠𝘡 U+1D622 - U+1D63B 𝘢𝘣𝘤𝘥𝘦𝘧𝘨𝘩𝘪𝘫𝘬𝘭𝘮𝘯𝘰𝘱𝘲𝘳𝘴𝘵𝘶𝘷𝘸𝘹𝘺𝘻 U+1D63C - U+1D655 𝘼𝘽𝘾𝘿𝙀𝙁𝙂𝙃𝙄𝙅𝙆𝙇𝙈𝙉𝙊𝙋𝙌𝙍𝙎𝙏𝙐𝙑𝙒𝙓𝙔𝙕 U+1D656 - U+1D66F 𝙖𝙗𝙘𝙙𝙚𝙛𝙜𝙝𝙞𝙟𝙠𝙡𝙢𝙣𝙤𝙥𝙦𝙧𝙨𝙩𝙪𝙫𝙬𝙭𝙮𝙯 U+1D670 - U+1D689 𝙰𝙱𝙲𝙳𝙴𝙵𝙶𝙷𝙸𝙹𝙺𝙻𝙼𝙽𝙾𝙿𝚀𝚁𝚂𝚃𝚄𝚅𝚆𝚇𝚈𝚉 U+1D68A - U+1D6A3 𝚊𝚋𝚌𝚍𝚎𝚏𝚐𝚑𝚒𝚓𝚔𝚕𝚖𝚗𝚘𝚙𝚚𝚛𝚜𝚝𝚞𝚟𝚠𝚡𝚢𝚣 U+1F110 - U+1F129 🄐🄑🄒🄓🄔🄕🄖🄗🄘🄙🄚🄛🄜🄝🄞🄟🄠🄡🄢🄣🄤🄥🄦🄧🄨🄩 U+1F130 - U+1F149 🄰🄱🄲🄳🄴🄵🄶🄷🄸🄹🄺🄻🄼🄽🄾🄿🅀🅁🅂🅃🅄🅅🅆🅇🅈🅉 U+1F150 - U+1F169 🅐🅑🅒🅓🅔🅕🅖🅗🅘🅙🅚🅛🅜🅝🅞🅟🅠🅡🅢🅣🅤🅥🅦🅧🅨🅩 U+1F170 - U+1F189 🅰🅱🅲🅳🅴🅵🅶🅷🅸🅹🅺🅻🅼🅽🅾🅿🆀🆁🆂🆃🆄🆅🆆🆇🆈🆉 U+1F1E6 - U+1F1FF raintrees.net 5
  6. 6. 似たような字形だけど区別された理由 こんな理由で区別されているようです 数学⽤英数字記号 英数字を様々な書体で表した形式の記号です。数学や技 術的な表記以外での使⽤は禁じられています。 囲み英数字 リスト上の順序を表わすために⽤いられる英数字です。 ほとんどは東アジアの既存の規格との互換⽤です。 囲み英数字補助 ⽇本のデータ放送規格ARIB STD B24や携帯電話の絵⽂字 との互換⽤の英数字、地域コードを表現するためのラテ ン⽂字などです。 raintrees.net 6
  7. 7. The Unicode Consortium の努⼒ がんばって以下の定義で区別しようとした… ⽂字 特定の形状のことを指すものではなく、抽象的な意味と 抽象的な形状のことを指す グリフ ⽂字が描画あるいは表⽰されるときに持ちうる形状を表 現するもの フォント ⽂字の視覚的表現のために使われるグリフを集めたもの raintrees.net 7
  8. 8. ⽂字とグリフの境界(実は曖昧) ナンバーサイン(#)とシャープ(♯) ギリシャ⽂字のオメガ(Ω)と電気抵抗のオーム(Ω) 数学では普通のRと太字の𝐑、実数空間を参照するための ⽩抜き⽂字のℝは違う⽂字だと主張がある 数学⽤の⽂字は、どんどん追加されている なので、ここらへんは雰囲気らしい                                        raintrees.net 8
  9. 9. 余談︓紛らわしい⽂字での攻撃 IDNホモグラフ攻撃 wikipediа.org(全⾓の a(スモールエー)を混ぜてる) wíkipedia.org(í を混ぜて偽装している) 朝⽈.com(「⽇」と酷似した、「⽈」で偽装している)                                      数学⽤の⽂字は使⽤が禁⽌されている(RFC3454) 参照: Wikipedia ホモグラフ攻撃 と RFC3454 raintrees.net 9
  10. 10. ツールを作った そんな訳でこんな⽂字を気軽に使いたい インストール ファイルダウンロードして実⾏権限をつけるだけ $ wget https://raintrees.net/attachments/download/712/funnychar $ chmod u+x ./funnychar                                         raintrees.net 10
  11. 11. 使い⽅ # 定義済み20パターンから選択する ./funnychar -p 9 "UNKO is unko" 𝖀𝕹𝕶𝕺 𝖎𝖘 𝖚𝖓𝖐𝖔 # 該当のAのコードポイントを指定する $ ./funnychar -u U+1D63C "UNKO is unko" 𝙐𝙉𝙆𝙊 𝙞𝙨 𝙪𝙣𝙠𝙤 # パイプ経由でも使える echo "うんこUnko"|./funnychar -p 12 うんこ𝘜𝘯𝘬𝘰                                        raintrees.net 11
  12. 12. おわり funnycharについて https://bit.ly/2SDxrLE 参考 Unicodeの基礎知識 http://exlight.net/devel/unicode/basics.html 図書館員のコンピュータ基礎講座 http://www.asahi- net.or.jp/~ax2s-kmtn/ref/unicode/alphanumeric.html Unicode Utilities: Character Properties https://unicode.org/cldr/utility/character.jsp raintrees.net 12

×