SlideShare une entreprise Scribd logo
1  sur  36
Télécharger pour lire hors ligne
Open-Tamil 
Text Processing Library in Python 
A Muthiah, T Shrinivasan, M Annamalai 
13th Tamil Internet Conference – 2014, Puducherry, India
Open-Tamil Python Library for Tamil Text Processing
T Shrinivasan 
tshrinivasan@gmail.com 
GNU/Linux Evangalist 
Editor : http://Kaniyam.com 
Ex-Co-ordinator : http://ilugc.in 
Publisher : http://FreeTamilEbooks.com 
Blogger : http://Goinggnu.wordpress.com 
Coder : http://github.com/tshrinivasan 
Photographer : http://commons.wikimedia.org/wiki/Special:ListFiles/Tshrinivasan
தமிழ் எழுத்துகளைளை 
ைகளயாளுதல்
நிறுவுதல் 
● Python package 
– Python Package installer (pip) 
– https://pypi.python.org/pypi/Open-Tamil/ 
● Git-Hub collaboration 
– Open-Tamil core repo 
https://github.com/arcturusannamalai/open-tamil/ 
● Social blogs 
– http://ezhillang.wordpress.com/
உயிரெரெழுத்துக்களள
எழுத்துக்களைளைக் களண்டறிதல் 
• Tamil Letters 
• Vowels 
• Consonants
வார்த்ைதகளளின் நீளைம் களாணுதல்
வைகளப்படுத்துதல்
வார்த்தைதைகளின் பயன்பாட
உரைர - IPA
உரைர - IPA
எழுத்ததுரு மாற்றம
எழுத்ததுரு மாற்ற வைககள 
13. Tam 
14. Tscii 
15. Pallavar 
16. Indoweb 
17. Koeln 
18. Libi 
19. Oldvikatan 
20. Webulagam 
21. Diacritic 
22. Shreelipi 
23. Softview 
24. Tace 
25. Vanavil 
1. Anjal 
2. Bamini 
3. Boomi 
4. Dinakaran 
5. Dinamani 
6. Dinathanthy 
7. Kavipriya 
8. Murasoli 
9. Mylai 
10. Nakkeeran 
11. Roman 
12. Tab
ஒருங்குறி மாற்றம
ngram
ஒலிபெபயர்ப்ப
வார்த்தைதைகைளை 
திருப்பதைல
தமிழ99 தட்டச்சுப் பலகைக 
➔ JQuery 
➔ JQuery UI based 
➔ Free to use on web 
➔ e.g. Www.Urbantamil.com
கட்டற்ற/திறவூற்று 
ெமென்பெபொருள 
➔ Multi-licensed 
➔ MIT, and other OSS 
➔ Multi-language 
➔ C, Python, JavaScript, C 
➔ 
Source : https://github.com/arcturusannamalai/open-tamil
பயன்பபொட 
1.Websites: 
1.Ezhil Language 
2.UrbanTamil 
2.Installs on Python 
1.1000+ downloads on PIP
பங்களிப்ோபொர 
முத்து & சீன 
ezhillang@gmail.com & tshrinivasan@gmail.com 
அருளொளன்ப சத்யொ 
msathia@gmail.com arulalant@gmail.com
உதொரணங்கள
எழுத்துக்கைள எண்ணுதல
Transliterate
வொரத்ைதகைள திருப்புதல
எழுத்துகளொகப் பிரித்தல
வார்த்தைதைகளாகப் பிரித்ததைல
எழுத்தது இடத்தைதைக் கண்டுபிடித்ததைல
திஸ்கி - ஒருங்குறி மாற்றம
ஒருங்குறி - திஸ்கி மாற்றம
உரைரை - IPA
Questions
Thanks
கிரிேயேடிவ் காமன்ஸ் படங்கள் மூலம 
● http://upload.wikimedia.org/wikipedia/commons/d/d1/Tamil-Encoding-UnicodePUA-TACE16-● http://pixabay.com/p-2261 
● http://upload.wikimedia.org/wikibooks/ta/c/c8/Tamil_vwl.gif 
● http://upload.wikimedia.org/wikibooks/ta/f/f8/Tamil_cons.gif 
● http://upload.wikimedia.org/wikipedia/commons/a/ae/Metal_movable_type.jpg 
● http://kamalasurabhi.org/basic_lessons/ipa_tamil.gif 
● http://en.wikipedia.org/wiki/Tamil_script 
● https://books.google.com/ngrams/graph?content=tamil&year_start=1900&year_end=● http://www.tamildictionary.org/tamil_transliteration.php 
● http://blog.ravidreams.net/wp-content/uploads/2006/12/tamil99.jpg 
● http://commons.wikimedia.org/wiki/File:Nandri_%28%E0%AE%A8%E0%AE%A9%E0%● http://about.me/SathiaNMahadevan 
● http://pixabay.com/p-96286
Creative Commons Attribution Share-Alike 
License

Contenu connexe

Plus de Shrinivasan T

Giving New Life to Old Tamil Little Magazines Through Digitization
Giving New Life to Old Tamil Little Magazines Through DigitizationGiving New Life to Old Tamil Little Magazines Through Digitization
Giving New Life to Old Tamil Little Magazines Through DigitizationShrinivasan T
 
Digitization of Tamil Soviet Publications and Little Magazines.pdf
Digitization of Tamil Soviet Publications and Little Magazines.pdfDigitization of Tamil Soviet Publications and Little Magazines.pdf
Digitization of Tamil Soviet Publications and Little Magazines.pdfShrinivasan T
 
python-an-introduction
python-an-introductionpython-an-introduction
python-an-introductionShrinivasan T
 
Tamilinayavaani - integrating tva open-source spellchecker with python
Tamilinayavaani -  integrating tva open-source spellchecker with pythonTamilinayavaani -  integrating tva open-source spellchecker with python
Tamilinayavaani - integrating tva open-source spellchecker with pythonShrinivasan T
 
Algorithms for certain classes of tamil spelling correction
Algorithms for certain classes of tamil spelling correctionAlgorithms for certain classes of tamil spelling correction
Algorithms for certain classes of tamil spelling correctionShrinivasan T
 
Tamil and-free-software - தமிழும் கட்டற்ற மென்பொருட்களும்
Tamil and-free-software - தமிழும் கட்டற்ற மென்பொருட்களும்Tamil and-free-software - தமிழும் கட்டற்ற மென்பொருட்களும்
Tamil and-free-software - தமிழும் கட்டற்ற மென்பொருட்களும்Shrinivasan T
 
Introducing FreeTamilEbooks
Introducing FreeTamilEbooks Introducing FreeTamilEbooks
Introducing FreeTamilEbooks Shrinivasan T
 
கட்டற்ற மென்பொருள் பற்றிய அறிமுகம் - தமிழில் - Introduction to Open source in...
கட்டற்ற மென்பொருள் பற்றிய அறிமுகம் - தமிழில் - Introduction to Open source in...கட்டற்ற மென்பொருள் பற்றிய அறிமுகம் - தமிழில் - Introduction to Open source in...
கட்டற்ற மென்பொருள் பற்றிய அறிமுகம் - தமிழில் - Introduction to Open source in...Shrinivasan T
 
Share your knowledge in wikipedia
Share your knowledge in wikipediaShare your knowledge in wikipedia
Share your knowledge in wikipediaShrinivasan T
 
Version control-systems
Version control-systemsVersion control-systems
Version control-systemsShrinivasan T
 
Contribute to-ubuntu
Contribute to-ubuntuContribute to-ubuntu
Contribute to-ubuntuShrinivasan T
 
Sprit of Engineering
Sprit of EngineeringSprit of Engineering
Sprit of EngineeringShrinivasan T
 
Amace ion newsletter-01
Amace ion   newsletter-01Amace ion   newsletter-01
Amace ion newsletter-01Shrinivasan T
 
Chennai Linux User Group
Chennai Linux User GroupChennai Linux User Group
Chennai Linux User GroupShrinivasan T
 
Ruby An Introduction
Ruby An IntroductionRuby An Introduction
Ruby An IntroductionShrinivasan T
 

Plus de Shrinivasan T (20)

Giving New Life to Old Tamil Little Magazines Through Digitization
Giving New Life to Old Tamil Little Magazines Through DigitizationGiving New Life to Old Tamil Little Magazines Through Digitization
Giving New Life to Old Tamil Little Magazines Through Digitization
 
Digitization of Tamil Soviet Publications and Little Magazines.pdf
Digitization of Tamil Soviet Publications and Little Magazines.pdfDigitization of Tamil Soviet Publications and Little Magazines.pdf
Digitization of Tamil Soviet Publications and Little Magazines.pdf
 
python-an-introduction
python-an-introductionpython-an-introduction
python-an-introduction
 
Tamilinayavaani - integrating tva open-source spellchecker with python
Tamilinayavaani -  integrating tva open-source spellchecker with pythonTamilinayavaani -  integrating tva open-source spellchecker with python
Tamilinayavaani - integrating tva open-source spellchecker with python
 
Algorithms for certain classes of tamil spelling correction
Algorithms for certain classes of tamil spelling correctionAlgorithms for certain classes of tamil spelling correction
Algorithms for certain classes of tamil spelling correction
 
Tamil and-free-software - தமிழும் கட்டற்ற மென்பொருட்களும்
Tamil and-free-software - தமிழும் கட்டற்ற மென்பொருட்களும்Tamil and-free-software - தமிழும் கட்டற்ற மென்பொருட்களும்
Tamil and-free-software - தமிழும் கட்டற்ற மென்பொருட்களும்
 
Introducing FreeTamilEbooks
Introducing FreeTamilEbooks Introducing FreeTamilEbooks
Introducing FreeTamilEbooks
 
கட்டற்ற மென்பொருள் பற்றிய அறிமுகம் - தமிழில் - Introduction to Open source in...
கட்டற்ற மென்பொருள் பற்றிய அறிமுகம் - தமிழில் - Introduction to Open source in...கட்டற்ற மென்பொருள் பற்றிய அறிமுகம் - தமிழில் - Introduction to Open source in...
கட்டற்ற மென்பொருள் பற்றிய அறிமுகம் - தமிழில் - Introduction to Open source in...
 
Share your knowledge in wikipedia
Share your knowledge in wikipediaShare your knowledge in wikipedia
Share your knowledge in wikipedia
 
Version control-systems
Version control-systemsVersion control-systems
Version control-systems
 
Contribute to-ubuntu
Contribute to-ubuntuContribute to-ubuntu
Contribute to-ubuntu
 
Dhvani TTS
Dhvani TTSDhvani TTS
Dhvani TTS
 
Freedom toaster
Freedom toasterFreedom toaster
Freedom toaster
 
Sprit of Engineering
Sprit of EngineeringSprit of Engineering
Sprit of Engineering
 
Amace ion newsletter-01
Amace ion   newsletter-01Amace ion   newsletter-01
Amace ion newsletter-01
 
Rpm Introduction
Rpm IntroductionRpm Introduction
Rpm Introduction
 
Foss History
Foss HistoryFoss History
Foss History
 
Jobs In Foss
Jobs In FossJobs In Foss
Jobs In Foss
 
Chennai Linux User Group
Chennai Linux User GroupChennai Linux User Group
Chennai Linux User Group
 
Ruby An Introduction
Ruby An IntroductionRuby An Introduction
Ruby An Introduction
 

Open-Tamil Python Library for Tamil Text Processing