SlideShare une entreprise Scribd logo
1  sur  11
Télécharger pour lire hors ligne
LEXIGRAF • ΑΝΑΠΤΥΞΗ ΠΛΑΤΦΟΡΜΑΣ ΛΟΓΙΣΜΙΚΟΥ
ΓΙΑ ΑΥΤΟΜΑΤΟΠΟΙΗΜΕΝΟ ΠΟΛΥΓΛΩΣΣΙΚΟ
ΛΕΞΙΚΟΓΡΑΦΙΚΟ DESKTOP PUBLISHING
Γιάννης Χατζόπουλος
ΠΕΡΙΛΗΨΗ
Η πλατφόρμα λογισμικού LeχiGraf αναπτύχθηκε υπό τα MS WINDOWS για να αυτοματοποιήσει
τη σύνταξη πολύγλωσσων και δίγλωσσων έντυπων λεξικών ορολογίας. Μπορεί να υποστηρίξει 2-8
γλώσσες ταυτοχρόνως (single byte σετ χαρακτήρων για την 16bit έκδοση, UNICODE υπό ανάπτυξη
για την 32bit). Λειτουργεί ως ενοποιημένο περιβάλλον διαχείρισης πολυγλωσσικής ορολογίας και
aυτοματοποιημένου desktop publishing. Προσφέρει άμεση μετάβαση από την πρωτογενή συλλογή
ορολογίας προς την τυπογραφική πρέσα ή ενδιαμέσως προς πλατφόρμες ηλεκτρονικών λεξικών
ορολογίας (CD-ROM). Τα έντυπα πολυγλωσσικό λεξικά ορολογίας που παράγει το LexiGraf
υλοποιούνται με την τεχνική του ευρετηρίου όρων. Με συνδυασμούς των διαθέσιμων γλωσσών ανά
ζεύγη, αυτομάτως προκύπτουν δίγλωσσα λεξικά ορολογίας. Λειτουργεί σε δίκτυο Η/Υ, συνδυαστικά
με δημοφιλή πακέτα επιτραπέζιων εκδοτικών συστημάτων (πχ. Ouark-Xpress) κατά το πρότυπο
διασύνδεσης ΧΤΑGΙ RTF. Μπορεί, όπου το επιτρέπουν οι συνθήκες. να δεχθεί είσοδο λεξιλογικής
πληροφορίας από λογισμικό οπτικής αναγνώρισης χαρακτήρων (OCR). Η ανάmuξη του LexiGra1
πραγματοποιήθηκε για να καλυφθούν οι μηχανογραφικές ανάγκες του Γενικού Τμήματος Ξένων
Γλωσσών του ΑΠΘ κατά την εκπόνηση ενός τετράγλωσσου λεξικού ορολογίας θετικών επιστημών
(Αγγλ/ Γαλλι' Γερμ/ Ελλην · 50.000 όρων/ γλώσσα) + 9 δίγλωσσων λεξικών (επιλεγμένοι συνδυασμοί
των παραπάνω γλωσσών ανά ζεύγη) + δευτερογενής ηλεκτρονική έκδοση του τετράγλωσσου
λεξικού. URL http://egnatia.ee.auth.gr,l'yhat/yiannis/
LEXIGRAF • DEVELOPMENT OF ΑΝ AUTOMATED MULfiLINGUAL
LEXICOGRAPHY DESKTOP PUBLISHING TOOL
Yiannis Hatzopoulos
SUMMARY
The LexiGraf software base has been deνeoped under MS Windows to assist the creation of mul-
tilingual and bilίngua terminology dΙctionaries in print. Any language combination sυpported by MS
WindowsTM can be accommodated to a maximum of Β anguages (singe byte language sets ony
for the 16bit νersion LexiGraf, Unicode 32bΙt νersion under development). The system offers direct
transition from the terminology collection to the printing press; proνides terminoogy management
services, LAN use and excellent quality output to typesetters for subsequent printing press repro-
duction. Multilingual dictionaries pτoduced by LexiGraf deploy a term reference index technique,
59
whίch allows their direct implementation in 2 volumes. regardless of requested number of languages
By combining available languages into pairs bilingual dictionaries are automatically produced, ready
for the printing press. Recently introduced features include process integration with OCR products
for updating existing terminology resources and connectιon layers with popular DTP software prod-
ucts (X1ag/ATF protocol). The resulting database files can be utilised for electronic media publishing
undertakings. Currently LexiGraf is being used in the Aristotle University- Thessalonikι Greece on a
4 language (Engl/ French/ German/Greek · 50.000 terms/ language) natural sciences dictionary + 9
bilιngual ones +- electronic versions. URL http://egnatra.ee.auth.gr(yhat/yιannis/
Keywords: Desktop publishing, multilingual lexicography. bilingual lexicography science termι­
nology, electronic dιctionaries
Ο. ΑΝτι ΕΙΣΑΓΩΓΗΣ
Η Ελληνική γλώσσα ομιλείται από 20.000.000 ανθρώπους σε όλη τη γη. Λόγω του μικρού
αυτού αριθμού, η πολυγλωσσική τεκμηρίωση της ελληνικής επιστημονικής ορολογίας είναι
ανεπαρκής, παρότι οι ανάγκες επικοινωνίας της επιστημονικής μας κοινότητας σε ένα
ανοικτό διεθνές περιβάλλον αυξάνονται καθημερινά. Η πλατφόρμα LexiGraf αναπτύχθηκε για
να καλύψει τις ανάγκες μηχανογράφησης κατά την εκπόνηση ενός έντυπου τετράγλωσσου
λεξικού ορολογίας θετικών επιστημών (Αγγλ/Γαλλ!Γερμ/Ελλην. '50,000 όρων/γλwσσα) στο
Γενικό Τμήμα Ξένων Γλωσσών του Α.Π.Θ. (κκ Στεπανιάν, Χαρσούλη, Ζάχου, Κωνσταντίνου
τηλ. 031.997862 fax 031.998419), μίας σειράς έντυπων δίγλωσσων λεξικwν ορολογίας, όπως
προκύπτουν από συνδυασμούς των παραπάνω γλωσσών ανά ζεύγη, καθwς και μiας
συνοδευτικής έκδοσης CD-ROM του τετράγλωσσου λεξικού.
Το LexiGraf αναπτύχθηκε ως εξειδικευμένο εργαλείο διαχείρισης πολυγλωσσικών
βάσεων ορολογίας και aυτοματοποιημένου Desktop publishing. ώστε να
πραγματοποιηθεί η μετάβαση από την πρωτογενή συλλογή ορολογίας προς την
τυπογραφική πρέσα ή δευτερογενώς προς το πιεστήριο CD-ROM με το ελάχιστο δυνατό
κόστος.
Κατά την ανάmυξη λήφθηκε μέριμνα, ώστε το λογισμικό να είναι σε θέση να καλύψει
μελλοντικές ανάγκες (πρόσθετες γλώσσες, νέες προδιαγραφές σελιδοποίησης, ανοικτή
διασύνδεση με άλλα πακέτα λογισμικού , εισαγωγή πληροφορίας από διάφορες πηγές,
αξιοποίηση τεχνολογίας δικτύων κοκ)
60
Freπch lerπrπ.J.
(3errrιan ιerιlnl35
(::! Ε·J·r,οrιγrι-ι~)
·3reek ιemπι.3.<
(~ ~-~ΓιΟnJ•ΓΠ<·:ι
ErtglιSh ΙerιΥΠ·"- dιscιplιπe ci.:J..OE.ι~ιcΞtιorι carrj Νο
 I
'

~'-_-_ι_d_~o_~7_hy_d_)_---=-----;--10_24_--1
:oukιnent <m-... toιr~n_lielc:------1
c/n1elle Stιoeπιung <f>
1. ΠΡΩΤΟΓΕΝΗΣ ΣΥΛΛΟΓΗ ΟΡΟΛΟΓΙΑΣ
Το λεξιλογικό υλικό το οποίο κληθήκαμε να επεξεργαστούμε με το LexiGraf ήταν ήδη
aποδελτιωμένο σε περίπου 50.000 χειρόγραφες καρτέλες. Παρακάτω διακρίνουμε μία
τυπική καρτέλα aποδελτίωσης με αγγλικό λήμμα + συνώνυμα, γνωστικό αντικείμενο,
αύξοντα αριθμό, γαλλική μετάφραση + συνώνυμα, γερμανική μετάφραση + συνώνυμα,
ελληνική μετάφραση + συνώνυμα. Γραμματικοί προσδιορισμοί συμπεριλαμβάνονταν
όπου κρίθηκε αναγκαίο. Η γλώσσα κλειδί ήταν η αγγλική. Σκοπός μας ήταν να
αναπτύξουμε ένα περιβάλλον λογισμικού, στο οποίο αφού τροφοδοτηθούν οι διαθέσιμοι
ορολογικοί πόροι (termιnological resources) σε PCs με δακτυλογράφηση (data-entry) ή
οποιονδήποτε άλλο ενδεδειγμένο τρόπο, να είμαστε σε θέση με το πάτημα ενός
κουμπιού να ολοκληρώνουμε αυτομάτως τη διαδοχή των εργασιών: ταξινόμηση/
επεξεργασία/ σελιδοποίηση/ desktoρ-ρυblishing, ώστε να λαμβάνουμε χωρίς πρόσθετη
εργασία έτοιμα προς μαζική αναπαραγωγή πολύγλωσσα και δίγλωσσα έντυπα λεξικά. Με
μία παρόμοια διαδικασία οδηγούμαστε σε εφαρμογές ηλεκτρονικών λεξικών. Τα
γνωστικά αντικείμενα τα οποία περιλαμβάνονταν στην συγκεκριμένη συλλογή
πολύγλωσσης ορολογίας ήταν τα ακόλουθα:
acoustics adνanced mathematics aerospace engineering algebra
-
analytical chemistry analytical mathe-matics astronomy astrophysics
t-- -
atomic physics biochemistry calculus chemical engineering
--
climatology
ι--
communications computer science control systems
crystallography electricity elec-tro-magnetism electronics engineering
-
fluid mechanics food engineering geochemistry geodesy
geography geology ge-ometry geophysics
--
hydrology inorganic chemistry mapping material technol-ogy
mechanical mechanics 1
metallurgy meteorology
-- ι--
engineerΙng
- --~
mineralogy mining eng1-neering nuclear physics nucleonics
- --
oceanology optics ordnance organic chemistry
- - - -
paleobotany particle physics petroleum engineering petrology
-
physical chemistry plasma physics quantum mechanics relativity
--~---- -- - -
set theory solid state physics spectros-copy statistical mechan ics
statistics systems engi-neering thermodynamics vectoring
2. ΠΟΛΥΓΛΩΣΣΑ ΛΕΞΙΚΑ ΜΕ EYPETHPIA ΟΡΩΝ
Η τεχνική του ευρετηρίου όρων αποτελεi την πλέον διαδεδομένη δομή σύνταξης
έντυπων πολυγλωσσικών λεξικών ορολογiας. Εξαιρετικά δείγματα έχουν κυκλοφορήσει οι
εταιρείες HatierTM, LongmanTM, ElseνierTM και LangenscheidtτM. Ανάλογα πολύγλωσσα
λεξικά αποτελούνται από δύο διακριτά τμήματα/ τόμους. Στον πρώτο τόμο παρατίθενται
οι μεταφράσεις των όρων σε όλες τις γλώσσες του λεξικού, ταξινομημένες ως προς την
αντιστοιχία τους στη γλώσσα κλειδί. Κάθε όρος στην γλώσσα κλειδί 'διευθυνσιοδοτείται'
μέσα στο πολύγλωσσο λεξικό με έναν ειδικό αλφάριθμο ή αύξοντα αριθμό. Ο δεύτερος
τόμος του λεξικού περιέχει χωριστά ευρετήρια όρων για κάθε μία γλώσσα - πλην της
γλώσσας κλειδιού - τα οποία παραπέμπουν στις καταχωρήσεις του πρώτου τόμου,
χρησιμοποιώντας τον προαναφερθέντα αλφάριθμο. Η μεθοδολογία είναι εντελώς
παρόμοια με την ύπαρξη ευρετηρίου όρων σε οποιοδήποτε βιβλίο, και μας επιτρέπει
πρόσβαση από και προς οποιαδήποτε γλώσσα σε ένα συμπαγές τελικό έντυπο πρ6ίόν.
Τα έντυπα πολύγλωσσα λεξικά ορολογiας, λόγω του τυπικά υψηλού τους κόστους
απευθύνονται κυρίως σε επαγγελματiες μεταφραστές και βιβλιοθήκες. Στην περίπτωσή
μας επιλέχθηκε από την πρώτη στιγμή να μορφοποιηθεί το διαθέσιμο λεξιλογικό υλικό
και να κυκλοφορήσει στην αγορά ως έντυπο πολύγλωσσο λεξικό για τους ακόλουθους
λόγους:
62
Χρησιμοποιώντας τις δυνατότητες των σύγχρονων Η/Υ, προϋπολογίσθηκε ότι το
λεξικογραφικό υλικό θο έφτανε στον καταναλωτή σε έντυπη μορφή με μία λιανική τιμή
που δεν θα ξεπερνούσε κατά πολύ το κόστος φωτοαντιγραφής του.
ΑΙprιaπιιrrιeπ.-:::
/ "'"χ ·· Multllingual dictionary - Volume I
Α1
Μ
Μ12
Z7U
Freπcι-; ,retiJΓeη,;e
.'"JdeX
Volume 11
Ήταν αναμενόμενο ότι πολλοί από τους ενδιαφερόμενους λαθροαντιγραφείς, λόγω
και του μεγάλου μεγέθους της έντυπης έκδοσης(' 1500 σελ.) δεν θα είχαν σοβαρό λόγο
να προτιμήσουν την φωτοαντιγραφή από τη νόμιμη αγορά. Στην περίπτωση αρχικής
κυκλοφορίας των λεξικών σε CD-ROM, το κόστος της πειρατικής αναπαραγωγής θα ήταν
μόλις το 10·15% της λιανικής τιμής, οπότε θα υπήρχε ισχυρότατο πρόβλημα απώλειας
εσόδων για τον εκδότη. Τα έντυπα λεξικά αρκετά συχνά προτιμώνται από βιβλιοθήκες,
έναντι των CD-ROM λόγω του ότι δεν απαιτούν Η/Υ για τη χρήση τους. Άρα είναι
προφανές ότι τα λεξικά σε CD-ROM και τα έντυπα πολύγλωσσα λεξικά, είναι δύο
διαφορετικά προϊόντα, τα οποία έχουν τη δική τους ξεχωριατrj θέση στην αγορά μας. Γι
αυτούς τους λόγους, οι χρήστες του LexιGraf επέλεξαν να προηγηθεί η κυκλοφορία του
υλικού τους σε έντυπη μορφή και στη συνέχεια σε ηλεκτρονική.
63
3. ΔΙΓΛΩΣΣΑ ΛΕΞΙΚΑ
Συνδυάζοντας ο Η/Υ τις διαθέσιμες γλώσσες ανά ζεύγη, μπορεί αυτομάτως να
δημιουργήσει δίγλωσσα έντυπα λεξικά ορολογίας. Αν κατά την υλοποίηση
ομαδοποιηθούν οι όροι σύμφωνα με τα γνωστικά αντικείμενα στα οποία ανήκουν,
μπορούν να υλοποιηθούν έντυπα δίγλωσσα λεξικά συγκεκριμένων επιστημονικών
κλάδων μέσα από μία ανομοιογενή συλλογή πολυγλωσσικής ορολογίας. (πχ ελληνο -
γαλλικό λεξικό μαθηματικών, ελληνο -αγγλικό φυσικής κοκ). Αυτά τα είδη των λεξικών,
λόγω της χαμηλής τους τιμής, της ευκολίας και της ταχύτητας υλοποίησης εμφανίζουν
ιδιαίτερα θετικές δυνατότητες απορρόφησης από την αγορά μας.
4. ΗΛΕΚΤΡΟΝΙΚΕΣ ΕΚΔΟΣΕΙΣ
Καθώς η αγορά των ηλεκτρονικών εκδόσεων ωριμάζει σταδιακά και στην Ελλάδα- με
παρόλληλη εξέλιξη της τεχνολογίας προστασίας κατά της παράνομης αντιγραφής CD-
ROM - δημιουργείται αυξανόμενο εμπορικό ενδιαφέρον για την κυκλοφορία CD-ROM
πολύγλωσσων λεξικών ορολογίας, απευθυνόμενων στο γενικό επιστημονικό κοινό.
Ανταποκρινόμενο στις εξελίξεις. το LexiGraf υποστηρίζει τη μεταφορά των
πολύγλωσσων δεδομένων ορολογίας του σε οποιαδήποτε από τις μηχανές (software
engιnes) δημιουργίας ηλεκτρονικών λεξικών που κυκλοφορούν στη διεθνή αγορά.
Ταυτοχρόνως, τα ίδια αυτό λεξιλογικά δεδομένα μπορούν να αξιοποιηθούν για τον
εμπλουτισμό γνωσιολογικών βάσεων δεδομένων σε εφαρμογές αυτόματης ή
επιβοηθούμενης μετόφρασης (translation memory software). δημιουργώντας πρόσθετα
έσοδα για τους ιδιοκτήτες των δεδομένων ορολογίας.
5. Η ΡΟΗ ΕΡΓΑΣΙΩΝ ΣτΟ LEXIGRAF
Η ροή εργασιών στο LexiGraf χωρίζεται σε τρία διακριτά στάδια:
• Είσοδος πολυγλωσσικής ορολογίας στο σύστημα
• Επεξεργασία
• Εξοδος επεξεργασμένης ορολογίας προς περιφερειακές συσκευές ή προς άλλα
πακέτα λογισμικού.
Η ορολογία εισέρχεται στο σύστημα με διάφορους τρόπους, ενδεχομένως
χρησιμοποιώντας υφιστόμενες ηλεκτρονικές συλλογές πολύγλωσσης ορολογίας,
ομάδες δακτυλογρόφων (data entry oρerators). ή με εισαγωγή πληροφορίας
χρησιμοποιώντας μηχανισμούς οπτικής αναγνώρισης χαρακτήρων OCR από ήδη
υπάρχοντα έντυπα λεξικά. Η τελευταία αυτή δυνατότητα εξαρτάται καθοριστικά από την
ικανότητα του εκάστοτε χρησιμοποιούμενου πακέτου OCR να επεξεργαστεί την
Αφού πραγματοποιηθεί η είσοδος λεξιλογικής πληροφορίας στο LexiGraf , από εκεί
και πέρα στο σύστημα το ίδιο επεξεργάζεται, ταξινομεί και μορφοποιεί το υλικό προς
πολύγλωσσο ή δίγλωσσα έντυπα λεξικά μέσα σε λίγα λεπτά. το αποτέλεσμα της
επεξεργασίας είναι αρχεία Η/Υ, κωδικοποιημένα κατά Χtag ή RτF. τα οποία περιέχουν
σελιδοποιημένο το υλικό μας, αναγνώσιμο από λογισμικό Desktop Pυblishing, και στη
συνέχεια άμεσα διαθέσιμο για φωτοστοιχειοθεσία σε ειδικές μηχανές
φωτοστοιχειοθεσίας Postscripl. (Xtag είναι τύπος αρχείων του πακέτου DTP Oυark­
Xρress", de-facto πρότυπο στο χώρο του DTP, RΠ Rich Text Format είναι παρόμοια
κωδικοποίηση της MίcrosottίM που υποστηρίζεται από πολλά πακέτα λογισμικού, τόσο σε
WindowsTM/PC όσο και σε Macintosh"').
Scannedtε::xt
iφΠ
Paperbased
tι?LΠiimlo,Ύ
collectiOf'_
manualdata
m>.ry
Νο 1223
Ι1inera:Water
HineL·al~Ιasse:r
F.aurπi11era.:
(ι.:pto81 anguages)
Uιsel"rlnter
i
ιι/ J
) I
Net-workof PCs
LeriGraf
1
'I'yfesetting
fiJm
oiictiona...
]'
pages
Χάρη σε αυτήν την προσέγγιση μπορούμε να προσθέσουμε οποιοδήποτε στοιχείο
μέσα στο κείμενο των λεξικών μας (πχ εικόνες. σχεδιαγράμματα. τύπους οργανικής
χημείας). να αλλciξουμε το στυλ σελιδοποίησης (layoυt) σε δευτερόλεπτα και να
πραγματοποιήσουμε διορθώσεις ταχύτατα. Καθώς τα συστήματα MacintoshTM είναι το
στάνταρντ στον εκδοτικό χώρο, τα δεδομένα μπορούν να μεταφερθούν από την
πλατφόρμα PC προς την πλατφόρμα Mac με ευκολία χάρη στα πρότυπα Xtag/RτF.
6. ΕΡΓΑΛΕΙΑ ΑΝΑΠΤVΞΗΣ ΤΟΥ LEXIGRAF
Η έκδοση 2.1 και 2.2 του LexiGraf αναπτύχθηκε με την Turbo Pascal for Windows +
Paradox Engine 3.01 της BorlandTM (16bil) υπό τα MS-WINDOWS. Οι λειτουργίες
διαχείρισης βάσεων δεδομένων παρέχονται από το Paradox με την τεχνική file-sharing.
Το σύστημα μπορεί να υποστηρίξει ως 20 χρήστες σε τοπικό δίκτυο. Υπό ανάπτυξη
65
βρίσκεται η έκδοση LexiGraf 3.0 (32bit) χρησιμοποιώντας την De/phi + Borland
lnterBase. Είναι μία εφαρμογή client/serνer, η οποία υποστηρίζει UNICODE και έχει
αυξημένες επιδόσεις σε σχέση με την 16bit έκδοση. Θα συνεργόζεται με SGML import
fιlters, και θα προσφέρει μία αυτοματοποιημένη 'μηχανή' δημιουργίας τόσο έντυπων,
όσο και ηλεκτρονικών λεξικών.
7. ΛΕΙΤΟΥΡΓΙΚΗ ΠΡΟΣΕΓΓΙΣΗ ΣτΟ LEXIGRAF
Το LexiGraf υποστηρίζει τρία βασικά επίπεδα πρόσβασης στο δίκτυο: 1. Data entry
operator access-leνel 2. Lexicography administrator access-leνel 3. Support proνision
access-leνel. Κατά την εξέλιξη του συγκεκριμένου project κατέστη προφανές ότι ήταν
εξαιρετικά δαπανηρό και δύσκολο να προσληφθούν δακτυλογρόφοι (data-entry opera-
tors), οι οποίοι θα ήταν σε θέση να χειριστούν όλες τις γλώσσες που υποστήριζε το
LeχiGraf ταυτοχρόνως. Ας μην ξεχνάμε ότι η πηγαία μας πληροφορία βρισκόταν
aποδελτιωμένη σε χειρόγραφες καρτέλες, άρα έπρεπε να βασιστούμε στην ανθρώπινη
εργασία για να τροφοδοτήσουμε το σύστημα με ορολογία.
Γι' αυτό το λόγο το LeχiGraf χωρίστηκε σε τρία διακριτά τμήματα (modυ/es).
DATA ΕΝΤRγ MODULE: Αυτόνομο κομμότι του LeχiGraf, το οποίο χειρίζονται οι
δακτυλογράφοι-χειριστές (data-entry operators) του συστήματος. Μπορεί να
λειτουργήσει αυτόνομα σε κάποιο απομακρυσμένο service bureau, off-line ή on-line σε
τοπικό δίκτυο. Επιτρέπει στους δακτυλογράφους (data-entry operators) να δουλεύουν
χωριστό την κάθε μία γλώσσα, ανεξόρτητα από τη συνολική εξέλιξη της δουλειάς των
συναδέλφων τους. Αν δουλεύουμε το σύστημα off-lιne, τα λεξικογραφικά δεδομένα
ενσωματώνονται με μεταφορές φακέλων/αρχείων σε κάποιο κεντρικό PC (remote leχi­
cography serνer) σε τακτό χρονικά διαστήματα. Η προσέγγιση βοηθάει στη μείωση του
κόστους εισαγωγής πληροφορίας στο σύστημα, διότι ο φόρτος εργασίας μπορεί να
καταμεριστεί ισομερώς σε πολλούς operators, οι οποίοι μπορούν να δουλεύουν μία μόνο
γλwσσα, σε διαφορετικούς χώρους και ώρες, χωρίς αυτό να δημιουργεί οποιοδήποτε
πρόβλημα στην εξέλιξη του project.
ΠRMINOLQGγ IMPORT/EXPORT: Αυτόνομο κομμότι του LeχiGraf, το οποίο
αναλαμβόνει τη μεταφορό πληροφορίας από και προς τον 'έξω' κόσμο (πχ. είσοδος από
ηλεκτρονικές λίστες ορολογίας, διασύνδεση με λογισμικό OCR, αντίγραφα ασφαλείας
(back-υp) των δεδομένων, εξαγωγή δεδομένων προς γεννήτριες εφαρμογές
ηλεκτρονικών λεξικwν κοκ)
66
r_~f)ι,&,[I{_.~~Σ MIPTI&!b11f;'
, - - l' --- - -- Γ
Ι' Nlti· !Κt:~γας 1
,~;:ι, ~~_;,W(ι)',σιiν '_:ΛΖ.<_Φ::5:[i)nΗrμςς I
ι_ _ _ ιl _ _ __ jj _ _ ι -
ι -
I
itli" _ _
1
' ~~~ c:1J;;~~ύiJ~~-
I A'{'{~LOCC ;,~~fl,"if,'::!:
--:Ξ:ό-οcο~-c~όρος i
1
- ---- - - 1
"'<'Eli-~c
[r_"''"~~Ο>'Π~ l
I ftλ'!'(:ρι€~ος I
~
"' tf~"l"'"ί~~ _[i{oJ:JUKHJ
ηι;;ω:.ιι~·.JΙi)U
' ~~-~,;-J..JJ~-"'_ - -1
3iηocn..αcrι:r:
[πe_~~zdrις_
Γ~~-"-.Jι~--~Σ
;..ι_-~Ίι~tt_;.l~~
f..fLilMIML~-~"fiN
_--:1_
I _'!ο --
I
~η::JC'!JI'i-!'(J;'J'ίlμ~:__; '
_
-~-~a:~~~Δ!~,JΊj~ I
/::,όΧΙιμl{)χ: 6_~φ;1ς
1Γc;,i.)Jrκό· .,.,,_65;«..~
iι:ih.)OJ[βc'lJηα.·~.;
I
IΓVWG'lH(I, J:"t":K i
--;:~,r_;;;,s,;._~ --- I
I~'""-"'" ''"'
1-Δ~OCCiuώ~;._~c: --
:5n%.1ι:Είο:~ζ
I_ Π{;)~cβ:~::irης
Jlitr.:,"'-IK3',):
ΙΠ'>..,.f'-,.f~IY'"'~N
ΛihιΜ.v:,""-η:.ι~:ι
_j -
,,,, -1
I - -- -
1-~Ω· ~~>i'J:~;ΡμΞ: I
~-[~~j~>:r:.λf:i~if-!'0: 1
jΔ:ι,;ι;"";t"''~---- -
1
' '""::;<(llqe
:ι"'"· I
AΞ.(J·:5:ρi3'dlo:.!.;
I τ:::ιιο:._~.;;β~Ίι.::τφ; ___ 
'Γιι-ΝΛΙV.-~Σ
~,r:"ML"'- YI[N.~lh
/~.'-ιi/!MJ:~' ·;)~~
;?~J.::ι;~-:,1/1; '_I' I li '1
,/<>_:[i Q [χΙ-_./},(! -(~ΛIΓ· <I ζ][<}
I ,--)· Ίl ,-~]{>,,11 ,~_Ι:~
ι1c :<ά!ρας
ljlo~~~,;~ I
·&...;·~ν. Μ~~μα
1---:---i
ι Μ'~"' ιρος ~
,~...:J;:yu'Ol{. Π.Ειtf.':;:,
I ,,,ΙJ<'βήηοης J
Γ ~·'Ι~ΊΓΟΧ·δ-~~:;ι:. I
I .~όιJcSμος I
Ι .~~~rκτη; .-{j~g!)Ι.D-- /
O"QJ1,iω,..,-jrμιol"
ΓbJ~!Quώμαιί;- -~,
I δiΧ'J:jO!Ι~J~]-1:;
·.ΙΓ[J)ΟΟ;&:;,:ο:τ[ς
lίHiL'rιζfi,1:
E.:v,~~-:rr-ι~:<.oιr;
Λ:-{'JίΜ~ζ-~~k'Ν
LEXICOGRAPHY DTP MODULE: Κομμάτι του LexiGraf, το οποίο ολοκληρώνει την
επεξεργασία DΤΡ/σελιδοποίησης των πολύγλωσσων και δίγλωσσων λεξικών μας. Παράγει
αυτομάτως λεξικογραφικά αρχεία σελιδοποίησης, κωδικοποιημένα κατά XTAG/RτF, τα
οποία μπορούν να διαβαστούν από επαγγελματικά επιτραπέζια εκδοτικά συστήματα
(desktop pυblishing software). Από εκεί δημιουργούνται τα φιλμ φωτοστοιχειοθεσίας, τα
οποία χρησιμοποιούνται για την τυπογραφική αναπαραγωγή των λεξικών μας.
Μέσα στα λήμματα μας μπορούμε να συμπεριλάβουμε γραμματικούς
προσδιορισμούς, χημικούς τύπους ή παρενθετικούς προσδιορισμούς. Όλη αυτή η
πρόσθετη πληροφορία αναγνωρίζεται από το LeχιGraf αυτομάτως και δεν επηρεάζει την
ορθή ταξινόμηση των λημμάτων σε όλες τις γλώσσες. Επιπλέον, στη φάση του
aυτοματοποιημένου DTP, το LexiGraf αυτομάτως αλλάζει τη μορφή (tyρefacing/ style)
των συγκεκριμένων προσδιορισμών, σύμφωνα με τις απαιτήσεις του τμήματος DTP της
εκδοτικής εταιρείας που αναλαμβάνει να κυκλοφορήσει τα λεξικά που προκύπτουν
(παραμετροποίηση του DTP). Για την ταξινόμηση των λημμάτων, λόγω του μεταβλητού
αριθμού γλωσσών που καλείται να χειριστεί το LexiGraf, δε χρησιμοποιήσαμε τις
ρουτίνες ταξινόμησης του λειτουργικού συστήματος MS WindowsTM. Κάθε γλώσσα που
υποστηρίζεται διαθέτει ένα εσωτερικό module κανόνων αλφαβήτισης/ ταξινόμησης,
67
Εξετάζοντας το πηγαίο λεξικογραφικό υλικό που κληθήκαμε να επεξεργαστούμε,
έγινε αμέσως προφανές ότι υπήρχαν μεμονωμένοι όροι σε κάποιες από τις γλώσσες, οι
οποίοι θα μπορούσαν να χαρακτηριστούν ως αδόκιμοι-επεξηγηματικοί (κυρίως στην
ελληνική γλώσσα). Ανάλογη πληροφορία έχει θέση σε ένα πολύγλωσσο λεξικό
ορολογίας ως ερμηνεία, αλλά όχι σε ένα πχ. ελληνο-αγγλικό λεξικό (οι αδόκιμοι όροι δεν
ευρετηριάζονται). Γι' αυτό το λόγο λήφθηκε ειδική μέριμνα ώστε οι αδόκιμοι ή οι
επεξηγηματικοί όροι να υπόκεινται σε κατάλληλους χειρισμούς αυτομάτως από το
LexiGraf. Παράλληλα, στην περίπτωση που θα διαπιστώσει κάποιο κενό στην απόδοση
μίας ερμηνείας σε μία γλώσσα, το λογισμικό μας αυτομάτως αποκρύπτει τη
συγκεκριμένη πολύγλωσση ορολογική οντότητα από ένα πολύγλωσσο λεξικό (δε
δικαιολογείται η ύπαρξη κενών αποδόσεων σε ένα πολύγλωσσο λεξικό). Η ίδια αυτή
πληροφορία θα αξιοποιηθεί κατά τη σύνταξη ενός δίγλωσσου λεξικού, εφόσον το ζεύγος
των εμπλεκόμενων γλωσσών είναι συμπληρωμένο, έστω αν οι υπόλοιπες γλώσσες είναι
κενές. Ταυτοχρόνως, το LexiGraf μας προειδοποιεί για την ύπαρξη διπλοκαταχωρήσεων
στην ορολογία μας, λαμβάνοντας υπόψιν και το γνωστικό αντικείμενο των όρων.
8. ΔΙΑΔΙΚΑΣΙΑ ΔΗΜ/ΟΥΡΓ/ΑΣ ΕΝΤΥΠΩΝ ΛΕΞΙΚΩΝ
Η δημιουργία έντυπων λεξικών στο LexiGraf εμπεριέχει τα ακόλουθα στάδια:
• Εισαγωγή πολύγλωσσης ορολογίας στο σύστημα.
• Επεξεργασία και ταξινόμηση του υλικού από τους Η/Υ.
• Αποθήκευση των λεξικών (πολύγλωσσων και δίγλωσσων) στο σκληρό δίσκο του
Η/Υ με μορφή proprietary μακροεντολών (L-Tags)
• Μετάφραση των L-Tags προς XTAGS/RΠ και τροφοδοσία του υλικού σε
επαγγελματικά συστήματα DTP (με πλήρη παραμετροποίηση).
• Εκτύπωση των λεξικών μας σε high-end typesetters.
Αφού τροφοδοτηθούν οι βάσεις δεδομένων του LexiGraf με πολυγλωσσική ορολογία, το
λογισμικό μας σαρώνει τα περιεχόμενα της γλώσσας κλειδιού για να δημιουργήσει και να
καταγράψει τους αλφαρίθμους/ αύξοντες αριθμούς που θα χρησιμοποιηθούν για τη σύνταξη
των λεξικών-ευρετηρίων, τα οποία συμπληρώνουν το πολύγλωσσο. Αφού ολοκληρωθεί αυτή
η εργασία, ο διαχειριστής λεξικογράφησης (dictionary administrator) μπορεί να επιλέξει αν
θα δημιουργήσει κάποιο πολύγλωσσο ή δίγλωσσο λεξικό με βάση τη διατιθέμενη συλλογή
ορολογίας. Το αποτέλεσμα της διεργασίας αυτής καταγράφεται στο σκληρό δίσκο του Η/Υ
κωδικοποιημένο κατά L-tags. Η πληροφορία αυτή μπορεί να δρομολογηθεί σε κάποιον
εκτυπωτή, ώστε να έχουμε σε πολύ σύντομο χρόνο ένα δοκίμιο του υλικού μας, πάνω στο
οποίο μπορούμε να εντοπίοουμε τυχόν σφάλματα. Η διόρθωση/ αποκατάσταση των
σφαλμάτων μπορεί να γίνει με εύκολο τρόπο από τους χειριστές του συστήματος.
68
•
Αν επιθυμούμε να έχουμε την τελική ποιότητα στην οποία θα φτάσει το υλικό στον
εκδότη μας, το μόνο που έχουμε να κάνουμε είναι να περάσουμε τα κωδικοποιημένα
κατά L-Tags λεξικά μας μέσα από το ειδικό φίλτρο Χtag/RΠ του LexiGraf, ώστε να
λάβουμε φακέλους αναγνώσιμους από επαγγελματικό λογισμικό DTP. Αν επιλέξουμε να
οδηγηθούμε προς εφαρμογή λεξικού σε CD-ROM. θα χρησιμοποιήσουμε τα εργαλεία
IMPORT/EΧPORT του LexiGraf για να οδηγήσουμε τα δεδομένα μας σε κάποια από τις
γεννήτριες εφαρμογές ηλεκτρονικών λεξικών που κυκλοφορούν στην αγορά.
Στην περίπτωση υλοποίησης δίγλωσσου λεξικού, θα επιλέξουμε το ζεύγος των
γλωσσών που θέλουμε και στη συνέχεια θα κληθούμε να συμπληρώσουμε μία
παραμετρική λίστα γνωστικών αντικειμένων, με βάση την οποία θα συνταχθεί το
συγκεκριμένο λεξικό (λεξικό κλάδων). Η εξέλιξη της διαδικασίας ακολουθεί παρόμοια
πορεία με αυτήν που περιγράψαμε.
9. ΧΡΗΣτΙΚΟΤΗΤΑ ΤΟΥ LEXIGRAF
• Μείωση του χρόνου μετάβασης από την πρωτογενή συλλογή ορολογίας προς το
τελικό έντυπο ή ηλεκτρονικό προ"ίόν.
• Ευελιξία στην υλοποίηση πολλών διαφορετικών προϊόντων που σχετίζονται με το
χώρο της ορολογίας, ανάλογα με τις ανάγκες της αγοράς την κάθε δεδομένη στιγμή.
• Απαλοιφή των εξόδων DTP και αυτοματοποίηση της λεξικογραφικής επεξεργασίας.
• Μείωση του χρόνου και του κόστους υλοποίησης ενημερωμένων λεξικογραφικών
εκδόσεων.
• Μπορεί να χρησιμοποιηθεί για λεξικογραφικά project που εξελίσσονται παραλλήλως.
• Δεν απαιτεί εξειδίκευση στη χρήση του.
Γιάννης Χρ. Χατζόπουλος
Διπλ. Ηλεκτρολόγος Μηχανικός
Υψηλάντοu 3 Σίνδος 574 00
τηλ. 031-797.532 / fax 031-798.432, κιν. 0977-517.317, Email yhat@egnatfa.ee.auth.gr
69

Contenu connexe

Similaire à 2nd_059-069_ChatzopoulosI.pdf

Tαξιδεύοντας στον κόσμο της φύσης με οδηγό τα κειμενικά είδη: Διδακτικό σενάρ...
Tαξιδεύοντας στον κόσμο της φύσης με οδηγό τα κειμενικά είδη: Διδακτικό σενάρ...Tαξιδεύοντας στον κόσμο της φύσης με οδηγό τα κειμενικά είδη: Διδακτικό σενάρ...
Tαξιδεύοντας στον κόσμο της φύσης με οδηγό τα κειμενικά είδη: Διδακτικό σενάρ...
Antonis Stergiou
 
Η γλώσσα προγραμματισμού C.
Η γλώσσα προγραμματισμού C.Η γλώσσα προγραμματισμού C.
Η γλώσσα προγραμματισμού C.
Stathis Gourzis
 

Similaire à 2nd_059-069_ChatzopoulosI.pdf (9)

Eisagwgi
EisagwgiEisagwgi
Eisagwgi
 
Tαξιδεύοντας στον κόσμο της φύσης με οδηγό τα κειμενικά είδη: Διδακτικό σενάρ...
Tαξιδεύοντας στον κόσμο της φύσης με οδηγό τα κειμενικά είδη: Διδακτικό σενάρ...Tαξιδεύοντας στον κόσμο της φύσης με οδηγό τα κειμενικά είδη: Διδακτικό σενάρ...
Tαξιδεύοντας στον κόσμο της φύσης με οδηγό τα κειμενικά είδη: Διδακτικό σενάρ...
 
ΑΕΠΠ - Εισαγωγή στον Προγραμματισμό (Μέρος Α)
ΑΕΠΠ - Εισαγωγή στον Προγραμματισμό (Μέρος Α)ΑΕΠΠ - Εισαγωγή στον Προγραμματισμό (Μέρος Α)
ΑΕΠΠ - Εισαγωγή στον Προγραμματισμό (Μέρος Α)
 
Εισαγωγή στις αρχές της επιστήμης των ΗΥκεφ 2 3 1
Εισαγωγή στις αρχές της επιστήμης των ΗΥκεφ 2 3 1Εισαγωγή στις αρχές της επιστήμης των ΗΥκεφ 2 3 1
Εισαγωγή στις αρχές της επιστήμης των ΗΥκεφ 2 3 1
 
Εισήγηση Ημερίδα ΚΕΠΛΗΝΕΤ 13/3/2013 Χρήστος Θεοδώρου
Εισήγηση Ημερίδα ΚΕΠΛΗΝΕΤ 13/3/2013 Χρήστος ΘεοδώρουΕισήγηση Ημερίδα ΚΕΠΛΗΝΕΤ 13/3/2013 Χρήστος Θεοδώρου
Εισήγηση Ημερίδα ΚΕΠΛΗΝΕΤ 13/3/2013 Χρήστος Θεοδώρου
 
Η γλώσσα προγραμματισμού C.
Η γλώσσα προγραμματισμού C.Η γλώσσα προγραμματισμού C.
Η γλώσσα προγραμματισμού C.
 
The Preparation, Impact and Future of the META-NET White Paper Series “Europe...
The Preparation, Impact and Future of the META-NET White Paper Series “Europe...The Preparation, Impact and Future of the META-NET White Paper Series “Europe...
The Preparation, Impact and Future of the META-NET White Paper Series “Europe...
 
Filoi Logismikou Anoiktou Kwdika
Filoi Logismikou Anoiktou KwdikaFiloi Logismikou Anoiktou Kwdika
Filoi Logismikou Anoiktou Kwdika
 
Kephalaio 5-6-7
 Kephalaio 5-6-7 Kephalaio 5-6-7
Kephalaio 5-6-7
 

Plus de Yiannis Hatzopoulos

Plus de Yiannis Hatzopoulos (20)

Islamic SIM application server
Islamic SIM application serverIslamic SIM application server
Islamic SIM application server
 
Keletron Card SmartGrids Amsterdam
Keletron Card SmartGrids AmsterdamKeletron Card SmartGrids Amsterdam
Keletron Card SmartGrids Amsterdam
 
LogosSolvo-Islamic-SIM-Service-Brochure.pdf
LogosSolvo-Islamic-SIM-Service-Brochure.pdfLogosSolvo-Islamic-SIM-Service-Brochure.pdf
LogosSolvo-Islamic-SIM-Service-Brochure.pdf
 
milipants.pdf
milipants.pdfmilipants.pdf
milipants.pdf
 
EOS_Wedding_gown.pdf
EOS_Wedding_gown.pdfEOS_Wedding_gown.pdf
EOS_Wedding_gown.pdf
 
Sealoc Poster
Sealoc PosterSealoc Poster
Sealoc Poster
 
Sealoc exhibited
Sealoc  exhibitedSealoc  exhibited
Sealoc exhibited
 
Weather map rendering engine Sealoc
Weather map rendering engine SealocWeather map rendering engine Sealoc
Weather map rendering engine Sealoc
 
Ofire+ public thermis_manual
Ofire+ public thermis_manualOfire+ public thermis_manual
Ofire+ public thermis_manual
 
Ofire+ dimos thermis_manual
Ofire+ dimos thermis_manualOfire+ dimos thermis_manual
Ofire+ dimos thermis_manual
 
Getronics / Ingenico TT41
Getronics / Ingenico TT41Getronics / Ingenico TT41
Getronics / Ingenico TT41
 
SmsVoice it
SmsVoice itSmsVoice it
SmsVoice it
 
Lexicon 4 lang science terminology dictionary
Lexicon 4 lang science terminology dictionaryLexicon 4 lang science terminology dictionary
Lexicon 4 lang science terminology dictionary
 
ELETO - 4 language science dictionary
ELETO - 4 language science dictionaryELETO - 4 language science dictionary
ELETO - 4 language science dictionary
 
Islamic sim European Venture Summit
Islamic sim European Venture SummitIslamic sim European Venture Summit
Islamic sim European Venture Summit
 
Intellibox
IntelliboxIntellibox
Intellibox
 
Chipper + TT41 POS terminal
Chipper + TT41 POS terminalChipper + TT41 POS terminal
Chipper + TT41 POS terminal
 
USB_Antipiracy_dongle
USB_Antipiracy_dongleUSB_Antipiracy_dongle
USB_Antipiracy_dongle
 
Bluefish islamic-sim-service
Bluefish islamic-sim-serviceBluefish islamic-sim-service
Bluefish islamic-sim-service
 
DW_SIM_Karte_fur_Muslime
DW_SIM_Karte_fur_MuslimeDW_SIM_Karte_fur_Muslime
DW_SIM_Karte_fur_Muslime
 

2nd_059-069_ChatzopoulosI.pdf

  • 1. LEXIGRAF • ΑΝΑΠΤΥΞΗ ΠΛΑΤΦΟΡΜΑΣ ΛΟΓΙΣΜΙΚΟΥ ΓΙΑ ΑΥΤΟΜΑΤΟΠΟΙΗΜΕΝΟ ΠΟΛΥΓΛΩΣΣΙΚΟ ΛΕΞΙΚΟΓΡΑΦΙΚΟ DESKTOP PUBLISHING Γιάννης Χατζόπουλος ΠΕΡΙΛΗΨΗ Η πλατφόρμα λογισμικού LeχiGraf αναπτύχθηκε υπό τα MS WINDOWS για να αυτοματοποιήσει τη σύνταξη πολύγλωσσων και δίγλωσσων έντυπων λεξικών ορολογίας. Μπορεί να υποστηρίξει 2-8 γλώσσες ταυτοχρόνως (single byte σετ χαρακτήρων για την 16bit έκδοση, UNICODE υπό ανάπτυξη για την 32bit). Λειτουργεί ως ενοποιημένο περιβάλλον διαχείρισης πολυγλωσσικής ορολογίας και aυτοματοποιημένου desktop publishing. Προσφέρει άμεση μετάβαση από την πρωτογενή συλλογή ορολογίας προς την τυπογραφική πρέσα ή ενδιαμέσως προς πλατφόρμες ηλεκτρονικών λεξικών ορολογίας (CD-ROM). Τα έντυπα πολυγλωσσικό λεξικά ορολογίας που παράγει το LexiGraf υλοποιούνται με την τεχνική του ευρετηρίου όρων. Με συνδυασμούς των διαθέσιμων γλωσσών ανά ζεύγη, αυτομάτως προκύπτουν δίγλωσσα λεξικά ορολογίας. Λειτουργεί σε δίκτυο Η/Υ, συνδυαστικά με δημοφιλή πακέτα επιτραπέζιων εκδοτικών συστημάτων (πχ. Ouark-Xpress) κατά το πρότυπο διασύνδεσης ΧΤΑGΙ RTF. Μπορεί, όπου το επιτρέπουν οι συνθήκες. να δεχθεί είσοδο λεξιλογικής πληροφορίας από λογισμικό οπτικής αναγνώρισης χαρακτήρων (OCR). Η ανάmuξη του LexiGra1 πραγματοποιήθηκε για να καλυφθούν οι μηχανογραφικές ανάγκες του Γενικού Τμήματος Ξένων Γλωσσών του ΑΠΘ κατά την εκπόνηση ενός τετράγλωσσου λεξικού ορολογίας θετικών επιστημών (Αγγλ/ Γαλλι' Γερμ/ Ελλην · 50.000 όρων/ γλώσσα) + 9 δίγλωσσων λεξικών (επιλεγμένοι συνδυασμοί των παραπάνω γλωσσών ανά ζεύγη) + δευτερογενής ηλεκτρονική έκδοση του τετράγλωσσου λεξικού. URL http://egnatia.ee.auth.gr,l'yhat/yiannis/ LEXIGRAF • DEVELOPMENT OF ΑΝ AUTOMATED MULfiLINGUAL LEXICOGRAPHY DESKTOP PUBLISHING TOOL Yiannis Hatzopoulos SUMMARY The LexiGraf software base has been deνeoped under MS Windows to assist the creation of mul- tilingual and bilίngua terminology dΙctionaries in print. Any language combination sυpported by MS WindowsTM can be accommodated to a maximum of Β anguages (singe byte language sets ony for the 16bit νersion LexiGraf, Unicode 32bΙt νersion under development). The system offers direct transition from the terminology collection to the printing press; proνides terminoogy management services, LAN use and excellent quality output to typesetters for subsequent printing press repro- duction. Multilingual dictionaries pτoduced by LexiGraf deploy a term reference index technique, 59
  • 2. whίch allows their direct implementation in 2 volumes. regardless of requested number of languages By combining available languages into pairs bilingual dictionaries are automatically produced, ready for the printing press. Recently introduced features include process integration with OCR products for updating existing terminology resources and connectιon layers with popular DTP software prod- ucts (X1ag/ATF protocol). The resulting database files can be utilised for electronic media publishing undertakings. Currently LexiGraf is being used in the Aristotle University- Thessalonikι Greece on a 4 language (Engl/ French/ German/Greek · 50.000 terms/ language) natural sciences dictionary + 9 bilιngual ones +- electronic versions. URL http://egnatra.ee.auth.gr(yhat/yιannis/ Keywords: Desktop publishing, multilingual lexicography. bilingual lexicography science termι­ nology, electronic dιctionaries Ο. ΑΝτι ΕΙΣΑΓΩΓΗΣ Η Ελληνική γλώσσα ομιλείται από 20.000.000 ανθρώπους σε όλη τη γη. Λόγω του μικρού αυτού αριθμού, η πολυγλωσσική τεκμηρίωση της ελληνικής επιστημονικής ορολογίας είναι ανεπαρκής, παρότι οι ανάγκες επικοινωνίας της επιστημονικής μας κοινότητας σε ένα ανοικτό διεθνές περιβάλλον αυξάνονται καθημερινά. Η πλατφόρμα LexiGraf αναπτύχθηκε για να καλύψει τις ανάγκες μηχανογράφησης κατά την εκπόνηση ενός έντυπου τετράγλωσσου λεξικού ορολογίας θετικών επιστημών (Αγγλ/Γαλλ!Γερμ/Ελλην. '50,000 όρων/γλwσσα) στο Γενικό Τμήμα Ξένων Γλωσσών του Α.Π.Θ. (κκ Στεπανιάν, Χαρσούλη, Ζάχου, Κωνσταντίνου τηλ. 031.997862 fax 031.998419), μίας σειράς έντυπων δίγλωσσων λεξικwν ορολογίας, όπως προκύπτουν από συνδυασμούς των παραπάνω γλωσσών ανά ζεύγη, καθwς και μiας συνοδευτικής έκδοσης CD-ROM του τετράγλωσσου λεξικού. Το LexiGraf αναπτύχθηκε ως εξειδικευμένο εργαλείο διαχείρισης πολυγλωσσικών βάσεων ορολογίας και aυτοματοποιημένου Desktop publishing. ώστε να πραγματοποιηθεί η μετάβαση από την πρωτογενή συλλογή ορολογίας προς την τυπογραφική πρέσα ή δευτερογενώς προς το πιεστήριο CD-ROM με το ελάχιστο δυνατό κόστος. Κατά την ανάmυξη λήφθηκε μέριμνα, ώστε το λογισμικό να είναι σε θέση να καλύψει μελλοντικές ανάγκες (πρόσθετες γλώσσες, νέες προδιαγραφές σελιδοποίησης, ανοικτή διασύνδεση με άλλα πακέτα λογισμικού , εισαγωγή πληροφορίας από διάφορες πηγές, αξιοποίηση τεχνολογίας δικτύων κοκ) 60
  • 3. Freπch lerπrπ.J. (3errrιan ιerιlnl35 (::! Ε·J·r,οrιγrι-ι~) ·3reek ιemπι.3.< (~ ~-~ΓιΟnJ•ΓΠ<·:ι ErtglιSh ΙerιΥΠ·"- dιscιplιπe ci.:J..OE.ι~ιcΞtιorι carrj Νο I ' ~'-_-_ι_d_~o_~7_hy_d_)_---=-----;--10_24_--1 :oukιnent <m-... toιr~n_lielc:------1 c/n1elle Stιoeπιung <f> 1. ΠΡΩΤΟΓΕΝΗΣ ΣΥΛΛΟΓΗ ΟΡΟΛΟΓΙΑΣ Το λεξιλογικό υλικό το οποίο κληθήκαμε να επεξεργαστούμε με το LexiGraf ήταν ήδη aποδελτιωμένο σε περίπου 50.000 χειρόγραφες καρτέλες. Παρακάτω διακρίνουμε μία τυπική καρτέλα aποδελτίωσης με αγγλικό λήμμα + συνώνυμα, γνωστικό αντικείμενο, αύξοντα αριθμό, γαλλική μετάφραση + συνώνυμα, γερμανική μετάφραση + συνώνυμα, ελληνική μετάφραση + συνώνυμα. Γραμματικοί προσδιορισμοί συμπεριλαμβάνονταν όπου κρίθηκε αναγκαίο. Η γλώσσα κλειδί ήταν η αγγλική. Σκοπός μας ήταν να αναπτύξουμε ένα περιβάλλον λογισμικού, στο οποίο αφού τροφοδοτηθούν οι διαθέσιμοι ορολογικοί πόροι (termιnological resources) σε PCs με δακτυλογράφηση (data-entry) ή οποιονδήποτε άλλο ενδεδειγμένο τρόπο, να είμαστε σε θέση με το πάτημα ενός κουμπιού να ολοκληρώνουμε αυτομάτως τη διαδοχή των εργασιών: ταξινόμηση/ επεξεργασία/ σελιδοποίηση/ desktoρ-ρυblishing, ώστε να λαμβάνουμε χωρίς πρόσθετη εργασία έτοιμα προς μαζική αναπαραγωγή πολύγλωσσα και δίγλωσσα έντυπα λεξικά. Με μία παρόμοια διαδικασία οδηγούμαστε σε εφαρμογές ηλεκτρονικών λεξικών. Τα γνωστικά αντικείμενα τα οποία περιλαμβάνονταν στην συγκεκριμένη συλλογή πολύγλωσσης ορολογίας ήταν τα ακόλουθα:
  • 4. acoustics adνanced mathematics aerospace engineering algebra - analytical chemistry analytical mathe-matics astronomy astrophysics t-- - atomic physics biochemistry calculus chemical engineering -- climatology ι-- communications computer science control systems crystallography electricity elec-tro-magnetism electronics engineering - fluid mechanics food engineering geochemistry geodesy geography geology ge-ometry geophysics -- hydrology inorganic chemistry mapping material technol-ogy mechanical mechanics 1 metallurgy meteorology -- ι-- engineerΙng - --~ mineralogy mining eng1-neering nuclear physics nucleonics - -- oceanology optics ordnance organic chemistry - - - - paleobotany particle physics petroleum engineering petrology - physical chemistry plasma physics quantum mechanics relativity --~---- -- - - set theory solid state physics spectros-copy statistical mechan ics statistics systems engi-neering thermodynamics vectoring 2. ΠΟΛΥΓΛΩΣΣΑ ΛΕΞΙΚΑ ΜΕ EYPETHPIA ΟΡΩΝ Η τεχνική του ευρετηρίου όρων αποτελεi την πλέον διαδεδομένη δομή σύνταξης έντυπων πολυγλωσσικών λεξικών ορολογiας. Εξαιρετικά δείγματα έχουν κυκλοφορήσει οι εταιρείες HatierTM, LongmanTM, ElseνierTM και LangenscheidtτM. Ανάλογα πολύγλωσσα λεξικά αποτελούνται από δύο διακριτά τμήματα/ τόμους. Στον πρώτο τόμο παρατίθενται οι μεταφράσεις των όρων σε όλες τις γλώσσες του λεξικού, ταξινομημένες ως προς την αντιστοιχία τους στη γλώσσα κλειδί. Κάθε όρος στην γλώσσα κλειδί 'διευθυνσιοδοτείται' μέσα στο πολύγλωσσο λεξικό με έναν ειδικό αλφάριθμο ή αύξοντα αριθμό. Ο δεύτερος τόμος του λεξικού περιέχει χωριστά ευρετήρια όρων για κάθε μία γλώσσα - πλην της γλώσσας κλειδιού - τα οποία παραπέμπουν στις καταχωρήσεις του πρώτου τόμου, χρησιμοποιώντας τον προαναφερθέντα αλφάριθμο. Η μεθοδολογία είναι εντελώς παρόμοια με την ύπαρξη ευρετηρίου όρων σε οποιοδήποτε βιβλίο, και μας επιτρέπει πρόσβαση από και προς οποιαδήποτε γλώσσα σε ένα συμπαγές τελικό έντυπο πρ6ίόν. Τα έντυπα πολύγλωσσα λεξικά ορολογiας, λόγω του τυπικά υψηλού τους κόστους απευθύνονται κυρίως σε επαγγελματiες μεταφραστές και βιβλιοθήκες. Στην περίπτωσή μας επιλέχθηκε από την πρώτη στιγμή να μορφοποιηθεί το διαθέσιμο λεξιλογικό υλικό και να κυκλοφορήσει στην αγορά ως έντυπο πολύγλωσσο λεξικό για τους ακόλουθους λόγους: 62
  • 5. Χρησιμοποιώντας τις δυνατότητες των σύγχρονων Η/Υ, προϋπολογίσθηκε ότι το λεξικογραφικό υλικό θο έφτανε στον καταναλωτή σε έντυπη μορφή με μία λιανική τιμή που δεν θα ξεπερνούσε κατά πολύ το κόστος φωτοαντιγραφής του. ΑΙprιaπιιrrιeπ.-::: / "'"χ ·· Multllingual dictionary - Volume I Α1 Μ Μ12 Z7U Freπcι-; ,retiJΓeη,;e .'"JdeX Volume 11 Ήταν αναμενόμενο ότι πολλοί από τους ενδιαφερόμενους λαθροαντιγραφείς, λόγω και του μεγάλου μεγέθους της έντυπης έκδοσης(' 1500 σελ.) δεν θα είχαν σοβαρό λόγο να προτιμήσουν την φωτοαντιγραφή από τη νόμιμη αγορά. Στην περίπτωση αρχικής κυκλοφορίας των λεξικών σε CD-ROM, το κόστος της πειρατικής αναπαραγωγής θα ήταν μόλις το 10·15% της λιανικής τιμής, οπότε θα υπήρχε ισχυρότατο πρόβλημα απώλειας εσόδων για τον εκδότη. Τα έντυπα λεξικά αρκετά συχνά προτιμώνται από βιβλιοθήκες, έναντι των CD-ROM λόγω του ότι δεν απαιτούν Η/Υ για τη χρήση τους. Άρα είναι προφανές ότι τα λεξικά σε CD-ROM και τα έντυπα πολύγλωσσα λεξικά, είναι δύο διαφορετικά προϊόντα, τα οποία έχουν τη δική τους ξεχωριατrj θέση στην αγορά μας. Γι αυτούς τους λόγους, οι χρήστες του LexιGraf επέλεξαν να προηγηθεί η κυκλοφορία του υλικού τους σε έντυπη μορφή και στη συνέχεια σε ηλεκτρονική. 63
  • 6. 3. ΔΙΓΛΩΣΣΑ ΛΕΞΙΚΑ Συνδυάζοντας ο Η/Υ τις διαθέσιμες γλώσσες ανά ζεύγη, μπορεί αυτομάτως να δημιουργήσει δίγλωσσα έντυπα λεξικά ορολογίας. Αν κατά την υλοποίηση ομαδοποιηθούν οι όροι σύμφωνα με τα γνωστικά αντικείμενα στα οποία ανήκουν, μπορούν να υλοποιηθούν έντυπα δίγλωσσα λεξικά συγκεκριμένων επιστημονικών κλάδων μέσα από μία ανομοιογενή συλλογή πολυγλωσσικής ορολογίας. (πχ ελληνο - γαλλικό λεξικό μαθηματικών, ελληνο -αγγλικό φυσικής κοκ). Αυτά τα είδη των λεξικών, λόγω της χαμηλής τους τιμής, της ευκολίας και της ταχύτητας υλοποίησης εμφανίζουν ιδιαίτερα θετικές δυνατότητες απορρόφησης από την αγορά μας. 4. ΗΛΕΚΤΡΟΝΙΚΕΣ ΕΚΔΟΣΕΙΣ Καθώς η αγορά των ηλεκτρονικών εκδόσεων ωριμάζει σταδιακά και στην Ελλάδα- με παρόλληλη εξέλιξη της τεχνολογίας προστασίας κατά της παράνομης αντιγραφής CD- ROM - δημιουργείται αυξανόμενο εμπορικό ενδιαφέρον για την κυκλοφορία CD-ROM πολύγλωσσων λεξικών ορολογίας, απευθυνόμενων στο γενικό επιστημονικό κοινό. Ανταποκρινόμενο στις εξελίξεις. το LexiGraf υποστηρίζει τη μεταφορά των πολύγλωσσων δεδομένων ορολογίας του σε οποιαδήποτε από τις μηχανές (software engιnes) δημιουργίας ηλεκτρονικών λεξικών που κυκλοφορούν στη διεθνή αγορά. Ταυτοχρόνως, τα ίδια αυτό λεξιλογικά δεδομένα μπορούν να αξιοποιηθούν για τον εμπλουτισμό γνωσιολογικών βάσεων δεδομένων σε εφαρμογές αυτόματης ή επιβοηθούμενης μετόφρασης (translation memory software). δημιουργώντας πρόσθετα έσοδα για τους ιδιοκτήτες των δεδομένων ορολογίας. 5. Η ΡΟΗ ΕΡΓΑΣΙΩΝ ΣτΟ LEXIGRAF Η ροή εργασιών στο LexiGraf χωρίζεται σε τρία διακριτά στάδια: • Είσοδος πολυγλωσσικής ορολογίας στο σύστημα • Επεξεργασία • Εξοδος επεξεργασμένης ορολογίας προς περιφερειακές συσκευές ή προς άλλα πακέτα λογισμικού. Η ορολογία εισέρχεται στο σύστημα με διάφορους τρόπους, ενδεχομένως χρησιμοποιώντας υφιστόμενες ηλεκτρονικές συλλογές πολύγλωσσης ορολογίας, ομάδες δακτυλογρόφων (data entry oρerators). ή με εισαγωγή πληροφορίας χρησιμοποιώντας μηχανισμούς οπτικής αναγνώρισης χαρακτήρων OCR από ήδη υπάρχοντα έντυπα λεξικά. Η τελευταία αυτή δυνατότητα εξαρτάται καθοριστικά από την ικανότητα του εκάστοτε χρησιμοποιούμενου πακέτου OCR να επεξεργαστεί την
  • 7. Αφού πραγματοποιηθεί η είσοδος λεξιλογικής πληροφορίας στο LexiGraf , από εκεί και πέρα στο σύστημα το ίδιο επεξεργάζεται, ταξινομεί και μορφοποιεί το υλικό προς πολύγλωσσο ή δίγλωσσα έντυπα λεξικά μέσα σε λίγα λεπτά. το αποτέλεσμα της επεξεργασίας είναι αρχεία Η/Υ, κωδικοποιημένα κατά Χtag ή RτF. τα οποία περιέχουν σελιδοποιημένο το υλικό μας, αναγνώσιμο από λογισμικό Desktop Pυblishing, και στη συνέχεια άμεσα διαθέσιμο για φωτοστοιχειοθεσία σε ειδικές μηχανές φωτοστοιχειοθεσίας Postscripl. (Xtag είναι τύπος αρχείων του πακέτου DTP Oυark­ Xρress", de-facto πρότυπο στο χώρο του DTP, RΠ Rich Text Format είναι παρόμοια κωδικοποίηση της MίcrosottίM που υποστηρίζεται από πολλά πακέτα λογισμικού, τόσο σε WindowsTM/PC όσο και σε Macintosh"'). Scannedtε::xt iφΠ Paperbased tι?LΠiimlo,Ύ collectiOf'_ manualdata m>.ry Νο 1223 Ι1inera:Water HineL·al~Ιasse:r F.aurπi11era.: (ι.:pto81 anguages) Uιsel"rlnter i ιι/ J ) I Net-workof PCs LeriGraf 1 'I'yfesetting fiJm oiictiona... ]' pages Χάρη σε αυτήν την προσέγγιση μπορούμε να προσθέσουμε οποιοδήποτε στοιχείο μέσα στο κείμενο των λεξικών μας (πχ εικόνες. σχεδιαγράμματα. τύπους οργανικής χημείας). να αλλciξουμε το στυλ σελιδοποίησης (layoυt) σε δευτερόλεπτα και να πραγματοποιήσουμε διορθώσεις ταχύτατα. Καθώς τα συστήματα MacintoshTM είναι το στάνταρντ στον εκδοτικό χώρο, τα δεδομένα μπορούν να μεταφερθούν από την πλατφόρμα PC προς την πλατφόρμα Mac με ευκολία χάρη στα πρότυπα Xtag/RτF. 6. ΕΡΓΑΛΕΙΑ ΑΝΑΠΤVΞΗΣ ΤΟΥ LEXIGRAF Η έκδοση 2.1 και 2.2 του LexiGraf αναπτύχθηκε με την Turbo Pascal for Windows + Paradox Engine 3.01 της BorlandTM (16bil) υπό τα MS-WINDOWS. Οι λειτουργίες διαχείρισης βάσεων δεδομένων παρέχονται από το Paradox με την τεχνική file-sharing. Το σύστημα μπορεί να υποστηρίξει ως 20 χρήστες σε τοπικό δίκτυο. Υπό ανάπτυξη 65
  • 8. βρίσκεται η έκδοση LexiGraf 3.0 (32bit) χρησιμοποιώντας την De/phi + Borland lnterBase. Είναι μία εφαρμογή client/serνer, η οποία υποστηρίζει UNICODE και έχει αυξημένες επιδόσεις σε σχέση με την 16bit έκδοση. Θα συνεργόζεται με SGML import fιlters, και θα προσφέρει μία αυτοματοποιημένη 'μηχανή' δημιουργίας τόσο έντυπων, όσο και ηλεκτρονικών λεξικών. 7. ΛΕΙΤΟΥΡΓΙΚΗ ΠΡΟΣΕΓΓΙΣΗ ΣτΟ LEXIGRAF Το LexiGraf υποστηρίζει τρία βασικά επίπεδα πρόσβασης στο δίκτυο: 1. Data entry operator access-leνel 2. Lexicography administrator access-leνel 3. Support proνision access-leνel. Κατά την εξέλιξη του συγκεκριμένου project κατέστη προφανές ότι ήταν εξαιρετικά δαπανηρό και δύσκολο να προσληφθούν δακτυλογρόφοι (data-entry opera- tors), οι οποίοι θα ήταν σε θέση να χειριστούν όλες τις γλώσσες που υποστήριζε το LeχiGraf ταυτοχρόνως. Ας μην ξεχνάμε ότι η πηγαία μας πληροφορία βρισκόταν aποδελτιωμένη σε χειρόγραφες καρτέλες, άρα έπρεπε να βασιστούμε στην ανθρώπινη εργασία για να τροφοδοτήσουμε το σύστημα με ορολογία. Γι' αυτό το λόγο το LeχiGraf χωρίστηκε σε τρία διακριτά τμήματα (modυ/es). DATA ΕΝΤRγ MODULE: Αυτόνομο κομμότι του LeχiGraf, το οποίο χειρίζονται οι δακτυλογράφοι-χειριστές (data-entry operators) του συστήματος. Μπορεί να λειτουργήσει αυτόνομα σε κάποιο απομακρυσμένο service bureau, off-line ή on-line σε τοπικό δίκτυο. Επιτρέπει στους δακτυλογράφους (data-entry operators) να δουλεύουν χωριστό την κάθε μία γλώσσα, ανεξόρτητα από τη συνολική εξέλιξη της δουλειάς των συναδέλφων τους. Αν δουλεύουμε το σύστημα off-lιne, τα λεξικογραφικά δεδομένα ενσωματώνονται με μεταφορές φακέλων/αρχείων σε κάποιο κεντρικό PC (remote leχi­ cography serνer) σε τακτό χρονικά διαστήματα. Η προσέγγιση βοηθάει στη μείωση του κόστους εισαγωγής πληροφορίας στο σύστημα, διότι ο φόρτος εργασίας μπορεί να καταμεριστεί ισομερώς σε πολλούς operators, οι οποίοι μπορούν να δουλεύουν μία μόνο γλwσσα, σε διαφορετικούς χώρους και ώρες, χωρίς αυτό να δημιουργεί οποιοδήποτε πρόβλημα στην εξέλιξη του project. ΠRMINOLQGγ IMPORT/EXPORT: Αυτόνομο κομμότι του LeχiGraf, το οποίο αναλαμβόνει τη μεταφορό πληροφορίας από και προς τον 'έξω' κόσμο (πχ. είσοδος από ηλεκτρονικές λίστες ορολογίας, διασύνδεση με λογισμικό OCR, αντίγραφα ασφαλείας (back-υp) των δεδομένων, εξαγωγή δεδομένων προς γεννήτριες εφαρμογές ηλεκτρονικών λεξικwν κοκ) 66
  • 9. r_~f)ι,&,[I{_.~~Σ MIPTI&!b11f;' , - - l' --- - -- Γ Ι' Nlti· !Κt:~γας 1 ,~;:ι, ~~_;,W(ι)',σιiν '_:ΛΖ.<_Φ::5:[i)nΗrμςς I ι_ _ _ ιl _ _ __ jj _ _ ι - ι - I itli" _ _ 1 ' ~~~ c:1J;;~~ύiJ~~- I A'{'{~LOCC ;,~~fl,"if,'::!: --:Ξ:ό-οcο~-c~όρος i 1 - ---- - - 1 "'<'Eli-~c [r_"''"~~Ο>'Π~ l I ftλ'!'(:ρι€~ος I ~ "' tf~"l"'"ί~~ _[i{oJ:JUKHJ ηι;;ω:.ιι~·.JΙi)U ' ~~-~,;-J..JJ~-"'_ - -1 3iηocn..αcrι:r: [πe_~~zdrις_ Γ~~-"-.Jι~--~Σ ;..ι_-~Ίι~tt_;.l~~ f..fLilMIML~-~"fiN _--:1_ I _'!ο -- I ~η::JC'!JI'i-!'(J;'J'ίlμ~:__; ' _ -~-~a:~~~Δ!~,JΊj~ I /::,όΧΙιμl{)χ: 6_~φ;1ς 1Γc;,i.)Jrκό· .,.,,_65;«..~ iι:ih.)OJ[βc'lJηα.·~.; I IΓVWG'lH(I, J:"t":K i --;:~,r_;;;,s,;._~ --- I I~'""-"'" ''"' 1-Δ~OCCiuώ~;._~c: -- :5n%.1ι:Είο:~ζ I_ Π{;)~cβ:~::irης Jlitr.:,"'-IK3',): ΙΠ'>..,.f'-,.f~IY'"'~N ΛihιΜ.v:,""-η:.ι~:ι _j - ,,,, -1 I - -- - 1-~Ω· ~~>i'J:~;ΡμΞ: I ~-[~~j~>:r:.λf:i~if-!'0: 1 jΔ:ι,;ι;"";t"''~---- - 1 ' '""::;<(llqe :ι"'"· I AΞ.(J·:5:ρi3'dlo:.!.; I τ:::ιιο:._~.;;β~Ίι.::τφ; ___ 'Γιι-ΝΛΙV.-~Σ ~,r:"ML"'- YI[N.~lh /~.'-ιi/!MJ:~' ·;)~~ ;?~J.::ι;~-:,1/1; '_I' I li '1 ,/<>_:[i Q [χΙ-_./},(! -(~ΛIΓ· <I ζ][<} I ,--)· Ίl ,-~]{>,,11 ,~_Ι:~ ι1c :<ά!ρας ljlo~~~,;~ I ·&...;·~ν. Μ~~μα 1---:---i ι Μ'~"' ιρος ~ ,~...:J;:yu'Ol{. Π.Ειtf.':;:, I ,,,ΙJ<'βήηοης J Γ ~·'Ι~ΊΓΟΧ·δ-~~:;ι:. I I .~όιJcSμος I Ι .~~~rκτη; .-{j~g!)Ι.D-- / O"QJ1,iω,..,-jrμιol" ΓbJ~!Quώμαιί;- -~, I δiΧ'J:jO!Ι~J~]-1:; ·.ΙΓ[J)ΟΟ;&:;,:ο:τ[ς lίHiL'rιζfi,1: E.:v,~~-:rr-ι~:<.oιr; Λ:-{'JίΜ~ζ-~~k'Ν LEXICOGRAPHY DTP MODULE: Κομμάτι του LexiGraf, το οποίο ολοκληρώνει την επεξεργασία DΤΡ/σελιδοποίησης των πολύγλωσσων και δίγλωσσων λεξικών μας. Παράγει αυτομάτως λεξικογραφικά αρχεία σελιδοποίησης, κωδικοποιημένα κατά XTAG/RτF, τα οποία μπορούν να διαβαστούν από επαγγελματικά επιτραπέζια εκδοτικά συστήματα (desktop pυblishing software). Από εκεί δημιουργούνται τα φιλμ φωτοστοιχειοθεσίας, τα οποία χρησιμοποιούνται για την τυπογραφική αναπαραγωγή των λεξικών μας. Μέσα στα λήμματα μας μπορούμε να συμπεριλάβουμε γραμματικούς προσδιορισμούς, χημικούς τύπους ή παρενθετικούς προσδιορισμούς. Όλη αυτή η πρόσθετη πληροφορία αναγνωρίζεται από το LeχιGraf αυτομάτως και δεν επηρεάζει την ορθή ταξινόμηση των λημμάτων σε όλες τις γλώσσες. Επιπλέον, στη φάση του aυτοματοποιημένου DTP, το LexiGraf αυτομάτως αλλάζει τη μορφή (tyρefacing/ style) των συγκεκριμένων προσδιορισμών, σύμφωνα με τις απαιτήσεις του τμήματος DTP της εκδοτικής εταιρείας που αναλαμβάνει να κυκλοφορήσει τα λεξικά που προκύπτουν (παραμετροποίηση του DTP). Για την ταξινόμηση των λημμάτων, λόγω του μεταβλητού αριθμού γλωσσών που καλείται να χειριστεί το LexiGraf, δε χρησιμοποιήσαμε τις ρουτίνες ταξινόμησης του λειτουργικού συστήματος MS WindowsTM. Κάθε γλώσσα που υποστηρίζεται διαθέτει ένα εσωτερικό module κανόνων αλφαβήτισης/ ταξινόμησης, 67
  • 10. Εξετάζοντας το πηγαίο λεξικογραφικό υλικό που κληθήκαμε να επεξεργαστούμε, έγινε αμέσως προφανές ότι υπήρχαν μεμονωμένοι όροι σε κάποιες από τις γλώσσες, οι οποίοι θα μπορούσαν να χαρακτηριστούν ως αδόκιμοι-επεξηγηματικοί (κυρίως στην ελληνική γλώσσα). Ανάλογη πληροφορία έχει θέση σε ένα πολύγλωσσο λεξικό ορολογίας ως ερμηνεία, αλλά όχι σε ένα πχ. ελληνο-αγγλικό λεξικό (οι αδόκιμοι όροι δεν ευρετηριάζονται). Γι' αυτό το λόγο λήφθηκε ειδική μέριμνα ώστε οι αδόκιμοι ή οι επεξηγηματικοί όροι να υπόκεινται σε κατάλληλους χειρισμούς αυτομάτως από το LexiGraf. Παράλληλα, στην περίπτωση που θα διαπιστώσει κάποιο κενό στην απόδοση μίας ερμηνείας σε μία γλώσσα, το λογισμικό μας αυτομάτως αποκρύπτει τη συγκεκριμένη πολύγλωσση ορολογική οντότητα από ένα πολύγλωσσο λεξικό (δε δικαιολογείται η ύπαρξη κενών αποδόσεων σε ένα πολύγλωσσο λεξικό). Η ίδια αυτή πληροφορία θα αξιοποιηθεί κατά τη σύνταξη ενός δίγλωσσου λεξικού, εφόσον το ζεύγος των εμπλεκόμενων γλωσσών είναι συμπληρωμένο, έστω αν οι υπόλοιπες γλώσσες είναι κενές. Ταυτοχρόνως, το LexiGraf μας προειδοποιεί για την ύπαρξη διπλοκαταχωρήσεων στην ορολογία μας, λαμβάνοντας υπόψιν και το γνωστικό αντικείμενο των όρων. 8. ΔΙΑΔΙΚΑΣΙΑ ΔΗΜ/ΟΥΡΓ/ΑΣ ΕΝΤΥΠΩΝ ΛΕΞΙΚΩΝ Η δημιουργία έντυπων λεξικών στο LexiGraf εμπεριέχει τα ακόλουθα στάδια: • Εισαγωγή πολύγλωσσης ορολογίας στο σύστημα. • Επεξεργασία και ταξινόμηση του υλικού από τους Η/Υ. • Αποθήκευση των λεξικών (πολύγλωσσων και δίγλωσσων) στο σκληρό δίσκο του Η/Υ με μορφή proprietary μακροεντολών (L-Tags) • Μετάφραση των L-Tags προς XTAGS/RΠ και τροφοδοσία του υλικού σε επαγγελματικά συστήματα DTP (με πλήρη παραμετροποίηση). • Εκτύπωση των λεξικών μας σε high-end typesetters. Αφού τροφοδοτηθούν οι βάσεις δεδομένων του LexiGraf με πολυγλωσσική ορολογία, το λογισμικό μας σαρώνει τα περιεχόμενα της γλώσσας κλειδιού για να δημιουργήσει και να καταγράψει τους αλφαρίθμους/ αύξοντες αριθμούς που θα χρησιμοποιηθούν για τη σύνταξη των λεξικών-ευρετηρίων, τα οποία συμπληρώνουν το πολύγλωσσο. Αφού ολοκληρωθεί αυτή η εργασία, ο διαχειριστής λεξικογράφησης (dictionary administrator) μπορεί να επιλέξει αν θα δημιουργήσει κάποιο πολύγλωσσο ή δίγλωσσο λεξικό με βάση τη διατιθέμενη συλλογή ορολογίας. Το αποτέλεσμα της διεργασίας αυτής καταγράφεται στο σκληρό δίσκο του Η/Υ κωδικοποιημένο κατά L-tags. Η πληροφορία αυτή μπορεί να δρομολογηθεί σε κάποιον εκτυπωτή, ώστε να έχουμε σε πολύ σύντομο χρόνο ένα δοκίμιο του υλικού μας, πάνω στο οποίο μπορούμε να εντοπίοουμε τυχόν σφάλματα. Η διόρθωση/ αποκατάσταση των σφαλμάτων μπορεί να γίνει με εύκολο τρόπο από τους χειριστές του συστήματος. 68 •
  • 11. Αν επιθυμούμε να έχουμε την τελική ποιότητα στην οποία θα φτάσει το υλικό στον εκδότη μας, το μόνο που έχουμε να κάνουμε είναι να περάσουμε τα κωδικοποιημένα κατά L-Tags λεξικά μας μέσα από το ειδικό φίλτρο Χtag/RΠ του LexiGraf, ώστε να λάβουμε φακέλους αναγνώσιμους από επαγγελματικό λογισμικό DTP. Αν επιλέξουμε να οδηγηθούμε προς εφαρμογή λεξικού σε CD-ROM. θα χρησιμοποιήσουμε τα εργαλεία IMPORT/EΧPORT του LexiGraf για να οδηγήσουμε τα δεδομένα μας σε κάποια από τις γεννήτριες εφαρμογές ηλεκτρονικών λεξικών που κυκλοφορούν στην αγορά. Στην περίπτωση υλοποίησης δίγλωσσου λεξικού, θα επιλέξουμε το ζεύγος των γλωσσών που θέλουμε και στη συνέχεια θα κληθούμε να συμπληρώσουμε μία παραμετρική λίστα γνωστικών αντικειμένων, με βάση την οποία θα συνταχθεί το συγκεκριμένο λεξικό (λεξικό κλάδων). Η εξέλιξη της διαδικασίας ακολουθεί παρόμοια πορεία με αυτήν που περιγράψαμε. 9. ΧΡΗΣτΙΚΟΤΗΤΑ ΤΟΥ LEXIGRAF • Μείωση του χρόνου μετάβασης από την πρωτογενή συλλογή ορολογίας προς το τελικό έντυπο ή ηλεκτρονικό προ"ίόν. • Ευελιξία στην υλοποίηση πολλών διαφορετικών προϊόντων που σχετίζονται με το χώρο της ορολογίας, ανάλογα με τις ανάγκες της αγοράς την κάθε δεδομένη στιγμή. • Απαλοιφή των εξόδων DTP και αυτοματοποίηση της λεξικογραφικής επεξεργασίας. • Μείωση του χρόνου και του κόστους υλοποίησης ενημερωμένων λεξικογραφικών εκδόσεων. • Μπορεί να χρησιμοποιηθεί για λεξικογραφικά project που εξελίσσονται παραλλήλως. • Δεν απαιτεί εξειδίκευση στη χρήση του. Γιάννης Χρ. Χατζόπουλος Διπλ. Ηλεκτρολόγος Μηχανικός Υψηλάντοu 3 Σίνδος 574 00 τηλ. 031-797.532 / fax 031-798.432, κιν. 0977-517.317, Email yhat@egnatfa.ee.auth.gr 69