Soumettre la recherche
Mettre en ligne
Research studies 1
•
Télécharger en tant que DOC, PDF
•
0 j'aime
•
146 vues
D
Diaa Toma
Suivre
Signaler
Partager
Signaler
Partager
1 sur 7
Télécharger maintenant
Recommandé
Technical 1
Technical 1
Diaa Toma
Financial 3 AR into EN
Financial 3 AR into EN
Diaa Toma
Medical 3
Medical 3
Diaa Toma
Contract 1
Contract 1
Diaa Toma
News 1
News 1
Diaa Toma
Literary 1 EN into AR
Literary 1 EN into AR
Diaa Toma
Drug instruction 1
Drug instruction 1
Diaa Toma
Chinese B Cer.
Chinese B Cer.
Diaa Toma
Recommandé
Technical 1
Technical 1
Diaa Toma
Financial 3 AR into EN
Financial 3 AR into EN
Diaa Toma
Medical 3
Medical 3
Diaa Toma
Contract 1
Contract 1
Diaa Toma
News 1
News 1
Diaa Toma
Literary 1 EN into AR
Literary 1 EN into AR
Diaa Toma
Drug instruction 1
Drug instruction 1
Diaa Toma
Chinese B Cer.
Chinese B Cer.
Diaa Toma
Chinese A Cert.
Chinese A Cert.
Diaa Toma
Bachelor of Arts
Bachelor of Arts
Diaa Toma
Prescription 1
Prescription 1
Diaa Toma
Medical 2
Medical 2
Diaa Toma
Hospitality 1
Hospitality 1
Diaa Toma
Medical AR into EN 2
Medical AR into EN 2
Diaa Toma
Legal 1
Legal 1
Diaa Toma
News 2
News 2
Diaa Toma
News 3
News 3
Diaa Toma
Story 4 of 4_DN_0916 (Diaa)
Story 4 of 4_DN_0916 (Diaa)
Diaa Toma
Article 2
Article 2
Diaa Toma
Medical 1
Medical 1
Diaa Toma
Contenu connexe
Plus de Diaa Toma
Chinese A Cert.
Chinese A Cert.
Diaa Toma
Bachelor of Arts
Bachelor of Arts
Diaa Toma
Prescription 1
Prescription 1
Diaa Toma
Medical 2
Medical 2
Diaa Toma
Hospitality 1
Hospitality 1
Diaa Toma
Medical AR into EN 2
Medical AR into EN 2
Diaa Toma
Legal 1
Legal 1
Diaa Toma
News 2
News 2
Diaa Toma
News 3
News 3
Diaa Toma
Story 4 of 4_DN_0916 (Diaa)
Story 4 of 4_DN_0916 (Diaa)
Diaa Toma
Article 2
Article 2
Diaa Toma
Medical 1
Medical 1
Diaa Toma
Plus de Diaa Toma
(12)
Chinese A Cert.
Chinese A Cert.
Bachelor of Arts
Bachelor of Arts
Prescription 1
Prescription 1
Medical 2
Medical 2
Hospitality 1
Hospitality 1
Medical AR into EN 2
Medical AR into EN 2
Legal 1
Legal 1
News 2
News 2
News 3
News 3
Story 4 of 4_DN_0916 (Diaa)
Story 4 of 4_DN_0916 (Diaa)
Article 2
Article 2
Medical 1
Medical 1
Research studies 1
1.
الجدولرقم1:فصلالكلماتفيالنصالنجليزي استدعاء=100x a/ (a+
c(ودقةمحددةكدقة=100X a/ (a+ b.( سيحتويالنموذجالمثاليعلىاستدعاءودقة100.% يكونالمقياسالكثرشيوعامتوفراعندتقييمنماذجتصحيح،النصوعندإمكانية مقارنةالنصمعالجُ البشكلمباشرمعالنصالصلي.( )ويمكن الصحيحتحديد الفرقبينهذينالنصينمنخللتعديلالمسافةبينهم)كورمينإت.، أل1990.( وقدتمتعريفمسافةالتعديلبين،ركيزتينالمعاملxوالمعاملy،بأنهاتسلسل التحولالدنىالذييحولالمعاملxإلىالمعاملy.ونحننعرفالدقةبأنها 100–100x e/m،حيثeهيمساحةالتعديلبينالنصمصححُ الوالنص ،الصليوMهيعددالرموزالموجودةفيالنص.عمليات الصليالتحويل:هي حذف،رمزإدخالرمز،جديدوتغييررمزإلى.ولقد آخرافترضناتكاليفمتساوية لكل.على تحويلسبيل،المثالمساحةتعديلبين)Eloplicinsons and Hokinsons(هي4.وتسلسلالعملياتالتيتؤديهذاالتحويل:حذف هوE، وتغييرIإلىH،حذفI،وتغييرcإلىk.
2.
1.5تجزئة( )الكلمة فصل لدىاللغةالنجليزيةعلمهجائيأبجديوتباعدبين،الكلماتعلىعكساللغات الخرىمثلاليابانيةأو،الصينيةلذافإنهالغةسهلةنسبيالتعتمد"
"كوحدة الكلمة أساسيةباستخداممسافةفارغةوعلماتتنقيطمتنوعة.كمحددات إنتجزئة( )الكلمة فصلهيعمليةهامةومطلوبةللتطبيقاتالتيتبدأبتمثيل ،هجائيمثلالتعرفعلى،الكلمأوعمليةالكتابةالصوتيةالليةلشفرة.مورس ولقدقدمبونتووكروفت)1996(طريقة)USeg(منأجلتوقعمواقعالمسافة وفحصواأداءهاباستخداممستخرجحجم500كيلوبايتمنصحيفةوال.ستريت Usegهونموذجيعتمدعلىالكلمةتمتدريبهعلىنصحجم1جيجا،بايتوقدم استدعاءبنسبة93.54%ودقةبنسبة90.03.% وتقدماستخدامطريقةرموزPPMالمعتمدةعلىالرموزفينفسالحضار ( )كل كوربوسمنمعدلتالستدعاءوالدقةبنسبة99.51%،معدقةمساحة تعديلبنسبة99.04.%ولميستخدمهذاالتحسينلنتائجبونتوكروفتإلجزء صغيرفقطمننصوص.تدريبهم يظهرالجدولرقم1مثالمستخدممنقبلبونتوكروفتمعإضافةالتوقعات المقدمةالتيقدمهاPPM.
3.
جدولرقم2:تصحيحPPMلنصOCR إنالتحسنالذييقدمهنموذجPPMواضحفيهذاالمثال.وعلى البسيطالرغم منأنالكلمةMicroniteلتحدثفيThe brown
Corups،فإنهتم/فصل تجزئة الكلمةبشكلصحيحباستخدامPPM.وعلىنحو،مماثلتمتجزئةالكلمةinits إلىكلمتيinوits.وفيهذا،المثالفإنPPMقدتلفي.لم خطآنتكن المسافةفيLoews CorpمتوقعةلنLoews Corpتطلبت54.3لترميزالنص بينماتتطلبالنصالصلي55.0.وبشكل بت،مماثلأضيفتُمساحةإضافيةفي crocidoliteلنالمسافةقللتعددالبتاتليتمتشفيرهامن57.7لـ55.3.بت 2.5تصحيحنصOCR منخلل،المقارنةفإننتاجالتصحيحالناتجعننظامOCRهومشكلةأكثر .وفي صعوبةهذا،القسمنقدمنموذجPPMلنتاجنظامتعريفالرموزالتجارية OmniPage 7.0،فيمحاولةلتصحيحأخطاء.من بسيطةالناحية،المثاليةفإنهقد يضمنُالنموذجPPMفينظامOCR،لكييتمتمكينالوصولللتوزيعالحتمالي الكاملمنخللالرموز.ولكن المختلفةمع،السفلمتكنتلكالمعلومة متوفرةفيأثناءتحليلناالنتاجفيمرحلةمابعد.المعالجة كانتالصورالمطلوبةلتلكالتجربةمحولةللصيغةالرقميةفي150نقطةمن البوصةمنالنسخةالصليةلقصةـجيفرسونالفيرجينيالمطبوعةسنة1948 )المجلدالوللجيفرسونمالون.(ولقد وزمانهاستخدمت،الصفحاتبشكل ،فوريلتدريبنماذجالخلطالمأخوذةمنالفصول)حتىالصفحة89(قبلالفصل الخيرفيجيفيرسون.واحتوت الفرجينيتلكالصفحاتعلى32.000كلمة)185
4.
.(واستخدم كيلوبايتنظامنموذجPPMD 5المستخدمفينصبراونكوربوس لتدريبنموذجاللغة.النجليزية نحننعرفالخلطعلىأنهالتحويلالمطلوبلتصحيحتسلسلعددصغيرللرموز في.نحن
النصنستخدمطريقة)المرصود( >--للشارة المصححإلىتحول الرتباكمنالنصالمرصودإلىالنص:على مصححُ السبيل،المثالIc---< K يرمزإلىأنالرسمالبيانيIcمصححللحرفk.ومنأجلحدالبحثالمطلوب منخللخوارزمية،فيتربيتمتجاهلالخلطالذييحدثمرةواحد،فقطأو يحتوىعلى.مساحة تظهرأمثلةالخطاءالموجودةفيالصفحاتالثلثالولللثلثةفصولالولفي الجدولرقم2) .بالترتيبالواردفي.(وتظهر النصمستخرجاتمنجزءمنتلك الصورالمرتبطةبالمثلةفيالعمود.بعض الولالصورالمنحرفةبشكل،طفيف هيتأثيرجانبيمنكيفيةوضعالصفحاتفيالماسح.الضوئي يدرجالجدولرقم3مثالعنالخلطالذيتمتعلمهمنبياناتتدريب.كما الخلط يظهرتكراركلمنالتحولتالصحيحةوغير.على الصحيحةسبيل،المثالتم استبدالالحرفElالتيتكررستمراتفيبياناتالتدريب؛بشكلغيرصحيح مرتينإلىالحرفالواحدH،وتمتعريفهبشكلصحيحأربع.يرتبط مراتهذا الخلطبتصحيحاتالمثلةالموضحةفيالجدولرقم2. وتأتيكافةتصحيحاتالكلمات)مثلكلمةAmericamإلىكلمةAmerican، وكلمةFotty-oneإلىكلمةForty-one،وكلمةchatإلىthat،وكلمة AmmapolisإلىAnnapolisوكذلككلمةhutإلىكلمة)butفيكافةالمقاطع منخلطحرفواحد)مثلmإلىn، tإلىr(،فيحينتكونتصحيحاتكلمة sealهيseat،)بمايشملالفاصلة(، الضافيةوكلمةEloplcinsonsهي Hopkinsons،وكلمةfumreهيكلمةfuture،وحرفmهوin.كانتصحيح حرفv"فيconcetntd) "الخط3فيالرسم" (و البيانيelecclon) "الخط4(، نجاحاجزئيالنالخلطالمطلوبلتصحيحتلكالخطاء)،مثالtإلىe، lإلىi(لم يتمرؤيتهمرتينعلىالقلفيبياناتالتدريب)وبالتاليلتحدثفيالجدول3.( يظهرالشكل1كيفأنعددالخلطيزيدكلمازادعددصفح.ويظهر التدريب الشكل2كيفتختلفمسافةالتعديلالتيتحدثبينالنتاجمصححُ اللـPPM والنصالصحيحالصليمععددصفح.التدريب بعد90،صفحةقلتمسافةالتعديلبالنسبةللنص... " "الصحيح
5.
عدد الخلط عددصفحاتالتدريب من1756إلى1468،زيادةفيالدقةمن96.28%إلى96.89.% يظهرُالشكل3نقصمساحةالتعديلالحادثةبينالنصالصحيحمصححُ وال بالترتيبفيالنموذج4و5ونصالتدريبمختلف.يتم الحجمرسمالمحورx باستخداممقياس.يظهرُ
و لوغاريتميالرسمالبيانيأننموذجالنظام5يحققُ تصحيحخطأأفضلبشكلقليلمننموذجالنظام4.وتبلغنسبةالتحسنحوالي 4%بعدتدريبعلى5.6ميجا.بايت 6الملخصوالستنتاج لقدقدمناطريقةتصحيحالخطاءفيالنصالنجليزياعتماداعلىنموذجPPM. ولقدتمتطبيقهذهالطريقةعلى-فصل مشكلتينحروففيالنص،النجليزي وتحسينالنتاجمننظامOCR.وكانت التجاريدقةفاصلالحروفPPM 99.04%معاستدعاءودقةبـ99.52.%بشكل،جوهريتطلباستخدامالرمز القائمعلىالنموذجنصوصتدريبأقلمنالطرقالخرى؛علىسبيل،المثالتم العثورعلىالـ5.6ميجابايتبراونكروبسللداءبشكلأفضلمنالنموذج السابقالذيتمنشرهوالمدربعلى1ميجابايت.للنص منخللتطبيقنموذجPPMإلىتصحيحالنطقOCR،ولقدتمكنامنتحسين دقةمساحةالتعديلمن96.3%إلى96.9%والتيقللتمننسبة14أً خطفي كل.صفحة
6.
تشيرالخبرةالسابقةمعالنماذجالمستخدمةلمقارنةالنصأنتلكالنتائجيمكن تحسينهابشكلجوهريمنخللاستخدامنصوصتدريب.وبالنسبة أكثرلـ OCR،سيكونمنالمهمبشكلكبيرجدازيادةحجمبياناتتدريب.ولقد الخلط تم،النتهاءوبشكل،رئيسيمناستبعادالخلطالذيحدثلمرةأويحتويعلى مسافاتمنأجلتقليلالمساحةوالوقتالمستهلكلخوارزمية.نحن
فيرتبينعمل علىتحسينكفاءةتطبيقتناونفترضأناستخدامبياناتخلطأكثرسيعملعلى زيادةتحسين.دقتها
7.
دقة مسافةالتعديل عددصفحاتالتدريب شكل2:كيفأنالتدريبعلىالخطاءالناتجةعننتاجOmnipagesيؤثرعلى النتاجPPM.المصحح دقة مسافةالتعديل حجمنصالتدريب( )بالبايت شكل3:كيفتختلفدقةمسافةالتعديللنماذجتنظيممختلفةونصوصتدريب مختلفة.الحجم
Télécharger maintenant