SlideShare une entreprise Scribd logo
1  sur  27
ПРИМЕНЕНИЕ МОДЕЛЕЙ ГЛАГОЛЬНОГО УПРАВЛЕНИЯ И ВЕРОЯТНОСТНЫХ ПРАВИЛ ПРИ МОРФОЛОГИЧЕСКОЙ РАЗМЕТКЕ РУССКОЯЗЫЧНЫХ ТЕКСТОВ Литвинов М.И. Московский институт электроники и математики, каф. ИТАС
Этапы автоматической обработки текста ,[object Object],[object Object],[object Object],[object Object],[object Object]
Виды морфологической разметки ,[object Object],[object Object],[object Object]
Уровни представления текста ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Виды систем предсинтаксической обработки текста ,[object Object],Детерминированные Гибридные
Детерминированные системы (основанные на правилах) ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Вероятностные системы ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Вероятностные классификаторы при морфологической разметке текста  ,[object Object],[object Object],[object Object],[object Object]
Способы сокращения вычислений при разметке текста ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Выбор вероятностной модели на основе принципа максимальной энтропии ,[object Object],[object Object],[object Object]
Пример сглаживания вероятностей ,[object Object],[object Object]
Сглаженные вероятностные  N- граммные модели ,[object Object],[object Object],[object Object],[object Object]
Другие виды вероятностных моделей ,[object Object],[object Object],[object Object],[object Object]
Обзор прикладных систем морфологической разметки  ,[object Object],[object Object],[object Object]
Этапы снятия омонимии в программе «Кросслятор» ,[object Object],[object Object],[object Object]
Гипотезы, положенные в основу метода наполнения лексической базы сочетаемости слов ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Состав лексической базы сочетаемости слов Параметры Число сочетаний млн. Гл. + сущ. 20.00 Гл. + нар. 1.05 Деепр. + сущ. 2.37 Деепр. + нар. 0.16 Прич. + сущ. 5.43 Прич. + нар. 0.28 Сущ. + прил. 4.88 Сущ.+сущ. 2.26
Пример предложения, для которого требуется провести морфологическую разметку ,[object Object],[object Object]
Биграммная модель при проверке на сочетаемость слов в базе ,[object Object],[object Object]
Проверка на сочетаемость слов ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Вероятностные правила ,[object Object],[object Object],[object Object],[object Object]
Пример работы вероятностных правил ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Разбиение предложений на фрагменты и итерационное применение правил ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Пример разбиения предложения на фрагменты ,[object Object],[object Object],[object Object],[object Object]
Методы оценки тэггеров ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Качество работы модуля морфологической разметки Параметры Покрытие Качество Триграммы 71.50 98.21 База 71.98 96.74 Правила 77.73 95.94 Триграммы + База 72.02 96.74 Триграммы + Правила 77.73 95.94 Триграммы + База + Правила 78.03 95.60 Триграммы + Правила + Оптимизация 81.15 94.65 База + Правила 78.03 95.60 Правила + Оптимизация 81.15 94.65 База + Правила + Оптимизация 81.27 94.66 Триграммы + База + Правила + Оптимизация 81.27 94.66
Заключение ,[object Object],[object Object],[object Object],[object Object],[object Object]

Contenu connexe

Tendances

лекция 5 тема 1
лекция 5 тема 1лекция 5 тема 1
лекция 5 тема 1Noobie312
 
Introduction To Machine Translation 1
Introduction To Machine Translation 1Introduction To Machine Translation 1
Introduction To Machine Translation 1Dmitry Kan
 
лекция 7 тема 1
лекция 7 тема 1лекция 7 тема 1
лекция 7 тема 1Noobie312
 
занятие 3 муромцев
занятие 3 муромцевзанятие 3 муромцев
занятие 3 муромцевdimour
 
Speech technologies
Speech technologiesSpeech technologies
Speech technologiesNLPseminar
 
08 машинный перевод
08 машинный перевод08 машинный перевод
08 машинный переводLidia Pivovarova
 
Анализ текста на основе лексико-синтаксичеких шаблонов c сокращением многов...
Анализ  текста на основе лексико-синтаксичеких  шаблонов c сокращением многов...Анализ  текста на основе лексико-синтаксичеких  шаблонов c сокращением многов...
Анализ текста на основе лексико-синтаксичеких шаблонов c сокращением многов...Alexey Noskov
 
Ontologies for Information Extraction
Ontologies for Information ExtractionOntologies for Information Extraction
Ontologies for Information ExtractionLidia Pivovarova
 

Tendances (18)

лекция 5 тема 1
лекция 5 тема 1лекция 5 тема 1
лекция 5 тема 1
 
Introduction To Machine Translation 1
Introduction To Machine Translation 1Introduction To Machine Translation 1
Introduction To Machine Translation 1
 
лекция 7 тема 1
лекция 7 тема 1лекция 7 тема 1
лекция 7 тема 1
 
занятие 3 муромцев
занятие 3 муромцевзанятие 3 муромцев
занятие 3 муромцев
 
Speech technologies
Speech technologiesSpeech technologies
Speech technologies
 
L24
L24L24
L24
 
L26
L26L26
L26
 
08 машинный перевод
08 машинный перевод08 машинный перевод
08 машинный перевод
 
Метрики семантической близости с приложениями к задачам АОТ
Метрики семантической близости с приложениями к задачам АОТМетрики семантической близости с приложениями к задачам АОТ
Метрики семантической близости с приложениями к задачам АОТ
 
Анализ текста на основе лексико-синтаксичеких шаблонов c сокращением многов...
Анализ  текста на основе лексико-синтаксичеких  шаблонов c сокращением многов...Анализ  текста на основе лексико-синтаксичеких  шаблонов c сокращением многов...
Анализ текста на основе лексико-синтаксичеких шаблонов c сокращением многов...
 
Смирнова. Методы исправления ошибок в текстах, написанных иностранцами.
Смирнова. Методы исправления ошибок в текстах, написанных иностранцами.Смирнова. Методы исправления ошибок в текстах, написанных иностранцами.
Смирнова. Методы исправления ошибок в текстах, написанных иностранцами.
 
Разрешение лексической неоднозначности
Разрешение лексической неоднозначностиРазрешение лексической неоднозначности
Разрешение лексической неоднозначности
 
ch6.pdf
ch6.pdfch6.pdf
ch6.pdf
 
Можарова Тематические модели: учет сходства между униграммами и биграммами.
Можарова Тематические модели: учет сходства между униграммами и биграммами.Можарова Тематические модели: учет сходства между униграммами и биграммами.
Можарова Тематические модели: учет сходства между униграммами и биграммами.
 
л 2 14
л 2 14л 2 14
л 2 14
 
Ontologies for Information Extraction
Ontologies for Information ExtractionOntologies for Information Extraction
Ontologies for Information Extraction
 
Экспертные системы: лекция №5
Экспертные системы: лекция №5Экспертные системы: лекция №5
Экспертные системы: лекция №5
 
Мищенко. Методы автоматического определения наиболее частотного значения слова.
Мищенко. Методы автоматического определения наиболее частотного значения слова.Мищенко. Методы автоматического определения наиболее частотного значения слова.
Мищенко. Методы автоматического определения наиболее частотного значения слова.
 

En vedette

Max2013 rejected apps presentation
Max2013   rejected apps presentationMax2013   rejected apps presentation
Max2013 rejected apps presentationMichael Chaize
 
Maker Art: How to Create a Wonderbox
Maker Art: How to Create a WonderboxMaker Art: How to Create a Wonderbox
Maker Art: How to Create a WonderboxGreen Change
 
How a bunch of normal people Used Technology To Repair a Rigged Election
How a bunch of normal people Used Technology To Repair a Rigged ElectionHow a bunch of normal people Used Technology To Repair a Rigged Election
How a bunch of normal people Used Technology To Repair a Rigged ElectionSelena Deckelmann
 
Social Insights from the Market
Social Insights from the MarketSocial Insights from the Market
Social Insights from the MarketJon Gatrell
 
«Зачем», «что» и «как» в исследовании коллокаций.
«Зачем», «что» и «как» в исследовании коллокаций. «Зачем», «что» и «как» в исследовании коллокаций.
«Зачем», «что» и «как» в исследовании коллокаций. Lidia Pivovarova
 
Kõnepuue
KõnepuueKõnepuue
Kõnepuuekiq
 
применение шаблонов при выделении 2коллокаций
применение шаблонов при выделении 2коллокацийприменение шаблонов при выделении 2коллокаций
применение шаблонов при выделении 2коллокацийLidia Pivovarova
 
God's Pharmacy
God's PharmacyGod's Pharmacy
God's Pharmacysanctuary
 
Urvalsproblemetihistoria
UrvalsproblemetihistoriaUrvalsproblemetihistoria
Urvalsproblemetihistoriahenriksvensson
 
Madrid Alfresco Day 2015 - John Newton - Digital as the Future of Work
Madrid Alfresco Day 2015 - John Newton - Digital as the Future of WorkMadrid Alfresco Day 2015 - John Newton - Digital as the Future of Work
Madrid Alfresco Day 2015 - John Newton - Digital as the Future of WorkJohn Newton
 

En vedette (16)

Max2013 rejected apps presentation
Max2013   rejected apps presentationMax2013   rejected apps presentation
Max2013 rejected apps presentation
 
Maker Art: How to Create a Wonderbox
Maker Art: How to Create a WonderboxMaker Art: How to Create a Wonderbox
Maker Art: How to Create a Wonderbox
 
How a bunch of normal people Used Technology To Repair a Rigged Election
How a bunch of normal people Used Technology To Repair a Rigged ElectionHow a bunch of normal people Used Technology To Repair a Rigged Election
How a bunch of normal people Used Technology To Repair a Rigged Election
 
Social Insights from the Market
Social Insights from the MarketSocial Insights from the Market
Social Insights from the Market
 
5. open innov ict-platf
5. open innov ict-platf5. open innov ict-platf
5. open innov ict-platf
 
«Зачем», «что» и «как» в исследовании коллокаций.
«Зачем», «что» и «как» в исследовании коллокаций. «Зачем», «что» и «как» в исследовании коллокаций.
«Зачем», «что» и «как» в исследовании коллокаций.
 
Kõnepuue
KõnepuueKõnepuue
Kõnepuue
 
Lidia Pivovarova
Lidia PivovarovaLidia Pivovarova
Lidia Pivovarova
 
Retrospectiva
RetrospectivaRetrospectiva
Retrospectiva
 
применение шаблонов при выделении 2коллокаций
применение шаблонов при выделении 2коллокацийприменение шаблонов при выделении 2коллокаций
применение шаблонов при выделении 2коллокаций
 
Roofing
Roofing Roofing
Roofing
 
God's Pharmacy
God's PharmacyGod's Pharmacy
God's Pharmacy
 
Urvalsproblemetihistoria
UrvalsproblemetihistoriaUrvalsproblemetihistoria
Urvalsproblemetihistoria
 
3. open innov organization
3. open innov organization3. open innov organization
3. open innov organization
 
Coca-Cola
Coca-ColaCoca-Cola
Coca-Cola
 
Madrid Alfresco Day 2015 - John Newton - Digital as the Future of Work
Madrid Alfresco Day 2015 - John Newton - Digital as the Future of WorkMadrid Alfresco Day 2015 - John Newton - Digital as the Future of Work
Madrid Alfresco Day 2015 - John Newton - Digital as the Future of Work
 

Similaire à Максим Литвинов

Построение правил для автоматического извлечения словосочетаний из текста
Построение правил для автоматического извлечения словосочетаний из текстаПостроение правил для автоматического извлечения словосочетаний из текста
Построение правил для автоматического извлечения словосочетаний из текстаIrene Pochinok
 
построение правил для автоматического извлечения словосочетаний из текста
построение правил для автоматического извлечения словосочетаний из текстапостроение правил для автоматического извлечения словосочетаний из текста
построение правил для автоматического извлечения словосочетаний из текстаYury Katkov
 
Ontology and Text Alalize
Ontology and Text AlalizeOntology and Text Alalize
Ontology and Text AlalizeOchirov Tsyren
 
ПОСТРОЕНИЕ ОТНОШЕНИЙ В СМЕШАННОЙ ОНТОЛОГИЧЕСКОЙ СЕТИ ДЛЯ РЕШЕНИЯ ЗАДАЧ ТЕСТИР...
ПОСТРОЕНИЕ ОТНОШЕНИЙ В СМЕШАННОЙ ОНТОЛОГИЧЕСКОЙ СЕТИ ДЛЯ РЕШЕНИЯ ЗАДАЧ ТЕСТИР...ПОСТРОЕНИЕ ОТНОШЕНИЙ В СМЕШАННОЙ ОНТОЛОГИЧЕСКОЙ СЕТИ ДЛЯ РЕШЕНИЯ ЗАДАЧ ТЕСТИР...
ПОСТРОЕНИЕ ОТНОШЕНИЙ В СМЕШАННОЙ ОНТОЛОГИЧЕСКОЙ СЕТИ ДЛЯ РЕШЕНИЯ ЗАДАЧ ТЕСТИР...Сергей Пономарев
 
Вычислительная лексическая семантика: метрики семантической близости и их при...
Вычислительная лексическая семантика: метрики семантической близости и их при...Вычислительная лексическая семантика: метрики семантической близости и их при...
Вычислительная лексическая семантика: метрики семантической близости и их при...Alexander Panchenko
 
Михаил Александров, Индуктивное моделирование
Михаил Александров, Индуктивное моделированиеМихаил Александров, Индуктивное моделирование
Михаил Александров, Индуктивное моделированиеLidia Pivovarova
 
лекции 3 4 тема 1
лекции 3 4 тема 1лекции 3 4 тема 1
лекции 3 4 тема 1Noobie312
 
Алексей Колосов
Алексей Колосов Алексей Колосов
Алексей Колосов Lidia Pivovarova
 
Query expansion
Query expansionQuery expansion
Query expansionNLPseminar
 
Fact Extraction (ideograph)
Fact Extraction (ideograph)Fact Extraction (ideograph)
Fact Extraction (ideograph)NLPseminar
 

Similaire à Максим Литвинов (20)

Автоматическое извлечение синтаксических контекстов из текстовой коллекции
Автоматическое извлечение синтаксических контекстов из текстовой коллекцииАвтоматическое извлечение синтаксических контекстов из текстовой коллекции
Автоматическое извлечение синтаксических контекстов из текстовой коллекции
 
Построение правил для автоматического извлечения словосочетаний из текста
Построение правил для автоматического извлечения словосочетаний из текстаПостроение правил для автоматического извлечения словосочетаний из текста
Построение правил для автоматического извлечения словосочетаний из текста
 
построение правил для автоматического извлечения словосочетаний из текста
построение правил для автоматического извлечения словосочетаний из текстапостроение правил для автоматического извлечения словосочетаний из текста
построение правил для автоматического извлечения словосочетаний из текста
 
Извлечение терминологических словосочетаний из текстов
Извлечение терминологических словосочетаний из текстовИзвлечение терминологических словосочетаний из текстов
Извлечение терминологических словосочетаний из текстов
 
Извлечение знаний и фактов из текстов
Извлечение знаний и фактов из текстовИзвлечение знаний и фактов из текстов
Извлечение знаний и фактов из текстов
 
Автоматическая кластеризация близких по смыслу слов
Автоматическая кластеризация близких по смыслу словАвтоматическая кластеризация близких по смыслу слов
Автоматическая кластеризация близких по смыслу слов
 
Ontology and Text Alalize
Ontology and Text AlalizeOntology and Text Alalize
Ontology and Text Alalize
 
Программные средства выявления теминологических вариантов в текстах
Программные средства выявления теминологических вариантов в текстахПрограммные средства выявления теминологических вариантов в текстах
Программные средства выявления теминологических вариантов в текстах
 
ПОСТРОЕНИЕ ОТНОШЕНИЙ В СМЕШАННОЙ ОНТОЛОГИЧЕСКОЙ СЕТИ ДЛЯ РЕШЕНИЯ ЗАДАЧ ТЕСТИР...
ПОСТРОЕНИЕ ОТНОШЕНИЙ В СМЕШАННОЙ ОНТОЛОГИЧЕСКОЙ СЕТИ ДЛЯ РЕШЕНИЯ ЗАДАЧ ТЕСТИР...ПОСТРОЕНИЕ ОТНОШЕНИЙ В СМЕШАННОЙ ОНТОЛОГИЧЕСКОЙ СЕТИ ДЛЯ РЕШЕНИЯ ЗАДАЧ ТЕСТИР...
ПОСТРОЕНИЕ ОТНОШЕНИЙ В СМЕШАННОЙ ОНТОЛОГИЧЕСКОЙ СЕТИ ДЛЯ РЕШЕНИЯ ЗАДАЧ ТЕСТИР...
 
Вычислительная лексическая семантика: метрики семантической близости и их при...
Вычислительная лексическая семантика: метрики семантической близости и их при...Вычислительная лексическая семантика: метрики семантической близости и их при...
Вычислительная лексическая семантика: метрики семантической близости и их при...
 
Михаил Александров, Индуктивное моделирование
Михаил Александров, Индуктивное моделированиеМихаил Александров, Индуктивное моделирование
Михаил Александров, Индуктивное моделирование
 
RussNet
RussNetRussNet
RussNet
 
лекции 3 4 тема 1
лекции 3 4 тема 1лекции 3 4 тема 1
лекции 3 4 тема 1
 
Алексей Колосов
Алексей Колосов Алексей Колосов
Алексей Колосов
 
Авиком
АвикомАвиком
Авиком
 
Комбинирование факторов для разрешения референции местоимений
Комбинирование факторов для разрешения референции местоименийКомбинирование факторов для разрешения референции местоимений
Комбинирование факторов для разрешения референции местоимений
 
Slovar pr. metodol
Slovar pr. metodolSlovar pr. metodol
Slovar pr. metodol
 
Механизмы обеспечения связности в системах динамической генерации текстов
Механизмы обеспечения связности в системах динамической генерации текстовМеханизмы обеспечения связности в системах динамической генерации текстов
Механизмы обеспечения связности в системах динамической генерации текстов
 
Query expansion
Query expansionQuery expansion
Query expansion
 
Fact Extraction (ideograph)
Fact Extraction (ideograph)Fact Extraction (ideograph)
Fact Extraction (ideograph)
 

Plus de Lidia Pivovarova

Classification and clustering in media monitoring: from knowledge engineering...
Classification and clustering in media monitoring: from knowledge engineering...Classification and clustering in media monitoring: from knowledge engineering...
Classification and clustering in media monitoring: from knowledge engineering...Lidia Pivovarova
 
Convolutional neural networks for text classification
Convolutional neural networks for text classificationConvolutional neural networks for text classification
Convolutional neural networks for text classificationLidia Pivovarova
 
Grouping business news stories based on salience of named entities
Grouping business news stories based on salience of named entitiesGrouping business news stories based on salience of named entities
Grouping business news stories based on salience of named entitiesLidia Pivovarova
 
Интеллектуальный анализ текста
Интеллектуальный анализ текстаИнтеллектуальный анализ текста
Интеллектуальный анализ текстаLidia Pivovarova
 
AINL 2016: Bodrunova, Blekanov, Maksimov
AINL 2016: Bodrunova, Blekanov, MaksimovAINL 2016: Bodrunova, Blekanov, Maksimov
AINL 2016: Bodrunova, Blekanov, MaksimovLidia Pivovarova
 
AINL 2016: Rykov, Nagornyy, Koltsova, Natta, Kremenets, Manovich, Cerrone, Cr...
AINL 2016: Rykov, Nagornyy, Koltsova, Natta, Kremenets, Manovich, Cerrone, Cr...AINL 2016: Rykov, Nagornyy, Koltsova, Natta, Kremenets, Manovich, Cerrone, Cr...
AINL 2016: Rykov, Nagornyy, Koltsova, Natta, Kremenets, Manovich, Cerrone, Cr...Lidia Pivovarova
 
AINL 2016: Shavrina, Selegey
AINL 2016: Shavrina, SelegeyAINL 2016: Shavrina, Selegey
AINL 2016: Shavrina, SelegeyLidia Pivovarova
 

Plus de Lidia Pivovarova (20)

Classification and clustering in media monitoring: from knowledge engineering...
Classification and clustering in media monitoring: from knowledge engineering...Classification and clustering in media monitoring: from knowledge engineering...
Classification and clustering in media monitoring: from knowledge engineering...
 
Convolutional neural networks for text classification
Convolutional neural networks for text classificationConvolutional neural networks for text classification
Convolutional neural networks for text classification
 
Grouping business news stories based on salience of named entities
Grouping business news stories based on salience of named entitiesGrouping business news stories based on salience of named entities
Grouping business news stories based on salience of named entities
 
Интеллектуальный анализ текста
Интеллектуальный анализ текстаИнтеллектуальный анализ текста
Интеллектуальный анализ текста
 
AINL 2016: Yagunova
AINL 2016: YagunovaAINL 2016: Yagunova
AINL 2016: Yagunova
 
AINL 2016: Kuznetsova
AINL 2016: KuznetsovaAINL 2016: Kuznetsova
AINL 2016: Kuznetsova
 
AINL 2016: Bodrunova, Blekanov, Maksimov
AINL 2016: Bodrunova, Blekanov, MaksimovAINL 2016: Bodrunova, Blekanov, Maksimov
AINL 2016: Bodrunova, Blekanov, Maksimov
 
AINL 2016: Boldyreva
AINL 2016: BoldyrevaAINL 2016: Boldyreva
AINL 2016: Boldyreva
 
AINL 2016: Rykov, Nagornyy, Koltsova, Natta, Kremenets, Manovich, Cerrone, Cr...
AINL 2016: Rykov, Nagornyy, Koltsova, Natta, Kremenets, Manovich, Cerrone, Cr...AINL 2016: Rykov, Nagornyy, Koltsova, Natta, Kremenets, Manovich, Cerrone, Cr...
AINL 2016: Rykov, Nagornyy, Koltsova, Natta, Kremenets, Manovich, Cerrone, Cr...
 
AINL 2016: Kozerenko
AINL 2016: Kozerenko AINL 2016: Kozerenko
AINL 2016: Kozerenko
 
AINL 2016: Shavrina, Selegey
AINL 2016: Shavrina, SelegeyAINL 2016: Shavrina, Selegey
AINL 2016: Shavrina, Selegey
 
AINL 2016: Khudobakhshov
AINL 2016: KhudobakhshovAINL 2016: Khudobakhshov
AINL 2016: Khudobakhshov
 
AINL 2016: Proncheva
AINL 2016: PronchevaAINL 2016: Proncheva
AINL 2016: Proncheva
 
AINL 2016:
AINL 2016: AINL 2016:
AINL 2016:
 
AINL 2016: Bugaychenko
AINL 2016: BugaychenkoAINL 2016: Bugaychenko
AINL 2016: Bugaychenko
 
AINL 2016: Grigorieva
AINL 2016: GrigorievaAINL 2016: Grigorieva
AINL 2016: Grigorieva
 
AINL 2016: Muravyov
AINL 2016: MuravyovAINL 2016: Muravyov
AINL 2016: Muravyov
 
AINL 2016: Just AI
AINL 2016: Just AIAINL 2016: Just AI
AINL 2016: Just AI
 
AINL 2016: Moskvichev
AINL 2016: MoskvichevAINL 2016: Moskvichev
AINL 2016: Moskvichev
 
AINL 2016: Goncharov
AINL 2016: GoncharovAINL 2016: Goncharov
AINL 2016: Goncharov
 

Максим Литвинов

  • 1. ПРИМЕНЕНИЕ МОДЕЛЕЙ ГЛАГОЛЬНОГО УПРАВЛЕНИЯ И ВЕРОЯТНОСТНЫХ ПРАВИЛ ПРИ МОРФОЛОГИЧЕСКОЙ РАЗМЕТКЕ РУССКОЯЗЫЧНЫХ ТЕКСТОВ Литвинов М.И. Московский институт электроники и математики, каф. ИТАС
  • 2.
  • 3.
  • 4.
  • 5.
  • 6.
  • 7.
  • 8.
  • 9.
  • 10.
  • 11.
  • 12.
  • 13.
  • 14.
  • 15.
  • 16.
  • 17. Состав лексической базы сочетаемости слов Параметры Число сочетаний млн. Гл. + сущ. 20.00 Гл. + нар. 1.05 Деепр. + сущ. 2.37 Деепр. + нар. 0.16 Прич. + сущ. 5.43 Прич. + нар. 0.28 Сущ. + прил. 4.88 Сущ.+сущ. 2.26
  • 18.
  • 19.
  • 20.
  • 21.
  • 22.
  • 23.
  • 24.
  • 25.
  • 26. Качество работы модуля морфологической разметки Параметры Покрытие Качество Триграммы 71.50 98.21 База 71.98 96.74 Правила 77.73 95.94 Триграммы + База 72.02 96.74 Триграммы + Правила 77.73 95.94 Триграммы + База + Правила 78.03 95.60 Триграммы + Правила + Оптимизация 81.15 94.65 База + Правила 78.03 95.60 Правила + Оптимизация 81.15 94.65 База + Правила + Оптимизация 81.27 94.66 Триграммы + База + Правила + Оптимизация 81.27 94.66
  • 27.

Notes de l'éditeur

  1. В работе [1] И.А. Мельчук приводит такие результаты исследований омонимии: «Омонимия же характерна лишь для низших уровней языка: омонимичных морф много, омонимия словоформ также встречается довольно часто (даже в таких флективных языках как русский), но уже омонимичные фразы в речи попадаются сравнительно редко. Представить же себе омонимичный абзац или омонимичную страницу текста очень трудно (в большинстве языков это, по всей видимости, и невозможно)». Обратим внимание, что омонимичные фразы встречаются, конечно, на практике, но зачастую являются искусственными примерами компьютерных лингвистов для проверки своих систем. В системах автоматической обработки текста используются в основном первые пять уровней. Слоги иногда используются при представлении информации в морфологических словарях.
  2. Доклад посвящен обзору методов, лежащих в основе вероятностных систем.
  3. Корпусная лингвистика Обучение с учителем, без учителя, полуобучение.
  4. Сказать, что по замечаниям Эрика Брилла все вероятностные модели обучаются по сути одним и тем же зависимостям, но только в несколько иной форме.
  5. Кратко об этом упомянуть и сказать, что об этом докладывалось в прошлом году коллегой.
  6. Кратко об этом упомянуть и сказать, что об этом докладывалось в прошлом году коллегой.
  7. Кратко об этом упомянуть и сказать, что об этом докладывалось в прошлом году коллегой.
  8. Здесь сказать, что детерминиронное правило – если слева от слова есть частица to , то в английском это глагол.
  9. Здесь сказать, что детерминиронное правило – если слева от слова есть частица to , то в английском это глагол.
  10. Кратко об этом упомянуть и сказать, что об этом докладывалось в прошлом году коллегой.