SlideShare une entreprise Scribd logo
1  sur  18
Об альтернативах коллокациям Кочеткова Н. А. Научный руководитель Клышинский Э. С.
Виды  словосочетаний Свободные Связные Разрывные Глагольное управление Неразрывные Коллокации
Объемы словарей сочетаемости Название Объем, статей Словарь сочетаемости слов русского языка / Под ред. П. Н. Денисова, В. В. Морковкина. 3-е изд., испр. М., АСТ, 2002. 816 с.  2500 Бирюк О.Л., Гусев В.Ю., Калинина Е.Ю. Словарь глагольной сочетаемости непредметных имен русского языка - http://dict.ruslang.ru/abstr_noun.php 10000 Невзорова О.А., Невзоров В.Н., Зинькина Ю.В., Пяткин Н.В. Интегральная технология разрешения омонимии в системе анализа текстовых документов «ЛоТА» 30000
[object Object],[object Object],[object Object],[object Object],[object Object]
Гипотезы в основе метода ,[object Object],[object Object]
Анализируемые группы ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Анализируемые группы ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Анализируемые   группы ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Анализируемые группы ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Анализируемые группы ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Граф конечного автомата 0 1 2 3 Гл. Гл. Пред. Прил. Сущ. Пред. Сущ. Др. Прил. Сущ . Гл. Др . Пред. Прил. Гл. Пред. Прил. Сущ. Др. 0 - начальное состояние 1 - ждем существительное после глагола 2 - ждем существительное до глагола 3 - ждем глагол Зеленый - занести в базу Красный – сброс Черный - переход
Метод создания базы сочетаемости слов ,[object Object],[object Object]
Объем обработанных источников Источник Объем, млн словоупотреблений Библиотека Мошкова 680 РИА Новости 156 Доп. корпус прозы 120 Независимая газета 89 Лента.ру 33 Российская газета 29 PCWeek 28 РБК 21 Компьюлента 9 Итого 1165
Недостаток метода: ,[object Object]
Причины возникновения ошибок ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Числитель показывает общее количество обнаруженных вхождений, знаменатель – количество уникальных сочетаний .  Статистика употреблений по частям речи Результаты (по количеству вхождений) Пара Всего вхождений, млн > 1 повторения, млн > 2 повторений, млн Глагол+сущ. 65 / 8,3 60,3 / 3,5 57,7 / 2,3 Деепр.+сущ. 3,5 / 0,88 2,8 / 0,31 2,6 / 0,18 Сущ.+прил. 9,9 / 1,3 9,2 / 0,56 8,8 / 0,36 Часть речи Приняло участие Всего в морфологии Глагол 21500 26400 Сущ. 53300 83000 Прил. 23700 45300
Результаты (процент ошибок) ,[object Object],[object Object]
Выводы ,[object Object],[object Object],[object Object]

Contenu connexe

En vedette

爱是什么(自动播放)
爱是什么(自动播放)爱是什么(自动播放)
爱是什么(自动播放)liuruifeng
 
Mergers and aquisitions strategy
Mergers and aquisitions strategyMergers and aquisitions strategy
Mergers and aquisitions strategySandeep Kulshrestha
 
AOD Workplace Modern Sample Final
AOD Workplace Modern Sample FinalAOD Workplace Modern Sample Final
AOD Workplace Modern Sample FinalAndrew Schwartz
 
Михаил Александров. Индуктивное моделирование.
Михаил Александров. Индуктивное моделирование.Михаил Александров. Индуктивное моделирование.
Михаил Александров. Индуктивное моделирование.Lidia Pivovarova
 
141022 ic3 k semanticsofinnovation missikoff
141022 ic3 k semanticsofinnovation missikoff141022 ic3 k semanticsofinnovation missikoff
141022 ic3 k semanticsofinnovation missikoffMichele Missikoff
 
One backend multiple Screens
One backend multiple ScreensOne backend multiple Screens
One backend multiple ScreensMichael Chaize
 
Max2013 rejected apps presentation
Max2013   rejected apps presentationMax2013   rejected apps presentation
Max2013 rejected apps presentationMichael Chaize
 
Martin karlssons vykortssamling munken och prästgatan
Martin karlssons vykortssamling   munken och prästgatanMartin karlssons vykortssamling   munken och prästgatan
Martin karlssons vykortssamling munken och prästgatanhembygdsigtuna
 
Eesti kultuur
Eesti kultuurEesti kultuur
Eesti kultuurkiq
 
Presentation of Software Study at IDI/NTNU
Presentation of Software Study at IDI/NTNUPresentation of Software Study at IDI/NTNU
Presentation of Software Study at IDI/NTNUletiziajaccheri
 
TööVarjupäEv2
TööVarjupäEv2TööVarjupäEv2
TööVarjupäEv2eveliiin
 
Verben-ir.
Verben-ir.Verben-ir.
Verben-ir.MsSchool
 
Martin karlssons vykortssamling ångbåtsbryggan och stranden
Martin karlssons vykortssamling   ångbåtsbryggan och strandenMartin karlssons vykortssamling   ångbåtsbryggan och stranden
Martin karlssons vykortssamling ångbåtsbryggan och strandenhembygdsigtuna
 

En vedette (16)

爱是什么(自动播放)
爱是什么(自动播放)爱是什么(自动播放)
爱是什么(自动播放)
 
Mergers and aquisitions strategy
Mergers and aquisitions strategyMergers and aquisitions strategy
Mergers and aquisitions strategy
 
AOD Workplace Modern Sample Final
AOD Workplace Modern Sample FinalAOD Workplace Modern Sample Final
AOD Workplace Modern Sample Final
 
Михаил Александров. Индуктивное моделирование.
Михаил Александров. Индуктивное моделирование.Михаил Александров. Индуктивное моделирование.
Михаил Александров. Индуктивное моделирование.
 
141022 ic3 k semanticsofinnovation missikoff
141022 ic3 k semanticsofinnovation missikoff141022 ic3 k semanticsofinnovation missikoff
141022 ic3 k semanticsofinnovation missikoff
 
Montpellier - Flex UG
Montpellier - Flex UGMontpellier - Flex UG
Montpellier - Flex UG
 
One backend multiple Screens
One backend multiple ScreensOne backend multiple Screens
One backend multiple Screens
 
Max2013 rejected apps presentation
Max2013   rejected apps presentationMax2013   rejected apps presentation
Max2013 rejected apps presentation
 
Martin karlssons vykortssamling munken och prästgatan
Martin karlssons vykortssamling   munken och prästgatanMartin karlssons vykortssamling   munken och prästgatan
Martin karlssons vykortssamling munken och prästgatan
 
Eesti kultuur
Eesti kultuurEesti kultuur
Eesti kultuur
 
Jax2001 adobe keynote
Jax2001 adobe keynoteJax2001 adobe keynote
Jax2001 adobe keynote
 
Presentation of Software Study at IDI/NTNU
Presentation of Software Study at IDI/NTNUPresentation of Software Study at IDI/NTNU
Presentation of Software Study at IDI/NTNU
 
TööVarjupäEv2
TööVarjupäEv2TööVarjupäEv2
TööVarjupäEv2
 
Verben-ir.
Verben-ir.Verben-ir.
Verben-ir.
 
120626 gdansk c ai se2012-2
120626 gdansk c ai se2012-2120626 gdansk c ai se2012-2
120626 gdansk c ai se2012-2
 
Martin karlssons vykortssamling ångbåtsbryggan och stranden
Martin karlssons vykortssamling   ångbåtsbryggan och strandenMartin karlssons vykortssamling   ångbåtsbryggan och stranden
Martin karlssons vykortssamling ångbåtsbryggan och stranden
 

Similaire à об альтернативах коллокациям

Ontology and Text Alalize
Ontology and Text AlalizeOntology and Text Alalize
Ontology and Text AlalizeOchirov Tsyren
 
Использование инструментальных средств для выделения коллокаций в лексикограф...
Использование инструментальных средств для выделения коллокаций влексикограф...Использование инструментальных средств для выделения коллокаций влексикограф...
Использование инструментальных средств для выделения коллокаций в лексикограф...Lidia Pivovarova
 
ПРОБЛЕМЫ ПОПОЛНЕНИЯ СЕМАНТИЧЕСКОГО СЛОВАРЯ
ПРОБЛЕМЫ ПОПОЛНЕНИЯ СЕМАНТИЧЕСКОГО СЛОВАРЯПРОБЛЕМЫ ПОПОЛНЕНИЯ СЕМАНТИЧЕСКОГО СЛОВАРЯ
ПРОБЛЕМЫ ПОПОЛНЕНИЯ СЕМАНТИЧЕСКОГО СЛОВАРЯITMO University
 
лекция 5 тема 1
лекция 5 тема 1лекция 5 тема 1
лекция 5 тема 1Noobie312
 
«Зачем», «что» и «как» в исследовании коллокаций.
«Зачем», «что» и «как» в исследовании коллокаций. «Зачем», «что» и «как» в исследовании коллокаций.
«Зачем», «что» и «как» в исследовании коллокаций. Lidia Pivovarova
 
ПОСТРОЕНИЕ ОТНОШЕНИЙ В СМЕШАННОЙ ОНТОЛОГИЧЕСКОЙ СЕТИ ДЛЯ РЕШЕНИЯ ЗАДАЧ ТЕСТИР...
ПОСТРОЕНИЕ ОТНОШЕНИЙ В СМЕШАННОЙ ОНТОЛОГИЧЕСКОЙ СЕТИ ДЛЯ РЕШЕНИЯ ЗАДАЧ ТЕСТИР...ПОСТРОЕНИЕ ОТНОШЕНИЙ В СМЕШАННОЙ ОНТОЛОГИЧЕСКОЙ СЕТИ ДЛЯ РЕШЕНИЯ ЗАДАЧ ТЕСТИР...
ПОСТРОЕНИЕ ОТНОШЕНИЙ В СМЕШАННОЙ ОНТОЛОГИЧЕСКОЙ СЕТИ ДЛЯ РЕШЕНИЯ ЗАДАЧ ТЕСТИР...Сергей Пономарев
 
клышинский
клышинскийклышинский
клышинскийNLPseminar
 
Построение правил для автоматического извлечения словосочетаний из текста
Построение правил для автоматического извлечения словосочетаний из текстаПостроение правил для автоматического извлечения словосочетаний из текста
Построение правил для автоматического извлечения словосочетаний из текстаIrene Pochinok
 
построение правил для автоматического извлечения словосочетаний из текста
построение правил для автоматического извлечения словосочетаний из текстапостроение правил для автоматического извлечения словосочетаний из текста
построение правил для автоматического извлечения словосочетаний из текстаYury Katkov
 
Схемы орфограмм
Схемы орфограммСхемы орфограмм
Схемы орфограммguestb520f2
 
Словари словосочетаний
Словари словосочетанийСловари словосочетаний
Словари словосочетанийYevgeniya Grigoryeva
 
П.П.Гаряев Волновой генетический код
П.П.Гаряев Волновой генетический кодП.П.Гаряев Волновой генетический код
П.П.Гаряев Волновой генетический кодAloha Bulgaria Ltd
 
синтаксические-нормы
синтаксические-нормысинтаксические-нормы
синтаксические-нормыSnezhanaP10
 
зачет 10 класс 2 полугодие
зачет 10 класс 2 полугодиезачет 10 класс 2 полугодие
зачет 10 класс 2 полугодиеEvgenia88
 

Similaire à об альтернативах коллокациям (20)

Ontology and Text Alalize
Ontology and Text AlalizeOntology and Text Alalize
Ontology and Text Alalize
 
Использование инструментальных средств для выделения коллокаций в лексикограф...
Использование инструментальных средств для выделения коллокаций влексикограф...Использование инструментальных средств для выделения коллокаций влексикограф...
Использование инструментальных средств для выделения коллокаций в лексикограф...
 
ПРОБЛЕМЫ ПОПОЛНЕНИЯ СЕМАНТИЧЕСКОГО СЛОВАРЯ
ПРОБЛЕМЫ ПОПОЛНЕНИЯ СЕМАНТИЧЕСКОГО СЛОВАРЯПРОБЛЕМЫ ПОПОЛНЕНИЯ СЕМАНТИЧЕСКОГО СЛОВАРЯ
ПРОБЛЕМЫ ПОПОЛНЕНИЯ СЕМАНТИЧЕСКОГО СЛОВАРЯ
 
Semantic evaluation on Dialog 2015
Semantic evaluation on Dialog 2015Semantic evaluation on Dialog 2015
Semantic evaluation on Dialog 2015
 
Masa
MasaMasa
Masa
 
лекция 5 тема 1
лекция 5 тема 1лекция 5 тема 1
лекция 5 тема 1
 
Извлечение терминологических словосочетаний из текстов
Извлечение терминологических словосочетаний из текстовИзвлечение терминологических словосочетаний из текстов
Извлечение терминологических словосочетаний из текстов
 
Автоматическое извлечение синтаксических контекстов из текстовой коллекции
Автоматическое извлечение синтаксических контекстов из текстовой коллекцииАвтоматическое извлечение синтаксических контекстов из текстовой коллекции
Автоматическое извлечение синтаксических контекстов из текстовой коллекции
 
«Зачем», «что» и «как» в исследовании коллокаций.
«Зачем», «что» и «как» в исследовании коллокаций. «Зачем», «что» и «как» в исследовании коллокаций.
«Зачем», «что» и «как» в исследовании коллокаций.
 
ПОСТРОЕНИЕ ОТНОШЕНИЙ В СМЕШАННОЙ ОНТОЛОГИЧЕСКОЙ СЕТИ ДЛЯ РЕШЕНИЯ ЗАДАЧ ТЕСТИР...
ПОСТРОЕНИЕ ОТНОШЕНИЙ В СМЕШАННОЙ ОНТОЛОГИЧЕСКОЙ СЕТИ ДЛЯ РЕШЕНИЯ ЗАДАЧ ТЕСТИР...ПОСТРОЕНИЕ ОТНОШЕНИЙ В СМЕШАННОЙ ОНТОЛОГИЧЕСКОЙ СЕТИ ДЛЯ РЕШЕНИЯ ЗАДАЧ ТЕСТИР...
ПОСТРОЕНИЕ ОТНОШЕНИЙ В СМЕШАННОЙ ОНТОЛОГИЧЕСКОЙ СЕТИ ДЛЯ РЕШЕНИЯ ЗАДАЧ ТЕСТИР...
 
презентация (Quasi synonyms, вмк 25.10.2011)
презентация (Quasi synonyms, вмк 25.10.2011)презентация (Quasi synonyms, вмк 25.10.2011)
презентация (Quasi synonyms, вмк 25.10.2011)
 
клышинский
клышинскийклышинский
клышинский
 
Построение правил для автоматического извлечения словосочетаний из текста
Построение правил для автоматического извлечения словосочетаний из текстаПостроение правил для автоматического извлечения словосочетаний из текста
Построение правил для автоматического извлечения словосочетаний из текста
 
построение правил для автоматического извлечения словосочетаний из текста
построение правил для автоматического извлечения словосочетаний из текстапостроение правил для автоматического извлечения словосочетаний из текста
построение правил для автоматического извлечения словосочетаний из текста
 
Схемы орфограмм
Схемы орфограммСхемы орфограмм
Схемы орфограмм
 
Словари словосочетаний
Словари словосочетанийСловари словосочетаний
Словари словосочетаний
 
П.П.Гаряев Волновой генетический код
П.П.Гаряев Волновой генетический кодП.П.Гаряев Волновой генетический код
П.П.Гаряев Волновой генетический код
 
синтаксические-нормы
синтаксические-нормысинтаксические-нормы
синтаксические-нормы
 
Методы морфологического анализа текстов
Методы морфологического анализа текстовМетоды морфологического анализа текстов
Методы морфологического анализа текстов
 
зачет 10 класс 2 полугодие
зачет 10 класс 2 полугодиезачет 10 класс 2 полугодие
зачет 10 класс 2 полугодие
 

Plus de Lidia Pivovarova

Classification and clustering in media monitoring: from knowledge engineering...
Classification and clustering in media monitoring: from knowledge engineering...Classification and clustering in media monitoring: from knowledge engineering...
Classification and clustering in media monitoring: from knowledge engineering...Lidia Pivovarova
 
Convolutional neural networks for text classification
Convolutional neural networks for text classificationConvolutional neural networks for text classification
Convolutional neural networks for text classificationLidia Pivovarova
 
Grouping business news stories based on salience of named entities
Grouping business news stories based on salience of named entitiesGrouping business news stories based on salience of named entities
Grouping business news stories based on salience of named entitiesLidia Pivovarova
 
Интеллектуальный анализ текста
Интеллектуальный анализ текстаИнтеллектуальный анализ текста
Интеллектуальный анализ текстаLidia Pivovarova
 
AINL 2016: Bodrunova, Blekanov, Maksimov
AINL 2016: Bodrunova, Blekanov, MaksimovAINL 2016: Bodrunova, Blekanov, Maksimov
AINL 2016: Bodrunova, Blekanov, MaksimovLidia Pivovarova
 
AINL 2016: Rykov, Nagornyy, Koltsova, Natta, Kremenets, Manovich, Cerrone, Cr...
AINL 2016: Rykov, Nagornyy, Koltsova, Natta, Kremenets, Manovich, Cerrone, Cr...AINL 2016: Rykov, Nagornyy, Koltsova, Natta, Kremenets, Manovich, Cerrone, Cr...
AINL 2016: Rykov, Nagornyy, Koltsova, Natta, Kremenets, Manovich, Cerrone, Cr...Lidia Pivovarova
 
AINL 2016: Shavrina, Selegey
AINL 2016: Shavrina, SelegeyAINL 2016: Shavrina, Selegey
AINL 2016: Shavrina, SelegeyLidia Pivovarova
 

Plus de Lidia Pivovarova (20)

Classification and clustering in media monitoring: from knowledge engineering...
Classification and clustering in media monitoring: from knowledge engineering...Classification and clustering in media monitoring: from knowledge engineering...
Classification and clustering in media monitoring: from knowledge engineering...
 
Convolutional neural networks for text classification
Convolutional neural networks for text classificationConvolutional neural networks for text classification
Convolutional neural networks for text classification
 
Grouping business news stories based on salience of named entities
Grouping business news stories based on salience of named entitiesGrouping business news stories based on salience of named entities
Grouping business news stories based on salience of named entities
 
Интеллектуальный анализ текста
Интеллектуальный анализ текстаИнтеллектуальный анализ текста
Интеллектуальный анализ текста
 
AINL 2016: Yagunova
AINL 2016: YagunovaAINL 2016: Yagunova
AINL 2016: Yagunova
 
AINL 2016: Kuznetsova
AINL 2016: KuznetsovaAINL 2016: Kuznetsova
AINL 2016: Kuznetsova
 
AINL 2016: Bodrunova, Blekanov, Maksimov
AINL 2016: Bodrunova, Blekanov, MaksimovAINL 2016: Bodrunova, Blekanov, Maksimov
AINL 2016: Bodrunova, Blekanov, Maksimov
 
AINL 2016: Boldyreva
AINL 2016: BoldyrevaAINL 2016: Boldyreva
AINL 2016: Boldyreva
 
AINL 2016: Rykov, Nagornyy, Koltsova, Natta, Kremenets, Manovich, Cerrone, Cr...
AINL 2016: Rykov, Nagornyy, Koltsova, Natta, Kremenets, Manovich, Cerrone, Cr...AINL 2016: Rykov, Nagornyy, Koltsova, Natta, Kremenets, Manovich, Cerrone, Cr...
AINL 2016: Rykov, Nagornyy, Koltsova, Natta, Kremenets, Manovich, Cerrone, Cr...
 
AINL 2016: Kozerenko
AINL 2016: Kozerenko AINL 2016: Kozerenko
AINL 2016: Kozerenko
 
AINL 2016: Shavrina, Selegey
AINL 2016: Shavrina, SelegeyAINL 2016: Shavrina, Selegey
AINL 2016: Shavrina, Selegey
 
AINL 2016: Khudobakhshov
AINL 2016: KhudobakhshovAINL 2016: Khudobakhshov
AINL 2016: Khudobakhshov
 
AINL 2016: Proncheva
AINL 2016: PronchevaAINL 2016: Proncheva
AINL 2016: Proncheva
 
AINL 2016:
AINL 2016: AINL 2016:
AINL 2016:
 
AINL 2016: Bugaychenko
AINL 2016: BugaychenkoAINL 2016: Bugaychenko
AINL 2016: Bugaychenko
 
AINL 2016: Grigorieva
AINL 2016: GrigorievaAINL 2016: Grigorieva
AINL 2016: Grigorieva
 
AINL 2016: Muravyov
AINL 2016: MuravyovAINL 2016: Muravyov
AINL 2016: Muravyov
 
AINL 2016: Just AI
AINL 2016: Just AIAINL 2016: Just AI
AINL 2016: Just AI
 
AINL 2016: Moskvichev
AINL 2016: MoskvichevAINL 2016: Moskvichev
AINL 2016: Moskvichev
 
AINL 2016: Goncharov
AINL 2016: GoncharovAINL 2016: Goncharov
AINL 2016: Goncharov
 

об альтернативах коллокациям

  • 1. Об альтернативах коллокациям Кочеткова Н. А. Научный руководитель Клышинский Э. С.
  • 2. Виды словосочетаний Свободные Связные Разрывные Глагольное управление Неразрывные Коллокации
  • 3. Объемы словарей сочетаемости Название Объем, статей Словарь сочетаемости слов русского языка / Под ред. П. Н. Денисова, В. В. Морковкина. 3-е изд., испр. М., АСТ, 2002. 816 с. 2500 Бирюк О.Л., Гусев В.Ю., Калинина Е.Ю. Словарь глагольной сочетаемости непредметных имен русского языка - http://dict.ruslang.ru/abstr_noun.php 10000 Невзорова О.А., Невзоров В.Н., Зинькина Ю.В., Пяткин Н.В. Интегральная технология разрешения омонимии в системе анализа текстовых документов «ЛоТА» 30000
  • 4.
  • 5.
  • 6.
  • 7.
  • 8.
  • 9.
  • 10.
  • 11. Граф конечного автомата 0 1 2 3 Гл. Гл. Пред. Прил. Сущ. Пред. Сущ. Др. Прил. Сущ . Гл. Др . Пред. Прил. Гл. Пред. Прил. Сущ. Др. 0 - начальное состояние 1 - ждем существительное после глагола 2 - ждем существительное до глагола 3 - ждем глагол Зеленый - занести в базу Красный – сброс Черный - переход
  • 12.
  • 13. Объем обработанных источников Источник Объем, млн словоупотреблений Библиотека Мошкова 680 РИА Новости 156 Доп. корпус прозы 120 Независимая газета 89 Лента.ру 33 Российская газета 29 PCWeek 28 РБК 21 Компьюлента 9 Итого 1165
  • 14.
  • 15.
  • 16. Числитель показывает общее количество обнаруженных вхождений, знаменатель – количество уникальных сочетаний . Статистика употреблений по частям речи Результаты (по количеству вхождений) Пара Всего вхождений, млн > 1 повторения, млн > 2 повторений, млн Глагол+сущ. 65 / 8,3 60,3 / 3,5 57,7 / 2,3 Деепр.+сущ. 3,5 / 0,88 2,8 / 0,31 2,6 / 0,18 Сущ.+прил. 9,9 / 1,3 9,2 / 0,56 8,8 / 0,36 Часть речи Приняло участие Всего в морфологии Глагол 21500 26400 Сущ. 53300 83000 Прил. 23700 45300
  • 17.
  • 18.