SlideShare une entreprise Scribd logo
1  sur  29
Языковые корпуса Клишин Арсений, 424 группа
Понятие корпуса текста ,[object Object]
Классификация корпусов Признак  Типы корпусов   Тип данных ,[object Object],[object Object],[object Object],Язык текстов ,[object Object],[object Object],«Параллельность» ,[object Object],[object Object],[object Object],Жанр  ,[object Object],[object Object],[object Object],[object Object]
Целесообразность создания корпусов ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Коротко о корпусной лингвистике ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Науки, связанные с корпусами Искусственный интеллект ,[object Object],[object Object],Корпусная лингвистика
Исследования в области корпусной лингвистики ,[object Object],[object Object]
Проблемы корпусной лингвистики: ,[object Object],[object Object],[object Object],[object Object],[object Object]
Проблема представительности ,[object Object],[object Object]
Проблема представления результатов ,[object Object]
Подробнее о метаразметке текстов ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Подробнее о метаразметке текстов ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Подробнее о метаразметке текстов ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Подробнее о метаразметке текстов ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Пример метаразметки текста ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Синтаксическая разметка ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Синтаксическая разметка ,[object Object],[object Object],[object Object]
Синтаксическая разметка ,[object Object],[object Object],[object Object]
Синтаксическая разметка ,[object Object],[object Object],[object Object],[object Object],[object Object]
Национальный корпус  русского языка ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Национальный Корпус Русского Языка Подкорпус  Число текстов  Число словоупотреблений  Основной корпус  42 387  147 577 522  в том числе со снятой омонимией 2 215  5 884 661  Диалектный корпус  122  144 099  Поэтический корпус  9 675  2 586 710  Обучающий корпус  230  649 684
Национальный Корпус Русского Языка ,[object Object],[object Object]
Классификация текстов РНКЯ ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Классификация текстов РНКЯ ,[object Object],[object Object],[object Object],[object Object],[object Object]
Возможности поиска в РНКЯ ,[object Object],[object Object],[object Object],[object Object],[object Object]
Лексико-грамматический поиск
Лексико-грамматический поиск
Поиск по синтаксически размеченному корпусу
Материалы : ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Contenu connexe

Tendances

Call Numbers
Call NumbersCall Numbers
Call Numbershisled
 
Obras de referência
Obras de referênciaObras de referência
Obras de referênciaCélia Dias
 
Knowledge Organization Systems
Knowledge Organization SystemsKnowledge Organization Systems
Knowledge Organization SystemsR A Akerkar
 
Text clustering
Text clusteringText clustering
Text clusteringKU Leuven
 
Haystack 2018 - Algorithmic Extraction of Keywords Concepts and Vocabularies
Haystack 2018 - Algorithmic Extraction of Keywords Concepts and VocabulariesHaystack 2018 - Algorithmic Extraction of Keywords Concepts and Vocabularies
Haystack 2018 - Algorithmic Extraction of Keywords Concepts and VocabulariesMax Irwin
 
hands on: Text Mining With R
hands on: Text Mining With Rhands on: Text Mining With R
hands on: Text Mining With RJahnab Kumar Deka
 
How to write a report
How to write a reportHow to write a report
How to write a reportDavidWayne30
 
Semantic web meetup – sparql tutorial
Semantic web meetup – sparql tutorialSemantic web meetup – sparql tutorial
Semantic web meetup – sparql tutorialAdonisDamian
 
Le classement des livres documentaires
Le classement des livres documentairesLe classement des livres documentaires
Le classement des livres documentairesSylvieC97
 
Ontology and Ontology Libraries: a Critical Study
Ontology and Ontology Libraries: a Critical StudyOntology and Ontology Libraries: a Critical Study
Ontology and Ontology Libraries: a Critical StudyDebashisnaskar
 
Parts of Speect Tagging
Parts of Speect TaggingParts of Speect Tagging
Parts of Speect Taggingtheyaseen51
 
Statistical machine translation
Statistical machine translationStatistical machine translation
Statistical machine translationHrishikesh Nair
 
Лекция 4: Стек. Очередь
Лекция 4: Стек. ОчередьЛекция 4: Стек. Очередь
Лекция 4: Стек. ОчередьMikhail Kurnosov
 
Minicurso Introdução ao FRBR e ao RDA (SNBU 2014, Belo Horizonte)
Minicurso Introdução ao FRBR e ao RDA (SNBU 2014, Belo Horizonte)Minicurso Introdução ao FRBR e ao RDA (SNBU 2014, Belo Horizonte)
Minicurso Introdução ao FRBR e ao RDA (SNBU 2014, Belo Horizonte)Fabrício Silva Assumpção
 
Data visualization using R
Data visualization using RData visualization using R
Data visualization using RUmmiya Mohammedi
 
Secrets of the Library Catalog (MARC, metadata, cataloging, RDA)
Secrets of the Library Catalog (MARC, metadata, cataloging, RDA)Secrets of the Library Catalog (MARC, metadata, cataloging, RDA)
Secrets of the Library Catalog (MARC, metadata, cataloging, RDA)robin fay
 

Tendances (20)

Call Numbers
Call NumbersCall Numbers
Call Numbers
 
Obras de referência
Obras de referênciaObras de referência
Obras de referência
 
Knowledge Organization Systems
Knowledge Organization SystemsKnowledge Organization Systems
Knowledge Organization Systems
 
Text clustering
Text clusteringText clustering
Text clustering
 
Minicurso - Catalogação em RDA
Minicurso - Catalogação em RDAMinicurso - Catalogação em RDA
Minicurso - Catalogação em RDA
 
Haystack 2018 - Algorithmic Extraction of Keywords Concepts and Vocabularies
Haystack 2018 - Algorithmic Extraction of Keywords Concepts and VocabulariesHaystack 2018 - Algorithmic Extraction of Keywords Concepts and Vocabularies
Haystack 2018 - Algorithmic Extraction of Keywords Concepts and Vocabularies
 
hands on: Text Mining With R
hands on: Text Mining With Rhands on: Text Mining With R
hands on: Text Mining With R
 
How to write a report
How to write a reportHow to write a report
How to write a report
 
Semantic web meetup – sparql tutorial
Semantic web meetup – sparql tutorialSemantic web meetup – sparql tutorial
Semantic web meetup – sparql tutorial
 
Le classement des livres documentaires
Le classement des livres documentairesLe classement des livres documentaires
Le classement des livres documentaires
 
Ontology and Ontology Libraries: a Critical Study
Ontology and Ontology Libraries: a Critical StudyOntology and Ontology Libraries: a Critical Study
Ontology and Ontology Libraries: a Critical Study
 
Parts of Speect Tagging
Parts of Speect TaggingParts of Speect Tagging
Parts of Speect Tagging
 
Statistical machine translation
Statistical machine translationStatistical machine translation
Statistical machine translation
 
Лекция 4: Стек. Очередь
Лекция 4: Стек. ОчередьЛекция 4: Стек. Очередь
Лекция 4: Стек. Очередь
 
Minicurso Introdução ao FRBR e ao RDA (SNBU 2014, Belo Horizonte)
Minicurso Introdução ao FRBR e ao RDA (SNBU 2014, Belo Horizonte)Minicurso Introdução ao FRBR e ao RDA (SNBU 2014, Belo Horizonte)
Minicurso Introdução ao FRBR e ao RDA (SNBU 2014, Belo Horizonte)
 
Data Management in R
Data Management in RData Management in R
Data Management in R
 
Data visualization using R
Data visualization using RData visualization using R
Data visualization using R
 
Secrets of the Library Catalog (MARC, metadata, cataloging, RDA)
Secrets of the Library Catalog (MARC, metadata, cataloging, RDA)Secrets of the Library Catalog (MARC, metadata, cataloging, RDA)
Secrets of the Library Catalog (MARC, metadata, cataloging, RDA)
 
BIBFRAME
BIBFRAMEBIBFRAME
BIBFRAME
 
NLP_KASHK:Text Normalization
NLP_KASHK:Text NormalizationNLP_KASHK:Text Normalization
NLP_KASHK:Text Normalization
 

En vedette

Электронные корпуса
Электронные корпусаЭлектронные корпуса
Электронные корпусаanna_pal
 
Проектирование корпусов
Проектирование корпусовПроектирование корпусов
Проектирование корпусовArtem Lukanin
 
Корпусная лингвистика: Проект открытый корпус и применение в народном хозяйстве
Корпусная лингвистика: Проект открытый корпус и применение в народном хозяйствеКорпусная лингвистика: Проект открытый корпус и применение в народном хозяйстве
Корпусная лингвистика: Проект открытый корпус и применение в народном хозяйствеWitology
 
Основные понятия корпусной лингвистики
Основные понятия корпусной лингвистикиОсновные понятия корпусной лингвистики
Основные понятия корпусной лингвистикиArtem Lukanin
 
Классификация корпусов
Классификация корпусовКлассификация корпусов
Классификация корпусовArtem Lukanin
 
дистанционное обучение в корпоративном формате
дистанционное обучение в корпоративном форматедистанционное обучение в корпоративном формате
дистанционное обучение в корпоративном форматеИрина Слуцкая
 

En vedette (20)

Панфилов. Корпусы текстов и принципы их создания
Панфилов. Корпусы текстов и принципы их созданияПанфилов. Корпусы текстов и принципы их создания
Панфилов. Корпусы текстов и принципы их создания
 
Электронные корпуса
Электронные корпусаЭлектронные корпуса
Электронные корпуса
 
Проектирование корпусов
Проектирование корпусовПроектирование корпусов
Проектирование корпусов
 
Корпусная лингвистика: Проект открытый корпус и применение в народном хозяйстве
Корпусная лингвистика: Проект открытый корпус и применение в народном хозяйствеКорпусная лингвистика: Проект открытый корпус и применение в народном хозяйстве
Корпусная лингвистика: Проект открытый корпус и применение в народном хозяйстве
 
Основные понятия корпусной лингвистики
Основные понятия корпусной лингвистикиОсновные понятия корпусной лингвистики
Основные понятия корпусной лингвистики
 
Багдатов Методы автоматического выявления плагиата в текстах компьютерных про...
Багдатов Методы автоматического выявления плагиата в текстах компьютерных про...Багдатов Методы автоматического выявления плагиата в текстах компьютерных про...
Багдатов Методы автоматического выявления плагиата в текстах компьютерных про...
 
Баев Системы для обучения программированию
Баев Системы для обучения программированиюБаев Системы для обучения программированию
Баев Системы для обучения программированию
 
Савостин. Системы и методы научного поиска и мониторинга
Савостин. Системы и методы научного поиска и мониторингаСавостин. Системы и методы научного поиска и мониторинга
Савостин. Системы и методы научного поиска и мониторинга
 
Лукьяненко. Извлечение коллокаций из текста
Лукьяненко. Извлечение коллокаций из текстаЛукьяненко. Извлечение коллокаций из текста
Лукьяненко. Извлечение коллокаций из текста
 
Можарова Тематические модели: учет сходства между униграммами и биграммами.
Можарова Тематические модели: учет сходства между униграммами и биграммами.Можарова Тематические модели: учет сходства между униграммами и биграммами.
Можарова Тематические модели: учет сходства между униграммами и биграммами.
 
Иванов. Автоматизация построения предметных указателей
Иванов. Автоматизация построения предметных указателейИванов. Автоматизация построения предметных указателей
Иванов. Автоматизация построения предметных указателей
 
Савкуев. Построение формального описания фотографий на основе контекстно-собы...
Савкуев. Построение формального описания фотографий на основе контекстно-собы...Савкуев. Построение формального описания фотографий на основе контекстно-собы...
Савкуев. Построение формального описания фотографий на основе контекстно-собы...
 
Котиков Простые методы выделения ключевых слов и построения рефератов
Котиков Простые методы выделения ключевых слов и построения рефератовКотиков Простые методы выделения ключевых слов и построения рефератов
Котиков Простые методы выделения ключевых слов и построения рефератов
 
Муромцев. Обзор библиографических менеджеров
Муромцев. Обзор библиографических менеджеровМуромцев. Обзор библиографических менеджеров
Муромцев. Обзор библиографических менеджеров
 
Тодуа. Сериализация и язык YAML
Тодуа. Сериализация и язык YAMLТодуа. Сериализация и язык YAML
Тодуа. Сериализация и язык YAML
 
Смолина Пользовательские интерфейсы систем лингвистической разметки текстов
Смолина Пользовательские интерфейсы систем лингвистической разметки текстовСмолина Пользовательские интерфейсы систем лингвистической разметки текстов
Смолина Пользовательские интерфейсы систем лингвистической разметки текстов
 
Мищенко. Методы автоматического определения наиболее частотного значения слова.
Мищенко. Методы автоматического определения наиболее частотного значения слова.Мищенко. Методы автоматического определения наиболее частотного значения слова.
Мищенко. Методы автоматического определения наиболее частотного значения слова.
 
Классификация корпусов
Классификация корпусовКлассификация корпусов
Классификация корпусов
 
Смирнова. Методы исправления ошибок в текстах, написанных иностранцами.
Смирнова. Методы исправления ошибок в текстах, написанных иностранцами.Смирнова. Методы исправления ошибок в текстах, написанных иностранцами.
Смирнова. Методы исправления ошибок в текстах, написанных иностранцами.
 
дистанционное обучение в корпоративном формате
дистанционное обучение в корпоративном форматедистанционное обучение в корпоративном формате
дистанционное обучение в корпоративном формате
 

Similaire à Языковые корпуса

Особые корпусы текстов
Особые корпусы текстовОсобые корпусы текстов
Особые корпусы текстовArtem Lukanin
 
львова о в лингвистические корпусы
львова о в лингвистические корпусыльвова о в лингвистические корпусы
львова о в лингвистические корпусыmetodika
 
Электронные корпусы как основа словарей современного английского языка
Электронные корпусы как основа словарей современного английского языкаЭлектронные корпусы как основа словарей современного английского языка
Электронные корпусы как основа словарей современного английского языкаYevgeniya Grigoryeva
 
«Зачем», «что» и «как» в исследовании коллокаций.
«Зачем», «что» и «как» в исследовании коллокаций. «Зачем», «что» и «как» в исследовании коллокаций.
«Зачем», «что» и «как» в исследовании коллокаций. Lidia Pivovarova
 
Ontology and Text Alalize
Ontology and Text AlalizeOntology and Text Alalize
Ontology and Text AlalizeOchirov Tsyren
 
Словари словосочетаний
Словари словосочетанийСловари словосочетаний
Словари словосочетанийYevgeniya Grigoryeva
 
17.03 большакова
17.03 большакова17.03 большакова
17.03 большаковаNatalia Ostapuk
 
Корпусная лингвистика
Корпусная лингвистикаКорпусная лингвистика
Корпусная лингвистикаNadezhda Smolko
 
АОТ - Введение
АОТ - ВведениеАОТ - Введение
АОТ - Введениеeibolshakova
 
Лексический уровень языка в РКИ
Лексический уровень языка в РКИЛексический уровень языка в РКИ
Лексический уровень языка в РКИAndrey Kuznetsov
 
Проблема классификации словарей
Проблема классификации словарейПроблема классификации словарей
Проблема классификации словарейYevgeniya Grigoryeva
 
Понятие лексикографии
Понятие лексикографииПонятие лексикографии
Понятие лексикографииArtem Lukanin
 
4 встреча — Компьютерная лингвистика (А. Катинская)
4 встреча — Компьютерная лингвистика (А. Катинская)4 встреча — Компьютерная лингвистика (А. Катинская)
4 встреча — Компьютерная лингвистика (А. Катинская)Smolensk Computer Science Club
 
Использование ИКТ инструментов в обучении лексике. Наталья Катасонова.28.07.10
Использование ИКТ инструментов в обучении лексике. Наталья Катасонова.28.07.10Использование ИКТ инструментов в обучении лексике. Наталья Катасонова.28.07.10
Использование ИКТ инструментов в обучении лексике. Наталья Катасонова.28.07.10Сообщество eLearning PRO
 

Similaire à Языковые корпуса (20)

Особые корпусы текстов
Особые корпусы текстовОсобые корпусы текстов
Особые корпусы текстов
 
презентация1
презентация1презентация1
презентация1
 
львова о в лингвистические корпусы
львова о в лингвистические корпусыльвова о в лингвистические корпусы
львова о в лингвистические корпусы
 
компьютерная лексикография
компьютерная лексикографиякомпьютерная лексикография
компьютерная лексикография
 
Электронные корпусы как основа словарей современного английского языка
Электронные корпусы как основа словарей современного английского языкаЭлектронные корпусы как основа словарей современного английского языка
Электронные корпусы как основа словарей современного английского языка
 
«Зачем», «что» и «как» в исследовании коллокаций.
«Зачем», «что» и «как» в исследовании коллокаций. «Зачем», «что» и «как» в исследовании коллокаций.
«Зачем», «что» и «как» в исследовании коллокаций.
 
Ontology and Text Alalize
Ontology and Text AlalizeOntology and Text Alalize
Ontology and Text Alalize
 
Словари словосочетаний
Словари словосочетанийСловари словосочетаний
Словари словосочетаний
 
Словари терминов
Словари терминовСловари терминов
Словари терминов
 
17.03 большакова
17.03 большакова17.03 большакова
17.03 большакова
 
Корпусная лингвистика
Корпусная лингвистикаКорпусная лингвистика
Корпусная лингвистика
 
АОТ - Введение
АОТ - ВведениеАОТ - Введение
АОТ - Введение
 
Лексический уровень языка в РКИ
Лексический уровень языка в РКИЛексический уровень языка в РКИ
Лексический уровень языка в РКИ
 
Проблема классификации словарей
Проблема классификации словарейПроблема классификации словарей
Проблема классификации словарей
 
Понятие лексикографии
Понятие лексикографииПонятие лексикографии
Понятие лексикографии
 
Извлечение перевожных эквивалентов из параллельных корпусов
Извлечение перевожных эквивалентов из параллельных корпусовИзвлечение перевожных эквивалентов из параллельных корпусов
Извлечение перевожных эквивалентов из параллельных корпусов
 
4 встреча — Компьютерная лингвистика (А. Катинская)
4 встреча — Компьютерная лингвистика (А. Катинская)4 встреча — Компьютерная лингвистика (А. Катинская)
4 встреча — Компьютерная лингвистика (А. Катинская)
 
P2 ozo kav
P2 ozo kavP2 ozo kav
P2 ozo kav
 
Использование ИКТ инструментов в обучении лексике. Наталья Катасонова.28.07.10
Использование ИКТ инструментов в обучении лексике. Наталья Катасонова.28.07.10Использование ИКТ инструментов в обучении лексике. Наталья Катасонова.28.07.10
Использование ИКТ инструментов в обучении лексике. Наталья Катасонова.28.07.10
 
лингвонтол
лингвонтоллингвонтол
лингвонтол
 

Plus de Спецсеминар "Искусственный Интеллект" кафедры АЯ ВМК МГУ

Plus de Спецсеминар "Искусственный Интеллект" кафедры АЯ ВМК МГУ (16)

Баев. Поиск шаблонов и машинное обучение для демографических событий (Pattern...
Баев. Поиск шаблонов и машинное обучение для демографических событий (Pattern...Баев. Поиск шаблонов и машинное обучение для демографических событий (Pattern...
Баев. Поиск шаблонов и машинное обучение для демографических событий (Pattern...
 
Муромцев. Методы анализа социальных графов и поиска сообществ
Муромцев. Методы анализа социальных графов и поиска сообществМуромцев. Методы анализа социальных графов и поиска сообществ
Муромцев. Методы анализа социальных графов и поиска сообществ
 
Рой. Аспектный анализ тональности отзывов
Рой. Аспектный анализ тональности отзывов Рой. Аспектный анализ тональности отзывов
Рой. Аспектный анализ тональности отзывов
 
Можарова. Автоматическое извлечение именованных сущностей методами машинного ...
Можарова. Автоматическое извлечение именованных сущностей методами машинного ...Можарова. Автоматическое извлечение именованных сущностей методами машинного ...
Можарова. Автоматическое извлечение именованных сущностей методами машинного ...
 
Сапин. Интеллектуальные агенты и обучение с подкреплением
Сапин. Интеллектуальные агенты и обучение с подкреплениемСапин. Интеллектуальные агенты и обучение с подкреплением
Сапин. Интеллектуальные агенты и обучение с подкреплением
 
Мадорский. Извлечение тематически сгруппированных ключевых терминов из тексто...
Мадорский. Извлечение тематически сгруппированных ключевых терминов из тексто...Мадорский. Извлечение тематически сгруппированных ключевых терминов из тексто...
Мадорский. Извлечение тематически сгруппированных ключевых терминов из тексто...
 
Иванов. Модель Belief-Desire-Intention (BDI)
Иванов. Модель Belief-Desire-Intention (BDI)Иванов. Модель Belief-Desire-Intention (BDI)
Иванов. Модель Belief-Desire-Intention (BDI)
 
Тодуа. Методы разработки интерпретатора языка Рефал-2
Тодуа. Методы разработки интерпретатора языка Рефал-2Тодуа. Методы разработки интерпретатора языка Рефал-2
Тодуа. Методы разработки интерпретатора языка Рефал-2
 
смирнов Data mining
смирнов Data miningсмирнов Data mining
смирнов Data mining
 
рогова обзор средств поддержки обучения программированию
рогова обзор средств поддержки обучения программированиюрогова обзор средств поддержки обучения программированию
рогова обзор средств поддержки обучения программированию
 
курышев рекомендательные системы
курышев рекомендательные системыкурышев рекомендательные системы
курышев рекомендательные системы
 
куликов Sketch engine ord
куликов Sketch engine ordкуликов Sketch engine ord
куликов Sketch engine ord
 
кулагин поиск близких по смыслу языковых выражений
кулагин поиск близких по смыслу языковых выраженийкулагин поиск близких по смыслу языковых выражений
кулагин поиск близких по смыслу языковых выражений
 
иванов анализ речевых команд
иванов анализ речевых командиванов анализ речевых команд
иванов анализ речевых команд
 
борисенкова методы визуализации для анализа зависящих от времени данных
борисенкова методы визуализации для анализа зависящих от времени данныхборисенкова методы визуализации для анализа зависящих от времени данных
борисенкова методы визуализации для анализа зависящих от времени данных
 
бицоев сравнение систем анализа тональности на русском языке
бицоев сравнение систем анализа тональности на русском языкебицоев сравнение систем анализа тональности на русском языке
бицоев сравнение систем анализа тональности на русском языке
 

Языковые корпуса