SlideShare une entreprise Scribd logo
1  sur  35
Машинный перевод Лидия Михайловна Пивоварова Системы понимания текста
Введенние ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Сожержание ,[object Object],[object Object],[object Object],[object Object]
Правила  vs . статистика Информационное сообщение: Документ:
Перевод по правилам ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Представляет собой «классический» подход к МП,  реализован в большинстве современных систем автоматического или автоматизированного перевода, в т.ч. в ПРОМТ,  SYSTRAN, Linguatec . ,[object Object],[object Object],[object Object],[object Object]
Статистический МП ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],На данный момент статистический МП реализован только в  некоммерческой системе  on-line  перевода  Google translate Достоинства: для улучшения качества перевода достаточно добавлять массивы параллельных текстов, дополнительная работа лингвистов  или программистов не требуется
Сожержание ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Основные подходы ,[object Object]
Сожержание ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Прямой перевод ,[object Object],[object Object],[object Object],[object Object],Текст на исходном языке Морфологический анализ Перевод лексики (двуязычный словарь) Переупорядочивание Синтез морфологии Текст на целевом языке
Правила
Прямой перевод ,[object Object],[object Object],[object Object],[object Object]
Слишком простая модель
Содержание ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Система типа  TRANSFER Предложение на языке входа Структура для языка входа Структура для языка выхода Предложение на языке выхода анализ TRANSFER синтез
Основные идеи ,[object Object],[object Object],[object Object],[object Object],[object Object]
Правила
Трансфер лексики ,[object Object],[object Object],[object Object]
Пример:  SYSTRAN ,[object Object],[object Object],[object Object],[object Object],[object Object]
SYSTRAN:  комбинация прямого перевода и трансфера ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
[object Object],[object Object],[object Object],[object Object],[object Object],Пример: ПРОМТ
[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],Промт: трансфер на разных уронях
Словари ,[object Object],[object Object],[object Object],[object Object]
Трансфер ,[object Object],[object Object],[object Object]
Содержание ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Система типа  INTERLINGUA Предложение на языке входа Метаструктура для языка входа  == Метаструктура для языка выхода Предложение на языке выхода анализ синтез ,[object Object],[object Object]
Transfer vs. interlingua
Сожержание ,[object Object],[object Object],[object Object],[object Object]
Статистический перевод ,[object Object],[object Object],[object Object],[object Object],[object Object]
Вероятностная модель ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Языковая модель  ,[object Object],[object Object],[object Object]
Модель перевода ,[object Object],[object Object],[object Object]
Содержание ,[object Object],[object Object],[object Object],[object Object]
Bilingual Evaluation Understudy (BLEU) ,[object Object],[object Object],[object Object]
Источники ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Contenu connexe

Tendances

Максим Литвинов
Максим ЛитвиновМаксим Литвинов
Максим ЛитвиновLidia Pivovarova
 
АОТ - Предсинтаксис
АОТ - ПредсинтаксисАОТ - Предсинтаксис
АОТ - Предсинтаксисeibolshakova
 
Speech technologies
Speech technologiesSpeech technologies
Speech technologiesNLPseminar
 
В.Ф.Спиридонов "Психология языка, или почему психологи так плохо различают ба...
В.Ф.Спиридонов "Психология языка, или почему психологи так плохо различают ба...В.Ф.Спиридонов "Психология языка, или почему психологи так плохо различают ба...
В.Ф.Спиридонов "Психология языка, или почему психологи так плохо различают ба...ЗПШ СПбГУ
 
Лингвистические свойства переводов (на материале RusLTC)
Лингвистические свойства переводов (на материале RusLTC)Лингвистические свойства переводов (на материале RusLTC)
Лингвистические свойства переводов (на материале RusLTC)Maria Kunilovskaya
 
Lecture1
Lecture1Lecture1
Lecture1esuesu
 
SentiScan: система автоматической разметки тональности в social media
SentiScan: система автоматической разметки тональности в social mediaSentiScan: система автоматической разметки тональности в social media
SentiScan: система автоматической разметки тональности в social mediaDmitry Kan
 
Презентация PROMT для РИТ
Презентация PROMT для РИТПрезентация PROMT для РИТ
Презентация PROMT для РИТQPsoft
 
гибридная технология перевода. юлия епифанцева. зал.4
гибридная технология перевода. юлия епифанцева. зал.4гибридная технология перевода. юлия епифанцева. зал.4
гибридная технология перевода. юлия епифанцева. зал.4rit2011
 
Data Science Weekend 2017. Segmento, На пути к идеальной диалоговой системе
Data Science Weekend 2017.  Segmento, На пути к идеальной диалоговой системеData Science Weekend 2017.  Segmento, На пути к идеальной диалоговой системе
Data Science Weekend 2017. Segmento, На пути к идеальной диалоговой системеNewprolab
 
07 автоматическое реферирование
07 автоматическое реферирование07 автоматическое реферирование
07 автоматическое реферированиеLidia Pivovarova
 
Question Classification by Fedor Vityugin
Question Classification by Fedor VityuginQuestion Classification by Fedor Vityugin
Question Classification by Fedor VityuginFedor
 
Идентификация уровня ложности текста и его адаптация
Идентификация уровня ложности текста и его адаптацияИдентификация уровня ложности текста и его адаптация
Идентификация уровня ложности текста и его адаптацияNikolay Karpov
 
Сбор, анализ, обработка текстовой информации
Сбор, анализ, обработка текстовой информацииСбор, анализ, обработка текстовой информации
Сбор, анализ, обработка текстовой информацииIlia Karpov
 

Tendances (20)

Максим Литвинов
Максим ЛитвиновМаксим Литвинов
Максим Литвинов
 
АОТ - Предсинтаксис
АОТ - ПредсинтаксисАОТ - Предсинтаксис
АОТ - Предсинтаксис
 
Speech technologies
Speech technologiesSpeech technologies
Speech technologies
 
В.Ф.Спиридонов "Психология языка, или почему психологи так плохо различают ба...
В.Ф.Спиридонов "Психология языка, или почему психологи так плохо различают ба...В.Ф.Спиридонов "Психология языка, или почему психологи так плохо различают ба...
В.Ф.Спиридонов "Психология языка, или почему психологи так плохо различают ба...
 
Лингвистические свойства переводов (на материале RusLTC)
Лингвистические свойства переводов (на материале RusLTC)Лингвистические свойства переводов (на материале RusLTC)
Лингвистические свойства переводов (на материале RusLTC)
 
Lecture1
Lecture1Lecture1
Lecture1
 
SentiScan: система автоматической разметки тональности в social media
SentiScan: система автоматической разметки тональности в social mediaSentiScan: система автоматической разметки тональности в social media
SentiScan: система автоматической разметки тональности в social media
 
Извлечение знаний и фактов из текстов
Извлечение знаний и фактов из текстовИзвлечение знаний и фактов из текстов
Извлечение знаний и фактов из текстов
 
Методы морфологического анализа текстов
Методы морфологического анализа текстовМетоды морфологического анализа текстов
Методы морфологического анализа текстов
 
Мищенко. Методы автоматического определения наиболее частотного значения слова.
Мищенко. Методы автоматического определения наиболее частотного значения слова.Мищенко. Методы автоматического определения наиболее частотного значения слова.
Мищенко. Методы автоматического определения наиболее частотного значения слова.
 
Презентация PROMT для РИТ
Презентация PROMT для РИТПрезентация PROMT для РИТ
Презентация PROMT для РИТ
 
гибридная технология перевода. юлия епифанцева. зал.4
гибридная технология перевода. юлия епифанцева. зал.4гибридная технология перевода. юлия епифанцева. зал.4
гибридная технология перевода. юлия епифанцева. зал.4
 
Data Science Weekend 2017. Segmento, На пути к идеальной диалоговой системе
Data Science Weekend 2017.  Segmento, На пути к идеальной диалоговой системеData Science Weekend 2017.  Segmento, На пути к идеальной диалоговой системе
Data Science Weekend 2017. Segmento, На пути к идеальной диалоговой системе
 
Комбинирование факторов для разрешения референции местоимений
Комбинирование факторов для разрешения референции местоименийКомбинирование факторов для разрешения референции местоимений
Комбинирование факторов для разрешения референции местоимений
 
07 автоматическое реферирование
07 автоматическое реферирование07 автоматическое реферирование
07 автоматическое реферирование
 
Question Classification by Fedor Vityugin
Question Classification by Fedor VityuginQuestion Classification by Fedor Vityugin
Question Classification by Fedor Vityugin
 
Идентификация уровня ложности текста и его адаптация
Идентификация уровня ложности текста и его адаптацияИдентификация уровня ложности текста и его адаптация
Идентификация уровня ложности текста и его адаптация
 
Реализация метода автоматического разрешения лексической многозначности
Реализация метода автоматического разрешения лексической многозначностиРеализация метода автоматического разрешения лексической многозначности
Реализация метода автоматического разрешения лексической многозначности
 
Можарова Тематические модели: учет сходства между униграммами и биграммами.
Можарова Тематические модели: учет сходства между униграммами и биграммами.Можарова Тематические модели: учет сходства между униграммами и биграммами.
Можарова Тематические модели: учет сходства между униграммами и биграммами.
 
Сбор, анализ, обработка текстовой информации
Сбор, анализ, обработка текстовой информацииСбор, анализ, обработка текстовой информации
Сбор, анализ, обработка текстовой информации
 

En vedette

машинный перевод
машинный переводмашинный перевод
машинный переводkaterinazelenko
 
статистический машинный перевод
статистический машинный переводстатистический машинный перевод
статистический машинный переводBorsalinoArt
 
Ag Systran 2008 04 26
Ag Systran 2008 04 26Ag Systran 2008 04 26
Ag Systran 2008 04 26NLPseminar
 
彩畫威尼斯Venice
彩畫威尼斯Venice彩畫威尼斯Venice
彩畫威尼斯Venicenonnon
 
La3 Intranet
La3 IntranetLa3 Intranet
La3 IntranetCma Mohd
 
онтологии верхнего уровня
онтологии верхнего уровняонтологии верхнего уровня
онтологии верхнего уровняLidia Pivovarova
 
La2 Software1
La2 Software1La2 Software1
La2 Software1Cma Mohd
 
Social Media Class Baarn - 151112
Social Media Class Baarn - 151112Social Media Class Baarn - 151112
Social Media Class Baarn - 151112Peter Wiegman
 
Relevant Quotes: Smart Folk
Relevant Quotes: Smart FolkRelevant Quotes: Smart Folk
Relevant Quotes: Smart FolkJon Gatrell
 
The Foretold Prophet
The  Foretold  ProphetThe  Foretold  Prophet
The Foretold ProphetZAKIR
 
Funny Photo of kids
Funny Photo of kidsFunny Photo of kids
Funny Photo of kidsnonnon
 
Beautiful Bridges
Beautiful BridgesBeautiful Bridges
Beautiful Bridgessanctuary
 

En vedette (20)

машинный перевод
машинный переводмашинный перевод
машинный перевод
 
статистический машинный перевод
статистический машинный переводстатистический машинный перевод
статистический машинный перевод
 
Heart Intro
Heart IntroHeart Intro
Heart Intro
 
Ag Systran 2008 04 26
Ag Systran 2008 04 26Ag Systran 2008 04 26
Ag Systran 2008 04 26
 
彩畫威尼斯Venice
彩畫威尼斯Venice彩畫威尼斯Venice
彩畫威尼斯Venice
 
La3 Intranet
La3 IntranetLa3 Intranet
La3 Intranet
 
Kuznetcov
KuznetcovKuznetcov
Kuznetcov
 
онтологии верхнего уровня
онтологии верхнего уровняонтологии верхнего уровня
онтологии верхнего уровня
 
La2 Software1
La2 Software1La2 Software1
La2 Software1
 
INFORED RURAL
INFORED RURALINFORED RURAL
INFORED RURAL
 
Social Media Class Baarn - 151112
Social Media Class Baarn - 151112Social Media Class Baarn - 151112
Social Media Class Baarn - 151112
 
Olympic Games
Olympic GamesOlympic Games
Olympic Games
 
Relevant Quotes: Smart Folk
Relevant Quotes: Smart FolkRelevant Quotes: Smart Folk
Relevant Quotes: Smart Folk
 
The Foretold Prophet
The  Foretold  ProphetThe  Foretold  Prophet
The Foretold Prophet
 
Funny Photo of kids
Funny Photo of kidsFunny Photo of kids
Funny Photo of kids
 
Eprom Pop Tech
Eprom Pop TechEprom Pop Tech
Eprom Pop Tech
 
Beautiful Bridges
Beautiful BridgesBeautiful Bridges
Beautiful Bridges
 
2007p&o1milieu
2007p&o1milieu2007p&o1milieu
2007p&o1milieu
 
PLC-Ideas
PLC-IdeasPLC-Ideas
PLC-Ideas
 
Puls Russian
Puls RussianPuls Russian
Puls Russian
 

Similaire à 08 машинный перевод

презентация технологии машинного перевода и Soylem net
презентация технологии машинного перевода и Soylem netпрезентация технологии машинного перевода и Soylem net
презентация технологии машинного перевода и Soylem netBerik Badayev
 
Query expansion
Query expansionQuery expansion
Query expansionNLPseminar
 
Fact Extraction (ideograph)
Fact Extraction (ideograph)Fact Extraction (ideograph)
Fact Extraction (ideograph)NLPseminar
 
molchanov(promt)
molchanov(promt)molchanov(promt)
molchanov(promt)NLPseminar
 
Presentation deja vu_x_animated_05-02-20010_gm
Presentation deja vu_x_animated_05-02-20010_gmPresentation deja vu_x_animated_05-02-20010_gm
Presentation deja vu_x_animated_05-02-20010_gmGeorgiy Moiseenko
 
машинный перевод
машинный переводмашинный перевод
машинный переводkaterinazelenko
 
01 информационный поиск
01 информационный поиск01 информационный поиск
01 информационный поискLidia Pivovarova
 
Translation and corpus linguistics
Translation and corpus linguisticsTranslation and corpus linguistics
Translation and corpus linguisticsmaarudneva
 
Распределенная статистическая система машинного перевода (Distributed statist...
Распределенная статистическая система машинного перевода (Distributed statist...Распределенная статистическая система машинного перевода (Distributed statist...
Распределенная статистическая система машинного перевода (Distributed statist...Ilya Nikitin
 
FOSS Sea 2014_Текстовый анализ на R: подбор рекомендаций для книжного магазина
FOSS Sea 2014_Текстовый анализ на R: подбор рекомендаций для книжного магазина FOSS Sea 2014_Текстовый анализ на R: подбор рекомендаций для книжного магазина
FOSS Sea 2014_Текстовый анализ на R: подбор рекомендаций для книжного магазина GeeksLab Odessa
 
Системы автоматического синтеза речи
Системы автоматического синтеза речиСистемы автоматического синтеза речи
Системы автоматического синтеза речиArtem Lukanin
 
04 извлечение информации
04 извлечение информации04 извлечение информации
04 извлечение информацииLidia Pivovarova
 
PEMT: практические вопросы для переводчиков и редакторов
PEMT: практические вопросы для переводчиков и редакторов PEMT: практические вопросы для переводчиков и редакторов
PEMT: практические вопросы для переводчиков и редакторов Tetyana Struk TrainStation
 

Similaire à 08 машинный перевод (20)

презентация технологии машинного перевода и Soylem net
презентация технологии машинного перевода и Soylem netпрезентация технологии машинного перевода и Soylem net
презентация технологии машинного перевода и Soylem net
 
Query expansion
Query expansionQuery expansion
Query expansion
 
Авиком
АвикомАвиком
Авиком
 
Fact Extraction (ideograph)
Fact Extraction (ideograph)Fact Extraction (ideograph)
Fact Extraction (ideograph)
 
Promt
PromtPromt
Promt
 
Извлечение терминологических словосочетаний из текстов
Извлечение терминологических словосочетаний из текстовИзвлечение терминологических словосочетаний из текстов
Извлечение терминологических словосочетаний из текстов
 
molchanov(promt)
molchanov(promt)molchanov(promt)
molchanov(promt)
 
Stolyarov
StolyarovStolyarov
Stolyarov
 
Presentation deja vu_x_animated_05-02-20010_gm
Presentation deja vu_x_animated_05-02-20010_gmPresentation deja vu_x_animated_05-02-20010_gm
Presentation deja vu_x_animated_05-02-20010_gm
 
машинный перевод
машинный переводмашинный перевод
машинный перевод
 
Lande, Jigalo
Lande, JigaloLande, Jigalo
Lande, Jigalo
 
01 информационный поиск
01 информационный поиск01 информационный поиск
01 информационный поиск
 
Translation and corpus linguistics
Translation and corpus linguisticsTranslation and corpus linguistics
Translation and corpus linguistics
 
Распределенная статистическая система машинного перевода (Distributed statist...
Распределенная статистическая система машинного перевода (Distributed statist...Распределенная статистическая система машинного перевода (Distributed statist...
Распределенная статистическая система машинного перевода (Distributed statist...
 
FOSS Sea 2014_Текстовый анализ на R: подбор рекомендаций для книжного магазина
FOSS Sea 2014_Текстовый анализ на R: подбор рекомендаций для книжного магазина FOSS Sea 2014_Текстовый анализ на R: подбор рекомендаций для книжного магазина
FOSS Sea 2014_Текстовый анализ на R: подбор рекомендаций для книжного магазина
 
Системы автоматического синтеза речи
Системы автоматического синтеза речиСистемы автоматического синтеза речи
Системы автоматического синтеза речи
 
Проблемы автоматической рубрикации текстов
Проблемы автоматической рубрикации текстовПроблемы автоматической рубрикации текстов
Проблемы автоматической рубрикации текстов
 
04 извлечение информации
04 извлечение информации04 извлечение информации
04 извлечение информации
 
PEMT: практические вопросы для переводчиков и редакторов
PEMT: практические вопросы для переводчиков и редакторов PEMT: практические вопросы для переводчиков и редакторов
PEMT: практические вопросы для переводчиков и редакторов
 
Механизмы обеспечения связности в системах динамической генерации текстов
Механизмы обеспечения связности в системах динамической генерации текстовМеханизмы обеспечения связности в системах динамической генерации текстов
Механизмы обеспечения связности в системах динамической генерации текстов
 

Plus de Lidia Pivovarova

Classification and clustering in media monitoring: from knowledge engineering...
Classification and clustering in media monitoring: from knowledge engineering...Classification and clustering in media monitoring: from knowledge engineering...
Classification and clustering in media monitoring: from knowledge engineering...Lidia Pivovarova
 
Convolutional neural networks for text classification
Convolutional neural networks for text classificationConvolutional neural networks for text classification
Convolutional neural networks for text classificationLidia Pivovarova
 
Grouping business news stories based on salience of named entities
Grouping business news stories based on salience of named entitiesGrouping business news stories based on salience of named entities
Grouping business news stories based on salience of named entitiesLidia Pivovarova
 
Интеллектуальный анализ текста
Интеллектуальный анализ текстаИнтеллектуальный анализ текста
Интеллектуальный анализ текстаLidia Pivovarova
 
AINL 2016: Bodrunova, Blekanov, Maksimov
AINL 2016: Bodrunova, Blekanov, MaksimovAINL 2016: Bodrunova, Blekanov, Maksimov
AINL 2016: Bodrunova, Blekanov, MaksimovLidia Pivovarova
 
AINL 2016: Rykov, Nagornyy, Koltsova, Natta, Kremenets, Manovich, Cerrone, Cr...
AINL 2016: Rykov, Nagornyy, Koltsova, Natta, Kremenets, Manovich, Cerrone, Cr...AINL 2016: Rykov, Nagornyy, Koltsova, Natta, Kremenets, Manovich, Cerrone, Cr...
AINL 2016: Rykov, Nagornyy, Koltsova, Natta, Kremenets, Manovich, Cerrone, Cr...Lidia Pivovarova
 
AINL 2016: Shavrina, Selegey
AINL 2016: Shavrina, SelegeyAINL 2016: Shavrina, Selegey
AINL 2016: Shavrina, SelegeyLidia Pivovarova
 

Plus de Lidia Pivovarova (20)

Classification and clustering in media monitoring: from knowledge engineering...
Classification and clustering in media monitoring: from knowledge engineering...Classification and clustering in media monitoring: from knowledge engineering...
Classification and clustering in media monitoring: from knowledge engineering...
 
Convolutional neural networks for text classification
Convolutional neural networks for text classificationConvolutional neural networks for text classification
Convolutional neural networks for text classification
 
Grouping business news stories based on salience of named entities
Grouping business news stories based on salience of named entitiesGrouping business news stories based on salience of named entities
Grouping business news stories based on salience of named entities
 
Интеллектуальный анализ текста
Интеллектуальный анализ текстаИнтеллектуальный анализ текста
Интеллектуальный анализ текста
 
AINL 2016: Yagunova
AINL 2016: YagunovaAINL 2016: Yagunova
AINL 2016: Yagunova
 
AINL 2016: Kuznetsova
AINL 2016: KuznetsovaAINL 2016: Kuznetsova
AINL 2016: Kuznetsova
 
AINL 2016: Bodrunova, Blekanov, Maksimov
AINL 2016: Bodrunova, Blekanov, MaksimovAINL 2016: Bodrunova, Blekanov, Maksimov
AINL 2016: Bodrunova, Blekanov, Maksimov
 
AINL 2016: Boldyreva
AINL 2016: BoldyrevaAINL 2016: Boldyreva
AINL 2016: Boldyreva
 
AINL 2016: Rykov, Nagornyy, Koltsova, Natta, Kremenets, Manovich, Cerrone, Cr...
AINL 2016: Rykov, Nagornyy, Koltsova, Natta, Kremenets, Manovich, Cerrone, Cr...AINL 2016: Rykov, Nagornyy, Koltsova, Natta, Kremenets, Manovich, Cerrone, Cr...
AINL 2016: Rykov, Nagornyy, Koltsova, Natta, Kremenets, Manovich, Cerrone, Cr...
 
AINL 2016: Kozerenko
AINL 2016: Kozerenko AINL 2016: Kozerenko
AINL 2016: Kozerenko
 
AINL 2016: Shavrina, Selegey
AINL 2016: Shavrina, SelegeyAINL 2016: Shavrina, Selegey
AINL 2016: Shavrina, Selegey
 
AINL 2016: Khudobakhshov
AINL 2016: KhudobakhshovAINL 2016: Khudobakhshov
AINL 2016: Khudobakhshov
 
AINL 2016: Proncheva
AINL 2016: PronchevaAINL 2016: Proncheva
AINL 2016: Proncheva
 
AINL 2016:
AINL 2016: AINL 2016:
AINL 2016:
 
AINL 2016: Bugaychenko
AINL 2016: BugaychenkoAINL 2016: Bugaychenko
AINL 2016: Bugaychenko
 
AINL 2016: Grigorieva
AINL 2016: GrigorievaAINL 2016: Grigorieva
AINL 2016: Grigorieva
 
AINL 2016: Muravyov
AINL 2016: MuravyovAINL 2016: Muravyov
AINL 2016: Muravyov
 
AINL 2016: Just AI
AINL 2016: Just AIAINL 2016: Just AI
AINL 2016: Just AI
 
AINL 2016: Moskvichev
AINL 2016: MoskvichevAINL 2016: Moskvichev
AINL 2016: Moskvichev
 
AINL 2016: Goncharov
AINL 2016: GoncharovAINL 2016: Goncharov
AINL 2016: Goncharov
 

08 машинный перевод