SlideShare a Scribd company logo
1 of 14
Система понимания и перевода естественного языка  ABBYY Compreno Александр Костюченко ABBYY
Технологии  ABBYY ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Универсальная Семантическая Иерархия ,[object Object]
Универсальная Семантическая Иерархия
Универсальная Семантическая Иерархия
Универсальная Семантическая Иерархия
Синтаксис и его роль в разборе
Сложные связи в тексте
Применение технологии ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Использование компьютерной лингвистики для других прикладных задач ,[object Object],[object Object],[object Object],[object Object]
Факты о проекте ,[object Object],[object Object],[object Object],[object Object]
Факты о компании ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
[object Object],[object Object]
Вопросы ? Контактная информация : Александр Костюченко Менеджер проектов Департамент лингвистических технологий ABBYY Phone: +7 495 783 37 00 E-mail:  [email_address] www.abbyy.com

More Related Content

More from Anatoly Levenchuk

Contemporary Systems Engineering (oct 2022)
Contemporary Systems Engineering (oct 2022)Contemporary Systems Engineering (oct 2022)
Contemporary Systems Engineering (oct 2022)Anatoly Levenchuk
 
Open-endedness curriculum at EEM Institute
Open-endedness curriculum at EEM InstituteOpen-endedness curriculum at EEM Institute
Open-endedness curriculum at EEM InstituteAnatoly Levenchuk
 
Праксиология и системное мышление
Праксиология и системное мышлениеПраксиология и системное мышление
Праксиология и системное мышлениеAnatoly Levenchuk
 
А.Левенчук -- развитие личности
А.Левенчук -- развитие личностиА.Левенчук -- развитие личности
А.Левенчук -- развитие личностиAnatoly Levenchuk
 
А.Левенчук -- стейкхолдерское мастерство
А.Левенчук -- стейкхолдерское мастерствоА.Левенчук -- стейкхолдерское мастерство
А.Левенчук -- стейкхолдерское мастерствоAnatoly Levenchuk
 
А.Левенчук -- SysArchi
А.Левенчук -- SysArchiА.Левенчук -- SysArchi
А.Левенчук -- SysArchiAnatoly Levenchuk
 
А.Левенчук -- как выжить в эпоху перемен перемен
А.Левенчук -- как выжить в эпоху перемен переменА.Левенчук -- как выжить в эпоху перемен перемен
А.Левенчук -- как выжить в эпоху перемен переменAnatoly Levenchuk
 
А.Левенчук -- Практики системной инженерии
А.Левенчук -- Практики системной инженерииА.Левенчук -- Практики системной инженерии
А.Левенчук -- Практики системной инженерииAnatoly Levenchuk
 
А.Левенчук -- визуальное мышление
А.Левенчук -- визуальное мышлениеА.Левенчук -- визуальное мышление
А.Левенчук -- визуальное мышлениеAnatoly Levenchuk
 
А.Левенчук -- системное развитие личности
А.Левенчук -- системное развитие личностиА.Левенчук -- системное развитие личности
А.Левенчук -- системное развитие личностиAnatoly Levenchuk
 
А.Левенчук -- Будущее девелопмента
А.Левенчук -- Будущее девелопментаА.Левенчук -- Будущее девелопмента
А.Левенчук -- Будущее девелопментаAnatoly Levenchuk
 
А.Левенчук -- Системное мышление в инженерии предприятий
А.Левенчук -- Системное мышление в инженерии предприятийА.Левенчук -- Системное мышление в инженерии предприятий
А.Левенчук -- Системное мышление в инженерии предприятийAnatoly Levenchuk
 
А.Левенчук -- Системное мышление и управление конфигурацией
А.Левенчук -- Системное мышление и управление конфигурациейА.Левенчук -- Системное мышление и управление конфигурацией
А.Левенчук -- Системное мышление и управление конфигурациейAnatoly Levenchuk
 
А.Левенчук -- аппаратное ускорение аналитики в BigData
А.Левенчук -- аппаратное ускорение аналитики в BigDataА.Левенчук -- аппаратное ускорение аналитики в BigData
А.Левенчук -- аппаратное ускорение аналитики в BigDataAnatoly Levenchuk
 
А.Левенчук -- Будущее проектирования
А.Левенчук -- Будущее проектированияА.Левенчук -- Будущее проектирования
А.Левенчук -- Будущее проектированияAnatoly Levenchuk
 
А.Левенчук -- безлюдные (дез)организации
А.Левенчук -- безлюдные (дез)организацииА.Левенчук -- безлюдные (дез)организации
А.Левенчук -- безлюдные (дез)организацииAnatoly Levenchuk
 
А.Левенчук -- предпринимательство: кейс NVIDIA
А.Левенчук -- предпринимательство: кейс NVIDIAА.Левенчук -- предпринимательство: кейс NVIDIA
А.Левенчук -- предпринимательство: кейс NVIDIAAnatoly Levenchuk
 
Системное мышление -- непопсовый обзор курса
Системное мышление -- непопсовый обзор курсаСистемное мышление -- непопсовый обзор курса
Системное мышление -- непопсовый обзор курсаAnatoly Levenchuk
 
А.Левенчук -- системный фитнес
А.Левенчук -- системный фитнесА.Левенчук -- системный фитнес
А.Левенчук -- системный фитнесAnatoly Levenchuk
 

More from Anatoly Levenchuk (20)

Contemporary Systems Engineering (oct 2022)
Contemporary Systems Engineering (oct 2022)Contemporary Systems Engineering (oct 2022)
Contemporary Systems Engineering (oct 2022)
 
Open-endedness curriculum at EEM Institute
Open-endedness curriculum at EEM InstituteOpen-endedness curriculum at EEM Institute
Open-endedness curriculum at EEM Institute
 
Праксиология и системное мышление
Праксиология и системное мышлениеПраксиология и системное мышление
Праксиология и системное мышление
 
А.Левенчук -- развитие личности
А.Левенчук -- развитие личностиА.Левенчук -- развитие личности
А.Левенчук -- развитие личности
 
А.Левенчук -- стейкхолдерское мастерство
А.Левенчук -- стейкхолдерское мастерствоА.Левенчук -- стейкхолдерское мастерство
А.Левенчук -- стейкхолдерское мастерство
 
А.Левенчук -- SysArchi
А.Левенчук -- SysArchiА.Левенчук -- SysArchi
А.Левенчук -- SysArchi
 
А.Левенчук -- как выжить в эпоху перемен перемен
А.Левенчук -- как выжить в эпоху перемен переменА.Левенчук -- как выжить в эпоху перемен перемен
А.Левенчук -- как выжить в эпоху перемен перемен
 
А.Левенчук -- Практики системной инженерии
А.Левенчук -- Практики системной инженерииА.Левенчук -- Практики системной инженерии
А.Левенчук -- Практики системной инженерии
 
А.Левенчук -- визуальное мышление
А.Левенчук -- визуальное мышлениеА.Левенчук -- визуальное мышление
А.Левенчук -- визуальное мышление
 
А.Левенчук -- системное развитие личности
А.Левенчук -- системное развитие личностиА.Левенчук -- системное развитие личности
А.Левенчук -- системное развитие личности
 
А.Левенчук -- Будущее девелопмента
А.Левенчук -- Будущее девелопментаА.Левенчук -- Будущее девелопмента
А.Левенчук -- Будущее девелопмента
 
А.Левенчук -- Системное мышление в инженерии предприятий
А.Левенчук -- Системное мышление в инженерии предприятийА.Левенчук -- Системное мышление в инженерии предприятий
А.Левенчук -- Системное мышление в инженерии предприятий
 
А.Левенчук -- Системное мышление и управление конфигурацией
А.Левенчук -- Системное мышление и управление конфигурациейА.Левенчук -- Системное мышление и управление конфигурацией
А.Левенчук -- Системное мышление и управление конфигурацией
 
А.Левенчук -- аппаратное ускорение аналитики в BigData
А.Левенчук -- аппаратное ускорение аналитики в BigDataА.Левенчук -- аппаратное ускорение аналитики в BigData
А.Левенчук -- аппаратное ускорение аналитики в BigData
 
А.Левенчук -- Будущее проектирования
А.Левенчук -- Будущее проектированияА.Левенчук -- Будущее проектирования
А.Левенчук -- Будущее проектирования
 
Future of Engineering
Future of EngineeringFuture of Engineering
Future of Engineering
 
А.Левенчук -- безлюдные (дез)организации
А.Левенчук -- безлюдные (дез)организацииА.Левенчук -- безлюдные (дез)организации
А.Левенчук -- безлюдные (дез)организации
 
А.Левенчук -- предпринимательство: кейс NVIDIA
А.Левенчук -- предпринимательство: кейс NVIDIAА.Левенчук -- предпринимательство: кейс NVIDIA
А.Левенчук -- предпринимательство: кейс NVIDIA
 
Системное мышление -- непопсовый обзор курса
Системное мышление -- непопсовый обзор курсаСистемное мышление -- непопсовый обзор курса
Системное мышление -- непопсовый обзор курса
 
А.Левенчук -- системный фитнес
А.Левенчук -- системный фитнесА.Левенчук -- системный фитнес
А.Левенчук -- системный фитнес
 

А.Костюченко -- технология Compreno фирмы ABBYY

Editor's Notes

  1. Мы разделяем наши технологии на две большие группы: это распознавание, необходимое для трансформации данных отображенных на бумажном носителе, в электронный, editable формат, их трансформации в удобные пользователю форматы и Семантико-синтаксический Анализ, необходимый для корректного перевода текста, позволяющий с невероятной эффективностью искать нужные факты в массивах неструктурированных данных. Именно со второй технологи е й мы пришли в Сколково и на ней более детально остановимся.
  2. Хотя все люди на земле говорят разными словами, но мыслят они очень похожими понятиями. Все люди ходят на работу, сидят дома, работают на компьютерах, составляют договоры, летают на самолетах, ведут переговоры. Для них строятся похожие бизнес-центры, они находятся в похожих помещениях и пользуются похожей мебелью. Все эти понятия и их взаимоотношения в разных развитых цивилизациях имеют гораздо больше общего, чем различного. Универсальная семантическая иерархия – это дерево понятий, универсальное для всех языков, толстые ветви которого являются более общими и универсальными понятиями (например, «движение»), а тонкие – более специфическими, но тоже универсальными понятиями (например, «плавать»). Древесная структура позволяет обеспечить наследование свойств от предков к потомкам, благодаря которому описание новых понятий происходит быстрее. Так, например, чтобы описать понятие «приказ», уже не надо перечислять все характеристики понятия «документ».
  3. А вот пример, как Универсальный класс связан с Понятиями конкретного языка. К каждому универсальному понятию в дереве мы присоединяем конкретные слова и словосочетания. При синтаксическом анализе и построении семантического представления, мы переходим от Исходного языка к Универсальному языку, языку Понятий и Смыслов. Затем при Синтезе мы переходим от Универсального языка к целевому языку Перевода. Например, Русский-Универсальный-Английский.
  4. При подключении нового языка, например, Французского, достаточно только описать переход от Французского к Универсальному и от Универсального к Французскому. И мы автоматом получаем пары переводов: RU <> EN , RU <> FR , EN <> FR . Добавляя Немецкий, мы получаем уже пары переводов: RU <> EN , RU <> FR , EN <> FR , RU <> DE , DE <> FR , EN <> DE .
  5. При подключении нового языка, например, Французского, достаточно только описать переход от Французского к Универсальному и от Универсального к Французскому. И мы автоматом получаем пары переводов: RU <> EN , RU <> FR , EN <> FR . Добавляя Немецкий, мы получаем уже пары переводов: RU <> EN , RU <> FR , EN <> FR , RU <> DE , DE <> FR , EN <> DE .
  6. Второй, но не менее важной частью технологии является полный синтаксический разбор текста. Синтаксис – это способ «кодирования» семантических отношений (или «слов», выражающих эти понятия) в конкретном языке. Сами семантические отношения универсальны, а способы их реализации в каждом языке – свои. В каких-то языках установлен линейный порядок, в других используются падежи, предлоги, специальные служебные слова, где-то используется все сразу. Для каждого языка синтаксическое описание делается заново, но сами средства, которые разные языки используют для кодирования смысла, перечислимы. При описывании нового языка, используется конструктор для его описания (тот же линейный порядок, различные типы синтаксических преобразований, грамматические значения, предлоги, специальные конструкции ). Используя семантическую иерархию, синтаксическое описание языка, а также статистику взаимоотношений между понятиями, технология Compreno производит полный анализ текста. Исходный текст разбирается с учетом синтаксиса, специфичного для данного конкретного языка, и с использованием информации о семантическом поведении слов в исходном тексте. В итоге текст преобразуется в универсальное для всех языков представление связанных между собой универсальных понятий, и это представление по сути выражает СМЫСЛ сказанного. Далее этот СМЫСЛ можно переводить на другие языки или использовать для индекса поисковой системы, которая сможет на его основе осуществлять смысловой (интеллектуальный) поиск.
  7. Технология Compreno также успешно определяет такие сложные синтаксические связи, как замена слова «мальчик» на слово «он» в предложении: «Хоть мальчик и хотел поиграть, но он понимал, что у него мало времени». Или целые пропуски в сложносочиненных предложениях, например «он любит красное вино, а она – белое». Эти связи также выражаются в универсальной структуре СМЫСЛа и несут важную информацию для поиска или перевода. Таким образом, система стремится к определению смысла текста на обычном языке, позволяя машине «понять» этот текст и трансформировать его в универсальное представление, не зависящее от языка.
  8. Получение универсального представления (смысла) дает возможность решать множество различных практических задач, в частности – перевод с одного языка на другой, а также интеллектуальный поиск по смыслу. Новая технология позволяет изменить сами принцип поиска, когда вместо ввода ключевых слов в запросе можно указать сам вопрос. Система проанализирует вопрос и подберет те результаты, которые отвечают его смыслу. В частности, ответы могут быть выражены словами, не присутствующими в вопросе. Таким образом технология позволяет существенно повысить качество поиска и анализа информации
  9. Среди других возможных применений данной технологии можно назвать [ читает ]
  10. Несколько фактов о проекте: технология основана на результатах лингвистических исследований многих ведущих ученых мира последних 50 лет и является для многих из них воплощением далёкой мечты, ставшей реальностью благодаря применению современных компьютерных инженерных подходов. В проекте на данный момент участвует около 300 человек, активно привлекаются студенты кафедры Аби в МФТИ и выпускники ведущих ВУЗов страны. Компания Аби ведет многолетнюю работу над данным проектом и для выполнения его в рамках Сколково передаёт все необходимые права на интеллектуальную собственность резиденту Сколково
  11. Несколько слов о материнской компании. Компания была основана в 1989 году. Сейчас в компании работает более 1000 человек в 1 3 офисах по всему миру. Штаб-квартира и центр разработки всех продуктов и технологий находится в Москве. За это время продукты компании получили более 2 4 0 наград от лидирующих журналов и тестовых лабораторий за качество, удобство и лучшее соотношение цена/качество своих продуктов. Среди этих наград есть и государственная Премия Правительства РФ в области науки и техники. Ежегодно свыше 11 миллионов копий программы ABBYY FineReader распространяется по всему миру. А электронным словарём ABBYY Lingvo пользуются свыше 7 миллионов человек.
  12. Это была короткая презентация инновационной лингвистической технологии ABBYY Compreno . Она работает уже сегодня и призвана помогать людям по всему миру.