SlideShare une entreprise Scribd logo
1  sur  27
ОНТОРЕДАКТОР
КАК КОМПЛЕКСНЫЙ ИНСТРУМЕНТ
ОНТОЛОГИЧЕСКОЙ ИНЖЕНЕРИИ

           Рубашкин В. Ш.
           Пивоварова Л. М.
            Чуприн Б. Ю.
      кафедра информационных систем
     в искусстве и гуманитарных науках
   Факультет филологии и искусств СПбГУ
2. Gomez-Perez A., Fernando-Lopez M., Corcho O. Ontology
   Engineering. – Springer – Ferlag, 2004.
3. Staab Steffen, Studer Rudi (eds). Handbook on Ontologies. – Berlin—
   Heidelberg: Springer—Verlag, 2004
4. Nirenburg S., Raskin V. Ontological Semantics. – Cambridge, MA:
   MIT Press, 2004
5. Denny M. Ontology Tools Survey, Revisited – 2004
   http://www.xml.com/pub/a/2004/07/14/onto.html
=========================
7. Гаврилова Т. А., Хорошевский В. Ф. Базы знаний
   интеллектуальных систем. – СПб.: Питер, 2000. С. 271 – 316
8. Рубашкин В. Ш. Представление и анализ смысла в
   интеллектуальных информационных системах. - М.: Наука, 1989
1. Рубашкин В. Ш. Универсальный понятийный словарь:
   функциональность и средства ведения // КИИ-2002. Восьмая
   национальная конференция по искусственному интеллекту с
   международным участием. Труды конференции. М., 2002. С. 231
   – 237.
2. Рубашкин В. Ш., Лахути Д.Г. Семантический (концептуальный)
   словарь для информационных технологий. // Научно-
   техническая информация. - Сер. 2. Часть1. 1998.- N 1. - С. 19 –24;
    Часть2. 1999.- N 5. - С. 1 -12. Часть3. 2000. - N 7. - С. 1 – 9
3. Рубашкин В. Ш., Лахути Д.Г. Онтология: от натурфилософии к
   научному мировоззрению и инженерии знаний // Вопросы
   философии № 1, 2005. С. 64 – 81.
4. Guarino Nicola. Formal Ontology and Information Systems // Formal
   Ontology in Information Systems. Proceedings of FOIS’98, Trento,
   Italy, 6-8 June 1998. Amsterdam, IOS Press, pp. 3-15.
1. Русский семантический словарь. Толковый словарь,
   систематизированный по классам слов и значений / РАН. Ин-т
   рус. яз.; Под общей ред. Н.Ю.Шведовой. – М.: Азбуковник.
   Том I.-1998; Том II. - 2000; Том III. – 2003.
3. Толковый словарь русских глаголов: Идеографическое
   описание. Английские эквиваленты. Синонимы. Антонимы. –
   М.: АСТ-ПРЕСС, 1999.
Wiki:
    Ontology editors are applications designed to assist
        in the creation or manipulation of ontologies.
Онтология
Том Грубер (1991):
T. R. Gruber. The Role of Common Ontology in Achieving Sharable,
    Reusable Knowledge Bases // Principles of Knowledge Representation
    and Reasoning: Proceedings of the Second International Conference,
    1991.
    An ontology is an explicit specification of a conceptualisation.



Michael Denny. Ontology Tools Survey, 2004 :
Ontologies are a way of specifying the structure of domain knowledge
   in a formal logic designed for machine processing.
Существенны три пункта:
4) Концептуальная структура
5) Формальная модель
6) Информационно-вычислительный ресурс
Онтология



1) Концептуальная структура
   а) единицы – понятия, а не слова!
   б) система, включающая множество понятий и набор
   утверждений об этих понятиях. (классификация понятий,
   отношения между понятиями; в частности иерархии понятий по
   отношениям общее – частное и часть - целое)


Проблема выбора и уровня детализации единиц; граница между
   понятиями и лексическими вариантами.
- линейный размер, цвета и оттенки
Онтология
• Формальная модель (Модель знаний)
Формализованное (посредством некоторого ЯПЗ) описание
    концептуальной системы, специфицирующее:
а) используемую классификацию концептов
б) набор допустимых парадигматических отношений между
    концептами
 в) аксиомы и правила вывода


Принципиальная важность выбора той или иной модели знаний
• OKBC – фреймовая модель: концепты (классы), экземпляры,
   слоты, фасеты
• OWL – классы, экземпляры, свойства (datatype property, object
   property)
• InfoL – концепты, их словарные характеристики, связи между
   концептами; дерево признаков.
1) Информационно-вычислительный ресурс
      (а не просто словарь!)
 Технически – исполняемый модуль
 (напр., dll библиотека, COM-объект),
 обладающий некоторой функциональностью и стандартным
    образом подключаемый к любым информационным
    технологиям.

Формально – это набор функций вида :
                      F (D),   F (D1, D2)

 ===========================
Поэтому ближайшим и непосредственным предшественником
   можно считать информационно-поисковые тезаурусы (ИПТ),
   а переход к онтологиям интерпретировать как процесс
                                       интеллектуализации ИПТ.
Наша мотивировка функциональности онтологии –
                                     семантический анализ текста
•   вопрос – ответные соответствия (цвет - красный);
•   представление числовых данных;
•   кореференция;
•   предикат – актанты;

Функциональность:
•   полный набор объемных отношений (тигр – охотник - повар);
•   предметно –ассоциативные отношения (тигр – лапа);
•   функциональные отношения (кг - масса)
Представление данных и операционная среда онтологии:
СУБД как "естественная операционная среда".
Варианты: продукционная система.
Онторедактор –
   не просто средство ввода и редактирования,
   но интегрированная среда разработки и использования
            (integrated development environment - IDE)


Функциональность онтологии (использование)
vs
функциональность онторедактора (создание и поддержка)

Онтология предоставляет программный интерфейс
                                              приложениям;
онторедактор реализует человеко-машинный интерфейс,
                обеспечивающий администрирование онтологий.


NB: Для реализации части функций онторедактора должна
  использоваться функциональность самой онтологии.
Функциональность онторедактора
Функциональный стандарт еще только формируется.
Традиционные функции:
• навигация, броузинг и поиск;
• ввод и редактирование.
Нетрадиционные:
• тестирование онтологии;
• экспорт – импорт;
•    интеграция разнородных концептуальных систем (ontology
   merging);
• (полу)автоматическое пополнение онтологий;
• определение взаимного соответствие концептов и единиц ЕЯ
   ("Лексикон");
• работа с описаниями экземпляров, являющихся "примерами"
   (instance) концептов.

(+ Функциональность онтологии)
Специфика навигации, броузинга, поиска
Просмотр и навигация предполагают некоторую "естественную"
   упорядоченность материала. "Естественный порядок в
   концептуальной системе = ???!
      – по алфавиту?
      – по ключу?
      – в порядке "физического" следования?
- Поиск как средство навигации

-   "Лексическая" навигация

-   Классификационные фильтры и фильтры администрирования
"Естественной" для концептуальной системы можно считать,
   скорее, таксономическую (общее - частное) упорядоченность
   концептов; она образует ядро всякой концептуальной модели.
Просмотр "сверху вниз" (от общего к частному).
А   также, возможно, просмотр групп концептов связанных
    иерархическими связями другого типа (например, целое -
    часть).
Отсюда - потребность графического представления всех или
   некоторых связей между концептами и поддержки процедур
   графического редактирования.

Вопрос об объеме графического представления связей:
   – только общее – частное?
   – + целое – часть?
   – + другие виды связей?
          (артефакт – функция: судно – плыть;
            единица измерения – признак: ватт – мощность
      и т.д.)

Складывающееся решение:
в графике представляется только таксономия.
Специфика ввода и редактирования
b) "ручной" ввод (собственно ввод);
c) автоматический или автоматизированный ввод на основе
   анализа корпуса текстов;
d) автоматизированный ввод с использованием традиционной
   лексикографической информации (энциклопедических и
   толковых словарей).

Главные проблемы:
   • достоверность;
   • эргономичность.
Конечная цель при проектировании процедур собственно ввода –
      максимально исключить формально определимые ошибки.

Самое плохое решение – неконтролируемый ввод.
Не лучшее решение - обнаруживать ошибки post factum.
Технологически "хорошее" решение -
   процедура ввода должна быть организована так, чтобы ввод
   некорректных элементов описания оказался вообще
   невозможным.
Требование достоверности ввода – конкретизация:
2) Неизбыточность и полнота описания –
   должны быть определены те и только те словарные признаки,
   которые релевантны для концептов данного типа.
2) Непротиворечивость описания –
   элементы словарных характеристик не должны противоречить
                                                   друг другу.
Пример:
   Для концепта, определяемого конъюнкцией (пересечением
   объектных классов; в других терминах – класс, определяемый
   через множественное наследование), определяющие концепты
   должны быть совместимы (в терминах OWL –не должны
   находиться в отношении Disjoint):
         'слон'  'животное' And 'металлический' ???

NB: Вызов машины вывода!
3) Правильность означивания –
    значения определяемых словарных признаков должны
                  принадлежать области их допустимых значений.
Пример1:
Формально неправильно:
    БАЗОВЫЙ_ПРИЗНАК ( 'метр' ) = 'нагрев' ???
правильно:
   БАЗОВЫЙ_ПРИЗНАК ( 'метр' ) = 'линейный размер'
    (допустим только концепт класса 'наименование числового
    признака', подкласс 'сочетающийся с числом').
Пример2 :
    'лед'  'агрегатное состояние' And 'химический состав' ???
-   категориальная ошибка: формальное толкование типа
    "конъюнкция" для объектного термина может содержать только
    объектные термины, либо означенные признаки.
4) Содержательная правильность –
    вводимые словарные характеристики должны быть адекватны
    смыслу добавляемого или редактируемого концепта.
Примеры:
    ОБОБЩАЮЩИЙ_ПРИЗНАК ( 'цвет' ) =
                            'химические свойства вещества' ???
   БАЗОВЫЙ_ПРИЗНАК ( 'метр' ) = 'температура' ???
     'лед'  'отверстие' And 'цилиндрической формы' ???
- определение является формально правильным.

Такого рода ошибки не являются формально контролируемыми;
они могут оставаться не выявленными, пока онтология не начнет
   использоваться в приложениях, для которых именно эта связь
   окажется существенной.
Решение задач формального контроля обусловлено возможностью
   построить формальное описание системы словарных
   признаков.
   a) определение области значений каждого признака;
   b) установление отношений зависимости по условиям
      применимости между признаками.
Тестирование


Тестирование как проверка формальной корректности (вместо
                                                контроля ввода)
vs
тестирование как содержательный экспертный контроль.


Предмет тестирования во 2-м случае = ?

Формальный ответ:
проверка отдельного концепта = просмотр словарной статьи;
собственно тестирование как экспертный контроль связей:
   • объемные отношения;
   • ассоциативные отношения;
   • функциональные отношения.
Тестирование

Терминология [Gomez-Perez]:
   • evaluation - общее название для процедур проверки;
   • verification - whether the ontology is building correctly
   • validation – whether the ontology definitions really model
                                                          the real world
   • assessment – judging the ontology from the user's &
                                              application's point of view
Автоматизация пополнения
•   Интеграция онтологий (ontology merging)
•   Собственно пополнение (ontology learning)
        - по корпусу текстов
        - из традиционных словарей (+WordNet ?)
Интеграция номологических и фактографических знаний
               (представление экземпляров)

Онтология – знание о применимости признаков к классу объектов.
Фактография (напр., БД) – знание о значениях признаков для
   конкретного объекта.

Относительность разделения на классы и экземпляры (ср. марки и
   автомобили).

Contenu connexe

Tendances

Формы мышления, алгебра высказываний
Формы мышления, алгебра высказыванийФормы мышления, алгебра высказываний
Формы мышления, алгебра высказыванийserge_luch
 
Сборка "Порядков мышления"
Сборка "Порядков мышления"Сборка "Порядков мышления"
Сборка "Порядков мышления"lukoshka
 
Научный подход и немного о том что вне него
Научный подход и немного о том что вне негоНаучный подход и немного о том что вне него
Научный подход и немного о том что вне негоAlexander Solodov
 
Единство и борьба онтологий
Единство и борьба онтологийЕдинство и борьба онтологий
Единство и борьба онтологийlukoshka
 

Tendances (7)

Ai_evolution_intro4
Ai_evolution_intro4Ai_evolution_intro4
Ai_evolution_intro4
 
Формы мышления, алгебра высказываний
Формы мышления, алгебра высказыванийФормы мышления, алгебра высказываний
Формы мышления, алгебра высказываний
 
Сборка "Порядков мышления"
Сборка "Порядков мышления"Сборка "Порядков мышления"
Сборка "Порядков мышления"
 
20100925 ontology konev_lecture02
20100925 ontology konev_lecture0220100925 ontology konev_lecture02
20100925 ontology konev_lecture02
 
Научный подход и немного о том что вне него
Научный подход и немного о том что вне негоНаучный подход и немного о том что вне него
Научный подход и немного о том что вне него
 
Единство и борьба онтологий
Единство и борьба онтологийЕдинство и борьба онтологий
Единство и борьба онтологий
 
Slovar pr. metodol
Slovar pr. metodolSlovar pr. metodol
Slovar pr. metodol
 

En vedette

Правилa формирования ведения и использования базового государственного информ...
Правилa формирования ведения и использования базового государственного информ...Правилa формирования ведения и использования базового государственного информ...
Правилa формирования ведения и использования базового государственного информ...Victor Gridnev
 
01Business&Technologies n°2158
01Business&Technologies n°215801Business&Technologies n°2158
01Business&Technologies n°2158alain Clapaud
 
Cloud Computing. A Practical Introduction to the Legal Issues от The British...
Cloud Computing. A Practical Introduction to the Legal Issues от  The British...Cloud Computing. A Practical Introduction to the Legal Issues от  The British...
Cloud Computing. A Practical Introduction to the Legal Issues от The British...Victor Gridnev
 
List of robotics projects in Horizon 2020
List of robotics projects in Horizon 2020List of robotics projects in Horizon 2020
List of robotics projects in Horizon 2020alain Clapaud
 
The Facebook Generation - Boon or Bane for E-Learning at Universities
The Facebook Generation - Boon or Bane for E-Learning at UniversitiesThe Facebook Generation - Boon or Bane for E-Learning at Universities
The Facebook Generation - Boon or Bane for E-Learning at UniversitiesMartin Ebner
 
Sweden PowerPoint Content
Sweden PowerPoint Content Sweden PowerPoint Content
Sweden PowerPoint Content Andrew Schwartz
 
la rappresentazione dei numeri
la rappresentazione dei numerila rappresentazione dei numeri
la rappresentazione dei numerierossina
 
Adobe LiveCycle Data Services
Adobe LiveCycle Data ServicesAdobe LiveCycle Data Services
Adobe LiveCycle Data ServicesMichael Chaize
 
[ ref ] Normalizing a Data Model in SQL Server
[ ref ] Normalizing a Data Model in SQL Server[ ref ] Normalizing a Data Model in SQL Server
[ ref ] Normalizing a Data Model in SQL ServerRobson Silva Espig
 
Shadow Fighter The Movie
Shadow Fighter The MovieShadow Fighter The Movie
Shadow Fighter The Movieguest337e86
 

En vedette (18)

Presentation_NEW.PPTX
Presentation_NEW.PPTXPresentation_NEW.PPTX
Presentation_NEW.PPTX
 
Правилa формирования ведения и использования базового государственного информ...
Правилa формирования ведения и использования базового государственного информ...Правилa формирования ведения и использования базового государственного информ...
Правилa формирования ведения и использования базового государственного информ...
 
01Business&Technologies n°2158
01Business&Technologies n°215801Business&Technologies n°2158
01Business&Technologies n°2158
 
Cloud Computing. A Practical Introduction to the Legal Issues от The British...
Cloud Computing. A Practical Introduction to the Legal Issues от  The British...Cloud Computing. A Practical Introduction to the Legal Issues от  The British...
Cloud Computing. A Practical Introduction to the Legal Issues от The British...
 
Christofer Gilbert Artwork
Christofer Gilbert ArtworkChristofer Gilbert Artwork
Christofer Gilbert Artwork
 
The Snazzy Look Gardening 2
The Snazzy Look Gardening 2The Snazzy Look Gardening 2
The Snazzy Look Gardening 2
 
List of robotics projects in Horizon 2020
List of robotics projects in Horizon 2020List of robotics projects in Horizon 2020
List of robotics projects in Horizon 2020
 
The Facebook Generation - Boon or Bane for E-Learning at Universities
The Facebook Generation - Boon or Bane for E-Learning at UniversitiesThe Facebook Generation - Boon or Bane for E-Learning at Universities
The Facebook Generation - Boon or Bane for E-Learning at Universities
 
Quality Art
Quality ArtQuality Art
Quality Art
 
Multus
MultusMultus
Multus
 
Sweden PowerPoint Content
Sweden PowerPoint Content Sweden PowerPoint Content
Sweden PowerPoint Content
 
2007p&o1milieu
2007p&o1milieu2007p&o1milieu
2007p&o1milieu
 
la rappresentazione dei numeri
la rappresentazione dei numerila rappresentazione dei numeri
la rappresentazione dei numeri
 
Adobe LiveCycle Data Services
Adobe LiveCycle Data ServicesAdobe LiveCycle Data Services
Adobe LiveCycle Data Services
 
Copiii Te Sfatuiesc
Copiii Te SfatuiescCopiii Te Sfatuiesc
Copiii Te Sfatuiesc
 
Durga
DurgaDurga
Durga
 
[ ref ] Normalizing a Data Model in SQL Server
[ ref ] Normalizing a Data Model in SQL Server[ ref ] Normalizing a Data Model in SQL Server
[ ref ] Normalizing a Data Model in SQL Server
 
Shadow Fighter The Movie
Shadow Fighter The MovieShadow Fighter The Movie
Shadow Fighter The Movie
 

Similaire à OntoEd

«Зачем», «что» и «как» в исследовании коллокаций.
«Зачем», «что» и «как» в исследовании коллокаций. «Зачем», «что» и «как» в исследовании коллокаций.
«Зачем», «что» и «как» в исследовании коллокаций. Lidia Pivovarova
 
Ainl 2013 bogatyrev_математическая и лингвистическая
Ainl 2013 bogatyrev_математическая и лингвистическаяAinl 2013 bogatyrev_математическая и лингвистическая
Ainl 2013 bogatyrev_математическая и лингвистическаяAINL Conferences
 
Новые поступления - Март 2011
Новые поступления - Март 2011Новые поступления - Март 2011
Новые поступления - Март 2011Nick
 
лекция 7 тема 1
лекция 7 тема 1лекция 7 тема 1
лекция 7 тема 1Noobie312
 
Новые поступления - Март 2011
Новые поступления - Март 2011Новые поступления - Март 2011
Новые поступления - Март 2011Nick
 
Ontologies for Information Extraction
Ontologies for Information ExtractionOntologies for Information Extraction
Ontologies for Information ExtractionLidia Pivovarova
 
Онтологии и информационная архитектура: соотношение терминов и потенциал совм...
Онтологии и информационная архитектура: соотношение терминов и потенциал совм...Онтологии и информационная архитектура: соотношение терминов и потенциал совм...
Онтологии и информационная архитектура: соотношение терминов и потенциал совм...Dmitry Kudryavtsev
 
извлечение объектов и фактов из текстов
извлечение объектов и фактов из текстовизвлечение объектов и фактов из текстов
извлечение объектов и фактов из текстовYandex
 
11 i r_ru
11 i r_ru11 i r_ru
11 i r_ruUA1011
 
11 информ ривкинд_лысенко_станд_2011_рус
11 информ ривкинд_лысенко_станд_2011_рус11 информ ривкинд_лысенко_станд_2011_рус
11 информ ривкинд_лысенко_станд_2011_русAira_Roo
 
бурдаев Ontology 2010
бурдаев Ontology 2010бурдаев Ontology 2010
бурдаев Ontology 2010Vladimir Burdaev
 

Similaire à OntoEd (20)

Dialog
DialogDialog
Dialog
 
rubashkin
rubashkinrubashkin
rubashkin
 
«Зачем», «что» и «как» в исследовании коллокаций.
«Зачем», «что» и «как» в исследовании коллокаций. «Зачем», «что» и «как» в исследовании коллокаций.
«Зачем», «что» и «как» в исследовании коллокаций.
 
Ainl 2013 bogatyrev_математическая и лингвистическая
Ainl 2013 bogatyrev_математическая и лингвистическаяAinl 2013 bogatyrev_математическая и лингвистическая
Ainl 2013 bogatyrev_математическая и лингвистическая
 
Новые поступления - Март 2011
Новые поступления - Март 2011Новые поступления - Март 2011
Новые поступления - Март 2011
 
лингвонтол
лингвонтоллингвонтол
лингвонтол
 
Проблемы автоматической рубрикации текстов
Проблемы автоматической рубрикации текстовПроблемы автоматической рубрикации текстов
Проблемы автоматической рубрикации текстов
 
лекция 7 тема 1
лекция 7 тема 1лекция 7 тема 1
лекция 7 тема 1
 
Новые поступления - Март 2011
Новые поступления - Март 2011Новые поступления - Март 2011
Новые поступления - Март 2011
 
Ontologies for Information Extraction
Ontologies for Information ExtractionOntologies for Information Extraction
Ontologies for Information Extraction
 
Онтологии и информационная архитектура: соотношение терминов и потенциал совм...
Онтологии и информационная архитектура: соотношение терминов и потенциал совм...Онтологии и информационная архитектура: соотношение терминов и потенциал совм...
Онтологии и информационная архитектура: соотношение терминов и потенциал совм...
 
L24
L24L24
L24
 
Методы интеграции разнородных онтологий
Методы интеграции разнородных онтологийМетоды интеграции разнородных онтологий
Методы интеграции разнородных онтологий
 
I M S Rubashkin
I M S RubashkinI M S Rubashkin
I M S Rubashkin
 
извлечение объектов и фактов из текстов
извлечение объектов и фактов из текстовизвлечение объектов и фактов из текстов
извлечение объектов и фактов из текстов
 
11 i r_ru
11 i r_ru11 i r_ru
11 i r_ru
 
11 информ ривкинд_лысенко_станд_2011_рус
11 информ ривкинд_лысенко_станд_2011_рус11 информ ривкинд_лысенко_станд_2011_рус
11 информ ривкинд_лысенко_станд_2011_рус
 
11
1111
11
 
svfw
svfwsvfw
svfw
 
бурдаев Ontology 2010
бурдаев Ontology 2010бурдаев Ontology 2010
бурдаев Ontology 2010
 

Plus de Lidia Pivovarova

Classification and clustering in media monitoring: from knowledge engineering...
Classification and clustering in media monitoring: from knowledge engineering...Classification and clustering in media monitoring: from knowledge engineering...
Classification and clustering in media monitoring: from knowledge engineering...Lidia Pivovarova
 
Convolutional neural networks for text classification
Convolutional neural networks for text classificationConvolutional neural networks for text classification
Convolutional neural networks for text classificationLidia Pivovarova
 
Grouping business news stories based on salience of named entities
Grouping business news stories based on salience of named entitiesGrouping business news stories based on salience of named entities
Grouping business news stories based on salience of named entitiesLidia Pivovarova
 
Интеллектуальный анализ текста
Интеллектуальный анализ текстаИнтеллектуальный анализ текста
Интеллектуальный анализ текстаLidia Pivovarova
 
AINL 2016: Bodrunova, Blekanov, Maksimov
AINL 2016: Bodrunova, Blekanov, MaksimovAINL 2016: Bodrunova, Blekanov, Maksimov
AINL 2016: Bodrunova, Blekanov, MaksimovLidia Pivovarova
 
AINL 2016: Rykov, Nagornyy, Koltsova, Natta, Kremenets, Manovich, Cerrone, Cr...
AINL 2016: Rykov, Nagornyy, Koltsova, Natta, Kremenets, Manovich, Cerrone, Cr...AINL 2016: Rykov, Nagornyy, Koltsova, Natta, Kremenets, Manovich, Cerrone, Cr...
AINL 2016: Rykov, Nagornyy, Koltsova, Natta, Kremenets, Manovich, Cerrone, Cr...Lidia Pivovarova
 
AINL 2016: Shavrina, Selegey
AINL 2016: Shavrina, SelegeyAINL 2016: Shavrina, Selegey
AINL 2016: Shavrina, SelegeyLidia Pivovarova
 

Plus de Lidia Pivovarova (20)

Classification and clustering in media monitoring: from knowledge engineering...
Classification and clustering in media monitoring: from knowledge engineering...Classification and clustering in media monitoring: from knowledge engineering...
Classification and clustering in media monitoring: from knowledge engineering...
 
Convolutional neural networks for text classification
Convolutional neural networks for text classificationConvolutional neural networks for text classification
Convolutional neural networks for text classification
 
Grouping business news stories based on salience of named entities
Grouping business news stories based on salience of named entitiesGrouping business news stories based on salience of named entities
Grouping business news stories based on salience of named entities
 
Интеллектуальный анализ текста
Интеллектуальный анализ текстаИнтеллектуальный анализ текста
Интеллектуальный анализ текста
 
AINL 2016: Yagunova
AINL 2016: YagunovaAINL 2016: Yagunova
AINL 2016: Yagunova
 
AINL 2016: Kuznetsova
AINL 2016: KuznetsovaAINL 2016: Kuznetsova
AINL 2016: Kuznetsova
 
AINL 2016: Bodrunova, Blekanov, Maksimov
AINL 2016: Bodrunova, Blekanov, MaksimovAINL 2016: Bodrunova, Blekanov, Maksimov
AINL 2016: Bodrunova, Blekanov, Maksimov
 
AINL 2016: Boldyreva
AINL 2016: BoldyrevaAINL 2016: Boldyreva
AINL 2016: Boldyreva
 
AINL 2016: Rykov, Nagornyy, Koltsova, Natta, Kremenets, Manovich, Cerrone, Cr...
AINL 2016: Rykov, Nagornyy, Koltsova, Natta, Kremenets, Manovich, Cerrone, Cr...AINL 2016: Rykov, Nagornyy, Koltsova, Natta, Kremenets, Manovich, Cerrone, Cr...
AINL 2016: Rykov, Nagornyy, Koltsova, Natta, Kremenets, Manovich, Cerrone, Cr...
 
AINL 2016: Kozerenko
AINL 2016: Kozerenko AINL 2016: Kozerenko
AINL 2016: Kozerenko
 
AINL 2016: Shavrina, Selegey
AINL 2016: Shavrina, SelegeyAINL 2016: Shavrina, Selegey
AINL 2016: Shavrina, Selegey
 
AINL 2016: Khudobakhshov
AINL 2016: KhudobakhshovAINL 2016: Khudobakhshov
AINL 2016: Khudobakhshov
 
AINL 2016: Proncheva
AINL 2016: PronchevaAINL 2016: Proncheva
AINL 2016: Proncheva
 
AINL 2016:
AINL 2016: AINL 2016:
AINL 2016:
 
AINL 2016: Bugaychenko
AINL 2016: BugaychenkoAINL 2016: Bugaychenko
AINL 2016: Bugaychenko
 
AINL 2016: Grigorieva
AINL 2016: GrigorievaAINL 2016: Grigorieva
AINL 2016: Grigorieva
 
AINL 2016: Muravyov
AINL 2016: MuravyovAINL 2016: Muravyov
AINL 2016: Muravyov
 
AINL 2016: Just AI
AINL 2016: Just AIAINL 2016: Just AI
AINL 2016: Just AI
 
AINL 2016: Moskvichev
AINL 2016: MoskvichevAINL 2016: Moskvichev
AINL 2016: Moskvichev
 
AINL 2016: Goncharov
AINL 2016: GoncharovAINL 2016: Goncharov
AINL 2016: Goncharov
 

OntoEd

  • 1. ОНТОРЕДАКТОР КАК КОМПЛЕКСНЫЙ ИНСТРУМЕНТ ОНТОЛОГИЧЕСКОЙ ИНЖЕНЕРИИ Рубашкин В. Ш. Пивоварова Л. М. Чуприн Б. Ю. кафедра информационных систем в искусстве и гуманитарных науках Факультет филологии и искусств СПбГУ
  • 2. 2. Gomez-Perez A., Fernando-Lopez M., Corcho O. Ontology Engineering. – Springer – Ferlag, 2004. 3. Staab Steffen, Studer Rudi (eds). Handbook on Ontologies. – Berlin— Heidelberg: Springer—Verlag, 2004 4. Nirenburg S., Raskin V. Ontological Semantics. – Cambridge, MA: MIT Press, 2004 5. Denny M. Ontology Tools Survey, Revisited – 2004 http://www.xml.com/pub/a/2004/07/14/onto.html ========================= 7. Гаврилова Т. А., Хорошевский В. Ф. Базы знаний интеллектуальных систем. – СПб.: Питер, 2000. С. 271 – 316 8. Рубашкин В. Ш. Представление и анализ смысла в интеллектуальных информационных системах. - М.: Наука, 1989
  • 3. 1. Рубашкин В. Ш. Универсальный понятийный словарь: функциональность и средства ведения // КИИ-2002. Восьмая национальная конференция по искусственному интеллекту с международным участием. Труды конференции. М., 2002. С. 231 – 237. 2. Рубашкин В. Ш., Лахути Д.Г. Семантический (концептуальный) словарь для информационных технологий. // Научно- техническая информация. - Сер. 2. Часть1. 1998.- N 1. - С. 19 –24; Часть2. 1999.- N 5. - С. 1 -12. Часть3. 2000. - N 7. - С. 1 – 9 3. Рубашкин В. Ш., Лахути Д.Г. Онтология: от натурфилософии к научному мировоззрению и инженерии знаний // Вопросы философии № 1, 2005. С. 64 – 81. 4. Guarino Nicola. Formal Ontology and Information Systems // Formal Ontology in Information Systems. Proceedings of FOIS’98, Trento, Italy, 6-8 June 1998. Amsterdam, IOS Press, pp. 3-15.
  • 4. 1. Русский семантический словарь. Толковый словарь, систематизированный по классам слов и значений / РАН. Ин-т рус. яз.; Под общей ред. Н.Ю.Шведовой. – М.: Азбуковник. Том I.-1998; Том II. - 2000; Том III. – 2003. 3. Толковый словарь русских глаголов: Идеографическое описание. Английские эквиваленты. Синонимы. Антонимы. – М.: АСТ-ПРЕСС, 1999.
  • 5. Wiki: Ontology editors are applications designed to assist in the creation or manipulation of ontologies.
  • 6. Онтология Том Грубер (1991): T. R. Gruber. The Role of Common Ontology in Achieving Sharable, Reusable Knowledge Bases // Principles of Knowledge Representation and Reasoning: Proceedings of the Second International Conference, 1991. An ontology is an explicit specification of a conceptualisation. Michael Denny. Ontology Tools Survey, 2004 : Ontologies are a way of specifying the structure of domain knowledge in a formal logic designed for machine processing.
  • 7. Существенны три пункта: 4) Концептуальная структура 5) Формальная модель 6) Информационно-вычислительный ресурс
  • 8. Онтология 1) Концептуальная структура а) единицы – понятия, а не слова! б) система, включающая множество понятий и набор утверждений об этих понятиях. (классификация понятий, отношения между понятиями; в частности иерархии понятий по отношениям общее – частное и часть - целое) Проблема выбора и уровня детализации единиц; граница между понятиями и лексическими вариантами. - линейный размер, цвета и оттенки
  • 9. Онтология • Формальная модель (Модель знаний) Формализованное (посредством некоторого ЯПЗ) описание концептуальной системы, специфицирующее: а) используемую классификацию концептов б) набор допустимых парадигматических отношений между концептами в) аксиомы и правила вывода Принципиальная важность выбора той или иной модели знаний • OKBC – фреймовая модель: концепты (классы), экземпляры, слоты, фасеты • OWL – классы, экземпляры, свойства (datatype property, object property) • InfoL – концепты, их словарные характеристики, связи между концептами; дерево признаков.
  • 10. 1) Информационно-вычислительный ресурс (а не просто словарь!) Технически – исполняемый модуль (напр., dll библиотека, COM-объект), обладающий некоторой функциональностью и стандартным образом подключаемый к любым информационным технологиям. Формально – это набор функций вида : F (D), F (D1, D2) =========================== Поэтому ближайшим и непосредственным предшественником можно считать информационно-поисковые тезаурусы (ИПТ), а переход к онтологиям интерпретировать как процесс интеллектуализации ИПТ.
  • 11. Наша мотивировка функциональности онтологии – семантический анализ текста • вопрос – ответные соответствия (цвет - красный); • представление числовых данных; • кореференция; • предикат – актанты; Функциональность: • полный набор объемных отношений (тигр – охотник - повар); • предметно –ассоциативные отношения (тигр – лапа); • функциональные отношения (кг - масса)
  • 12. Представление данных и операционная среда онтологии: СУБД как "естественная операционная среда". Варианты: продукционная система.
  • 13. Онторедактор – не просто средство ввода и редактирования, но интегрированная среда разработки и использования (integrated development environment - IDE) Функциональность онтологии (использование) vs функциональность онторедактора (создание и поддержка) Онтология предоставляет программный интерфейс приложениям; онторедактор реализует человеко-машинный интерфейс, обеспечивающий администрирование онтологий. NB: Для реализации части функций онторедактора должна использоваться функциональность самой онтологии.
  • 14. Функциональность онторедактора Функциональный стандарт еще только формируется. Традиционные функции: • навигация, броузинг и поиск; • ввод и редактирование. Нетрадиционные: • тестирование онтологии; • экспорт – импорт; • интеграция разнородных концептуальных систем (ontology merging); • (полу)автоматическое пополнение онтологий; • определение взаимного соответствие концептов и единиц ЕЯ ("Лексикон"); • работа с описаниями экземпляров, являющихся "примерами" (instance) концептов. (+ Функциональность онтологии)
  • 15. Специфика навигации, броузинга, поиска Просмотр и навигация предполагают некоторую "естественную" упорядоченность материала. "Естественный порядок в концептуальной системе = ???! – по алфавиту? – по ключу? – в порядке "физического" следования? - Поиск как средство навигации - "Лексическая" навигация - Классификационные фильтры и фильтры администрирования
  • 16. "Естественной" для концептуальной системы можно считать, скорее, таксономическую (общее - частное) упорядоченность концептов; она образует ядро всякой концептуальной модели. Просмотр "сверху вниз" (от общего к частному). А также, возможно, просмотр групп концептов связанных иерархическими связями другого типа (например, целое - часть).
  • 17. Отсюда - потребность графического представления всех или некоторых связей между концептами и поддержки процедур графического редактирования. Вопрос об объеме графического представления связей: – только общее – частное? – + целое – часть? – + другие виды связей? (артефакт – функция: судно – плыть; единица измерения – признак: ватт – мощность и т.д.) Складывающееся решение: в графике представляется только таксономия.
  • 18. Специфика ввода и редактирования b) "ручной" ввод (собственно ввод); c) автоматический или автоматизированный ввод на основе анализа корпуса текстов; d) автоматизированный ввод с использованием традиционной лексикографической информации (энциклопедических и толковых словарей). Главные проблемы: • достоверность; • эргономичность.
  • 19. Конечная цель при проектировании процедур собственно ввода – максимально исключить формально определимые ошибки. Самое плохое решение – неконтролируемый ввод. Не лучшее решение - обнаруживать ошибки post factum. Технологически "хорошее" решение - процедура ввода должна быть организована так, чтобы ввод некорректных элементов описания оказался вообще невозможным.
  • 20. Требование достоверности ввода – конкретизация: 2) Неизбыточность и полнота описания – должны быть определены те и только те словарные признаки, которые релевантны для концептов данного типа. 2) Непротиворечивость описания – элементы словарных характеристик не должны противоречить друг другу. Пример: Для концепта, определяемого конъюнкцией (пересечением объектных классов; в других терминах – класс, определяемый через множественное наследование), определяющие концепты должны быть совместимы (в терминах OWL –не должны находиться в отношении Disjoint): 'слон'  'животное' And 'металлический' ??? NB: Вызов машины вывода!
  • 21. 3) Правильность означивания – значения определяемых словарных признаков должны принадлежать области их допустимых значений. Пример1: Формально неправильно: БАЗОВЫЙ_ПРИЗНАК ( 'метр' ) = 'нагрев' ??? правильно: БАЗОВЫЙ_ПРИЗНАК ( 'метр' ) = 'линейный размер' (допустим только концепт класса 'наименование числового признака', подкласс 'сочетающийся с числом'). Пример2 : 'лед'  'агрегатное состояние' And 'химический состав' ??? - категориальная ошибка: формальное толкование типа "конъюнкция" для объектного термина может содержать только объектные термины, либо означенные признаки.
  • 22. 4) Содержательная правильность – вводимые словарные характеристики должны быть адекватны смыслу добавляемого или редактируемого концепта. Примеры: ОБОБЩАЮЩИЙ_ПРИЗНАК ( 'цвет' ) = 'химические свойства вещества' ??? БАЗОВЫЙ_ПРИЗНАК ( 'метр' ) = 'температура' ??? 'лед'  'отверстие' And 'цилиндрической формы' ??? - определение является формально правильным. Такого рода ошибки не являются формально контролируемыми; они могут оставаться не выявленными, пока онтология не начнет использоваться в приложениях, для которых именно эта связь окажется существенной.
  • 23. Решение задач формального контроля обусловлено возможностью построить формальное описание системы словарных признаков. a) определение области значений каждого признака; b) установление отношений зависимости по условиям применимости между признаками.
  • 24. Тестирование Тестирование как проверка формальной корректности (вместо контроля ввода) vs тестирование как содержательный экспертный контроль. Предмет тестирования во 2-м случае = ? Формальный ответ: проверка отдельного концепта = просмотр словарной статьи; собственно тестирование как экспертный контроль связей: • объемные отношения; • ассоциативные отношения; • функциональные отношения.
  • 25. Тестирование Терминология [Gomez-Perez]: • evaluation - общее название для процедур проверки; • verification - whether the ontology is building correctly • validation – whether the ontology definitions really model the real world • assessment – judging the ontology from the user's & application's point of view
  • 26. Автоматизация пополнения • Интеграция онтологий (ontology merging) • Собственно пополнение (ontology learning) - по корпусу текстов - из традиционных словарей (+WordNet ?)
  • 27. Интеграция номологических и фактографических знаний (представление экземпляров) Онтология – знание о применимости признаков к классу объектов. Фактография (напр., БД) – знание о значениях признаков для конкретного объекта. Относительность разделения на классы и экземпляры (ср. марки и автомобили).