В данной статье поднята проблематика анализа информации, предоставляемой информационными системами. Рассмотрены актуальные способы ее структурирования и представления пользователю. Предложена концепция построения и применения онтологических структур в информационных системах для анализа данных.
This article is devoted to the problems of data analysis that is provided by information systems. The actual methods of structuring and representation for user were considered. There was proposed the principle of making and applying the ontology structure in information systems for data analysis.
Исследование и разработка алгоритмов распознавания номерных знаков
Концепция применения онтологических структур в ERP-системах
1. Симкин Анатолий Владимирович,
бакалавр техники и технологии по направлению «Автоматизация и управление»,
магистрант 1го года обучения кафедр:
- управленческого консалтинга факультета ИБС МФТИ,
- систем автоматического управления факультета ИУ МГТУ им. Баумана,
e-mail: simkin.av@gmail.com
Концепция применения онтологических структур в ERP-системах
А.В. Симкин
The concept of application of ontology structures in ERP-systems
A.V. Simkin
Аннотация
В данной статье поднята проблематика анализа информации, предоставляемой
информационными системами. Рассмотрены актуальные способы ее структурирования
и представления пользователю. Предложена концепция построения и применения
онтологических структур в информационных системах для анализа данных.
Ключевые слова: анализ данных, информационная система, онтологическая
структура, семантическая сеть, система планирования производства, таксономия.
Abstract
This article is devoted to the problems of data analysis that is provided by information
systems. The actual methods of structuring and representation for user were considered. There was
proposed the principle of making and applying the ontology structure in information systems
for data analysis.
Key words: data analysis, information system, ontology structure, semantic network,
manufacturing resource planning system, taxonomy.
Введение
Экспоненциальный рост объемов информации в современном мире заставил
человечество не только разрабатывать системы управления информацией, но и применять
математические модели для анализа этой информации. Проблемы структурирования
и отображения пользователю данной информации в настоящий момент являются
ключевыми в вопросах создания подобных информационных систем.
2. Кто виноват?
Возможно ли менеджеру, контактирующему ежедневно с множеством клиентов,
имеющих различный статус, быстро ответить на вопрос о состоянии заказа без подручных
средств? Это практически невозможно. Необходимо держать в голове огромное количество
информации, которое не каждый человек способен проанализировать, не говоря уже о том,
чтобы запомнить.
Как узнать дебиторскую задолженность в разрезе заказов? Как узнать время задержки
заказа на производстве? Как объяснить клиенту, почему не доставлена часть товаров? Чтобы
ответить на любой из вопросов порой необходимо немалое время. Говоря
об информационных аспектах подобных проблем, менеджеры часто жалуются на них своим
руководителям, а те, не получив удовлетворительного ответа от собственных ИТ-служб,
в свою очередь, обращаются к внешним консультантам.
Подобные вопросы ИТ-поддержки оперативного управления в любой организации
лежат в сфере внедрения инструментов управления эффективностью. Для начала придется
автоматизировать учетные задачи, внедрив систему планирования ресурсов предприятия,
или ERP-систему. Когда придет понимание того, что не на все вопросы необходимого
представления информации и управленческого анализа она может ответить, целесообразно
применять другие инструменты. К таким инструментам поддержки принятия решений
относятся системы класса BI (Business Intelligence), которые предоставляют менеджерам
всех уровней управления широкие возможности для многоаспектного анализа.
Обзор технологий анализа и структурирования данных
Как работает Business Intelligence? Класс BI-систем предназначен для того, чтобы
менеджер при анализе информации мог опираться на сложные модели и алгоритмы
прогноза [1]. В основе архитектуры подобных систем в большинстве случаев лежат OLAP
(On-Line Analytical Processing) технологии. Производители BI-систем порой оставляют
в тени данный факт, рекламируя такие технологии как data mining (разведка данных),
operational data store (оперативный склад данных) и прочее. Фактически, BI – это расширение
OLAP технологий специализированными программными инструментами анализа.
Развитие систем управления базами данных (СУБД) привело к включению
возможностей OLAP-технологий в системы лидирующих поставщиков, например, такие как
Oracle и Microsoft. Логично, что эти компании предлагают рынку свой встроенный
BI-функционал в СУБД, что способствует развитию данного сегмента ИТ-отрасли.
3. OLAP – это технология обработки информации, которая включает в себя составление
и динамическую публикацию отчѐтов и документов. В реальности ее можно представить
как мгновенный снимок реляционной базы данных, приведенной к определенной структуре,
называющейся OLAP-кубом [2]. За счет агрегирования реляционной информации может
достигаться увеличение скорости обработки подобных запросов относительно базы данных
в сотни раз.
Таким образом, можно построить определенную структуру данных, которая поможет
быстро формировать необходимый отчет. Использование BI-приложений предоставляет
возможность провести качественный анализ этих данных, и, возможно, найти необходимую
информацию для принятия решений.
Однако как происходит на практике? Для проведения подобного анализа необходимо
открывать многомерные отчеты, проверять актуальность информации, на основании которой
сформирован OLAP-отчет. Если данные в OLAP-кубах обновляются в соответствии
с принятым в компании регламентом (как правило, не чаще, чем 1 раз в сутки),
то эффективность аналитической работы менеджера в значительной степени будет зависеть
от качества хранения и представления данных, а также от скорости их обновления.
Такова практика применения и реальность OLAP-анализа. Каковы сейчас видятся
перспективы его улучшения в будущем?
Концепция применения онтологических структур
Ответ достаточно прост. Необходимо создать такой механизм, интегрированный
в информационную систему, который позволит быстро и интерактивно находить требуемую
информацию.
Для этого необходимо реализовать функциональность, используемую при построении
семантических сетей. Семантическая сеть – это один из способов представления знаний.
Однако не совсем простой: для определенного эффекта от использования необходимо
задаться семантическими отношениями между элементами, множествами и частями
объектов. Это отношения называют «отношением классификации».
Концепция «Semantic Web» (семантическая паутина) на базе онтологий
(«Web Ontology Language» [3]) дает формализованные отношения между объектами
с помощью концептуальной схемы [4]. В данном случае, типичными примерами онтологий
является таксономия и набор правил вывода.
Основная идея реализации подобного механизма состоит в том, что определяется
таксономия классов объектов и отношения между ними [5]. Это определяет концептуальную
4. схему. На ее основе совместно с набором правил вывода можно сформировать
онтологическую структуру (см. рисунок 1).
Рисунок 1. Этапы формирования онтологической структуры
Как же построить онтологии в информационной системе? В любой информационной
системе имеется база данных, т.е. информация, структурированная по определенным
правилам (нормальным формам). ER-модель данных (информационная модель) – это модель
данных, описывающая отношения между объектами. Таким образом, первый шаг
к формированию онтологической структуры может быть пройден достаточно просто.
Следующий шаг – определение таксономии классов объектов. В общем случае
таксономию можно выделить по информационной модели, однако это не совсем верно.
Информационная модель всегда будет намного сложнее, чем это требуется
в функциональности. При построении надо применять определенный «анализ» данных
для их последующей интерпретации пользователю. Таким образом, концептуальную схему
можно получить за счет согласования полученной таксономии и отношений между
объектами.
Для полной онтологии необходимо предусмотреть механизм связи самих данных
с концептуальной схемой. На рисунке 2 представлена концепция формирования подобной
онтологической структуры.
5. DATA
Entity-
relationship
Ontology
Structure
mapping
mapping
m
apping
Direct semantic layer
Ontology semantic layer
Information layer
Рисунок 2. Концепция формирования онтологической структуры
Таким образом, после формирования таксономии объектов и их структуры
отображения данных в концептуальную схему, необходимо пройти огромный путь
по интеллектуальной интерпретации этих данных для вывода пользователю. Рассмотрим
простой пример, понятие покупатель может быть определен отношением «имеет»
с понятием заказ покупателя. Тогда, как заказ покупателя должно иметь адрес доставки,
который, в свою очередь, может быть определен как разновидность понятия
местонахождения. В случае, когда у объекта заказ покупателя имеется более 100 связей,
возникает сложность в их выводе пользователю. В качестве вывода этой информации
предлагается использовать структуру семантической сети, представленную в виде облака
ключевых слов (tag cloud) и изображенную в трехмерном визуальном пространстве.
Это позволит предоставить пользователю полную картину связей между объектами.
Интерфейс также должен предоставлять пользователю возможность, вывести данную
связанную структуру объектов для любого из отображаемых элементов простым нажатием
ссылки. Это позволит быстро и интерактивно переноситься между связями к данным того
или иного объекта, причем скорость поиска нужной информации, теоретически, должна
вырасти на порядок.
6. Заключение
Таким образом, была предложена концепция формирования и построения
онтологических структур для применения в информационных системах при анализе данных.
Кроме того предложены требования к интерфейсу для пользователя, который предоставит
возможность для интерактивного анализа связанных данных.
Литература
1. Корнеев В.В., Гареев А.Ф., Васютин С.В., Райх В.В. Базы данных.
Интеллектуальная обработка информации. М.: Нолидж, 2001. – 352 с.
2. Кудрявцев Ю.А. OLAP технологии: обзор решаемых задач и исследований //
Бизнес-информатика. – 2008. – №1. – С. 66-70.
3. OWL 2 Web Ontology Language. Document Overview. W3C Recommendation –
URL: http://www.w3.org/TR/2009/REC-owl2-overview-20091027 (дата обращения 01.04.2010).
4. Дэвидсон, Д. Об идее концептуальной схемы // Аналитическая философия:
Избранные тексты. – М.: Изд-во МГУ, 1993. – C. 144-159.
5. Tim Berners-Lee, James Hendler, Ora Lassila. The Semantic Web // Scientific
American Magazine. – 2001, May.