SlideShare une entreprise Scribd logo
1  sur  56
Télécharger pour lire hors ligne
Семантични технологии основи
Мариана Дамова, PhD
Moзайка
15.10.2013

BG051PO001-3.3.06-0022/19.03.2012 "на
нови практики и знания в обучението по
компютърна лингвистика"
Семантика
http://www.thefreedictionary.com/semantics
se·man·tics (s-mntks)n. (used with a sing. or pl. verb)
1. Linguistics The study or science of meaning in language.
2. Linguistics The study of relationships between signs and symbols and what they
represent. Also called semasiology.
3. The meaning or the interpretation of a word, sentence, or other language form:
We're basically agreed; let's not quibble over semantics.
semantics [sɪˈmæntɪks]n (functioning as singular)
1. (Linguistics) the branch of linguistics that deals with the study of meaning,
changes in meaning, and the principles that govern the relationship
between sentences or words and their meanings
2. (Philosophy / Logic) the study of the relationships between signs and symbols and what
they represent
3. (Philosophy / Logic) Logic
a. the study of interpretations of a formal theory
b. the study of the relationship between the structure of a theory and its subject matter
c. (of a formal theory) the principles that determine the truth or falsehood of sentences
within the theory, and the references of its terms
BG051PO001-3.3.06-0022/19.03.2012
"Интегриране на нови практики и знания
в обучението по компютърна
Съдържание
•
•
•
•
•
•
•
•
•
•

Въвеждащи бележки
Теоретични основи на семантичния уеб
Семантичните технологии като пластовете на торта
Приложения на семантичния уеб
Свързани отворени данни
RDF, RDFs, OWL – W3C стандарти
Език за заявки - SPARQL
Онтология
Примери на онтологии
Заключение
BG051PO001-3.3.06-0022/19.03.2012
"Интегриране на нови практики и знания
в обучението по компютърна
лингвистика"
Интернет

• Email
• WWW

Световна система от компютърни мрежи –
мрежа от мрежи, в която потребителите на
всеки един компютър могат до изтеглят
информация, ако имат разрешение, от
всеки друг компютър
Измислена е от Advanced Research Projects
Agency (ARPA) на правителството на САЩ
през 1969 и е известна в началото като
ARPANET
Днес интернет е публично само-поддържащо
се
съоръжение,
позволяващо
сътрудничество, което е достъпно за
стотици милиони хора по целия свят
Интернет използва една част от всички
ресурси на съществуващите понастоящем
телекомуникационни мрежи и няколко
протокола,
наречени
TCP/IP
(for
Transmission
Control
Protocol/Internet
Protocol)

BG051PO001-3.3.06-0022/19.03.2012
"Интегриране на нови практики и знания
в обучението по компютърна
лингвистика"
WWW – World Wide Web
 роден през 1990
 първоначалният проект за хипертекст е
предложен от Sir Tim Berners-Lee, физик
в лабораторията CERN в Женева,
Швейцария, през март 1989.
хипертекст
е
метод
за
моментно
рефериране
(instant cross-referencing)
 първият уеб сървър е пуснат онлайн през 1990 и първият уеб
броузър е публикуван. До края на 1991 WWW става публично
достъпен за всички
 успехът на World Wide Web се базира на глобализирането на
идеята да хипертекст и прилагането й в глобалната мрежа
Интернет


http://www.ted.com/talks/tim_berners_lee_on_the_next_web.html
BG051PO001-3.3.06-0022/19.03.2012
"Интегриране на нови практики и знания
в обучението по компютърна
лингвистика"
WWW – източник на информация
 Съдържание: текст, таблици и изображения
 21.22 милиарда уеб страници през 2009
“The Indexed Web contains at least 3.77 billion pages (Wednesday, 09 October, 2013)”
 Търсачките индексират уеб страници и сравняват индексите с текстовете
на заявките на потребителите, като връщат големи количества резултати,
които не винаги са подредени по най-подходящия за потребителя начин

Flight LZ304
Fgh)(*YUVSDFL
Sofia-Berlin
??*4WDGDFGFG
WWW е огромен източник на информация за хората, понеже те
Dep. 02.12.2009 1500
Dfg2359$%%6Dep
са способни да прочетат, разберат, интерпретират
Arr. 02.12.2009 1730
Asdj7&%)(#dgWR
съдържанието и правят изводи като събират информация от
Price 230€
#%45GFG 230€
различни източници в уеб пространството.
С растежа му става все по-трудно да се обозре съдържанието в
book now
Еиж4f fgi
него и да се интерпретира
Машините не разбират естествен език и съдържанието на
уеб страниците, но трябва да дойдат на помощ.
BG051PO001-3.3.06-0022/19.03.2012
"Интегриране на нови практики и знания
в
обучението
по
компютърна
Как ? …
Информацията в Уеба трябва да бъде предоставена по такъв начин,
че да не бъде само разбираема за хората, но и обработваема от
машините.

Технически изисквания
• да се даде възможност ресурсите да бъдат анотирани с информация за
тях, с метаданни - данни за данните
•

да се разшири съществуващият маркиращ език за Уеба, така че да може
да присъедини тези анотации и метаданни

•

да се използва формална логика при специфицирането на анотации, така
че те да могат да бъдат интерпретират автоматично от машини

•

да се направи този език стандарт, така че метаданните да могат да се
споделят, разширяват, съединяват, обработват …

BG051PO001-3.3.06-0022/19.03.2012
"Интегриране на нови практики и знания
в обучението по компютърна
Семантичен Уеб – The Semantic Web
Семантичния Уеб е Уебът от данни за разлика от настоящия уеб,
който е уеб от документи. Семантичният уеб е нещо като глобална
база данни.

Динамична интерпретация за непредполагаеми нужди

Автоматично обработваеми метаданни за:
– структурата (синтаксиса) и
– значението (семантиката)
на съдържанието, което се намира в Уеба
– представени в стандартна форма
BG051PO001-3.3.06-0022/19.03.2012
"Интегриране на нови практики и знания
в обучението по компютърна
Настоящият Уеб – Web 1.0

BG051PO001-3.3.06-0022/19.03.2012
"Интегриране на нови практики и знания
в обучението по компютърна
лингвистика"
Семантичният Уеб – Web 3.0

BG051PO001-3.3.06-0022/19.03.2012
"Интегриране на нови практики и знания
в обучението по компютърна
лингвистика"
Sir Tim Berners-Lee - създателят
Създателят на WWW.

През 1998 предлага визията за семантичния уеб в
статията “Semantic Web Road Map”
http://www.w3.org/DesignIssues/Semantic

Тази визия е доразвита в статия от 2001:
Tim Berners-Lee et al., "The Semantic Web", Scientific
American, May 2001
Дефиниция:
"The Semantic Web is an extension of the current web
in which information is given well-defined meaning,
better enabling computers and people to work in
cooperation.“ [Berners-Lee et al. 2001]
BG051PO001-3.3.06-0022/19.03.2012
"Интегриране на нови практики и знания
в обучението по компютърна
лингвистика"
Съдържание
•
•
•
•
•
•
•
•
•
•
•

Въвеждащи бележки
Теоретични основи на семантичния уеб
Семантичните технологии като пластове на торта
Приложения на семантичния уеб
Свързани отворени данни
RDF, RDFs, OWL – W3C стандарти
Език за заявки - SPARQL
Свързани отворени данни
Онтология
Примери на онтологии
Заключение
BG051PO001-3.3.06-0022/19.03.2012
"Интегриране на нови практики и знания
в обучението по компютърна
лингвистика"
Формална логика
•

Теоретичните основи на Семантичния Уеб се градят
върху формалната логика, логическото програмиране и
изкуствения интелект

Логика – що е то?
• Логиката
е
формална
система
за
организиране
и
структуриране на изрази и аргументи и правене на изводи за
тях, което включва определяне на тяхната валидност и
идентифициране на противоречия
• В логиката човек употребява изрази, които определят като
истинни на базата на общи изрази от специфична форма,
наричани правила на извод или аксиоми, които създават нови
NB! Извеждането на нови изрази зависи от валидността на
знанието, от което те са изведени!

BG051PO001-3.3.06-0022/19.03.2012
"Интегриране на нови практики и знания
в обучението по компютърна
Формална система
Една логическа система се дефинира на базата на:
- Формален език, който да описва логическите изрази;
- Граматика, която дефинира правилното използване на езика
- Апарат за извод, който създава условия системата да извежда
нови изрази (като се използват аксиоми и/или правила за извод)

Естествен Език

Логическа система

Граматика

Граматика

- Части на речта
- Синтаксис

- Индивиди
- Променливи

- Правила за изменение
- Правила за строеж на граматични
изречения

- Променливите обобщават индивиди
- Индивидите се свързват с предикати

Правила за извод
- ако нещо е вярно,

то и друго нещо е вярно

BG051PO001-3.3.06-0022/19.03.2012
"Интегриране на нови практики и знания
в обучението по компютърна
Логически извод
Логическа теория дефинира следната аксиома:
Ако всички X са Y и A е X, то A е Y

всички X са Y
AеX
---------------------AеY
Пример:
Ако всички мъже са смъртни
Сократ е мъж
-------------------------------------Сократ е смъртен
BG051PO001-3.3.06-0022/19.03.2012
"Интегриране на нови практики и знания
в обучението по компютърна

променливи
индивид
Свойства на логическата система
Важни свойства на логическата система:

•

Съгласуваност (consistency)
няма изрази в логическата система, които си противоречат
Сократ е мъж, Сократ не е мъж

•

Стабилност (soundness)
апаратът за извод на системата никога няма да позволи грешен
извод от вярна предпоставка
Всички мъже са смъртни, Сократ е мъж, то Сократ не е смъртен

•

Пълнота (completeness)
няма истинни изрази, които не могат да бъдат изведени от
системата, поне принципно
Всички мъже са смъртни, Виктор е мъж, то Виктор е смъртен
BG051PO001-3.3.06-0022/19.03.2012
"Интегриране на нови практики и знания
в обучението по компютърна
Предизвикателства

Логиката трябва да се занимава с сложността на
естествения език и на реалния свят

В компютърните системи, изразителността на логиката
трябва да се ограничи, за да се избягнат двусмислия
(ambiguities|
и
извеждането
на
факти
остава
изчислируемо (computationally possible)

BG051PO001-3.3.06-0022/19.03.2012
"Интегриране на нови практики и знания
в обучението по компютърна
Логика и семантика
•

“Семантиката” изследва значението на нещата

•

В информатиката семантиката е част от математическата
логика, където тя се отнася към значението на компютърните
програми

•

“Semantic computing” се отнася към опити да се определят
логическите системи на компютрите, т.е. да се дефинира
формален език, граматика и апарат за извод като формат на
данните и компютърни програми

•

В този смисъл семантичният уеб представлява разширение на
настоящия уеб във формална логическа система, в която
съдържанието в Уеба се представя като изрази, от които може
да се генерира ново знание

BG051PO001-3.3.06-0022/19.03.2012
"Интегриране на нови практики и знания
в обучението по компютърна
Съдържание
•
•
•
•
•
•
•
•
•
•

Въвеждащи бележки
Теоретични основи на семантичния уеб
Семантичните технологии като пластове на
торта
Приложения на семантичния уеб
Свързани отворени данни
RDF, RDFs, OWL – W3C стандарти
Език за заявки - SPARQL
Онтология
Примери на онтологии
Заключение
BG051PO001-3.3.06-0022/19.03.2012
"Интегриране на нови практики и знания
в обучението по компютърна
лингвистика"
Слоевете на Семантичния Уеб

BG051PO001-3.3.06-0022/19.03.2012
"Интегриране на нови практики и знания
в обучението по компютърна
Пирамида на управление на информацията

BG051PO001-3.3.06-0022/19.03.2012
"Интегриране на нови практики и знания
в обучението по компютърна
Съдържание
•
•
•
•
•
•
•
•
•
•

Въвеждащи бележки
Теоретични основи на семантичния уеб
Семантичните технологии като пластове на
торта
Приложения на семантичния уеб
Свързани отворени данни
RDF, RDFs, OWL – W3C стандарти
Език за заявки - SPARQL
Онтология
Примери на онтологии
Заключение
BG051PO001-3.3.06-0022/19.03.2012
"Интегриране на нови практики и знания
в обучението по компютърна
лингвистика"
Основни характеристики на семантичния уеб












управление на информацията на 21 век
стандарти за моделиране и представяне на данни
ново поколение софтуер за съхранение, известен по името семантични хранилища
голяма лекота в интегрирането на данни от разнородни източници
ниска цена на производство и поддръжка на данните
ефикасно използване на хардуерните ресурси
формат на представяне на данните без схема
автоматично вадене на изводи и генериране на ново знание
лесно свързване на данни от различни източници
извличането на информация от различни източници с една единствена заявка
единно представяне на информация извлечена от структурирани (бази данни, csv
файлове, excel таблици), полу-структурирани (уеб страници) и неструктурирани
източници (текстове)
 обобщение и изводи на базата на цялата тази информация, постигнато по
автоматизиран път

BG051PO001-3.3.06-0022/19.03.2012
"Интегриране на нови практики и знания
в обучението по компютърна
Очаквания към семантичния уеб


Ubiquitous networking – данните трябва да са свързани и използваеми
независимо от физическото им местоположение



Open everything – безпрецедентни нива на автоматизация налагат
мрежите да остават непрекъснато отворени



Adaptive information – “Уеб от данни” и “изпълним Уеб”, хора създават
данни извън документите и тези данни могат да бъдат събрани при нужда
или повикване



Adaptive service clouds – публикацията и консумирането на данни и
модели от данни като сервиз в облачните компютърни системи



Federated data – уебът от данни се състои от структурирани записи, които
са публикувани в уеба в преизползваеми или търсируеми формати но
Семантичния Уеб



Simulated intelligence – Уеб 3.0 ще знае какво хората искат и какво имат
ред вид с техните заявки

BG051PO001-3.3.06-0022/19.03.2012
"Интегриране на нови практики и знания
в обучението по компютърна
Семантичният Уеб в полза на бизнеса
 Семантичният Уеб се продава трудно на бизнеси, които
мислят за бърза печалба
 Семантичният Уеб е за хора, които предпочитат
ценностите, защото семантичният уеб помага да се
съхрани и запази най-ценното капиталовложение –
данните
 Семантичният уеб позволява бизнесите да започнат да
създават своите връзки през техните корпоративни
данни, съдържание и документи

Бизнес решения се правят на базата на достъп до
вярна и пълна информация.
Тя идва от данни
BG051PO001-3.3.06-0022/19.03.2012
"Интегриране на нови практики и знания
в обучението по компютърна
Семантичният Уеб в полза на бизнеса


Инвестиции в системи за управление на данни
 Бази данни
 Хранилища
 Бизнес интелигентност
 Управление на информационния цикъл
 Системи за управление на съдържанието
 Планиране на ресурси в предприятията
 Интеграция
 Търсене
Обръщане на данните в информация

 Данните в бизнес средата са логически свързани, но физически
разделени, което не позволява на системите за управление на
съдържанието да свържат отделните парчета информация
 Създават се проблеми, когато приложенията на могат да комуникират
помежду си през физически връзки
BG051PO001-3.3.06-0022/19.03.2012
"Интегриране на нови практики и знания
в обучението по компютърна
Семантичният Уеб в полза на бизнеса
 Семантичният Уеб създава средства да могат да се
обобщават автоматично големи и сложни информационни
екосистими
 Семантичният Уеб маже да се приложи стратегически в
управлението
на
информацията
в
предприятия,
управлението на предприятията и риска
 По същество Семантичният Уеб е средство
 Той дава възможност да се работи с по-добри метаданни, създава
евтини работни места за ръчна обработка на данните, дава много
по-силни възможности за одит, проследяване и дефиниране на
ективни правила върху споделени корпоративни данни
 Той спомага за развалянето на силозите от данни, които в момента
костват много средства на предприятията да ги направят
съвместими

BG051PO001-3.3.06-0022/19.03.2012
"Интегриране на нови практики и знания
в обучението по компютърна
Разчупване на силозите от данни

BG051PO001-3.3.06-0022/19.03.2012
"Интегриране на нови практики и знания в
Приложения на Семантичният Уеб
•

•
•

TripIt: Travel aggregator
http://www.tripit.com
ZoomInfo: People finder
http://www.zoominfo.com
Humminbird: Google
Open Knowledge Graph
http://www.businessinsider.com/googles-new-humminbird-search-algorithm-2013-9

•
•

Facebook: Open Graph Search
https://www.facebook.com/about/graphsearch
London Olympics 2012 Website
http://www.olympic.org/london-2012-summer-olympics
http://www.bbc.co.uk/sport/0/olympics/2012/

BG051PO001-3.3.06-0022/19.03.2012
"Интегриране на нови практики и знания
в обучението по компютърна
Съдържание
•
•
•
•
•
•
•
•
•
•

Въвеждащи бележки
Теоретични основи на семантичния уеб
Семантичните технологии като пластове на
торта
Приложения на семантичния уеб
Свързани отворени данни
RDF, RDFs, OWL – W3C стандарти
Език за заявки - SPARQL
Онтология
Примери на онтологии
Заключение
BG051PO001-3.3.06-0022/19.03.2012
"Интегриране на нови практики и знания
в обучението по компютърна
лингвистика"
Облак от отворени свързани данни

BG051PO001-3.3.06-0022/19.03.2012
"Интегриране на нови практики и знания
в обучението по компютърна
Множества данни
•

Freebase

•

DBPedia

•

Wikidata

•

CKAN

•

…

http://www.freebase.com
http://dbpedia.org
http://wikidata.org
http://ckan.org/

Пример на публикуван ресурс:
http://dbpedia.org/resource/Sofia

BG051PO001-3.3.06-0022/19.03.2012
"Интегриране на нови практики и знания
в обучението по компютърна
Енциклопедично знание в Семантичния Уеб
http://factforge.net

-

летища около Лондон
градове, където има картини на Модилиани
световни управници, които са били на власт между 1998 и 2005
5-скоростни коли, които се произвеждат в Европа
софтуерни фирми, основани в Съединените Щати
политици, родени в Германия

BG051PO001-3.3.06-0022/19.03.2012
"Интегриране на нови практики и знания
в обучението по компютърна
Естествен език и Семантичния Уеб
@Davidcamposh has visto el de Una verdad incomoda de
<Al Gore>...es muy bueno tambi
Davidcamposh’ve seen An Inconvenient Truth of <Al Gore> ... is very good also

positive sentiment
topic: Al Gore

Politician
Person
DBpedia URI

hasProfession

DBpedia URI
bornIn

United States

BG051PO001-3.3.06-0022/19.03.2012
"Интегриране на нови практики и знания
в обучението по компютърна
Съдържание
•
•
•
•
•
•
•
•
•
•

Въвеждащи бележки
Теоретични основи на семантичния уеб
Семантичните технологии като пластове на
торта
Приложения на семантичния уеб
Свързани отворени данни
RDF, RDFs, OWL – W3C стандарти
Език за заявки - SPARQL
Онтология
Примери на онтологии
Заключение
BG051PO001-3.3.06-0022/19.03.2012
"Интегриране на нови практики и знания
в обучението по компютърна
лингвистика"
RDF – Resource Description Framework
Flight LZ304
Sofia-Berlin
Dep. 02.12.2009 1500
Arr. 02.12.2009 1730
Price 230€
book now

Add mark-up

<flight>Flight LZ304
<from>Sofia</from>
<to>Berlin</to>
<dep>02.12.2009 1500</dep>
<arr>02.12.2009 1730</arr>
<price>230€</price>
</flight>

http://travel.com/Flight LZ304
:from http://travel.com/Sofia
:to http://travel.com/Berlin
:dep 02.12.2009 1500
:arr 02.12.2009 1730
:price 230
:currency http://travel.com/euro
BG051PO001-3.3.06-0022/19.03.2012
"Интегриране на нови практики и знания
в обучението по компютърна
RDF
Петър

живее

София

Насочен
именован граф

RDF тройки са URIs
Subject

Predicate

Object

http://www.anon.co
m/foaf#Peter

http://www.location
.org/rdf#lives_in

http://www.dbpedia
.org/resource/Sofia

Език за представяне на информация в Уеб пространството.
Предлага граф структура за изразяване на факти за неща.
 Модел за представяне на данни и синтаксис за споделяне на
знание за концепти в Уеба без да определя как концептите се
отнасят един към друг.
 RDF предлага модел за правене на логически изкази, който може да
се използва за вадене на извод.


BG051PO001-3.3.06-0022/19.03.2012
"Интегриране на нови практики и знания
в обучението по компютърна
Namespace
URI – Uniform Resource Identifier
http адрес
Namespace = URI + <tag>
<x xmlns:edi='http://ecommerce.example.org/schema'> </x>
или
edi:
<http://ecommerce.example.org/schema>
Book - книга
<http://ecommerce.example.org/schema/Book>
- счетоводна книга
<http://library.com/ontology#Book>
- литературно произведение

BG051PO001-3.3.06-0022/19.03.2012
"Интегриране на нови практики и знания
в обучението по компютърна
RDFs – RDF Schema
Език, който позволява формализация на значението на нещата,
представени в RDF на базата на компютърна логика.
Дефинира прости онтологии (модели на понятия и връзките между
тях), които могат да се използват за генериране на ново знание.
http://travel.com/Sofia
Is a http://travel.com/City
http://travel.com/City
SubClassOf
http://travel.com/Populated Place

София

rdf:type

Град

http://travel.com/Flight LZ304
:from http://travel.com/Sofia
:to http://travel.com/Berlin
:dep 02.12.2009 1500
:arr 02.12.2009 1730
:price 230
:currency http://travel.com/euro

rdfs:subClassOf

BG051PO001-3.3.06-0022/19.03.2012
"Интегриране на нови практики и знания
в обучението по компютърна

Населено място
RDF, RDFs и OWL Namespaces

rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>
rdfs: <http://www.w3.org/2000/01/rdf-schema#>
owl: <http://www.w3.org/2002/07/owl#>

BG051PO001-3.3.06-0022/19.03.2012
"Интегриране на нови практики и знания
в обучението по компютърна
OWL – Web ontology language
Език, който разширява експресивността на онтологията, като
позволява да се правят по-сложни модели за света с цената на това
те да станат по-трудни за компютърна обработка.
http://travel.com/Sofia
IsPlaceIn http://travel.com/Bulgaria
http://travel.com/Bulgaria
IsPlaceIn http://travel.com/Europe
IsPlaceIn is a transitive property
http://travel.com/Sofia
IsPlaceIn http://travel.com/Europe
София

се_намира_в

България

http://travel.com/Flight LZ304
:from http://travel.com/Sofia
:to http://travel.com/Berlin
:dep 02.12.2009 1500
:arr 02.12.2009 1730
:price 230
:currency http://travel.com/euro
се_намира_в

Европа

се_намира_в
ако “се_намира” дефинирано като транзитивно свойство
BG051PO001-3.3.06-0022/19.03.2012
"Интегриране на нови практики и знания
в обучението по компютърна
OWL

Full

DL

Lite

Има три разновидности на OWL, които са направени
като подмножества едно на друго
•
•
•

OWL DL разширява изразителността на OWL Litе
OWL Full разширява изразителността на OWL DL
OWL Full е обединението на OWL синтаскиса и RDF/S,

OWL Full включва пълната изразителност на RDF(S) и
следователно е неизчислим

OWL
DL
е
ограничен
до
подмножество
дескриптивната логика и за това е изчислим
OWL Lite е опростено подмножество на OWL DL

BG051PO001-3.3.06-0022/19.03.2012
"Интегриране на нови практики и знания
в обучението по компютърна

на
Дескриптивна логика
•

•
•

•

Дефинира понятия, представителни за дадена област от живота,
после използва понятията, за да дефинира свойствата на
обектите и индивидите от тази област
Има семантичен апарат на базата на формалната логика,
използва автоматичното извеждане на знания от експлицитно
налично знание
Поддържа модели за извод, които се базират на класификация на
понятия и на класификация на индивиди
– Класификацията на концепти дефинира йерархични връзки,
наречени subsumption relationships. Така се образуват
йерархични концептуални структури. Тези йерархии помагат
да се ускори процесът на извеждане на нова информация
заради описанието на свързаността между понятията - TBox
– Класификацията на индивиди определя дали даден индивид е
представител на дадено понятие. Дава информация за
свойствата
на
индивида.
Тези
връзки
предизвикват
генерирането на нови факти в базата от знания - ABox
Процедурите за вадене на извод на дескриптивната логика са
процедури, които са винаги разрешими, базирани са на
предикатната логика от първи ред; т.е. наблюдава се зависимост
между изразителната сила на дескриптивната логика и нейната
разрешимост
BG051PO001-3.3.06-0022/19.03.2012
"Интегриране на нови практики и знания в
обучението по компютърна лингвистика"
Изразителност на RDFs и OWL
RDFs
Hierarchy of classes
Hierarchy of properties
Domain and Range restrictions of the properties

OWL
Types of properties
(transitive, symmetric, inverse, functional, inverse functional)
Class construction
Property construction

rdfs:Class и owl:CLass

Библиография:
http://www.w3.org/TR/rdf-primer/
http://www.w3.org/TR/rdf-schema/
http://www.w3.org/TR/owl2-primer/
BG051PO001-3.3.06-0022/19.03.2012
"Интегриране на нови практики и знания
в обучението по компютърна
Съдържание
•
•
•
•
•
•
•
•
•
•

Въвеждащи бележки
Теоретични основи на семантичния уеб
Семантичните технологии като пластове на
торта
Приложения на семантичния уеб
Свързани отворени данни
RDF, RDFs, OWL – W3C стандарти
Език за заявки - SPARQL
Онтология
Примери на онтологии
Заключение
BG051PO001-3.3.06-0022/19.03.2012
"Интегриране на нови практики и знания
в обучението по компютърна
лингвистика"
SPARQL – език за заявки за RDF
SPARQL създава възможности
да се задават въпроси на
модела на графа или схемата
на дадена RDF база.

живее_в

обект

човек

SPARQL
1.1
включва
и
операции
от
теория
на
множествата и федерирани
заявки, насочващи се към
различни сървъри през една
заявка.
BG051PO001-3.3.06-0022/19.03.2012
"Интегриране на нови практики и знания
в обучението по компютърна

град
се_намира_в

Проектиран е да отговаря за
изискания
проучени
и
дефинирани в работни групи
на W3C и покрива редица
логически
изрази
от
предикатната логика.

?обект
обект

България

лингвист
Пример на SPARQL заявка
Има ли полет от София до Германия на цена под 250 Евро?

SELECT ?flight WHERE {
?flight :from http://travel.com/Sofia
?flight :to ?place
?place :isPlaceIn http://travel.com/Germany
?flight :price ?price
?flight :currency http://travel.com/euro
}

FILTER
(?price < 250)

http://travel.com/Flight LZ304
:from http://travel.com/Sofia
:to http://travel.com/Berlin
:dep 02.12.2009 1500
:arr 02.12.2009 1730
:price 230
:currency http://travel.com/euro

Библиография:
http://www.w3.org/TR/sparql11-query/
BG051PO001-3.3.06-0022/19.03.2012
"Интегриране на нови практики и знания
в обучението по компютърна
Съдържание
•
•
•
•
•
•
•
•
•
•

Въвеждащи бележки
Теоретични основи на семантичния уеб
Семантичните технологии като пластове на
торта
Приложения на семантичния уеб
Свързани отворени данни
RDF, RDFs, OWL – W3C стандарти
Език за заявки - SPARQL
Онтология
Примери на онтологии
Заключение
BG051PO001-3.3.06-0022/19.03.2012
"Интегриране на нови практики и знания
в обучението по компютърна
лингвистика"
Онтология
Спецификация на концептуализация
(Tom Gruber, 1992)
• Експлицитно описание на дадена област от света
–
–
–

понятия
свойства, атрибути на понятията
ограничения на свойства и атрибути

• Дефинира
–
–

•

общ речник
споделено разбиране
за дадена област от света, дадено понятие или дадена релация

Резултат:
–
–
–
–
–

споделяне на разбиране между хора и софтуерни агенти
преизползване на описаните знания в определена област от света
да направи експлицитни дадени допускания за определена област от света
да се разделят специфичното знание и оперативното знание
да се анализира специфичното знание за дадена област от света
BG051PO001-3.3.06-0022/19.03.2012
"Интегриране на нови практики и знания
в обучението по компютърна
История на онтологията
Parmenides of Elea, ancient Greek philosopher (early 5th century
BCE) made the ontological argument against nothingness,
essentially denying the possible existence of a void.
Jacob Lorhard, German philosopher (1561 - 1609)
1607 - First occurrence of the word Ontology (lat. Ontologia) and
the first published ontology

BG051PO001-3.3.06-0022/19.03.2012
"Интегриране на нови практики и знания
в обучението по компютърна
Типове онтологии
• Upper Ontology – model of the common objects that are
applicable across a wide range of domain ontologies

• Domain Ontology – an ontology developed for a specific
domain; conforms to an upper ontology
• Application Ontology – an ontology created for a specific
application; may conform to a domain ontology

appl
ontology
domain ontology
upper ontology
BG051PO001-3.3.06-0022/19.03.2012
"Интегриране на нови практики и знания
в обучението по компютърна
Съдържание
•
•
•
•
•
•
•
•
•
•

Въвеждащи бележки
Теоретични основи на семантичния уеб
Семантичните технологии като пластове на
торта
Приложения на семантичния уеб
Свързани отворени данни
RDF, RDFs, OWL – W3C стандарти
Език за заявки - SPARQL
Онтология
Примери на онтологии
Заключение
BG051PO001-3.3.06-0022/19.03.2012
"Интегриране на нови практики и знания
в обучението по компютърна
лингвистика"
Примери на онтологии
Upper Ontologies:
• Dublin Core
• GFO - General Formal Ontology
• OpenCyc/Cyc - Cycorp
• SUMO - Suggested Upper Merged Ontology
• DOLCE - Descriptive Ontology for Linguistic and Cognitive Engineering
• PROTON - ProtoOntology
Domain Ontologies:
• E-commerce : Rosetta-Net
• Business: Good relations
• Medical: GALEN, UMLS
• Engineering: EngMath

BG051PO001-3.3.06-0022/19.03.2012
"Интегриране на нови практики и знания
в обучението по компютърна
Съдържание
•
•
•
•
•
•
•
•
•
•

Въвеждащи бележки
Теоретични основи на семантичния уеб
Семантичните технологии като пластове на
торта
Приложения на семантичния уеб
Свързани отворени данни
RDF, RDFs, OWL – W3C стандарти
Език за заявки - SPARQL
Онтология
Примери на онтологии
Заключение
BG051PO001-3.3.06-0022/19.03.2012
"Интегриране на нови практики и знания
в обучението по компютърна
лингвистика"
Заключение

•
•
•
•
•

Запознахме се със
Семантичния Уеб
Управление на информацията през 21 век
Стандарти за представяне на знанията в семантичния уеб
Теоретични основи на семантичния уеб
Дескриптивна логика
Дефиниция на онтология
Следващия път ще разгледаме
Проектиране на онтологии и връзката им с езиковите
технологии

BG051PO001-3.3.06-0022/19.03.2012
"Интегриране на нови практики и знания
в обучението по компютърна
Въпроси ? …

Благодаря за вниманието!

mariana.damova@mozajka.co
me@marianadamova.com
damova.mariana@gmail.com
BG051PO001-3.3.06-0022/19.03.2012
"Интегриране на нови практики и знания
в обучението по компютърна
лингвистика"

Contenu connexe

Similaire à семантични технологии основи

Share.TEC project in Bulgarian, P. Boytchev
Share.TEC project in Bulgarian, P. BoytchevShare.TEC project in Bulgarian, P. Boytchev
Share.TEC project in Bulgarian, P. BoytchevShare.TEC
 
An ontology based approach for sharing digital resources in teacher education
An ontology based approach for sharing digital resources in teacher educationAn ontology based approach for sharing digital resources in teacher education
An ontology based approach for sharing digital resources in teacher educationguest0b1f10
 
An ontology based approach for sharing digital resources in teacher education
An ontology based approach for sharing digital resources in teacher educationAn ontology based approach for sharing digital resources in teacher education
An ontology based approach for sharing digital resources in teacher educationErik Axdorph
 
An ontology based approach for sharing digital resources in teacher education
An ontology based approach for sharing digital resources in teacher educationAn ontology based approach for sharing digital resources in teacher education
An ontology based approach for sharing digital resources in teacher educationguest0b1f10
 
European digital repositories (Bulgarian) P. Boytchev
European digital repositories (Bulgarian) P. BoytchevEuropean digital repositories (Bulgarian) P. Boytchev
European digital repositories (Bulgarian) P. BoytchevShare.TEC
 
Web Services Security
Web Services SecurityWeb Services Security
Web Services Securitynevzasroma
 
НАУКА ЗА ДАННИТЕ.pptx
НАУКА ЗА ДАННИТЕ.pptxНАУКА ЗА ДАННИТЕ.pptx
НАУКА ЗА ДАННИТЕ.pptxAntonPetrov49
 
Индивидуален план на клуб "Web design"
Индивидуален план на клуб "Web design"Индивидуален план на клуб "Web design"
Индивидуален план на клуб "Web design"mnpc2012
 
Система за електронно обучение и видеоконференции iKnow
Система за електронно обучение и видеоконференции iKnowСистема за електронно обучение и видеоконференции iKnow
Система за електронно обучение и видеоконференции iKnowrobertbul
 
Cloud computing course overview
Cloud computing course overviewCloud computing course overview
Cloud computing course overviewMiroslav Lessev
 
Модул No. 1 – Обработка на информация
Модул No. 1 – Обработка на информацияМодул No. 1 – Обработка на информация
Модул No. 1 – Обработка на информацияKarel Van Isacker
 
услуги и ресурси на интернет от ново поколение
услуги и ресурси на интернет от ново поколениеуслуги и ресурси на интернет от ново поколение
услуги и ресурси на интернет от ново поколениеPetya Kubratova
 

Similaire à семантични технологии основи (14)

Share.TEC project in Bulgarian, P. Boytchev
Share.TEC project in Bulgarian, P. BoytchevShare.TEC project in Bulgarian, P. Boytchev
Share.TEC project in Bulgarian, P. Boytchev
 
An ontology based approach for sharing digital resources in teacher education
An ontology based approach for sharing digital resources in teacher educationAn ontology based approach for sharing digital resources in teacher education
An ontology based approach for sharing digital resources in teacher education
 
An ontology based approach for sharing digital resources in teacher education
An ontology based approach for sharing digital resources in teacher educationAn ontology based approach for sharing digital resources in teacher education
An ontology based approach for sharing digital resources in teacher education
 
An ontology based approach for sharing digital resources in teacher education
An ontology based approach for sharing digital resources in teacher educationAn ontology based approach for sharing digital resources in teacher education
An ontology based approach for sharing digital resources in teacher education
 
European digital repositories (Bulgarian) P. Boytchev
European digital repositories (Bulgarian) P. BoytchevEuropean digital repositories (Bulgarian) P. Boytchev
European digital repositories (Bulgarian) P. Boytchev
 
Web Services Security
Web Services SecurityWeb Services Security
Web Services Security
 
НАУКА ЗА ДАННИТЕ.pptx
НАУКА ЗА ДАННИТЕ.pptxНАУКА ЗА ДАННИТЕ.pptx
НАУКА ЗА ДАННИТЕ.pptx
 
Индивидуален план на клуб "Web design"
Индивидуален план на клуб "Web design"Индивидуален план на клуб "Web design"
Индивидуален план на клуб "Web design"
 
Melchor
MelchorMelchor
Melchor
 
Система за електронно обучение и видеоконференции iKnow
Система за електронно обучение и видеоконференции iKnowСистема за електронно обучение и видеоконференции iKnow
Система за електронно обучение и видеоконференции iKnow
 
DIPLOMA_MAGISTUR
DIPLOMA_MAGISTURDIPLOMA_MAGISTUR
DIPLOMA_MAGISTUR
 
Cloud computing course overview
Cloud computing course overviewCloud computing course overview
Cloud computing course overview
 
Модул No. 1 – Обработка на информация
Модул No. 1 – Обработка на информацияМодул No. 1 – Обработка на информация
Модул No. 1 – Обработка на информация
 
услуги и ресурси на интернет от ново поколение
услуги и ресурси на интернет от ново поколениеуслуги и ресурси на интернет от ново поколение
услуги и ресурси на интернет от ново поколение
 

Plus de Mariana Damova, Ph.D

ИКТ програма 2018-2020 Хоризонт 2020 мариана дамова
ИКТ програма 2018-2020 Хоризонт 2020 мариана дамоваИКТ програма 2018-2020 Хоризонт 2020 мариана дамова
ИКТ програма 2018-2020 Хоризонт 2020 мариана дамоваMariana Damova, Ph.D
 
Geography of Letters - The Spirituality of Sofia in the Historic Memory
Geography of Letters - The Spirituality of Sofia in the Historic MemoryGeography of Letters - The Spirituality of Sofia in the Historic Memory
Geography of Letters - The Spirituality of Sofia in the Historic MemoryMariana Damova, Ph.D
 
Startup Europe Week Sofia introduction
Startup Europe Week Sofia introductionStartup Europe Week Sofia introduction
Startup Europe Week Sofia introductionMariana Damova, Ph.D
 
Industry informofmozaikathehumanizingtechnologieslab june23
Industry informofmozaikathehumanizingtechnologieslab june23Industry informofmozaikathehumanizingtechnologieslab june23
Industry informofmozaikathehumanizingtechnologieslab june23Mariana Damova, Ph.D
 
Industry informofmozaikathehumanizingtechnologieslab june23
Industry informofmozaikathehumanizingtechnologieslab june23Industry informofmozaikathehumanizingtechnologieslab june23
Industry informofmozaikathehumanizingtechnologieslab june23Mariana Damova, Ph.D
 
Communication channels for the european single digital market
Communication channels for the european single digital marketCommunication channels for the european single digital market
Communication channels for the european single digital marketMariana Damova, Ph.D
 
Bulgariana europeana27112013 ним
Bulgariana europeana27112013 нимBulgariana europeana27112013 ним
Bulgariana europeana27112013 нимMariana Damova, Ph.D
 
NLIWoD ISWC 2014 - Multilingual Retrieval Interface for Structured data on th...
NLIWoD ISWC 2014 - Multilingual Retrieval Interface for Structured data on th...NLIWoD ISWC 2014 - Multilingual Retrieval Interface for Structured data on th...
NLIWoD ISWC 2014 - Multilingual Retrieval Interface for Structured data on th...Mariana Damova, Ph.D
 
Multilingual Access to Cultural Heritage Content on the Semantic Web - Acl2013
Multilingual Access to Cultural Heritage Content on the Semantic Web - Acl2013Multilingual Access to Cultural Heritage Content on the Semantic Web - Acl2013
Multilingual Access to Cultural Heritage Content on the Semantic Web - Acl2013Mariana Damova, Ph.D
 
Support Europeana in Securing Funding for the Connecting Europe Facility (CEF)
Support Europeana in Securing Funding for the Connecting Europe Facility (CEF)Support Europeana in Securing Funding for the Connecting Europe Facility (CEF)
Support Europeana in Securing Funding for the Connecting Europe Facility (CEF)Mariana Damova, Ph.D
 
National aggregatorvarna032013 marianadamova
National aggregatorvarna032013 marianadamovaNational aggregatorvarna032013 marianadamova
National aggregatorvarna032013 marianadamovaMariana Damova, Ph.D
 
National aggregatorvarna032013 marianadamova
National aggregatorvarna032013 marianadamovaNational aggregatorvarna032013 marianadamova
National aggregatorvarna032013 marianadamovaMariana Damova, Ph.D
 

Plus de Mariana Damova, Ph.D (20)

ИКТ програма 2018-2020 Хоризонт 2020 мариана дамова
ИКТ програма 2018-2020 Хоризонт 2020 мариана дамоваИКТ програма 2018-2020 Хоризонт 2020 мариана дамова
ИКТ програма 2018-2020 Хоризонт 2020 мариана дамова
 
Geography of Letters - The Spirituality of Sofia in the Historic Memory
Geography of Letters - The Spirituality of Sofia in the Historic MemoryGeography of Letters - The Spirituality of Sofia in the Historic Memory
Geography of Letters - The Spirituality of Sofia in the Historic Memory
 
IndustryInform Service of Mozaika
IndustryInform Service of MozaikaIndustryInform Service of Mozaika
IndustryInform Service of Mozaika
 
IndustryInform Demo March 2016
IndustryInform Demo March 2016IndustryInform Demo March 2016
IndustryInform Demo March 2016
 
Startup Europe Week Sofia introduction
Startup Europe Week Sofia introductionStartup Europe Week Sofia introduction
Startup Europe Week Sofia introduction
 
Mozaika-Jan2016a
Mozaika-Jan2016aMozaika-Jan2016a
Mozaika-Jan2016a
 
Concordia july2015
Concordia july2015Concordia july2015
Concordia july2015
 
Industry informofmozaikathehumanizingtechnologieslab june23
Industry informofmozaikathehumanizingtechnologieslab june23Industry informofmozaikathehumanizingtechnologieslab june23
Industry informofmozaikathehumanizingtechnologieslab june23
 
Industry informofmozaikathehumanizingtechnologieslab june23
Industry informofmozaikathehumanizingtechnologieslab june23Industry informofmozaikathehumanizingtechnologieslab june23
Industry informofmozaikathehumanizingtechnologieslab june23
 
Communication channels for the european single digital market
Communication channels for the european single digital marketCommunication channels for the european single digital market
Communication channels for the european single digital market
 
Bulgariana europeana27112013 ним
Bulgariana europeana27112013 нимBulgariana europeana27112013 ним
Bulgariana europeana27112013 ним
 
NLIWoD ISWC 2014 - Multilingual Retrieval Interface for Structured data on th...
NLIWoD ISWC 2014 - Multilingual Retrieval Interface for Structured data on th...NLIWoD ISWC 2014 - Multilingual Retrieval Interface for Structured data on th...
NLIWoD ISWC 2014 - Multilingual Retrieval Interface for Structured data on th...
 
Mozaika june2014
Mozaika june2014Mozaika june2014
Mozaika june2014
 
Europeana in Bulgaria
Europeana in BulgariaEuropeana in Bulgaria
Europeana in Bulgaria
 
Bulgariana europeana02112013
Bulgariana europeana02112013Bulgariana europeana02112013
Bulgariana europeana02112013
 
Multilingual Access to Cultural Heritage Content on the Semantic Web - Acl2013
Multilingual Access to Cultural Heritage Content on the Semantic Web - Acl2013Multilingual Access to Cultural Heritage Content on the Semantic Web - Acl2013
Multilingual Access to Cultural Heritage Content on the Semantic Web - Acl2013
 
Support Europeana in Securing Funding for the Connecting Europe Facility (CEF)
Support Europeana in Securing Funding for the Connecting Europe Facility (CEF)Support Europeana in Securing Funding for the Connecting Europe Facility (CEF)
Support Europeana in Securing Funding for the Connecting Europe Facility (CEF)
 
National aggregatorvarna032013 marianadamova
National aggregatorvarna032013 marianadamovaNational aggregatorvarna032013 marianadamova
National aggregatorvarna032013 marianadamova
 
National aggregatorvarna032013 marianadamova
National aggregatorvarna032013 marianadamovaNational aggregatorvarna032013 marianadamova
National aggregatorvarna032013 marianadamova
 
Europeana datainaction nov2012
Europeana datainaction nov2012Europeana datainaction nov2012
Europeana datainaction nov2012
 

семантични технологии основи

  • 1. Семантични технологии основи Мариана Дамова, PhD Moзайка 15.10.2013 BG051PO001-3.3.06-0022/19.03.2012 "на нови практики и знания в обучението по компютърна лингвистика"
  • 2. Семантика http://www.thefreedictionary.com/semantics se·man·tics (s-mntks)n. (used with a sing. or pl. verb) 1. Linguistics The study or science of meaning in language. 2. Linguistics The study of relationships between signs and symbols and what they represent. Also called semasiology. 3. The meaning or the interpretation of a word, sentence, or other language form: We're basically agreed; let's not quibble over semantics. semantics [sɪˈmæntɪks]n (functioning as singular) 1. (Linguistics) the branch of linguistics that deals with the study of meaning, changes in meaning, and the principles that govern the relationship between sentences or words and their meanings 2. (Philosophy / Logic) the study of the relationships between signs and symbols and what they represent 3. (Philosophy / Logic) Logic a. the study of interpretations of a formal theory b. the study of the relationship between the structure of a theory and its subject matter c. (of a formal theory) the principles that determine the truth or falsehood of sentences within the theory, and the references of its terms BG051PO001-3.3.06-0022/19.03.2012 "Интегриране на нови практики и знания в обучението по компютърна
  • 3. Съдържание • • • • • • • • • • Въвеждащи бележки Теоретични основи на семантичния уеб Семантичните технологии като пластовете на торта Приложения на семантичния уеб Свързани отворени данни RDF, RDFs, OWL – W3C стандарти Език за заявки - SPARQL Онтология Примери на онтологии Заключение BG051PO001-3.3.06-0022/19.03.2012 "Интегриране на нови практики и знания в обучението по компютърна лингвистика"
  • 4. Интернет • Email • WWW Световна система от компютърни мрежи – мрежа от мрежи, в която потребителите на всеки един компютър могат до изтеглят информация, ако имат разрешение, от всеки друг компютър Измислена е от Advanced Research Projects Agency (ARPA) на правителството на САЩ през 1969 и е известна в началото като ARPANET Днес интернет е публично само-поддържащо се съоръжение, позволяващо сътрудничество, което е достъпно за стотици милиони хора по целия свят Интернет използва една част от всички ресурси на съществуващите понастоящем телекомуникационни мрежи и няколко протокола, наречени TCP/IP (for Transmission Control Protocol/Internet Protocol) BG051PO001-3.3.06-0022/19.03.2012 "Интегриране на нови практики и знания в обучението по компютърна лингвистика"
  • 5. WWW – World Wide Web  роден през 1990  първоначалният проект за хипертекст е предложен от Sir Tim Berners-Lee, физик в лабораторията CERN в Женева, Швейцария, през март 1989. хипертекст е метод за моментно рефериране (instant cross-referencing)  първият уеб сървър е пуснат онлайн през 1990 и първият уеб броузър е публикуван. До края на 1991 WWW става публично достъпен за всички  успехът на World Wide Web се базира на глобализирането на идеята да хипертекст и прилагането й в глобалната мрежа Интернет  http://www.ted.com/talks/tim_berners_lee_on_the_next_web.html BG051PO001-3.3.06-0022/19.03.2012 "Интегриране на нови практики и знания в обучението по компютърна лингвистика"
  • 6. WWW – източник на информация  Съдържание: текст, таблици и изображения  21.22 милиарда уеб страници през 2009 “The Indexed Web contains at least 3.77 billion pages (Wednesday, 09 October, 2013)”  Търсачките индексират уеб страници и сравняват индексите с текстовете на заявките на потребителите, като връщат големи количества резултати, които не винаги са подредени по най-подходящия за потребителя начин Flight LZ304 Fgh)(*YUVSDFL Sofia-Berlin ??*4WDGDFGFG WWW е огромен източник на информация за хората, понеже те Dep. 02.12.2009 1500 Dfg2359$%%6Dep са способни да прочетат, разберат, интерпретират Arr. 02.12.2009 1730 Asdj7&%)(#dgWR съдържанието и правят изводи като събират информация от Price 230€ #%45GFG 230€ различни източници в уеб пространството. С растежа му става все по-трудно да се обозре съдържанието в book now Еиж4f fgi него и да се интерпретира Машините не разбират естествен език и съдържанието на уеб страниците, но трябва да дойдат на помощ. BG051PO001-3.3.06-0022/19.03.2012 "Интегриране на нови практики и знания в обучението по компютърна
  • 7. Как ? … Информацията в Уеба трябва да бъде предоставена по такъв начин, че да не бъде само разбираема за хората, но и обработваема от машините. Технически изисквания • да се даде възможност ресурсите да бъдат анотирани с информация за тях, с метаданни - данни за данните • да се разшири съществуващият маркиращ език за Уеба, така че да може да присъедини тези анотации и метаданни • да се използва формална логика при специфицирането на анотации, така че те да могат да бъдат интерпретират автоматично от машини • да се направи този език стандарт, така че метаданните да могат да се споделят, разширяват, съединяват, обработват … BG051PO001-3.3.06-0022/19.03.2012 "Интегриране на нови практики и знания в обучението по компютърна
  • 8. Семантичен Уеб – The Semantic Web Семантичния Уеб е Уебът от данни за разлика от настоящия уеб, който е уеб от документи. Семантичният уеб е нещо като глобална база данни. Динамична интерпретация за непредполагаеми нужди Автоматично обработваеми метаданни за: – структурата (синтаксиса) и – значението (семантиката) на съдържанието, което се намира в Уеба – представени в стандартна форма BG051PO001-3.3.06-0022/19.03.2012 "Интегриране на нови практики и знания в обучението по компютърна
  • 9. Настоящият Уеб – Web 1.0 BG051PO001-3.3.06-0022/19.03.2012 "Интегриране на нови практики и знания в обучението по компютърна лингвистика"
  • 10. Семантичният Уеб – Web 3.0 BG051PO001-3.3.06-0022/19.03.2012 "Интегриране на нови практики и знания в обучението по компютърна лингвистика"
  • 11. Sir Tim Berners-Lee - създателят Създателят на WWW. През 1998 предлага визията за семантичния уеб в статията “Semantic Web Road Map” http://www.w3.org/DesignIssues/Semantic Тази визия е доразвита в статия от 2001: Tim Berners-Lee et al., "The Semantic Web", Scientific American, May 2001 Дефиниция: "The Semantic Web is an extension of the current web in which information is given well-defined meaning, better enabling computers and people to work in cooperation.“ [Berners-Lee et al. 2001] BG051PO001-3.3.06-0022/19.03.2012 "Интегриране на нови практики и знания в обучението по компютърна лингвистика"
  • 12. Съдържание • • • • • • • • • • • Въвеждащи бележки Теоретични основи на семантичния уеб Семантичните технологии като пластове на торта Приложения на семантичния уеб Свързани отворени данни RDF, RDFs, OWL – W3C стандарти Език за заявки - SPARQL Свързани отворени данни Онтология Примери на онтологии Заключение BG051PO001-3.3.06-0022/19.03.2012 "Интегриране на нови практики и знания в обучението по компютърна лингвистика"
  • 13. Формална логика • Теоретичните основи на Семантичния Уеб се градят върху формалната логика, логическото програмиране и изкуствения интелект Логика – що е то? • Логиката е формална система за организиране и структуриране на изрази и аргументи и правене на изводи за тях, което включва определяне на тяхната валидност и идентифициране на противоречия • В логиката човек употребява изрази, които определят като истинни на базата на общи изрази от специфична форма, наричани правила на извод или аксиоми, които създават нови NB! Извеждането на нови изрази зависи от валидността на знанието, от което те са изведени! BG051PO001-3.3.06-0022/19.03.2012 "Интегриране на нови практики и знания в обучението по компютърна
  • 14. Формална система Една логическа система се дефинира на базата на: - Формален език, който да описва логическите изрази; - Граматика, която дефинира правилното използване на езика - Апарат за извод, който създава условия системата да извежда нови изрази (като се използват аксиоми и/или правила за извод) Естествен Език Логическа система Граматика Граматика - Части на речта - Синтаксис - Индивиди - Променливи - Правила за изменение - Правила за строеж на граматични изречения - Променливите обобщават индивиди - Индивидите се свързват с предикати Правила за извод - ако нещо е вярно, то и друго нещо е вярно BG051PO001-3.3.06-0022/19.03.2012 "Интегриране на нови практики и знания в обучението по компютърна
  • 15. Логически извод Логическа теория дефинира следната аксиома: Ако всички X са Y и A е X, то A е Y всички X са Y AеX ---------------------AеY Пример: Ако всички мъже са смъртни Сократ е мъж -------------------------------------Сократ е смъртен BG051PO001-3.3.06-0022/19.03.2012 "Интегриране на нови практики и знания в обучението по компютърна променливи индивид
  • 16. Свойства на логическата система Важни свойства на логическата система: • Съгласуваност (consistency) няма изрази в логическата система, които си противоречат Сократ е мъж, Сократ не е мъж • Стабилност (soundness) апаратът за извод на системата никога няма да позволи грешен извод от вярна предпоставка Всички мъже са смъртни, Сократ е мъж, то Сократ не е смъртен • Пълнота (completeness) няма истинни изрази, които не могат да бъдат изведени от системата, поне принципно Всички мъже са смъртни, Виктор е мъж, то Виктор е смъртен BG051PO001-3.3.06-0022/19.03.2012 "Интегриране на нови практики и знания в обучението по компютърна
  • 17. Предизвикателства Логиката трябва да се занимава с сложността на естествения език и на реалния свят В компютърните системи, изразителността на логиката трябва да се ограничи, за да се избягнат двусмислия (ambiguities| и извеждането на факти остава изчислируемо (computationally possible) BG051PO001-3.3.06-0022/19.03.2012 "Интегриране на нови практики и знания в обучението по компютърна
  • 18. Логика и семантика • “Семантиката” изследва значението на нещата • В информатиката семантиката е част от математическата логика, където тя се отнася към значението на компютърните програми • “Semantic computing” се отнася към опити да се определят логическите системи на компютрите, т.е. да се дефинира формален език, граматика и апарат за извод като формат на данните и компютърни програми • В този смисъл семантичният уеб представлява разширение на настоящия уеб във формална логическа система, в която съдържанието в Уеба се представя като изрази, от които може да се генерира ново знание BG051PO001-3.3.06-0022/19.03.2012 "Интегриране на нови практики и знания в обучението по компютърна
  • 19. Съдържание • • • • • • • • • • Въвеждащи бележки Теоретични основи на семантичния уеб Семантичните технологии като пластове на торта Приложения на семантичния уеб Свързани отворени данни RDF, RDFs, OWL – W3C стандарти Език за заявки - SPARQL Онтология Примери на онтологии Заключение BG051PO001-3.3.06-0022/19.03.2012 "Интегриране на нови практики и знания в обучението по компютърна лингвистика"
  • 20. Слоевете на Семантичния Уеб BG051PO001-3.3.06-0022/19.03.2012 "Интегриране на нови практики и знания в обучението по компютърна
  • 21. Пирамида на управление на информацията BG051PO001-3.3.06-0022/19.03.2012 "Интегриране на нови практики и знания в обучението по компютърна
  • 22. Съдържание • • • • • • • • • • Въвеждащи бележки Теоретични основи на семантичния уеб Семантичните технологии като пластове на торта Приложения на семантичния уеб Свързани отворени данни RDF, RDFs, OWL – W3C стандарти Език за заявки - SPARQL Онтология Примери на онтологии Заключение BG051PO001-3.3.06-0022/19.03.2012 "Интегриране на нови практики и знания в обучението по компютърна лингвистика"
  • 23. Основни характеристики на семантичния уеб            управление на информацията на 21 век стандарти за моделиране и представяне на данни ново поколение софтуер за съхранение, известен по името семантични хранилища голяма лекота в интегрирането на данни от разнородни източници ниска цена на производство и поддръжка на данните ефикасно използване на хардуерните ресурси формат на представяне на данните без схема автоматично вадене на изводи и генериране на ново знание лесно свързване на данни от различни източници извличането на информация от различни източници с една единствена заявка единно представяне на информация извлечена от структурирани (бази данни, csv файлове, excel таблици), полу-структурирани (уеб страници) и неструктурирани източници (текстове)  обобщение и изводи на базата на цялата тази информация, постигнато по автоматизиран път BG051PO001-3.3.06-0022/19.03.2012 "Интегриране на нови практики и знания в обучението по компютърна
  • 24. Очаквания към семантичния уеб  Ubiquitous networking – данните трябва да са свързани и използваеми независимо от физическото им местоположение  Open everything – безпрецедентни нива на автоматизация налагат мрежите да остават непрекъснато отворени  Adaptive information – “Уеб от данни” и “изпълним Уеб”, хора създават данни извън документите и тези данни могат да бъдат събрани при нужда или повикване  Adaptive service clouds – публикацията и консумирането на данни и модели от данни като сервиз в облачните компютърни системи  Federated data – уебът от данни се състои от структурирани записи, които са публикувани в уеба в преизползваеми или търсируеми формати но Семантичния Уеб  Simulated intelligence – Уеб 3.0 ще знае какво хората искат и какво имат ред вид с техните заявки BG051PO001-3.3.06-0022/19.03.2012 "Интегриране на нови практики и знания в обучението по компютърна
  • 25. Семантичният Уеб в полза на бизнеса  Семантичният Уеб се продава трудно на бизнеси, които мислят за бърза печалба  Семантичният Уеб е за хора, които предпочитат ценностите, защото семантичният уеб помага да се съхрани и запази най-ценното капиталовложение – данните  Семантичният уеб позволява бизнесите да започнат да създават своите връзки през техните корпоративни данни, съдържание и документи Бизнес решения се правят на базата на достъп до вярна и пълна информация. Тя идва от данни BG051PO001-3.3.06-0022/19.03.2012 "Интегриране на нови практики и знания в обучението по компютърна
  • 26. Семантичният Уеб в полза на бизнеса  Инвестиции в системи за управление на данни  Бази данни  Хранилища  Бизнес интелигентност  Управление на информационния цикъл  Системи за управление на съдържанието  Планиране на ресурси в предприятията  Интеграция  Търсене Обръщане на данните в информация  Данните в бизнес средата са логически свързани, но физически разделени, което не позволява на системите за управление на съдържанието да свържат отделните парчета информация  Създават се проблеми, когато приложенията на могат да комуникират помежду си през физически връзки BG051PO001-3.3.06-0022/19.03.2012 "Интегриране на нови практики и знания в обучението по компютърна
  • 27. Семантичният Уеб в полза на бизнеса  Семантичният Уеб създава средства да могат да се обобщават автоматично големи и сложни информационни екосистими  Семантичният Уеб маже да се приложи стратегически в управлението на информацията в предприятия, управлението на предприятията и риска  По същество Семантичният Уеб е средство  Той дава възможност да се работи с по-добри метаданни, създава евтини работни места за ръчна обработка на данните, дава много по-силни възможности за одит, проследяване и дефиниране на ективни правила върху споделени корпоративни данни  Той спомага за развалянето на силозите от данни, които в момента костват много средства на предприятията да ги направят съвместими BG051PO001-3.3.06-0022/19.03.2012 "Интегриране на нови практики и знания в обучението по компютърна
  • 28. Разчупване на силозите от данни BG051PO001-3.3.06-0022/19.03.2012 "Интегриране на нови практики и знания в
  • 29. Приложения на Семантичният Уеб • • • TripIt: Travel aggregator http://www.tripit.com ZoomInfo: People finder http://www.zoominfo.com Humminbird: Google Open Knowledge Graph http://www.businessinsider.com/googles-new-humminbird-search-algorithm-2013-9 • • Facebook: Open Graph Search https://www.facebook.com/about/graphsearch London Olympics 2012 Website http://www.olympic.org/london-2012-summer-olympics http://www.bbc.co.uk/sport/0/olympics/2012/ BG051PO001-3.3.06-0022/19.03.2012 "Интегриране на нови практики и знания в обучението по компютърна
  • 30. Съдържание • • • • • • • • • • Въвеждащи бележки Теоретични основи на семантичния уеб Семантичните технологии като пластове на торта Приложения на семантичния уеб Свързани отворени данни RDF, RDFs, OWL – W3C стандарти Език за заявки - SPARQL Онтология Примери на онтологии Заключение BG051PO001-3.3.06-0022/19.03.2012 "Интегриране на нови практики и знания в обучението по компютърна лингвистика"
  • 31. Облак от отворени свързани данни BG051PO001-3.3.06-0022/19.03.2012 "Интегриране на нови практики и знания в обучението по компютърна
  • 32. Множества данни • Freebase • DBPedia • Wikidata • CKAN • … http://www.freebase.com http://dbpedia.org http://wikidata.org http://ckan.org/ Пример на публикуван ресурс: http://dbpedia.org/resource/Sofia BG051PO001-3.3.06-0022/19.03.2012 "Интегриране на нови практики и знания в обучението по компютърна
  • 33. Енциклопедично знание в Семантичния Уеб http://factforge.net - летища около Лондон градове, където има картини на Модилиани световни управници, които са били на власт между 1998 и 2005 5-скоростни коли, които се произвеждат в Европа софтуерни фирми, основани в Съединените Щати политици, родени в Германия BG051PO001-3.3.06-0022/19.03.2012 "Интегриране на нови практики и знания в обучението по компютърна
  • 34. Естествен език и Семантичния Уеб @Davidcamposh has visto el de Una verdad incomoda de <Al Gore>...es muy bueno tambi Davidcamposh’ve seen An Inconvenient Truth of <Al Gore> ... is very good also positive sentiment topic: Al Gore Politician Person DBpedia URI hasProfession DBpedia URI bornIn United States BG051PO001-3.3.06-0022/19.03.2012 "Интегриране на нови практики и знания в обучението по компютърна
  • 35. Съдържание • • • • • • • • • • Въвеждащи бележки Теоретични основи на семантичния уеб Семантичните технологии като пластове на торта Приложения на семантичния уеб Свързани отворени данни RDF, RDFs, OWL – W3C стандарти Език за заявки - SPARQL Онтология Примери на онтологии Заключение BG051PO001-3.3.06-0022/19.03.2012 "Интегриране на нови практики и знания в обучението по компютърна лингвистика"
  • 36. RDF – Resource Description Framework Flight LZ304 Sofia-Berlin Dep. 02.12.2009 1500 Arr. 02.12.2009 1730 Price 230€ book now Add mark-up <flight>Flight LZ304 <from>Sofia</from> <to>Berlin</to> <dep>02.12.2009 1500</dep> <arr>02.12.2009 1730</arr> <price>230€</price> </flight> http://travel.com/Flight LZ304 :from http://travel.com/Sofia :to http://travel.com/Berlin :dep 02.12.2009 1500 :arr 02.12.2009 1730 :price 230 :currency http://travel.com/euro BG051PO001-3.3.06-0022/19.03.2012 "Интегриране на нови практики и знания в обучението по компютърна
  • 37. RDF Петър живее София Насочен именован граф RDF тройки са URIs Subject Predicate Object http://www.anon.co m/foaf#Peter http://www.location .org/rdf#lives_in http://www.dbpedia .org/resource/Sofia Език за представяне на информация в Уеб пространството. Предлага граф структура за изразяване на факти за неща.  Модел за представяне на данни и синтаксис за споделяне на знание за концепти в Уеба без да определя как концептите се отнасят един към друг.  RDF предлага модел за правене на логически изкази, който може да се използва за вадене на извод.  BG051PO001-3.3.06-0022/19.03.2012 "Интегриране на нови практики и знания в обучението по компютърна
  • 38. Namespace URI – Uniform Resource Identifier http адрес Namespace = URI + <tag> <x xmlns:edi='http://ecommerce.example.org/schema'> </x> или edi: <http://ecommerce.example.org/schema> Book - книга <http://ecommerce.example.org/schema/Book> - счетоводна книга <http://library.com/ontology#Book> - литературно произведение BG051PO001-3.3.06-0022/19.03.2012 "Интегриране на нови практики и знания в обучението по компютърна
  • 39. RDFs – RDF Schema Език, който позволява формализация на значението на нещата, представени в RDF на базата на компютърна логика. Дефинира прости онтологии (модели на понятия и връзките между тях), които могат да се използват за генериране на ново знание. http://travel.com/Sofia Is a http://travel.com/City http://travel.com/City SubClassOf http://travel.com/Populated Place София rdf:type Град http://travel.com/Flight LZ304 :from http://travel.com/Sofia :to http://travel.com/Berlin :dep 02.12.2009 1500 :arr 02.12.2009 1730 :price 230 :currency http://travel.com/euro rdfs:subClassOf BG051PO001-3.3.06-0022/19.03.2012 "Интегриране на нови практики и знания в обучението по компютърна Населено място
  • 40. RDF, RDFs и OWL Namespaces rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> rdfs: <http://www.w3.org/2000/01/rdf-schema#> owl: <http://www.w3.org/2002/07/owl#> BG051PO001-3.3.06-0022/19.03.2012 "Интегриране на нови практики и знания в обучението по компютърна
  • 41. OWL – Web ontology language Език, който разширява експресивността на онтологията, като позволява да се правят по-сложни модели за света с цената на това те да станат по-трудни за компютърна обработка. http://travel.com/Sofia IsPlaceIn http://travel.com/Bulgaria http://travel.com/Bulgaria IsPlaceIn http://travel.com/Europe IsPlaceIn is a transitive property http://travel.com/Sofia IsPlaceIn http://travel.com/Europe София се_намира_в България http://travel.com/Flight LZ304 :from http://travel.com/Sofia :to http://travel.com/Berlin :dep 02.12.2009 1500 :arr 02.12.2009 1730 :price 230 :currency http://travel.com/euro се_намира_в Европа се_намира_в ако “се_намира” дефинирано като транзитивно свойство BG051PO001-3.3.06-0022/19.03.2012 "Интегриране на нови практики и знания в обучението по компютърна
  • 42. OWL Full DL Lite Има три разновидности на OWL, които са направени като подмножества едно на друго • • • OWL DL разширява изразителността на OWL Litе OWL Full разширява изразителността на OWL DL OWL Full е обединението на OWL синтаскиса и RDF/S, OWL Full включва пълната изразителност на RDF(S) и следователно е неизчислим OWL DL е ограничен до подмножество дескриптивната логика и за това е изчислим OWL Lite е опростено подмножество на OWL DL BG051PO001-3.3.06-0022/19.03.2012 "Интегриране на нови практики и знания в обучението по компютърна на
  • 43. Дескриптивна логика • • • • Дефинира понятия, представителни за дадена област от живота, после използва понятията, за да дефинира свойствата на обектите и индивидите от тази област Има семантичен апарат на базата на формалната логика, използва автоматичното извеждане на знания от експлицитно налично знание Поддържа модели за извод, които се базират на класификация на понятия и на класификация на индивиди – Класификацията на концепти дефинира йерархични връзки, наречени subsumption relationships. Така се образуват йерархични концептуални структури. Тези йерархии помагат да се ускори процесът на извеждане на нова информация заради описанието на свързаността между понятията - TBox – Класификацията на индивиди определя дали даден индивид е представител на дадено понятие. Дава информация за свойствата на индивида. Тези връзки предизвикват генерирането на нови факти в базата от знания - ABox Процедурите за вадене на извод на дескриптивната логика са процедури, които са винаги разрешими, базирани са на предикатната логика от първи ред; т.е. наблюдава се зависимост между изразителната сила на дескриптивната логика и нейната разрешимост BG051PO001-3.3.06-0022/19.03.2012 "Интегриране на нови практики и знания в обучението по компютърна лингвистика"
  • 44. Изразителност на RDFs и OWL RDFs Hierarchy of classes Hierarchy of properties Domain and Range restrictions of the properties OWL Types of properties (transitive, symmetric, inverse, functional, inverse functional) Class construction Property construction rdfs:Class и owl:CLass Библиография: http://www.w3.org/TR/rdf-primer/ http://www.w3.org/TR/rdf-schema/ http://www.w3.org/TR/owl2-primer/ BG051PO001-3.3.06-0022/19.03.2012 "Интегриране на нови практики и знания в обучението по компютърна
  • 45. Съдържание • • • • • • • • • • Въвеждащи бележки Теоретични основи на семантичния уеб Семантичните технологии като пластове на торта Приложения на семантичния уеб Свързани отворени данни RDF, RDFs, OWL – W3C стандарти Език за заявки - SPARQL Онтология Примери на онтологии Заключение BG051PO001-3.3.06-0022/19.03.2012 "Интегриране на нови практики и знания в обучението по компютърна лингвистика"
  • 46. SPARQL – език за заявки за RDF SPARQL създава възможности да се задават въпроси на модела на графа или схемата на дадена RDF база. живее_в обект човек SPARQL 1.1 включва и операции от теория на множествата и федерирани заявки, насочващи се към различни сървъри през една заявка. BG051PO001-3.3.06-0022/19.03.2012 "Интегриране на нови практики и знания в обучението по компютърна град се_намира_в Проектиран е да отговаря за изискания проучени и дефинирани в работни групи на W3C и покрива редица логически изрази от предикатната логика. ?обект обект България лингвист
  • 47. Пример на SPARQL заявка Има ли полет от София до Германия на цена под 250 Евро? SELECT ?flight WHERE { ?flight :from http://travel.com/Sofia ?flight :to ?place ?place :isPlaceIn http://travel.com/Germany ?flight :price ?price ?flight :currency http://travel.com/euro } FILTER (?price < 250) http://travel.com/Flight LZ304 :from http://travel.com/Sofia :to http://travel.com/Berlin :dep 02.12.2009 1500 :arr 02.12.2009 1730 :price 230 :currency http://travel.com/euro Библиография: http://www.w3.org/TR/sparql11-query/ BG051PO001-3.3.06-0022/19.03.2012 "Интегриране на нови практики и знания в обучението по компютърна
  • 48. Съдържание • • • • • • • • • • Въвеждащи бележки Теоретични основи на семантичния уеб Семантичните технологии като пластове на торта Приложения на семантичния уеб Свързани отворени данни RDF, RDFs, OWL – W3C стандарти Език за заявки - SPARQL Онтология Примери на онтологии Заключение BG051PO001-3.3.06-0022/19.03.2012 "Интегриране на нови практики и знания в обучението по компютърна лингвистика"
  • 49. Онтология Спецификация на концептуализация (Tom Gruber, 1992) • Експлицитно описание на дадена област от света – – – понятия свойства, атрибути на понятията ограничения на свойства и атрибути • Дефинира – – • общ речник споделено разбиране за дадена област от света, дадено понятие или дадена релация Резултат: – – – – – споделяне на разбиране между хора и софтуерни агенти преизползване на описаните знания в определена област от света да направи експлицитни дадени допускания за определена област от света да се разделят специфичното знание и оперативното знание да се анализира специфичното знание за дадена област от света BG051PO001-3.3.06-0022/19.03.2012 "Интегриране на нови практики и знания в обучението по компютърна
  • 50. История на онтологията Parmenides of Elea, ancient Greek philosopher (early 5th century BCE) made the ontological argument against nothingness, essentially denying the possible existence of a void. Jacob Lorhard, German philosopher (1561 - 1609) 1607 - First occurrence of the word Ontology (lat. Ontologia) and the first published ontology BG051PO001-3.3.06-0022/19.03.2012 "Интегриране на нови практики и знания в обучението по компютърна
  • 51. Типове онтологии • Upper Ontology – model of the common objects that are applicable across a wide range of domain ontologies • Domain Ontology – an ontology developed for a specific domain; conforms to an upper ontology • Application Ontology – an ontology created for a specific application; may conform to a domain ontology appl ontology domain ontology upper ontology BG051PO001-3.3.06-0022/19.03.2012 "Интегриране на нови практики и знания в обучението по компютърна
  • 52. Съдържание • • • • • • • • • • Въвеждащи бележки Теоретични основи на семантичния уеб Семантичните технологии като пластове на торта Приложения на семантичния уеб Свързани отворени данни RDF, RDFs, OWL – W3C стандарти Език за заявки - SPARQL Онтология Примери на онтологии Заключение BG051PO001-3.3.06-0022/19.03.2012 "Интегриране на нови практики и знания в обучението по компютърна лингвистика"
  • 53. Примери на онтологии Upper Ontologies: • Dublin Core • GFO - General Formal Ontology • OpenCyc/Cyc - Cycorp • SUMO - Suggested Upper Merged Ontology • DOLCE - Descriptive Ontology for Linguistic and Cognitive Engineering • PROTON - ProtoOntology Domain Ontologies: • E-commerce : Rosetta-Net • Business: Good relations • Medical: GALEN, UMLS • Engineering: EngMath BG051PO001-3.3.06-0022/19.03.2012 "Интегриране на нови практики и знания в обучението по компютърна
  • 54. Съдържание • • • • • • • • • • Въвеждащи бележки Теоретични основи на семантичния уеб Семантичните технологии като пластове на торта Приложения на семантичния уеб Свързани отворени данни RDF, RDFs, OWL – W3C стандарти Език за заявки - SPARQL Онтология Примери на онтологии Заключение BG051PO001-3.3.06-0022/19.03.2012 "Интегриране на нови практики и знания в обучението по компютърна лингвистика"
  • 55. Заключение • • • • • Запознахме се със Семантичния Уеб Управление на информацията през 21 век Стандарти за представяне на знанията в семантичния уеб Теоретични основи на семантичния уеб Дескриптивна логика Дефиниция на онтология Следващия път ще разгледаме Проектиране на онтологии и връзката им с езиковите технологии BG051PO001-3.3.06-0022/19.03.2012 "Интегриране на нови практики и знания в обучението по компютърна
  • 56. Въпроси ? … Благодаря за вниманието! mariana.damova@mozajka.co me@marianadamova.com damova.mariana@gmail.com BG051PO001-3.3.06-0022/19.03.2012 "Интегриране на нови практики и знания в обучението по компютърна лингвистика"