Структура Semantic Web

Читайте также:

№ п/п

Наименование графы

Период

янв

фев.

март

1 кв.

апр.

май

июнь

2 кв.

июль

авг.

сен.

3 кв.

окт.

нояб.

дек.

4 кв.

Прибыль до налогообложения (18+19-20-21)

Налог на прибыль

Чистая прибыль (22-23)

Использование прибыли

25.1

В т.ч. уплата процентов за кредит

Нераспределенная прибыль текущего периода (24-25)

Справочно: сумма процентов за кредит (11+25.1)

Лекция 10-12. Семантические сети

План лекций

1. Структура Semantic Web

2. XML - синтаксическая основа Semantic Web

3. Средства описания ресурсов RDF

4. Онтологии

5. Классификация алгоритмов Semantic Web

6. Реализации Semantic Web

Структура Semantic Web

Интернет - это крупнейший из когда-либо существовавших информационных хранилищ данных, причем его содержание все время растет и представлено на самых разнообразных языках и практически во всех областях знаний. Но в конечном счете становится все труднее находить смысл во всем этом содержимом. Поисковые системы способны находить информацию, содержащую определенные слова, но эта информация не всегда оказывается именно той, что требуется. Какой-то элемент всегда оказывается упущенным. Поиск основан на содержании страниц, а не на семантическом значении этого содержания или информации о странице.

Общее определение понятия семантика (от греческого понятия semantikos, т.е. "важное значение", а в основе последнего лежит слово sema, т.е. знак) - это изучение значений. Семантическая паутина (англ. Semantic Web) — часть глобальной концепции развития сети Интернет, целью которой является реализация возможности машинной обработки информации, доступной во Всемирной паутине. Основной акцент концепции делается на работе с метаданными, однозначно характеризующими свойства и содержание ресурсов Всемирной паутины, вместо используемого в настоящее время текстового анализа документов. Семантические технологии веб помогают выделять полезную информацию из данных, содержания документов или кодов приложений, опираясь на открытые стандарты. Если компьютер понимает семантику документа, то это не означает, что он просто интерпретирует набор символов, содержащихся в документе. Это значит, что компьютер понимает смысл документа.

Две основные причины порождают две основные проблемы Internet. Первая причина - рост объемов информационного наполнения, порожденный популярностью и дешевизной веб-технологий, а вторая - формат представления информации в Сети, который ориентирован преимущественно на людей и лишь в некоторых случаях допускает автоматическую обработку программными агентами.

В результате, во-первых, возникает проблема нахождения необходимой пользователю информации в любом виде - объемы веб-пространства не позволяют оперативно обновлять базы данных информационно-поисковых систем (не говоря уже о невозможности достижения 100-процентного охвата), а во-вторых в автоматизированном режиме практически невозможно выделить смысл информационных сообщений, например, по названию какой-либо конкретной статьи можно найти сотни ссылок на эту статью, в массиве которых сама статья теряется.

Поэтому дальнейшее развитие Internet многие ученые связывают с концепцией Семантического веба (Semantic Web), которая во многом благодаря унификации обмена данными предположительно даст возможность интегрировать в Internet даже объекты реального мира. Концепцию Семантического веба выдвинул Тим Бернерс-Ли, один из основоположников Worl-Wide Web и председатель WWW-консорциума (W3C) на международной конференции XML-2000, прошедшей в 2000 году в Вашингтоне.

Семантическая паутина — это надстройка над существующей Всемирной паутиной, которая призвана сделать размещённую в ней информацию более понятной для компьютеров. Машинная обработка возможна в семантической паутине благодаря двум её важнейшим характеристикам:

Повсеместное использование унифицированных идентификаторов ресурсов (URI - Universal Resource Identifier - унифицированный идентификатор, определяющий способ записи адреса произвольного ресурса). Традиционная схема использования таких идентификаторов в современном Интернете сводится к установке ссылок, ведущих на объект, им адресуемый. Очевидным свойством такой ссылки является возможность «загрузки» объекта, на который она указывает. Таким объектом может быть веб-страница, файл произвольного содержания, фрагмент веб-страницы, а также неявное указание на обращение к реально существующему физическому ресурсу по протоколу, отличному от HTTP (например, ссылки mailto:). Концепция семантической паутины расширяет это понятие, включая в него ресурсы, недоступные для скачивания. Адресуемыми с помощью URI ресурсами могут быть, например, отдельные люди, города и другие географические сущности, художественные артефакты и т. д. К идентификатору предъявляются несколько простых требований: он должен быть строкой определённого формата, уникальной, а также адресующей реально существующий объект.

Повсеместное использование онтологий и языков описания метаданных. Современные методы автоматической обработки данных, как правило, основаны на частотном и лексическом анализах текстового содержимого (хотя есть и исключения: например, Swoogle или Intellidimension Semantic Web Search Engine), которое прежде всего предназначено для восприятия человеком. В семантической паутине предлагается использовать форматы описания, доступные для машинной обработки (например, семейство форматов, часто упоминаемое в литературе как «Semantic Web family»: RDF, RDF Schema или RDF-S, и OWL), в свою очередь, использующие URI для адресации описываемых и описывающих объектов, а также онтологии и дескрипционные логики (семейство языков представления знаний, позволяющих описывать понятия предметной области в недвусмысленном, формализованном виде) в качестве базовых математических формализмов.

Итак, Семантический веб можно представить как симбиоз двух направлений, первое из которых охватывает языки представления данных. На сегодняшний день основными такими языками являются Расширяемый Язык Разметки XML и Средства Описания Ресурсов RDF (Resource Description Framework). Существует также ряд других форматов, однако XML и RDF предоставляют больше возможностей, потому они обладают статусом рекомендаций W3C.

Второе, концептуальное направление несет в себе теоретическое представление о моделях предметных областей. Такие модели предметных обласей в терминологии Семантического веба называются онтологиями. 10 февраля 2004 года консорциумом W3C была утверждена и опубликована спецификация языка сетевых онтологий OWL (Web Ontology Language).

Таким образом, две ветви Семантического веба используют три ключевых языка (соответственно, технологий):

спецификация XML, позволяющая определить синтаксис и структуру документов;

механизм описания ресурсов RDF, обеспечивающий модель кодирования для значений, определенных в онтологии.

язык онтологий OWL, позволяющий определять понятия и отношения между ними. Семантический веб использует также и другие языки, технологии и концепции, в частности, универсальные идентификаторы ресурсов, цифровые подписи, системы логического вывода и т. д.

Список основных действующих рекомендаций W3C, связанных с Семантическим вебом:

· XML обеспечивает синтаксис для структурированных документов, но не налагает никаких семантических ограничений на содержание этих документов

· XML Schema определяет структуру документов XML, а также дополняет XML конкретными типами данных.

· RDF позволяет описать модель данных для ресурсов и отношения между ними, обеспечивает простую семантику для этих моделей данных, представляя их в синтаксисе XML.

· RDF Schema предоставляет средства для описания свойств и классов RDF-ресурсов, а также семантику для иерархий-обобщений таких свойств и классов.

· OWL расширенные возможности описания свойств и классов.

Рис. 1 - Рекомендации W3C касательно Semantic Web

Если говорить о логических уровнях, на которых базируется технология Семантического веба, то самый нижний уровень - это URI. Семантический веб, именуя всякое понятие просто с помощью URI- идентификатора, дает возможность каждому выражать те понятия, которыми он пользуется. Типичными примерами URI-идентификаторов являются URL-адреса, однако URI-идентификатор задавая или ссылаясь на некоторый ресурс, не обязательно при этом указывает на его местонахождение в Internet.

Следующий уровень - язык XML как базовая форма разметки и средства, предназначенные для определения и описания классов XML-документов (DTD, XML-схемы). Отдельный уровень в концепции Семантического веба ориентирован на работу с цифровой подписью, которая необходима, чтобы клиенты могли определять степень достоверности данных.

На базе XML кроме того развертываются средства описания ресурсов RDF и RDF- схемы, объясняющие, как состыковывать XML-данные в сети и строить каталоги и словари понятий. RDF позволяет выполнять поиск необходимых понятий в Семантическом вебе.

И наконец, язык сетевых онтологий OWL предназначен для описания классов и отношений между ними, которые присущи как для сетевых документов, так и приложений. OWL обеспечивает более полную автоматическую обработку сетевого контента, чем та, которую поддерживают XML и RDF, предоставляя наряду с формальной семантикой дополнительную семантическую поддержку. При этом сами онтологии образуют систему, состоящую из наборов понятий и утверждений об этих понятиях, на основе которых можно строить классы, объекты и отношения. Отдельная онтология определяет семантику конкретной предметной области и способствует установлению связей между значениями ее элементов.

Дата добавления: 2014-12-15; просмотров: 156 | Поможем написать вашу работу | Нарушение авторских прав

12 3 4 5

lektsii.net - Лекции.Нет - 2014-2025 год. (0.291 сек.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав