“семантический web и языки информационного обмена” icon

“семантический web и языки информационного обмена”




Скачати 128.47 Kb.
Назва“семантический web и языки информационного обмена”
Дата25.10.2012
Розмір128.47 Kb.
ТипДокументи
1. /XML-Лекция 1. концепция Семантического Веб.doc
2. /XML-Лекция 10. XSL.doc
3. /XML-Лекция 11. Сортировка и фильтрация.doc
4. /XML-Лекция 12. Другие способы отображения XML документов.docx
5. /XML-Лекция 13. XLINK.doc
6. /XML-Лекция 14_RDF.doc
7. /XML-Лекция 15_OWL.doc
8. /XML-Лекция 1_Презентация.docx
9. /XML-Лекция 2. Основы XML.doc
10. /XML-Лекция 3. Создание XML-документов.doc
11. /XML-Лекция 4. Обработка XML в C#.docx
12. /XML-Лекция 5. Создание XML-документов в C#.docx
13. /XML-Лекция 6. Отображение XML-документов в помощью CSS.doc
14. /XML-Лекция 7. Атрибуты и пространства имен.doc
15. /XML-Лекция 8. Определение типа документа.doc
16. /XML-Лекция 9. Схемы XSD.doc
“семантический web и языки информационного обмена”
Тема Обработка документов xml лекция 10. Способы преобразования документов xml план
Тема Обработка документов xml лекция 11. Фильтрация и сортировка данных xml план
Лекция 12. Другие способы отображения xml документов План Связывание xml данных с html страницей с помощью dso
Тема Связь xml документов Лекция 12. Создание ссылок на языке xlink
Стандарты rdf пример практического применения rdf
Языки онтологий Создание онтологий в редакторе Protégé-2000
Тема концепция семантического web
Тема Язык xml лекция Введение
Тема Основы xml лекция Создание и отображение xml-документа
Лекция Работа с xml в. Net план Классы для работы с xml. Net чтение и запись потоков данных Xml Использование класса XmlReader Методы чтения данных
Лекция Создание xml-документов в. Net план Использование класса XmlWriter запись потоков данных Xml Использование dom в. Net Чтение xml-документа с помощью XmlNodeList
Тема Основы xml лекция Применение css для отображения xml-документа
Тема Основы xml лекция 7
Тема xml-схемы – описание структуры документа лекция Определение типа документа (dtd document Type Definition)
Тема xml-схемы – описание структуры документа лекция Описание схемы документа средствами xsd (xml schema Definition language)




МЕЖДУНАРОДНЫЙ НАУЧНО-ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ

ИМЕНИ АКАДЕМИКА ЮРИЯ БУГАЯ

“СЕМАНТИЧЕСКИЙ WEB И ЯЗЫКИ ИНФОРМАЦИОННОГО ОБМЕНА”



Специальность:

8.080401: Информационные управляющие системы и технологии



Образовательно квалификационный уровень – магистр


(конспект лекций)


ТЕМА 1. КОНЦЕПЦИЯ СЕМАНТИЧЕСКОГО WEB

План

Введение

1.1 Современная концепция Семантического Web

1.2 Историческая справка развития

1.3 Структура понятий Семантического Web

1.4 Метаданные и модели метаданных. Проекты практического применения в Семантическом Web



Введение

Сегодня Интернет, в частности Всемирная паутина (Веб, Web), занимает значительное место во всех сферах человеческой деятельности, от образования и науки – до развлечений и рекламы. Вместе с этим, рост объемов информационного наполнения, порожденный популярностью и дешевизной веб-технологий, а также формат представления информации в сети, ориентированный преимущественно на людей и только в некоторых случаях допускает автоматическую обработку программными агентами, приводит к ряду проблем относительно его дальнейшего развития и использования.

Одна из этих проблем касается поиска необходимой пользователю информации, - объемы веб-ресурсов не позволяют оперативно обновлять базу данных информационно-поисковых систем, а вторая – касается выделения “семантики” из большого количества информации. Например, по названию какой-либо конкретной статьи, представленной в Internet, можно найти сотни ссылок на эту статью, в массиве которых сама статья теряется.

Поэтому последующее развитие Internet многие ученые связывают с концепцией Семантического Веб (Semantic Web), которая во многом благодаря унификации обмена данными вероятно даст возможность интегрировать в Internet даже объекты реального мира [1].

Целью изучения дисциплины "Семантический WEB и языки информационного обмена" является ознакомление с современными направлениями развития Web-технологий, в частности концепцией сети нового поколения, которая получила название «Семантический Web», основными языками информационного обмена и их использованием.

Сначала вспомним, в чем разница между понятиями Интернет и Web (WWW)?

Интернет: сеть компьютеров, которые соединены каналами и используют для связи протоколы (TCP/IP). Изобретатели: Vint Cerf и Robert Kahn

Web: сеть сайтов, которые используют гиперссылки для переходов от страницы к странице. Изобретатель: Tim Berners-Lee.

1.1 Современная концепция семантического Web


Что же такое “Семантический Web”, почему он так называется, какое его назначение и возможно практическое приложение сегодня и в будущем? Попробуем найти ответы на эти вопросы, но сначала дадим определение (неформальное) понятий синтаксис и семантика.

Синтаксис - набор правил построения фраз языка, что позволяет определить, осмысленные предложения на этом языке.

Семантика - система правил толкования отдельных языковых конструкций. Семантика определяет смысловое значение предложений языка.


Традиционный Web является синтаксическим и представляет собой множество HTML-документов, распределенных в сети и связанных гипертекстовыми ссылками.

Традиционный Web базируется на стандартах языка HTML.


Теперь попробуем дать определение Семантического Web.

Электронная энциклопедия wiki (http://ru.wikipedia.org/wiki/) дает следующее определение Семантического Web:


Семантическая паутина (Semantic Web) — часть глобальной концепции развития сети Интернет, целью которой является реализация возможности машинной обработки информации, доступной во Всемирной паутине. Основной акцент концепции делается на работе с метаданными, которые однозначно характеризуют свойства и содержание ресурсов Всемирной паутины, вместо используемого в настоящее время текстового анализа документов.


Концепцию семантического Web предложил Тим Бернерс-Ли, который назвал его «следующим шагом в развитии Всемирной паутины». В семантической паутине предусматривается использование, во-первых, универсальных идентификаторов ресурсов (URI), а во-вторых — онтологий и языков описания метаданных.

Эта концепция была принята и продвигается W3С. Для ее внедрения предусматривается создание сети документов, которые содержат метаданные о ресурсах Всемирной паутины и существуют параллельно с ними. В то время как сами ресурсы предназначены для восприятия человеком, метаданные используются машинами (поисковыми роботами и другими интеллектуальными агентами) для проведения однозначных логических выводов о свойствах этих ресурсов.

Основная идея этого проекта заключается в организации такого представления данных в сети, чтобы допускалась не только их визуализация, но и их эффективная автоматическая обработка программами разных производителей. Путем таких радикальных превращений концепции уже традиционного Web предусматривается превращение его в систему семантического уровня. По замыслу творцов Семантический Web должен обеспечить “понимание” информации компьютерами, выделение ими наиболее соответствующих по тем или иным критериям данных, и уже после этого – предоставление информации пользователям.

При автоматической обработке информации в рамках Семантического Web сервисы, которые взаимодействуют друг с другом, на основе анализа содержательных связей между объектами и понятиями, которые сохраняются в Сети, должны отбирать лишь ту информацию, которая будет реально полезна пользователям.


Таким образом, семантическую паутину можно рассматривать как надстройку над существующей Всемирной паутиной, которая призвана сделать размещенную в ней информацию понятнее для компьютеров. Машинная обработка возможна в семантической паутине благодаря двум ее важнейшим характеристикам:

  • Использование универсальных идентификаторов ресурсов (URI). Традиционная схема использования таких идентификаторов в современном Интернете сводится к установке ссылок на адресуемый объект. Очевидным свойством такой ссылки является возможность «загрузки» объекта, на который она указывает. Таким объектом может быть веб-страница, файл произвольного содержимого, фрагмент веб-страницы, а также неявное указание на обращение к реально существующему физическому ресурсу по протоколу, отличающемуся от HTTP (например, ссылка mailto:). Концепция семантической паутины расширяет это понятие, включая у него ресурсы, недоступные для скачивания. Ресурсами, которые адресуются с помощью URI могут быть, например, отдельные люди, города и другие географические места, художественные артефакты и так далее. К идентификатору предъявляются несколько простых требований: он должен быть строкой определенного формата, уникальным, а также указывать на реально существующий объект.

  • Использование онтологий и языков описания метаданных. Современные методы автоматической обработки данных, доступных в Интернете, как правило, базируются на частотном и лексическом анализе текстового содержимого, который прежде всего предназначен для восприятия человеком. В семантической паутине предлагается использовать форматы описаний, доступные для машинной обработки.



Таким образом, в настоящий момент в исследованиях семантического WEB прослеживаются два основных направления:

1. Разработка новых языков представления данных. На сегодняшний день такими языками являются Расширяемый Язык Разметки XML (eXtensible Markup Language) и Средства Описания Ресурсов RDF (Resource Description Framework). Существует также ряд других форматов, однако XML и RDF предоставляют больше возможностей, потому они имеют статус рекомендаций W3C.

2. Разработка онтологии понятий предметных областей. Это направление близко к области искусственного интеллекта, и называется онтологическим подходом. Он включает средства аннотирования документов, которыми могли бы воспользоваться компьютерные программы - веб-сервиси и агенты при обработке сложных запросов пользователя.

Эти два направления Семантического Веб используют три основных языка:

- спецификация XML, которая позволяет определить синтаксис и структуру документов;

- механизм описания ресурсов RDF, что обеспечивает модель кодировки для значений, определенных в онтологии;

- и, наконец, язык сетевой онтологии OWL (Ontology Web Language) на основе стандарта XML, предназначенный для описания классов и отношений между ними, которые свойственны как сетевым документам, так и приложениям. OWL обеспечивает более полную автоматическую обработку сетевого контента, чем та, которую поддерживают XML и RDF, оказывая вместе с формальной семантикой дополнительную семантическую поддержку. При этом сама онтология образует систему, которая состоит из наборов понятий и утверждений об этих понятиях, на основе которых можно строить классы, объекты и отношения. Отдельная онтология определяет семантику конкретной предметной области и способствует установлению связей между значениями ее элементов.


1.2 Историческая справка развития


1994: Создание W3C. Разработаны стандарты: HTML

URL, HTTP, PNG, SVG, CSS

1998: Тим Бернерс-Ли публикует план семантического Веб

(Semantic Web Road map)

1999: W3C создает группы по проектированию

семантического Веб, публикуется первая версия RDF

2000: Американские военные начинают исследование в области

описания онтологии (DAML+OIL project)

2001: В журнале Scientific American публикуется описание

семантического Веб

2004: Выпущена новая версия RDF, представлен язык

описания онтологии OWL

2006: Представлена версия языка запросов SPARQL

(candidate recommendation)

1.3 Структура понятий Семантического Web


Следовательно, Семантический Web можно представить как симбиоз двух направлений, первый из которых охватывает языки представления данных. На сегодняшний день основными такими языками являются Расширяемый Язык Разметки XML (eXtensible Markup Language) и Средства Описания Ресурсов RDF (Resource Description Framework).

Второе, концептуальное направление несет в себе теоретическое представление о моделях предметных областей. Такие модели в терминологии Семантического Web называются онтологией. 10 февраля 2004 года консорциумом W3C была утверждена и опубликована спецификация языка сетевых онтологий OWL (Ontology Web Language).

Такую структуру принято изображать в виде логических уровней (ее еще называют «пирог Тима») (рис. 1.1).





Рис. 1.1. Структура Семантического Web (пирог Тима)


В этой структуре самый нижний уровень - это Universal Resource Identifier (URI), унифицированный идентификатор, который определяет способ записи адреса произвольного ресурса. Семантический Web, именуя всякое понятие просто с помощью URI-идентификатора, дает возможность каждому выражать те понятия, которыми он пользуется. Типичными примерами URI-идентификаторов является URL-адрес, однако URI-идентификатор задавая или ссылаясь на некоторый ресурс, не обязательно при этом указывает на его местонахождение в Internet.

Следующий уровень - язык XML как базовая форма разметки и средства, предназначенные для определения и описания классов XML-документов (DTD, XML- схемы).


XML – это синтаксическая основа Семантического Web.


Отдельный уровень в концепции Семантического Web ориентирован на работу с цифровой подписью, которая необходима, чтобы клиенты могли определять степень достоверности данных.

На базе XML разворачиваются средства описания ресурсов RDF и RDF-схемы, которые объясняют, как стыковать XML-данные в сети и строить каталоги и словари понятий. RDF позволяет выполнять поиск необходимых понятий в Семантическом Web.


RDF – это семантическая основа Семантического Web.


Следующий уровень - язык сетевой онтологии OWL, предназначенный для описания классов и отношений между ними, которые свойственны как сетевым документам, так и программам. OWL обеспечивает более полную автоматическую обработку сетевого контента, чем та, которую поддерживают XML и RDF, оказывая вместе с формальной семантикой дополнительную семантическую поддержку.


OWL - используется для представления общепринятых соглашений о семантическом описании структур данных.


Высшие уровни Семантического Web - относятся к области искусственного интеллекта.

Уровень логики (Logic) позволяет выполнять интеллектуальный вывод, используя правила дескриптивной (описательной) логики с помощью системы аксиом.


Уровень логики – позволяет получать новые знания из информации, которая задана в явном виде.


Уровни доказательств (Proof) и доверия (Trust) выполняют функцию поддержки взаимодействия между программными агентами на нужном уровне доверия, обеспечивая понимание того, каким образом получена необходимая информация.


Эти уровни должны обеспечить проверку степени достоверности выведенных утверждений.


1.4 Метаданные и модели метаданных. Проекты практического применения в Семантическом Web


Что такое «метаданные» и какое их назначение?

Метаданные (метаинформация) – данные о данных. Формализированное описание коллекции, документа или ресурса.


Основатель Web Тим Бернерс-Ли отметил: «метаданные — это машиночитаемая информация о ресурсах Web в Интернете. Слово машиночитаемая является ключевым. Разработчики программного обеспечения могут использовать эту информацию и сделать нашу жизнь легче...».


Это определение указывает на одно из важнейших свойств метаданных – использования их для программ поиска электронных документов.

Деятельность консорциума (W3C) в области метаданных была включена в Semantic Web под инициативой «обеспечить общую структуру, которая позволит данным совместимо и повторно использоваться в разных приложениях, производствах (enterprise) и содружествах». RDF-структура – один из ключевых стандартов. Усилия Semantic Web направлены на стандарты, которые увеличивают интероперабельность метаданных, а не специфических моделей метаданных.

Примерами метаданных являются тэги языков HTML и XML, язык RDF.

В настоящее время наиболее распространенными форматами метаданных являются форматы семейства MARC и Дублинское ядро (Dublin Core, DC), причем можно констатировать следующее: в сентябре в 2001 г. набор метаданных DC утвержден в США Американским институтом национальных стандартов (ANSI) как стандарт Z39.85-2001 (Это уже и стандарт ISO 15836-2003). В том же году формат DC рекомендован и принят как государственный стандарт для онлайновых ресурсов в Австралии, Канаде, Дании, Финляндии, Ирландии и Великобритании.

Направления использования Семантического Web:

  • Семантический поиск

  • Системы вопрос-ответ

  • Агенты в семантическом Веб (интеллектуальные агенты)

  • Объединение знаний (интеграция баз данных).


Проекты практического применения Семантического Web

Дублинское ядро


Одним из первых серьезных проектов, который базируется на принципах семантической паутины, стал проект «Дублинское ядро» (Dublin Core), которое реализовывается инициативной организацией Dublin Core Metadata Initiative (DCMI). Это открытый проект, цель которого — разработать стандарты метаданных, которые были бы независимы от платформ и подходили бы для широкого спектра заданий. В частности, DCMI занимается разработкой словарей метаданных общего назначения, которые стандартизируют описания ресурсов в формате RDF.

Последняя версия набора элементов DC (http://dublincore.org/-usage/terms/dc/current elements/) содержит в себе 16 элементов (атрибутов) для описания цифрового ресурса:

Название — Title

Автор — Creator

Тема (Предметная рубрика) — Subject

Описание (Аннотация) — Description

Издатель — Publisher

Соавтор — Contributor

Дата — Date

Формат — Format

Тип — Type

Идентификатор — Identifier

Источник — Source

Язык — Language

Отношение — Relation

Охват (Покрытие) — Coverage

Авторские права — Rights

Аудитория— Audience


А также 30 классификаторов (уточнений или подтипов элемента), которые определены и поддерживаются группой “Dublin Core Metadata Initiative Usage Board”. Это международная и междисциплинарная попытка определить набор элементов описания электронных информационных ресурсов, которое бы было ориентировано на их выявление и простую каталогизацию. DC предназначен поддерживать совместимость в описании и семантической интерпретации ресурсов сети. Наконец, описание словаря DC (набор элементов и их уточнений) на языке RDF/RDFS (www.w3.org/TR/REC-rdf-syntax/; www.w3.org/TR/rdfschema) является доступным с 2003 года.

По правилам Dublin Core каждый из 16-ти элементов не является обязательным и может повторяться. В самом общем случае для внесения любого элемента достаточно пары — ИМЯ и ЗНАЧЕНИЕ (Content): .


Пример описания книги в формате DC


xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"

xmlns:dc="http://purl.org/dc/elements/1.1/"

xmlns:dcterms="http://purl.org/dc/terms/">



Automated Theorem Proving





Mantsivoda Andrei





681.3





2004-04-04





Article





http://andrei.baikal.ru/atp2004





RSS (версии 0.90 и 1.0) Ленты новостей


Версии 0.90 и 1.0 формата RSS основаны на RDF. Информация в нем представляется как и в RDF, тройками субъект-отношение-объект. Необходимо отметить, что несмотря на то, что этот формат имеет много недостатков (дублирование информации, например), он быстро стал чрезвычайно популярным за счет узкой категоризации подмножества используемых метаданных. Отличие RSS от RDF заключается в том, что субъектом тройки всегда является сайт-источник RSS-файла, а в качестве отношений используются самые очевидные свойства документов касающиеся источников, информация в которых часто обновляется: дата написания, автор, и так далее Другими словами, RSS — узкоспециализированное подмножество RDF.

FOAF («Friend of а Friend»)


Проект «Friend of а Friend» («Друг друга») – онтология характеристик и взаимоотношений между людьми, позволяющая описывать отношение знакомства с помощью RDF. Любой его участник может идентифицировать себя уникальным образом с помощью URI (например, mailto-адресом электронной почты, адресом блога, и т. п.), создать свой профиль, используя определенные для FOAF отношения на языке RDF, и указать идентификаторы людей, которых этот участник знает. Это описание может обрабатываться автоматически; на его основе можно строить сети доверия, анализировать структуру социальных групп, и так далее.

Цель этого проекта - обеспечить домашние страницы и профили описаниями, которые понимают машины, объединив все социальные сети в одну глобальную базу.

Семантические веб-сервиси


В то время как совокупность ресурсов и их метаданных можно считать статической частью семантического Web, ее динамическую часть представляют так называемые семантические веб-сервиси — законченные элементы программной логики с однозначно описанной семантикой, доступные через Интернет и пригодные для поиска, композиции и выполнения.

Технически, семантический веб-сервис отличается от обычного веб-сервиса наличием не только описания интерфейса (на языке WSDL), но и семантического описания всех его характеристик.

Потенциальное преимущество использования семантических веб-сервисов заключается в возможности автоматического поиска (а также композиции) программными агентами соответствующих сервисов для решения поставленных задач.


Другие проекты, которые так или иначе связаны с проектом семантического веб:

Поисковая система SHOE: поиск, в семантическом Веб.

Jena: среда разработки приложений для семантического Веб, включает исполнителя SPARQL-запросов.

Simile: семантический веб для электронных библиотек.

Protege: редактор онтологий из Стенфорда

Литература к теме 1


1. Дмитрий Ландэ СЕМАНТИЧЕСКИЙ ВЕБ: ВОТ ИДЕИ – К ТЕХНОЛОГИИ //dwl@visti.net

2. Dieter Fensel, Wolfgang Wahlster, Henry Lieberman, James Hendler, «Spinning the Semantic Web: Bringing the World Wide Web to Its Full Potential», MIT Press, ISBN 0-262-06232-1

3. John Davies, Dieter Fensel, Frank van Harmelen, «Towards the Semantic Web: Ontology-Driven Knowledge Management», John Wiley & Sons, ISBN 0-470-84867-7

4. Тем Бернерс-Ли, Джеймс Хендлер и Ора Лассила. Семантический Веб

http://ezolin.pisem.net/logic/semantic_web_rus.html

5. Joshua Tauberer What Is RDF?

http://www.xml.com/pub/a/2001/01/24/rdf.html

6. Рекомендация W3C, перевод Дмитрия Щербины

OWL, язык веб-онтологий. Руководство

http://sherdim.rsu.ru/pts/semantic_web/REC-owl-guide-20040210_ru.html

7. А.В. Манцивода. Система метаописаний Dublin Core

http://teacode.com/concept/eor/dc.html

Схожі:

“семантический web и языки информационного обмена” iconЛекція №2. Стандарти Web Створення World Wide Web «Війни браузерів» Поява стандартів Web Формування W3c розвиток стандартів Web
У 1993 р у світі працювало 1700 Gopher-серверів. Але після того, як університет оголосив, що збирається вимагати ліцензійні відрахування...
“семантический web и языки информационного обмена” iconСмешанные дистрофии. Нарушения обмена сложных белков Актуальность темы
Нарушения обмена этих веществ лежат в основе многих заболеваний и изучаются на разных клинических кафедрах
“семантический web и языки информационного обмена” iconЦель конференции
Целью конференции является расширение научно-информационного обмена между ведущими специалистами Европы в области метрологического...
“семантический web и языки информационного обмена” iconЦель конференции
Целью конференции является расширение научно-информационного обмена между ведущими специалистами Европы в области метрологического...
“семантический web и языки информационного обмена” iconИнформационная система управления технической эксплуатацией ат
Проанализированы проблемы автоматизации информационного обеспечения поддержки процессов управления технической эксплуатацией, сформулированы...
“семантический web и языки информационного обмена” iconИнформационная система управления технической эксплуатацией ат
Проанализированы проблемы автоматизации информационного обеспечения поддержки процессов управления технической эксплуатацией, сформулированы...
“семантический web и языки информационного обмена” iconНарушения кровообращения актуальность темы
Система лимфообращения, с одной стороны, представляет собой дренажную систему, которая резорбирует и выводит продукты тканевого обмена...
“семантический web и языки информационного обмена” iconНарушения кровообращения актуальность темы
Система лимфообращения, с одной стороны, представляет собой дренажную систему, которая резорбирует и выводит продукты тканевого обмена...
“семантический web и языки информационного обмена” iconРазработка Web-сервиса на основе php и Mysql
На платформе Microsoft. Net или J2ee web-сервис представляет собой развитый сервер на основе wsdl (Web Service Definition Language),...
“семантический web и языки информационного обмена” iconТехническая документация web ирбис64 и web ирбис32
Команда чтения внутреннего двоичного объекта из библиографической записи – «интегрированный файл»(3) 12
“семантический web и языки информационного обмена” iconТехническая документация web ирбис64 и web ирбис32
Команда чтения внутреннего двоичного объекта из библиографической записи – «интегрированный файл»(3) 12
Додайте кнопку на своєму сайті:
Документи


База даних захищена авторським правом ©zavantag.com 2000-2013
При копіюванні матеріалу обов'язкове зазначення активного посилання відкритою для індексації.
звернутися до адміністрації
Документи