Referat.me

Название: Побудова украиномовнои онтологии засобами СУБД

Вид работы: реферат

Рубрика: Информатика

Размер файла: 417.53 Kb

Скачать файл: referat.me-131994.docx

Краткое описание работы: Глибовець М. М., Марченко О. О., Никоненко А. О. ПОБУДОВА УКРАЇНОМОВНОЇ ОНТОЛОГІЇ ЗАСОБАМИ СУБД 2. Формати онтологій Для спрощення роботи з онтологіями ство¬

Побудова украиномовнои онтологии засобами СУБД

Глибовець М. М., Марченко О. О., Никоненко А. О.

ПОБУДОВА УКРАЇНОМОВНОЇ

ОНТОЛОГІЇ ЗАСОБАМИ СУБД

2. Формати онтологій

Для спрощення роботи з онтологіями ство¬

рено ряд мов опису онтологій. Метою таких

мов є надання можливості задавати додаткову

машинно-інтерпретовану семантику ресурсам,

зробити машинне представлення даних більш

наближеним до реального світу, підвищити мож¬

ливості концептуального моделювання слабко

структурованих Web-даних. Такий підхід поши¬

рився й на різноманітні мови опису онтології та

на інструментальні засоби, призначені для робо¬

ти з ними. Сьогодні виділяють три основні класи

мов опису онтологій:

- традиційні мови специфікації онтологій: Ontolingua,

CycL та мови, засновані на дескриптивних

логіках (такі як LOOM), також мови,

засновані на фреймах (OKBC, OCML, Flogic);

- більш пізні мови, засновані на Web-стандартах

(XOL, SHOE, UPML);

- спеціальні мови для обміну онтологіями че¬

рез Web: RDF(S), DAML, OIL, OWL [2].

Коротко охарактеризуємо найбільш пошире¬

ні та часто вживані мови опису онтологій.

Мова RDF. У рамках проекту семантичної

інтерпретації інформаційних ресурсів Інтернету

(Semantic Web) був запропонований стандарт

опису метаданих документа Resource Description

Framework, що використовує Xml-синтаксис.

RDF використовує базову модель даних

≪об'єкт - атрибут - значення≫ іздатний відігра¬

ти роль універсальної мови опису семантики ре¬

сурсів та взаємозв'язків між ними. Ресурси опи¬

суються у вигляді орієнтованого розміченого

графа. Кожен ресурс може мати властивості, які

у свою чергу також можуть бути ресурсами або

їхніми колекціями. Усі словники RDF викорис¬

товують базову структуру, яка описує класи ре¬

сурсів і типи зв'язків між ними. Це дозволяє ви¬

користовувати різнорідні децентралізовані слов¬

ники, створені для машинної обробки за різними

принципами й методами. Важливою особливіс¬

тю стандарту є розширюваність: можна задати

структуру опису джерела, використовуючи й

розширюючи такі вбудовані поняття RDF-схем,

як класи, властивості, типи, колекції. Модель

схеми RDF включає наслідування класів і влас¬

тивостей [3].

DAML+OIL - семантична мова розмітки

Web-ресурсів, що розширює стандарти RDF і

RDF Schema за рахунок більш повних примітивів

моделювання. Остання версія DAML+OIL забез¬

печує багатий набір конструкцій для створення

онтології й розмітки інформації таким чином,

щоб їх могла читати й розуміти машина [4].

OWL (Web Ontology Language) - мова подан¬

ня онтологій, що розширює можливості XML,

RDF, RDF Schema і DAML+OIL. Цей проект пе¬

редбачає створення потужного механізму семан¬

тичного аналізу. Планується, що в ньому буде

усунено обмеження конструкцій DAML+OIL.

Онтології OWL - це послідовності аксіом і

фактів, а також посилань на інші онтології. Вони

містять компонент для запису авторства та іншої

докладної інформації, є документами Web, на

них можна посилатися через URI [5].

KIF (Knowledge Interchange Format, або формат

обміну знаннями) - заснований на S-виразах

синтаксис для логіки. KIF - це спеціальна мова,

призначена для використання при обміні зна¬

ннями між різними комп'ютерними системами.

Мова не призначена для внутрішнього представ¬

лення знань усередині комп'ютерних систем або

всередині тісно зв'язаних наборів комп'ютерних

систем (хоча може бути використана й для цієї

мети). Мова була розроблена для опису загаль¬

ного формату представлення знань, незалежного

від конкретних систем [6].

CycL (мова опису онтології Cyc) - це гібрид¬

на мова, що поєднує в собі властивості фреймів

і логіку предикатів. CycL розрізняє такі сутності,

як екземпляри, класи, предикати й функції. Син¬

таксис мови CycL схожий на синтаксис мови

Lisp. Словник CycL складається з термів. Мно¬

жину термів можна розділити на константи, тер¬

ми (що не є атомами) і змінні. Крім цього, зустрі¬

чаються деякі інші типи об'єктів. Терми вико¬

ристовуються для складання значущих виразів

CycL, які використовуються для формування су¬

джень, з яких складається база знань [7].

Зважаючи на сказане вище, зрозуміло, що

сьогодні не існує ні єдиної, формалізованої та

стандартизованої мови для опису онтологій, ні

єдиного загальновживаного формату збережен¬

ня даних в онтологіях. Тому кожен розробник

системи для обробки природномовних текстів

вимушений розробляти свою онтологію з ≪нуля

≫, починаючи з формату збереження даних і

закінчуючи самим наповненням бази. З'явилися

навіть спеціалізовані онтології, які дістали назву

≪організаційні≫. Звичайно, така ситуація не є

прийнятною й дуже ускладнює, сповільнює та

робить більш дорогою розробку нових лінгвіс¬

тичних систем [8].

Наша розробка - перший крок у напрямі усу¬

нення ситуацій, коли для кожного проекту по¬

трібно розробляти нову онтологію. Найближчим

часом ми плануємо закінчити проект щодо ство¬

рення єдиної онтологічної бази для програмних

систем, що працюють з українською мовою, а в

перспективі - і для російської, англійської та де¬

яких інших європейських мов. Принципи орга¬

нізації онтологічної бази української мови та її

структура й будуть описані далі у статті.

Частина бази даних, що відповідає за _роботу з онтологією:

Рис. 2. Діаграма класів для даних про семантику

http://www.library.ukma.kiev.ua/e-lib/NZ/NZV86_2008_computer/08_glybovets_mm.PDF

Похожие работы

  • PowerPoint

    Реферат на тему: PowerPoint План 1. PowerPoint. 2. Створення презентації. Застосування сучасної техніки для презентацій стало звичайним явищем при проведенні семінарів, конференцій і в ході навчального процесу. Традиційно для демонстрації використовуються 35-міліметрові слайди і прозорі плівки.

  • Основи CASЕ-технологій

    Методологія RAD Одним з можливих підходів до розробки ПЗ в рамках спіральної моделі ЖЦ є що одержала останнім часом широке розповсюдження методологія швидкої розробки застосувань RAD (Rapid Application Development). Під цим терміном звичайно розуміється процес розробки ПЗ, що містить 3 елементи:

  • Формування 3D зображень

    Затверджено 482.362.70915-28 13 59-3 ЛЗ МІНІСТЕРСТВО ОСВІТИ ТА НАУКИ УКРАЇНИ ЧЕРНІВЕЦЬКИЙ НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ ІМЕНІ ЮРІЯ ФЕДЬКОВИЧА Факультет комп’ютерних наук

  • Розробка операційного та керуючого автомату що виконує операцію прискореного множення

    Курсовий проект на тему: Розробка операційного та керуючого автомату, що виконує операцію прискореного множення Вступ У наш час, з розвитком науково-технічного прогресу розвивається і обчислювальна техніка, що сприяє більшому удосконаленню. Обчислювальна техніка займає не останнє місце і грає визначальну роль в науковому технічному прогресі, сприяє підвищенню ефективності виробництва, покращанню якості продукції, росту продуктивності праці.

  • Вивчення елементів середовища СУБД MS Access

    Міністерство освіти і науки України Національний університет Львівська політехніка Кафедра ІСМ Звіт до лабораторної роботи №1 Вивчення елементів середовища СУБД

  • Основні поняття математичного програмування Побудова моделі задачі лінійного програмування

    Пошукова робота на тему: Основні поняття математичного програмування. Побудова моделі задачі лінійного програмування 1. Мета і предмет математичного програмування.

  • Проектування інформаційної системи Меблевий салон

    Вступ Microsoft Access на сьогоднішній день є одним з найпоширеніших настільних додатків для роботи з базами даних. Це пов'язане з тим, що Access має дуже широкий діапазон засобів для уведення, аналізу й подання даних. Ці засоби є не тільки простими й зручними, але й високопродуктивними, що забезпечує високу швидкість розробки додатків.

  • Допоміжні алгоритми

    та тему: ДОПОМІЖНІ АЛГОРИТМИ Тема: Допоміжні алгоритми. Мета уроку: навчити учнів складати допоміжні алгоритми; виховати старанність, дисциплінованість;

  • Побудова компютерної мережі в Cisco Packet Tracer

    ЗМІСТ 1. ЗАВДАННЯ НА КУРСОВУ РОБОТУ 2. ПОБУДОВА КОРПОРАТИВНОЇ МЕРЕЖІ З КІЛЬКІСТЮ АБОНЕНТІВ - 4 3. ПОБУДОВА КОРПОРАТИВНОЇ МЕРЕЖІ З КІЛЬКІСТЮ АБОНЕНТІВ - 7

  • Создание онтологии Генетический алгоритм в системе PROTEGE

    СОЗДАНИЕ ОНТОЛОГИИ «ГЕНЕТИЧЕСКИЙ АЛГОРИТМ» В СИСТЕМЕ PROTEGE Морозов А.Б, магистрант гр. 240441, кафедра АТМ, ТулГУ Научный руководитель: Богатырёв М.Ю., д.т.н., проф.