Электронная библиотека Веда
Цели библиотеки
Скачать бесплатно
Доставка литературы
Доставка диссертаций
Размещение литературы
Контактные данные
Я ищу:
Библиотечный каталог российских и украинских диссертаций

Вы находитесь:
Дисертаційні роботи України
Технічні науки
Системи та засоби штучного інтелекту

Диссертационная работа:

Щербак Сергій Сергійович. Методи та засоби формування баз онтологічних знань на підставі джерел табличних структур : Дис... канд. наук: 05.13.23 - 2007.

смотреть введение
Введение к работе:

Актуальність теми. До важливих задач, що виникають при розробці систем штучного інтелекту, варто віднести розробку методів та засобів формування баз знань цих систем. Необхідність цього, обумовлена насамперед активним розвитком ініціативи Semantic Web по створенню виразних моделей подання розподілених по Web знань у вигляді онтологій, що представляють собою набори явних специфікацій зв’язаних відношеннями об’єктів предметних областей для організації автоматичної обробки даних і знань. У рамках Semantic Web онтології разом з екземплярами складових їх об’єктів утворюють бази онтологічних знань (БОЗ).

У якості одного з основних джерел знань для Semantic Web розглядають різного роду набори даних, організовані за допомогою табличних структур, аналіз яких може додати додаткові знання про предметну область, – джерела знань табличних структур (ДЗТС), які широко використовуються в Інтранет/Інтернет середовищах. Однак широка різноманітність табличних структур, які застосовуються для організації вмісту джерел, становить серйозну перешкоду для ефективного застосування класичних методів аналізу джерел такого типу для створення об’єктів предметних областей, їхніх екземплярів і формування на їх основі БОЗ. Крім того, орієнтація існуючих проектів та засобів формування баз онтологічних знань на ручне введення знань про предметні області в ряді випадків виявляється економічно й організаційно не завжди доцільною в умовах практичного застосування.

Різним аспектам рішення проблеми формування баз онтологічних знань на основі джерел табличних структур присвячені роботи Осипова Г.С., Манциводи А.В. , Хорошевського В.Ф, Смірнова С.В., Кляцкіна В.М., Плесневич Г.С., Загорулько Ю.О., Ushold М., Guarino N. та інших вчених.

У той же час слід зазначити, що дослідження даної проблеми ще не дозволяють запропонувати сукупність ефективних засобів формування БОЗ різного призначення. Таким чином, актуальним і доцільним є розробка ефективних методів формування БОЗ, орієнтованих на автоматичне введення знань шляхом аналізу джерел табличних структур. Задачі, які при цьому виникають, обумовили напрямок цієї дисертаційної роботи.

Зв’язок роботи з науковими програмами, планами, темами. Дисертаційна робота виконана відповідно до плану науково-дослідних робіт Харківського національного університету радіоелектроніки в межах розділу №105-4 «Розробка теоретичних основ, моделей та алгоритмів вилучення знань з текстових баз даних та побудови високоефективних багатозначних структур природно-мовних систем щодо реалізації інтелектуального інтерфейсу» держбюджетної теми №105 «Розробка математичного, алгоритмічного та програмного забезпечення для проектування інтелектуальних систем обробки аудіо, відеосигналів, природно-мовної і аналітичної інформації» (№ДР 0100U005436), розділу №164-2 «Розробка методів, моделей і алгоритмів видобування та подання знань у розподілених мережевих інтелектуальних системах» держбюджетної теми №164 «Розробка математичного, інформаційно-лінгвістичного і програмного забезпечення розподілених мережевих інтелектуальних систем» (№ДР 0103U001548), що виконуються згідно наказу Міністерства освіти і науки України за результатами конкурсного відбору проектів наукових досліджень, та науково-дослідницької роботи за госпдоговірною тематикою (договір на створення науково-технічної продукції №04-09 від 16.02.2004 «Розробка підсистеми аналізу табличних документів» (№ДР 0104U004062). У межах зазначених тем здобувачем як виконавцем були запропоновані формальні критерії приналежності до типів табличних структур та розроблені формальна модель, методи та засоби аналізу джерел знань табличних структур, а також формальна модель, методи та засоби формування баз онтологічних знань.

Мета і задачі дослідження. Метою роботи є підвищення ефективності електронного документообігу в Semantic Web шляхом розробки методів та засобів формування баз онтологічних знань на підставі джерел табличних структур.

Для досягнення цієї мети в роботі розв’язуються наступні задачі:

аналіз існуючих підходів до формування баз онтологічних знань на підставі джерел табличних структур;

розробка формальної моделі баз онтологічних знань;

розробка методу формування баз онтологічних знань на підставі цілеспрямованого перебору та його математичного забезпечення;

розробка формальної моделі джерел знань табличних структур;

розробка методу аналізу джерел знань табличних структур на підставі цілеспрямованого перебору та його математичного забезпечення;

розробка методу формування екземплярів об’єктів предметних областей на підставі джерел знань табличних структур та його математичного забезпечення;

застосування розроблених методів для реалізації комплексу програмних засобів формування баз онтологічних знань.

Об’єктом дослідження є системи електронного документообігу, середовище Semantic Web.

Предметом дослідження є бази онтологічних знань та методи їх формування, джерела знань табличних структур та моделі даних, які використовують для представлення даних табличні структури.

Методи дослідження. Для рішення поставлених задач використовувались ідеї та принципи штучного інтелекту, гіпертекстових технологій Semantic Web, теорій інженерії знань, онтологічного інжинірінга та складності обчислень. Експериментальні дослідження проводилися на тестових прикладах і на реальних джерелах знань табличних структур у вигляді табличних документів які широко використовуються на підприємствах України для організації документообігу.

Наукова новизна отриманих результатів.

1. Вперше запропоновано метод формування баз онтологічних знань, який на відміну від існуючих методів використовує адитивну ієрархічну організацію баз онтологічних знань, що дає можливість на основі запитів у вигляді структурно-логічних схем додавати нові об’єкти предметної області, проводити цілеспрямований пошук онтологічних знань та поповнювати об’єкти новими екземплярами.

2. Вперше запропоновано метод формування екземплярів об’єктів предметної області на підставі джерел знань табличних структур, який відрізняється тим, що дані вводяться до баз онтологічних знань з урахуванням «спрямованої на властивості» реалізації об’єктів предметної області, завдяки чому забезпечується обробка наборів даних, які є організованими за допомогою табличних структур.

3. Вдосконалено комплексну табличну модель мови гіпертексту HTML, орієнтовану на представлення довільних табличних структур, шляхом введення об’єктних характеристик для опису вмісту комірок, таких як «приналежність до об’єкта», «тип вмісту заголовної комірки», що забезпечує умови для організації уніфікованого доступу при формуванні баз онтологічних знань.

4. Одержав подальший розвиток метод аналізу джерел знань табличних структур, який забезпечує розширення вихідних даних за рахунок настроювання критеріїв інтерпретації структурно-логічних схем та формує запити на введення об’єктів предметної області до бази онтологічних знань, що дозволяє збільшити рівень розуміння вмісту джерел при автоматичній обробці.

Практичне значення отриманих результатів. Розроблені в дисертаційній роботі методи та засоби формування баз онтологічних знань на підставі джерел табличних структур дозволяють вирішувати широкий клас задач, пов’язаних з організацією документообігу на основі баз онтологічних знань з можливістю одержання нових знань у вигляді зв’язаних відношеннями об’єктів ПрО шляхом аналізу ДЗТС різних форматів, або з організацією автоматичної обробки розподілених знань в Semantic Web. Реалізація алгоритмічного, математичного забезпечення методів, які запропоновані в дисертаційній роботі, та експериментальні дослідження, що проведені для визначення верхньої оцінки і характеру зростання складності методу формування баз онтологічних знань на підставі цілеспрямованого перебору, підтверджують основні положення, що виносяться на захист.

Результати дисертаційної роботи були використані під час створення комплексу програмних засобів формування баз онтологічних знань підсистеми аналізу табличних документів при виконанні господарчого договору № 04-09 від 16.02.2004 «Розробка підсистеми табличних документів» (№ДР 0104U004062) між багатопрофільним підприємством «Системотехніка» та Харківським національним університетом радіоелектроніки. Наукові положення, висновки і рекомендації, викладені в дисертації, були використані при підготовці і читанні курсів «Організація банків і баз даних» у 2002/2003 навчальному році, «Структури даних», «Інтернет-техно-логії» у 2002/2003 - 2004/2005 навчальних роках, «Інформаційні технології в корпоративних мережах», «Розподілені системи» у 2004/2005 навчальному році на кафедрі штучного інтелекту Харківського національного університету радіоелектроніки.

Особистий внесок здобувача. Усі основні результати, що виносяться на захист, отримані здобувачем особисто. У роботах, опублікованих зі співавторами, здобувачу належать: у [2] – розробка методу ідентифікації об’єктів предметних областей в онтологічних графах, у [4] – розробка методу формування онтологій предметних областей на підставі джерел табличних структур, у [5] – розробка архітектури засобів автоматичного формування баз онтологічних знань, у [7] – розробка методу цілеспрямованого пошуку об’єктів з урахуванням обмежень користувача в базі онтологічних знань «Навчальний процес», у [8] – розробка архітектури засобів аналізу даних джерел табличних структур, у [9] – технологія вилучення зв’язаних відношеннями об’єктів предметних областей на підставі структурованих джерел знань; у [12] – розробка архітектури бази онтологічних знань «Електронна бібліотека» та метод обробки знань цієї бази.

Апробація результатів дисертації. Основні результати дисертаційної роботи були представлені, доповідалися та обговорювалися на Міжнародних науково-технічних конференціях та форумах: 10-й Ювілейній міжнародній науковій конференції «Теорія і техніка передачі, прийому і обробки інформації» (Харків-Туапсе, 2004), 8-му, 9-му та 10-му Міжнародних молодіжних форумах «Радіоелектроніка і молодь в ХХI столітті» (Харків, 2004, 2005, 2006), 12-й Міжнародній конференції з автоматичного управління «Автоматика-2005» (Харків, 2005), 7-й Міжнародній науково-технічній конференції «Системний аналіз і інформаційні технології» (Київ, 2005), 2-му Міжнародному радіоелектронному форумі «Прикладная радиоэлектроника. Состояние и перспективы развития» (Харків, 2005), 3-й Міжнародній науково-практичній конференції «Математическое и программное обеспечение интеллектуальных систем» (Дніпропетровськ, 2005), Міжнародній науковій конференції «Інтелектуалізація обробки інформації» (Сімферополь, 2004).

Публікації. По темі дисертації опубліковано 13 науково-технічних публікацій, з них: 4 статті (2 з яких одноосібно) у виданнях, включених до переліку видань ВАК України, у яких можуть публікуватися результати дисертаційних робіт на здобуття наукового ступеня кандидата технічних наук; 9 публікацій видані в збірниках праць і тез міжнародних науково-технічних конференцій і форумів.

Структура дисертації. Дисертація складається зі вступу, п’яти розділів, висновків, списку використаних джерел та двох додатків. Повний обсяг дисертації становить 152 сторінки; обсяг основного тексту 125 сторінок; 40 рисунків; 3 таблиці; список використаних джерел, що включає 120 найменувань та займає 12 сторінок; два додатки на 15 сторінках.

Подобные работы
Четвериков Григорій Григорович
Формальні моделі та методи синтезу швидкодіючих багатозначних структур мовних систем
Козяєв Леонід Леонідович
Методи формалізації і моделі морфологічних структур та їх застосування в системах штучного інтелекту
Кустра Наталія Омелянівна
Методи та засоби попреднього опрацювання наборів однотипних зображень
Єрохін Андрій Леонідович
Інтелектуальні методи та засоби візуалізації позаштатних ситуацій в складних системах
Самра Муавія Хассан Хамо
Нейромережеві методи та засоби розпізнавання газів для медичної діагностики та екологічного моніторингу
Козяев Леонид Леонидович
Методы формализации и модели морфологических структур и их применение в системах искусственного интеллекта
Щербак Сергей Сергеевич
Методы и средства формирования баз онтологических знаний на основе источников табличных структур
Хаймуді Ель Кхатір
Моделі та методи розпізнавання класів багатопараметричних об'єктів на основі штучних нейронних мереж
Іващенко Валерій Володимирович
Методи та алгоритми компараторної ідентифікації статичних сенсорних систем при обмеженні на вхідну інформацію
Карпенко Анжела Петрівна
Оцінки розходження між зображеннями та методи їх застосування в задачах розпізнавання образів

© Научная электронная библиотека «Веда», 2003-2013.
info@lib.ua-ru.net