|
МІНІСТЕРСТВО ОСВІТИ УКРАЇНИ
ХЕРСОНСЬКИЙ ДЕРЖАВНИЙ ТЕХНІЧНИЙ УНІВЕРСИТЕТ
ШЕКЕТА Василь Іванович
УДК 681. 3:622. 276
ІНФОРМАЦІЙНА СИСТЕМА ДЛЯ ПРОГНОЗУВАННЯ НАФТОГАЗОНОСНИХ ПОКЛАДІВ
05.13.06 – Автоматизовані системи управління і
прогресивні інформаційні технології
АВТОРЕФЕРАТ
дисертації на здобуття наукового ступеня
кандидата технічних наук
ХЕРСОН - 1999
Роботу виконано на кафедрі прикладної математики Івано-Франківського державного технічного університету нафти і газу.
Науковий керівник: кандидат технічних наук, доцент Юрчишин Володимир Миколаєвич, Івано-Франківський державний технічний університет нафти і газу, завідуючий кафедрою прикладної математики
Офіційні опоненти :
Доктор фізико-математичних наук, професор Хомченко А.Н., Херсонський державний технічний університет, завідуючий кафедрою математичного моделювання
Кандидат технічних наук, доцент Лєпа Є.В., Херсонський державний аграрний університет, доцент кафедри економічної кібернетики
Провідна установа :
Харківський державний технічний університет радіоелектроніки
Захист відбудеться “17” вересня 1999р. о годині на засіданні спеціалізованої вченої ради К67.052.01 у Херсонському державному технічному університеті за адресою:
Україна, 325008, м.Херсон, Бериславське шосе, 24, корп.3, ауд.320.
З дисертацією можна ознайомитися в бібліотеці Херсонського державного технічного університету за адресою : Україна, 325008, м.Херсон, Бериславське шосе, 24.
Автореферат розісланий “14” липня 1999р.
Вчений секретар
спеціалізованої вченої ради Костін В.О.
ЗАГАЛЬНА ХАРАКТЕРИСТИКА РОБОТИ
Актуальність теми. В даний час нафтогазова галузь має автоматизовані системи різних рівнів і типів, а також різні програмні комплекси для прогнозу нафтогазоносності, пошуку та розвідки родовищ нафти і газу, але масштаби та ефективність застосування ЕОМ для кожного рівня різні. Це пов’язане з тим, що недостатньо використовуються розвинені бази даних і відсутня типова методика набуття і накопичення знань про нафтогазоносні поклади та прогнозування необхідності проведення пошуково-розвідувальних робіт з використанням нових інформаційних технологій .
Впровадження нових інформаційних технологій в нафтогазовій справі дає можливість суттєво змінити економіко-екологічний підхід до пошуково-розвідувальних робіт на нафту і газ . Оскільки основними джерелами інформації при таких пошуково-розвідувальних роботах є буріння свердловин, які вимагають значних капітальних витрат, важливим є накопичення баз знань, що можуть бути використані при прогнозуванні нафтогазонасичених покладів з використанням експертних систем(ЕС).
Експертні системи, як системи штучного інтелекту, використовують знання висококваліфікованих спеціалістів-експертів для розв’язуванння задач в порівняно вузьких проблемних областях. Проблемна спрямованість і можливість вирішувати широкий клас задач зробила експертні системи незамінними в багатьох галузях промисловості і науки . Сьогодні на перший план виходять проблеми, пов’язані з практичною реалізацією ЕС в великих і складних проблемних областях .
Основною перешкодою на шляху створення і поширення експертних систем є проблема набуття і представлення знань . Значна кількість інформації, її слабка структурованість, труднощі експерта при спробі пояснити послідовність своїх міркувань по прийняттю певного рішення призводять до того, що процес передачі знань від експерта до системи здійснюється з великими труднощами, методом “спроб, помилок і виправлень” . Існуючі методики по роботі з експертом є далеко неповними . Слабким місцем є їх нездатність контролювати процес прийняття рішень експертом і підтримки в експерта постійного інтересу до процесу передачі знань . В результаті процес передачі знань перетворюється в абсолюно нецікаве і монотонне заняття для експерта, а процес формування бази знань розтя-гується в часі. З другого боку, при представленні вже набутих знань виникають труднощі у виборі правильного способу представлення і відповідних інстру-ментальних засобів. В складних проблемних областях часто виникає потреба в комбінованому застосуванні вже існуючих способів представлення, а також у впровадженні нових специфічних прийомів .
І, нарешті, ще більш складною проблемою є процес логічного висновку. Вузьким місцем цієї проблеми є необхідність здійснювати процес логічного висновку в умовах неповної і неточної інформації, що має місце при прогнозу-ванні нафтогазоносних покладів .
Таким чином, існує реальна потреба в розробці нових, більш ефективних методів набуття знань, що враховують всю сукупність проблем, які виникають в процесі передачі знань і стимулюють творчу активність експерта, а також вико-ристання нових підходів з представлення набутих знань і здійснення логічного висновку .
Зв’язок роботи з науковими програмами, планами,темами. Дослідження, що отримані в дисертаційній роботі, тісно пов’язані з виконанням держбюджетних і господарсько-договірних НДДКР кафедри ПМ за участю здобувача.
Дисертаційна робота виконувалась за планом науково-дослідних робіт держбюджетної теми Д6/7ф “Наукові основи розробки експертних систем для об’єктів нафтогазового комплексу” та науково-дослідних робіт теми 211/96 “Розробка комп’ютеризованої експертної системи для прогнозування колекторів нафти і газу “, теми 89/95 “Систематизація геологічної інформації по родовищах нафти і газу для комп’ютерної бази даних”.
Мета і задачі дослідження: аналіз аналітико-інформаційної діяльності спеціаліста-геолога для розробки і реалізації нових методів роботи з експертом і обробки набутих знань, розв’язку задач набуття та представлення знань і логічного висновку в умовах неповної і неточної інформації нафтогазової предметної області.
Загальні методи дослідження: в основу досліджень покладено комплексне використання засобів інженерії знань, теорії нечітких множин, теорії ймовірнос-тей, дедукції і алгебри логіки. Для практичної реалізації одержаних математичних моделей використано інтегроване середовище Visual Prolog 5.0 .
Наукова новизна отриманих результатів полягає в наступному :
розроблена і реалізована методика набуття знань від спеціаліста-експерта предметної області на прикладі нафтогазоносних покладів ;
застосовано нові підходи до аналізу одержаних знань і їх представлення з використанням теорії нечітких множин;
розроблено метод для організації логічного висновку в умовах неточної і неповної інформації предметної області .
Практичне значення отриманих результатів :
запропоновані підходи до роботи з експертом нафтогазової предметної області дозволяють розв’язувати проблеми, які виникають в процесі формування баз знань, підвищувати творчу активність спеціаліста-експерта і значно прискорити процес розробки ЕС ;
на базі оболонки експертної системи ESTA розроблено і реалізовано експертну систему COLECTOR, що об’єднує в рамках універсального інтерфейсу засоби набуття, аналізу, формалізації і представлення експертних знань та логіч-ного висновку в умовах неповної і неточної інформації на прикладі прогнозування нафтогазових колекторів. ЕС COLECTOR успішно використовується для прогнозування нафтогазових колекторів в ДГП “Полтавнафтогазгеологія” .
Особистий внесок здобувача . Всі положення, які виносяться на захист, належать особисто автору і не містять результатів, ідей або розробок, що нале-жать співавторам, разом з якими опубліковані наукові праці.
Апробація результатів дисертації. Основні результати проведених досліджень доповідались і обговорювались на науково-технічних конференціях Івано-Франківського державного технічного університету нафти і газу в 1996р., 1997р., на міжнародній конференції “Нафта-газ України- 98”(Полтава 15-17 верес-ня 1998), на міжнародному симпозіумі “Комп’ютери в Європі: минуле, сучасне, майбутнє”(Київ 5-9 жовтня 1998р. ), на міжнародній конференції по матема-тичному моделюванню “Математические модели и современные информацион-ные технологии”(Херсон, 3-6 вересня, 1998р. ) .
Публікації. Основні результати дисертаційної роботи опубліковані у 7 наукових статтях[1, 2, 3, 4, 5, 6, 7], 7 тезах доповідей [8, 9, 10, 11, 12, 13, 14], 1 звіті з НДР .
Структура та обсяг дисертаційної роботи. Дисертаційна робота складається з вступу, чотирьох розділів, висновків, містить 130 сторінок основного тексту, список літератури з 140 найменувань, 9 рисунків, 18 таблиць і 5 додатків.
ОСНОВНИЙ ЗМІСТ РОБОТИ
У вступі обгрунтовано актуальність теми дисертаційної роботи, дано загальну характеристику роботи, описано її зв’язок з науковими програмами , пла-нами, темами, сформульована мета та задачі досліджень, наведені відомості щодо наукової новизни, практичної цінності та впровадження результатів роботи, пуб-лікацій автора та апробації роботи .
У першому розділі дисертації проаналізовано аналітико-інформаційні аспекти діяльності експерта в нафтогазовій предметній області при класифікації типів розрізів і колекторів, промисловій оцінці продуктивних порід. Виділено ряд методик, більшість із яких характеризуються нечіткістю та невизначеністю і за-пропоновано методику поетапної формалізації знань експерта із використанням величин типу “невизначено”.
Проведено аналіз стану робіт в області впровадження нових інформаційних технологій в нафтогазовий комплекс і обгрунтовано актуальність досліджень спрямованих на розробку комплесних інформаційних систем прогнозування нафтогазових покладів .
У другому розділі проаналізовано стан робіт і публікацій стосовно основних підходів, щодо проектування і розробки інформаційних систем.
Викладено основні положення з розробки формально-логічного апарату для представлення і використання знань. Запропонована математична модель аналізу невизначеності побудована на основі теорії нечітких множин(ТНМ).
Всю множину міркувань представляють у вигляді декартового добутку базових множин S1×S2, а змінні X i Y, що приймають свої значення на S1 i S2 від-повідно, є взаємодіючими, базові знання відображаються декартовим добутком не-чітких множин, а степені можливості і необхідності розмитих висловлювань, що відповідають нечітким подіям F1×F2 i F1+F2 задаються через :
FE(F1×F2, AA×BB) = min (FE(F1, AA), FE(F2, BB));
SE(F1×F2, AA×BB) = min (SE(F1, AA), SE(F2, BB));
FE(F1+F2, AA×BB) = max(FE(F1, AA), FE(F2, BB));
SE(F1+F2, AA×BB) = max(SE(F1, AA), SE(F2, BB)),
що дозволяє представляти одночасно розмите і невизначене висловлювання з допомогою розподілу можливостей, що відповідає менш точному, але більш достовірному висловлюванню.
При наявності k різних надійних джерел, що описують певне родовище пари оцінок (FEj(s), SEj(s)) об’єднуються в єдиний блок інформації (FE(s), SE(s)):
(1)
(2) Значення нечіткої істинності деякої посилки, що представляється характе-ристичною функцією μυ на інтервалі [0, 1] інтерпретується, як
∀z∈Z, μC′(z) = sup μυ (μB(r) *→μC(z))* μB′(r) (3)
r∈R
Тоді для двох функціонально залежних атрибутів А1 і А2 після виконання нечіткої фільтрації одержуємо відношення
FE(L(х)≅РL(y)) = sup min(μP(r, t), πL(х)(r), πL(y)(t)),
(r, t)∈CL× CL
Умовний розподіл πZ|X, що враховує невизначеність для правил з невизначеними висновками в базі знань інформаційної системи у випадку, коли АA і ВB – звичайні множини, а dn i ds- оцінки відповідно степені необхідності і степені дос-
татності має вигляд :
(4)
Аналіз нечіткого запиту моделюється за допомогою складеного фільтру, що уявляє собою кон’юнкцію елементарних фільтрів, що проводять порівняння можливих значень атрибутів і-го об’єкту (i=1, …n) з відповідними нечіткими множинами в активних фільтрах.
FE(H1×…× Hn| G1×…× Gn) = min FE(Hi, Gi) (5)
SE(H1×…× Hn| G1×…× Gn) = min SE(Hi, Gi) (6)
Для подолання розриву між представленням знань і нечітким логічним висновком пропонується гібридна конструкція представлення нечітких знань, що має два компоненти :один працює власне з знаннями, а другий з невизначеністю, якою вони характеризуються. При такому підході система не тільки має засоби для представлення нечітких знань, але й може здійснювати нечіткий логічний висновок на структурах даних . Гібридна структура задається у вигляді кортежу ℜ = <ℵ, Φ, g, ℑ, Ψ> , де ℵ формальна мова і ℑ і g непорожні множини. ℵ і Φ разом утворюють компонент представлення знань в ℜ. З іншого боку, ми використовуємо множину ℑ суджень на основі фактів для обчислення невизначеностей , і пару функцій (Ψ1, Ψ2) , які визначають їх динамічну поведінку в просторі інтенсивності. Елементи ℑ, Ψ разом утворюють компонент нечіткого висновку в ℜ . Вводяться наступні операції :
E%[ ] = {<Φ(trueℵ), trueℑ>}
A%[a, k] = Ψ1(Φ(a), k)
T%[a, x, k]= Ψ2(<Φ(a), x >, k).
де, trueℵ представляє ℵ, і trueℑ∈ ℑ представляє коефіцієнти довіри.
Побудова структур знань починається із E%[ ], далі виконується операція T% . Таким чином, утворені нами структури знань є множинами пар <p, x>, де p- інтенсивність, x∈ ℑ.
Мова ℵ і формула a з неї, Φ(a) складається з множини світів, де a відпові-дає семантиці даній для ℵ :
ℜ1 = <ℵFOL, ΦFOL, g, ℑTF, ΨTF> ,
де ℑTF = {так, ні} , g складає множина світів <M, sO> таких, що M = <{sO}, D, V>
є стандартною структурою, що інтерпретується в численні предикатів першого порядку:
ΦFOL(a) = {<M, sO>|<M, sO> |=FOL a}
де, |=FOL стандартне істинне відношення для даного числення.
Вводячи функції ΨTF такі, що
Ψ1TF(p, k) = так якщо для всіх <q, так>∈k, q⊆ p інакше ні
Ψ2TF(<p, x>, k)= {<q∩p, так>|<q, так>∈k } якщо x= так інакше k ,
операції над структурами знань означають в термінах ΦFOL і ΨTF :

Роль модуля представлення знань полягає в обчисленні Φ(a) для кожної формули a, що входить в склад мови представлення знань.
Сказане відображається архітектурою :
Рис. 1 Архітектура гібридної структури представлення знань і логічного
висновку
В третьому розділі проаналізовано місце системи логічного висновку в інформаційній системі і побудовано його на основі стандартних предикатів.
В рамках пропонованого підходу значення істинності правила логічного висновку “якщо Аі то Ві ” інтерпретується в термінах умовної істинності . Це значення істинності записується у вигляді verify(Ві|Аі), що еквівалентно множині розв’язків рівняння
verify(Аі∧Ві) = min(verify(Ві|Аі), verify(Аі)). (7) Оскільки, verify(Ві)≥verify(Аі∧Ві), то verify(Ві) ≥ min(verify(Ві|Аі), verify(Аі)). Якщо Ві=“Z=w” i Ai=“Q=r”, причому πZ|Q(w, r)=FE(Ві|Аі), і πZ - проекція двохмір-ного розподілу можливостей πQ, Z = πZ|Q*πQ на базову множину BS змінної Z, то правило “якщо Q є АA, то Z є ВB” виражатиметься нерівністю:
∀w∈BS, μBB(w) ≥ sup π Z|Q (w, r)* μAA(r) (8)
Запропонований механізм висновку приймає нечіткі описи спостережень і
виводить нечіткі описи прогнозів за допомогою нечітких відношень через використання таких правил композиції для висновку прогнозу FCj, для родовища DEq, із набору спостережень OBi :
- Композиція для OBiFCj (гіпотези і підтвердження) :
W1DEFC =WDEOB ° WCOBFC , (9)
що визначається
μW1DEFC (DEq, FCj) = max min[μWdeob(DEq, OBi) ; μWcobfc(OBi, FCj) ]
OBi
- Композиція для OBiFCj (виключення (наявними спостереженнями)) :
W2DEFC = WDEOB ° (1 - WCOBFC ) , (10)
що визначається
μW2DEFC (DEq, FCj) = max min[μWdeob(DEq, OBi) ;1- μWcobfc(OBi, FCj) ]
OBi
- Композиція для OBiFCj (виключення (відсутніми спостереженнями)) :
W3DEFC = (1-WDEOB )° WρOBFC , (11)
що визначається наступним чином :
μW3DEFC (DEq, FCj) = max min[1- μWdeob(DEq, OBi) ; μWρOBFC(OBi, FCj) ]
OBi
Прогноз вважається підтвердженим, якщо
μW1DEFC (DEq, FCj) = 1.00 (12)
Прогноз можливий, якщо
ε ≤ μW1DEFC (DEq, FCj) ≤ 0.99, (13)
де ε уявляє собою еврістичне значення, яке з дуже малою очевидністю (наприк-лад, ε = 0.1000) виключає прогноз.
Прогноз виключається, якщо
μW2DEFC (DEq, FCj) = 1.00 або μW3DEFC (DEq, FCj) = 1.00 (14)
Для гібридної структури
ℜ2 = <ℵFOL, ΦFOL, g, ℑDS, ΨDS> ,
де ℵFOL, ΦFOL, g такі самі, як і в ℜ1 , ℑDS тепер належить до інтервалу [0, 1]. Структура знань ℜ2 є множиною пар <p, x>, де p представляє певну множину світів, і , x∈[0, 1].
Ψ1DS(p,k) повертає значення з проміжку [0,1], що задовільняє представлення:

Впевненість експерта в точності знань представлених через p є сумою всіх показників приписаних до значень інтенсивності в k. Тоді :
Ψ2DS(<p, x>, k) = k⊕{<p, x>, <W, 1-x>}
Нові означення для E2, A2, T2 матимуть вигляд :
E2[] = {<W, 1>}
A2[a, k] = Σ{ x | <q, x>∈k i q⊆ΦFOL(a)}
T2[a, x, k] = k⊕{<ΦFOL(a), x>, <W, 1-x>}
Для множини світів W= {∅, d, a, da}, де D містить значення “колектор” маємо
k0 = E2[] = {<W, 1>}
k1 = T2[(порода родовище), 0.9, k0] = {<W, 0.1>, <{∅, a, da }, 0.9 >}
k2 = T2[(порода колектор), 0.7, k1] = {<W, 0.03>, <{d, da }, 0.07 >,
<{∅, a, da }, 0.27>, <, 0.63>}
Звідки :
A2[(родовище колектор), k2] = 0.63
Розглядаються означення форм типу (def Mi Mj), що інтерпретується як “Mi є підпоняттям Mj” і факти форми (Mi mj), що інтерпретується як “mj є прикладом поняття Mi” :
<M, s>|=Z(Mi mj) якщо T(mj, s)∈T(Mi , s)
<M, s>|=Z(def Mi Mj) якщо для всіх s i sRs, F(Mi, s)⊆F(Mj , s)
Використання відношення R гарантує залежність між фактами і простими запитами , що обробляються за схемою :
Рис. 2 Схема обробки цілі
A1. (def Mi Mj)
R1. З (Mi mk) i (def Mi Mj) ⇒ (Mj mk)
R2. З (def Mi Mj) i (def Mj Mk) ⇒ (def Mi Mk)
Складені запити утворюються через об’єднання простих цілей. Структура складається з цілей, впорядкованих зліва направо, і окремої таблиці , що містить поточні значення зв’язаних змінних. Передача управління відбувається в зворотньому напрямі , від цілі до цілі , коли система намагається знайти значення змінних, що задовольняють запит. Для кожної цілі вхід і вихід з неї можливий через відповідний порт зліва чи справа . Процес починається з виклику першої цілі зліва . Якщо ця ціль успішно досягається , то наступна ціль викликається з допо-могою зв’язаної змінної , яка одержала своє значення при виконанні попередньої цілі . Процес продовжується до тих пір, поки не буде здійснено вихід через exit-порт самої правої цілі .
Для предикатів, що викликаються з двома аргументами пропонується чоти-ри можливих види шаблонів потоку :
(i, i) (i, o) (o, i) (o, o)
Для прискорення обробки бази даних кожна порція інформації розміщується у власному домені :
родовище(C) ( o )
родовище(глибина_залягання(Назва, Глибина))глибина_залягання ( o, o )
родовище(вік("Богатойське", Вік))вік ( i, o )
родовище(літологія("Вапняки") ( i )
Для оптимізації процедур пошуку інформації в базі даних організовуються рекурсивні бінарні дерева пошуку. Розглядаючи будь-яку комірку дерева, можна передбачити в якому з її піддерев міститься потрібний фрагмент інформації . Такий ефект досягається за рахунок задання на сукупності даних певного порядкового відношення(алфавітного чи цифрового). Елементи лівого піддерева передуватимуть поточній комірці, а елементи правого піддерева слідуватимуть за нею .
Після виконання обробки кожної конкретної комірки під час процесу пошуку, половина комірок що залишилась, усувається з подальшого розгляду і тим самим швидкість виконання пошуку збільшується . Тому якщо розмір дерева збільшився, наприклад, вдвічі, то пошук по новому дереву потребуватиме лише одного додаткового кроку . Швидкість пошуку пропорційна логарифму числа N, де N- число комірок .
Побудова інтерпретатора починається з термів aTerms і sTerms, які використовуються процедурою оцінювання :
1. Прочитаний iнтерпретатором вихідний код поділяється на статичні терми.
2. Після цього кожний статичний терм перетворюється в aTerm, що і може бути оцінений.
Процес оцінки починається з початкового терма . Будь-яке твердження внесене в базу даних зберігається у вигляді sТerm. Коли ціль перетворюється в активний терм, iнтерпретатор правил ( механізм висновку ) оцінює aТerm і виконує по-в’язану з ним дію. Дія полягає в пошуку в базі даних статичного терма ( твердження ), що відповідає активній цілі. Якщо система знаходить відповідне твердження, то вона зчитує цей sТerm і перетворює його в aТerm, унiфікуючи ціль і твердження, а після цього, якщо твердження є правилом, повторює про-цес для кожної підцілi в тілі твердження .
Основою машини висновку є предикат unify_term. Він одержує на вході статичні терми, дійсні терми, а також середовище, а на виході дає унiфікацію двох різноманітних типів термів .
Виклик предикату member забезпечує звязування аТerm1 із змінною ідентифікації, після чого унiфікація термів аТerm і аТerm1 здійснюється одним із трьох способів :
1. Якщо обидва терми зв'язані, то в залежності від їх значень унiфікація закінчується успішно, або ні .
2. Якщо зв'язаний тільки один терм, то унiфікація пройде шляхом вста-новлення двох термів одне на одного .
3. Якщо обидва терми є вільними змінними, то вони поділяються (що означає, що вони будуть представлені вказівниками і кожний вказівник буде вка-зувати на один і той же вільний адрес).
Предикат unify_body є входом вищого порядку iнтерпретатора; для iнтерпретацiї бази правил предикату unify_body задається ціль, яку треба задовільнити ( гіпотеза ) і вільне середовище. Після цього цей предикат досягне цілі, або ні в залежності від того, чи можна довести гіпотезу. Unify_body відповідає за iнтерпретацію структури тіла правила згідно алгоритму :
1. Поділ тіла на підцілi - відповідно до порядку оцінювання, що виз-начається будовою тіла .
2. Виклику іншого предикату, що відповідає за фактичне виконання окре-мих підцілей .
Виконання бази правил відбувається через сходження :
- від гіпотези
- через її підцілi
- і їх підцілi
- і т.д.
- до фактів, що мають тіло true , яке виконалося в першому реченні.
Якщо гіпотезу не можна довести з допомогою фактів і правил бази даних, то це призведе до невиконання виклику unify_body на рівні гіпотези. Це вико-нання чи невиконання є єдиним результатом iнтерпретації бази правил; на такий результат налагоджена перевірка контрольної програми.
Визначення цієї оболонки включає три вимоги, що виходять за межі мож-ливостей ланцюга зворотніх міркувань, прийнятого в Пролозі :
1. Фактор впевненості формує частину правил і висновків з них.
2. Якщо користувачу задано питання, то система завжди може пояснити, чому вона його задала.
3. Всі висновки можуть бути пояснені за допомогою посилань на попередні міркування .
Ці вимоги сумуються в трьох додаткових аргументах предикату unify_body.
1. Real , що є фактором впевненості, створеним в результаті висновку.
2. Терм, що є заголовком правила, що виконується в даний момент; він дозволяє системі сформулювати фразу : " Я задаю це питання , бо намагаюся встановити <заголовок правила > .
3. Статичний терм , що здійснює просування вперед трасіровки; він буде одержувати встановлену версію тіла, над якою працює unify_body, враховуючи, що терми, які є змінними в процесі переходу тіла в unify_body і call, будуть зміне-ні на ті значення, які вони одержать в процесі виконання. Наявність цих уста-новок в базі даних, дозволяє пояснити будь-яке заключення через посиланням на раніше доведені положення.
Перетворення правила в факт, про який відомо, що він підтверджений, існуючими в базі даних фактами, здійснюється двома способами :
1. Вилучення правила і установки йому відповідного факту .
2. Помічення правила як підтвердженого .
Ці можливості виконуються через запровадження оптимiзації, в якій кожному правилу приписаний свій власний номер. Цей номер за допомогою предиката бази даних, що називається proven (<rule_no> ), буде вказувати , чи підтверджено правило як факт. Це не тільки прискорює роботу, але й дозволяє виконувати пошук альтернативних рішень .
В четвертьому розділі дано оцінку ефективності застосування розробленого формально-логічного апарату для автоматизації процесу рішення діагностико-прогнозтичних задач спеціалістів-геологів.
Розроблена комплексна методика набуття знань в ході інтерактивного діалогу “експерт --інженер-когнітолог-- інформаційна система” дозволяє виділити ключеві об’єкти предметної області через побудову послідовностей пар “гіпотеза-спостереження” і сформувати модель предметної області.
Здобуті знання пропонується представляти у вигляді фреймів, триплетів об’єкт-атрибут-значення, реляційних відношень, і правил із змінними, що значно полегшить наступну їх формалізацію.
Розглядаються чотири класи об’єктів :
- спостереження, ознаки, результати геофізичних досліджень і одержані дані(OBi);
- гіпотези і сценарії(FCj) ;
- проміжні комбінації (ICk);
- комбінації спостережень (OCl).
Спостереження OBi приймають значення μOBi із [0, 1]∪{ν}. Значення μOBi показує , в якій степені проявляються спостереження OBi . Після цього будується бінарне нечітке відношення WρOB ⊂ Π×Σ, що визначається умовою μWdeob(DEq, OBi)=μOBi для родовища DEq, де DEq∈Π (Π={DE1, …, DEr} ) і OBi∈Σ(Σ = {OB1, …, OBm}).
Прогнози також приймають значення із [0,1]∪{ν}. Нечіткі значення 0.00 < μFCi<1. 00 представляють можливі прогнози, тоді як значення μFCi=1. 00 і μFCi=0. 00 відповідають підтвердженому прогнозу і непідтвердженому прогнозу відповідно . Ще не розглянуті прогнози приймають значення μFCi=ν . Формально будується віднощення WDEFC⊂Π×Δ, що визначається умовою μWdefc(DEq, FCj) = μFCj для родовища DEq , де FCj∈Δ(Δ = {FC1, …, FCn}).
Обидва об’єкти, що розглядаються: проміжні комбінації і комбінації спосте-режень – приймають значення μIck i μOCl відповідно із [0, 1]∪{ν}, де ν означає, що дійсне значення ще не визначено . Відношення RDEOBC⊂Π×Κ задається умовою μWdeobс(DEq, OСl)=μOBCl для родовища DEq, де виконюється OCl∈K(K={OCl, …, OCl}), і WDEOBC формально описує комбінації спостережень по даному родовищу.
Між нафтогазовими об’єктами розглядаються такі відношення:
- відношення спостереження-прогноз(OBi FCj) ;
- відношення комбінація спостережень-прогнозів(OClFCj);
- відношення спостереження-спостереження (OBi OBj);
- відношення прогноз-прогноз (FCi FCj).
Ці відношення характеризуються наступними двома параметрами :
- частота появи (f);
- степінь підтвердження (сd).
Відношення між нафтогазовими об’єктами задаються у вигляді правил відношення з відповідними їм парами відношень. Загальне формулювання такого правила має вигляд :
ЯКЩО (антецедент) ТО (консеквент) ПРИ (f, сd)
Пари відношення (f, сd) містять або числові значення μf і μсd , або лінгвістично нечіткі значення λf і λсd , або і ті і інші .
Значення μf і μсd інтерпретуються, як значення нечітких відношень між антецедентами і консеквентами. Так ,
OBiFCj (відношення появи) WOBFCf ⊂ Σ×Δ
OBiFCj (відношення підтвердження) WOBFCcd ⊂ Σ×Δ
OClFCj (відношення появи) WOBCFCf⊂ K×Δ
OClFCj (відношення підтвердження) WOBCFCcd⊂ K×Δ
OBiOBj (відношення появи) WOBOBf ⊂ Σ×Σ
OBiOBj (відношення підтвердження) ROBOBcd ⊂ Σ×Σ
FCiFCj (відношення появи) RFCFCf ⊂ Δ×Δ
FCiFCj (відношення підтвердження) RFCFCcd ⊂ Δ×Δ
Ці відношення мають ту важливу властивість , що вони можуть бути інтер-претовані статистично. Частоти появи f і степінь підтвердження сd становить:
μf = G(OBi∩FCj) / G(FCj) = G( OBi /FCj ) (15) μcd = G(OBi∩FCj) / G(OBi) = G(FCj /OBi ) (16) де
G(OBi∩FCj) - абсолютна частота появи OBi і FCj ;
G(FCj) - абсолютна частота появи FCj ;
G(OBi) - абсолютна частота появи OBi ;
G( OBi /FCj ) - умовна частота OBi при умові FCj ;
G(FCj /OBi ) - умовна частота FCj при умові OBi .
Після того, як зібрані всі спостреження здійснюється логічний висновок типу “спостереження-спостереження”. Список спостережень містить всі необхідні пункти даних, що включають нечіткі значення, результати вимірів і висновку, числові значення, дані спострережень . Після цього список спостережень пере-віряється на несуперечливість .
На наступному кроці оцінюються проміжні комбінації спостережень. Після проходження перевірки на відповідність обчислюються нечіткі значення для всіх комбінацій спостережень. Одержані в результаті списки тепер повні і не містять ніяких протиріч . Нечіткі значення μFCj = 1.00, тобто підтверджені прогнози FCj для родовища DEq визначаються з допомогою такого співвідношення :
μFCj = 1.00 , якщо μW1DEFC (DEq, FCj) = 1.00 або μW4DEFC (DEq, FCj) = 1.00 (17)
Нечіткі значення μFCj = 0.00, тобто виключені прогнози FCj для родовища DEq визначаються з допомогою :
μFCj = 0.00 , якщо ( μW2DEFC (DEq, FCj) = 1.00
або μW3DEFC (DEq, FCj) = 1.00 або (18)
μW5DEFC (DEq, FCj) = 1.00
або μW6DEFC (DEq, FCj) = 1.00 )
Відношення типу “колектор-продуктивний колектор” допускають логічний висновок наступних прогнозів( підтверджувані або такі, що виключаються):
|