|
ДОНЕЦЬКИЙ НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ
Григор`єв Андрій Вікторович
УДК 004.89+ 681.327.12.001.362
АВТОМАТИЗОВАНА ІНФОРМАЦІЙНО-ПОШУКОВА СИСТЕМА,
ЩО ҐРУНТУЄТЬСЯ НА НЕЧІТКІЙ МОДЕЛІ ПОРТРЕТА ЛЮДИНИ
05.13.06 – автоматизовані системи управління
та прогресивні інформаційні технології
Автореферат дисертації на здобуття наукового ступеня
кандидата технічних наук
Донецьк – 2005Дисертацією є рукопис.
Роботу виконано на кафедрі Комп`ютерних технологій Донецького національного університету Міністерства освіти і науки України.
Науковий керівник: доктор технічних наук, професор
Каргін Анатолій Олексійович,
завідувач кафедри комп`ютерних технологій
Донецького національного університету, м. Донецьк.
Офіційні опоненти: доктор технічних наук, професор
Слєпцов Анатолій Ілліч,
професор кафедри інформаційних систем управління Донецького національного університету,
м. Донецьк.
кандидат технічних наук, доцент
Рубан Ігор Вікторович,
начальник кафедри
Харківського університету повітряних сил,
м. Харків.
Провідна установа: кафедра автоматизації проектування
обчислювальної техніки, Харківський національний
університет радіоелектроніки Міністерства
освіти і науки України, м. Харків.
Захист відбудеться “ 16 ” грудня 2005 р. о 13.00 годині на засіданні спеціалізованої вченої ради К 11.051.08 у Донецькому національному університеті за адресою: 83055, м. Донецьк, пр. Театральний, 13, корп. 4, ауд. 416.
З дисертацією можна ознайомитися в бібліотеці Донецького національного університету за адресою: 83055, м. Донецьк, вул. Університетська, 24, головний корпус.
Автореферат розісланий “ 14 ” листопада 2005 г.
Учений секретар спеціалізованої
вченої ради К 11.051.08 ______________________ Шевцов Д.В.
ЗАГАЛЬНА ХАРАКТЕРИСТИКА РОБОТИ
Актуальність теми. На сучасному етапі розвитку суспільства відомо декілька додатків щодо застосування задачі ідентифікації особистості. Один з головних виникає в процесі оперативно-розшукової діяльності органів внутрішніх справ. У сучасній криміналістиці є актуальною задача ідентифікації особистості за зовнішністю людини – фотопортретом або словесним описом, складеним свідком.
В умовах підвищеної небезпеки терористичних актів створюються комп`ютерні системи глобального спостереження, в яких головна роль відводиться задачі ідентифікації особистості за оперативними даними від камер, розміщених у громадських місцях різних міст світу, за словесним описом або портретом, складеним за допомогою фоторобота.
Перспективними також є дослідження в галузі інтелектуальних пошукових машин у зв`язку з тенденцією до інтеграції різнорідної інформації і створення інтелектуальних середовищ. Створення систем, які припускають пошук інформації не лише за текстовими фрагментами, але й за іншими видами даних, такими як зображення та звук, надасть можливість суттєво підвищити якість пошукових систем.
Найбільшого успіху в галузі пошуку інформації про людину за словесним описом досягнуто в криміналістиці. Сучасні системи криміналістичного обліку, наприклад, такі як автоматизована дактилоскопічна інформаційна система АДІС “Папілон” та Система інформаційного забезпечення ОВС України, які містять у своєму складі модулі, що забезпечують внесення інформації про зовнішність людини як у формі словесного портрета, так і фотографії. Однак можливість автоматизованого пошуку за фотопортретом у цих системах не реалізована, а створення словесного портрета на практиці викликає певні складнощі. Таким чином, удосконалення методів пошуку за портретом людини є актуальною проблемою.
Зв`язок роботи із науковими програмами, планами, темами.
Дисертаційна робота виконана за період з 2000 по 2005 роки відповідно до наукової тематики кафедри комп`ютерних технологій Донецького національного університету в рамках держбюджетних тем: реєстр. №0101U005380 “Технології ситуаційних нечітких динамічних процесів для створення систем штучного інтелекту” і реєстр. №0104U002161 “Інтелектуальні машини, засновані на інтегрованих знаннях”.
Мета і задачі дослідження. Метою роботи є створення автоматизованої системи ідентифікації особистості людини та пошуку інформації на основі портрета (словесного та фото).
Для досягнення мети в роботі поставлені наступні задачі:
- дослідити сучасний стан проблеми представлення інформації про зовнішність людини, у тому числі методів представлення та порівняння зображень обличчя людини;
- розробити модель представлення словесної та графічної інформації про обличчя людини;
- розробити метод порівняння гібридних моделей, які відбивають як словесну, так і графічну інформацію про обличчя людини;
- розробити автоматизовану систему ідентифікації особистості за портретом;
- перевірити ефективність запропонованих методів та моделей за допомогою комп`ютерного експерименту.
Об`єкт дослідження – ідентифікація людини за зовнішнім виглядом.
Предмет дослідження – методи ідентифікації обличчя людини.
Методи дослідження. У роботі використані такі методи: теорії нечітких множин, нечіткого моделювання, експертних оцінок, нечіткого ситуаційного висновку, теорії систем автоматизованого управління, словесного портрета, програмування і оптимізації.
Наукова новизна отриманих результатів:
- отримав подальший розвиток метод словесного портрета, що відрізняється від існуючих представленням ознак опису обличчя людини нечіткими моделями;
- розроблено модель ідентифікації особистості, що відрізняється від відомих нечітким представленням та зіставленням словесного портрета обличчя;
- розроблено модель представлення інформації, що ґрунтується на “особливих областях” фотопортрета обличчя людини в фас, що надало можливість розробити новий механізм нечіткого пошуку в гетерогенних базах даних;
- запропоновано процедуру використання накопичених експертних знань, які використовуються у традиційному методі словесного портрета при побудові функцій приналежності нечітких множин, що відображають значення ознак метричного типу.
Практичне значення отриманих результатів:
- Метод нечіткого словесного портрета максимально наближений до можливостей людини щодо опису зовнішності у вигляді словесного портрета, що підвищує ефективність автоматизованого пошуку інформації про людину в базі даних.
- Метод нечітких особливих областей дозволяє розширити функції автоматизованих пошукових систем і перейти до створення систем нового покоління, в яких пошук може бути реалізований не лише за текстовою, але й за графічною інформацією.
- Метод нечіткого словесного портрета і нечітких особливих областей можуть бути використані в системах криміналістичного обліку як гібридні моделі в гетерогенних базах даних, що суттєво розширює їх функціонально та підвищує ефективність.
- Результати дисертації впроваджені на ДД ВАТ “Укртелеком” у розробці інтелектуального порталу “Донбас”.
- Запропоновані методи та моделі можуть бути використані в інтелектуальних пошукових машинах ІНТЕРНЕТ, що дозволить організувати віртуальне бюро знайомств, розшуку зниклих людей, глобальні системи спостереження та ін.
Особистий внесок здобувача. Всі головні ідеї, положення, теоретичні і практичні розробки, та інші результати дисертаційної роботи, які винесені на захист, отримані автором самостійно.
Апробація результатів роботи. Результати дисертаційної роботи були повідомлені, обговорені та схвалені на наступних семінарах та конференціях:
- науковій конференції Донецького національного університету за підсумками науково-дослідницьких робіт за період 1999 – 2000 рр., 18–20 квітня 2001 р., м. Донецьк;
- 13-й міжнародній школі-семінарі “Перспективні системи управління на залізничному, промисловому та міському транспорті”, 20-25 вересня 2000 р., м. Алушта;
- другій, третій, четвертій і п`ятій міжнародних науково-практичних конференціях “Сучасні інформаційні та електронні технології”, 28–31 травня 2001 р., 21–24 травня 2002 р., 19–23 травня 2003 р. і 17–21 травня 2004 р., м. Одеса;
- міжнародній конференції з управління “Автоматика – 2002”, 16-20 вересня 2002 р., м. Донецьк.
Публікації. За результатами дослідження опубліковано 12 робіт. З них 5 – у наукових виданнях, які входять до переліку ВАК України.
Структура і обсяг дисертації. Дисертація складається із вступу, чотирьох розділів, висновку, списку використаної літератури зі 106 найменувань і 2 додатків. Робота містить 30 рисунків, 4 таблиці. Повний обсяг дисертації складає 143 сторінки тексту.
ОСНОВНИЙ ЗМІСТ РОБОТИ
У вступі обґрунтовано актуальність теми, сформульовано мету дослідження і перераховано основні положення, винесені на захист.
У першому розділі виконано аналіз існуючого стану досліджуваної проблеми; показано місце автоматизованих інформаційно-пошукових систем, що використовуються для вирішення задачі ідентифікації особистості людини за зовнішнім виглядом. В умовах інтенсивного впровадження електронних технологій у різні галузі людського життя виникає потреба в нових моделях взаємодії людини з інформаційними ресурсами. Показано, що на сучасному етапі акцент зміщується від простих пошукових систем текстової інформації до моделей, які базуються на психологічних особистостях сприйняття людиною різноманітної інформації, що використовують в інтелектуальних пошукових системах.
Під час роботи з гетерогенними базами даних, які містять як текстову, так і графічну інформацію, сучасні пошукові системи підтримують пошук як за ключовими словами, термінами та значущими фрагментами текстової інформації, так і за фрагментами графічної інформації. У гетерогенних базах даних, що зберігають фотографії і текстову інформацію (як спеціальні криміналістичні, так і загального користування – сайти знайомств, пошуку зниклих, галереї, музеї та ін.), використовують два підходи: перший пов`язаний з пошуком у базі даних інформації про людину за словесним описом, другий – за фотопортретом. Обґрунтовується вибір методу словесного портрета який використовується в сучасній криміналістиці для вирішення першої задачі. Виконано аналіз простору ознак і виділено три механізми формування значень ознак, запропоновано їх класифікацію на метричні, експертні та похідні.
Показано основний недолік існуючого методу словесного портрета при формуванні ознак метричного типу – перехід від числових даних, отриманих вимірюваннями, до вербальних значень здійснюється за допомогою порогових оціночних функцій. Зазначено, що ця проблема порогових оцінок призводить до виникнення протирічних ситуацій. Для ознак експертного типу виявлено проблему категоричності. Ознаки похідного типу формуються на основі вже сформованих значень ознак і продукційних правил за допомогою методу логічного висновку. Для вирішення цих проблем запропоновано перейти до нечіткої моделі словесного портрета, як такого, що найбільш точно відбиває психологічні властивості людини.
Проведений аналіз систем криміналістичного обліку: “АДІС “Папілон” та “Системи інформаційного забезпечення ОВС України”, а також ряду зарубіжних інформаційних систем, що здійснюють ідентифікацію людини за фотографією її обличчя і реалізуються такими компаніями, як Visionic, Viisage, Miros. Аналіз показав, що в розглянутих системах криміналістичного обліку реалізована можливість збереження інформації про зовнішність людини у вигляді словесного портрета і фотографії обличчя, однак не реалізована можливість пошуку за зображенням обличчя та гібридним запитом. Крім цього, має місце залежність показників якості розпізнавання від швидкісних характеристик. Таким чином, під час розробки системи пошуку переслідувалась мета підвищення якості розпізнавання за умови високих швидкісних показників.
У другому розділі подано модель нечіткого словесного портрета. Вона заснована на методі, який використовується в криміналістиці та передбачає опис зовнішності людини впорядкованим набором ознак, що відносяться до різних її елементів. У дисертаційній роботі використовується частина словесного портрета, що побудована на ознаках, які належать до обличчя людини (обличчя в цілому, волосся на обличчі, вуса, борода, чоло, брови, очі, вії, повіки, ніс у цілому, перенісся, спинка носа, основа носа, кінчик носа, крила носа, ніздрі, носова перегородка, рот, носогубний фільтр, губи, зуби, підборіддя) та до таких загальних елементів зовнішності, як антропологічний тип, стать та вік. До кожного з цих елементів входить множина ознак (наприклад, до елемента “чоло” належать ознаки: форма, висота, ширина, величина, нахил, а також чолові бугри та надбрівні дуги) – всього модель складається із 95 ознак, із якими взагалі пов`язано 292 значення. Нечітка модель побудована на впорядкованому наборі ознак зовнішності та представлена множиною нечітких підмножин:
де – множина ознак; (x та y – прийняті в методі словесного портрета індикативні коди елемента і ознаки зовнішності); – множина значень ознаки ; (значення індексів j позначають цифрові коди згідно із п`ятиланковою системою позначень, доповненою літерними значеннями індексу для позначення особистих значень ознак, які мають цифровий код 0 та потребують словесного пояснення).
Модель словесного портрета має два компоненти: нечіткий еталон, який міститься в базі даних, та нечіткий запит. У першому випадку функція приналежності формується на основі об’єктивних даних; у другому – на основі суб`єктивної впевненості. Нечіткий еталон позначається у вигляді (1); нечітку модель-запит та значення ознак, які входять до неї, позначено відповідно та .
Процедура формування функції приналежності в (2) залежить від типу ознаки. Нечіткі ознаки метричного типу будуються на основі числових результатів абсолютних або відносних вимірювань. На рис.1 цифрами позначені результати вимірювань, які використовуються для обчислення значень ознак висоти і ширини чола: 1) – висота чола; 2) – фізична висота обличчя; 3) – ширина чола; 4) – ширина обличчя на рівні вилиці. Для висоти чола використовується відношення вимірювань 1) і 2), для ширини чола – відношення 3) та 4).
Перехід від числового результату вимірювання до нечіткого значення ознаки – фазифікація – заданий сімейством функцій , , а функція приналежності для (2) є .

Рис. 1. Схематичне зображення обличчя людини в фас
Запропонований підхід до побудови на основі експертних оцінок, заданих для кожного точкам максимальної відповідності та областями домінування. Точка максимальної відповідності є результат вимірювання , що найбільш відповідає, з точки зору експерта, значенню . Область домінування – підмножина , кожна точка якого відповідає значенню не в меншому ступені, ніж будь-якому із інших значень .
Для визначення області домінування на множині заданий порядок <, представлений умовою: . На основі впровадженого порядку на виділені елементи такі, що та елементи і , який безпосередньо розміщений перед елементом та той, що безпосередньо йде за ним.
Показано, що областями домінування є: ; ; , де – точка розмежування між областями домінування та , яка відповідає пороговому значенню, що розмежовує області домінування для значень і на . Обґрунтовано доцільність апроксимації залежностей L-R функціями вигляду :
Для ознак експертного типу нечіткі значення будуються на основі образу елемента зовнішності, який безпосередньо спостерігається та описується ознакою , де – множина різноманітних образів елемента зовнішності, який описується ознакою , і зумовлена різними його значеннями. Кожному відповідає шаблонний образ , яким може бути словесний опис, який чітко відповідає цьому значенню елемента зовнішності, або його графічне зображення. Значення ознаки формуються експертом, роль якого полягає у встановлені ступеня подібності образу, що спостерігається, кожному з шаблонів. Таким чином, функція приналежності для нечіткої множини , яка задає значення ознаки , є , де – встановлена експертом функція подібності двох образів за ознакою .
Значення ознак похідного типу обчислюється методом нечіткого висновку на основі, з одного боку, вже обчислених нечітких ознак зовнішності, і, з іншого боку, на основі формалізації заданих експертом продукційних правил. Таким чином, функція приналежності для нечіткої множини , яка виражає значення ознаки похідного типу, є: , де – нечіткий вираз, який формалізує продукційне правило, що описує умови, за яких ознака приймає значення .
Процедура пошуку в гетерогенній базі даних запису за словесним описом зовнішності припускає впорядкування моделей-еталонів, які зберігаються в базі даних, за нечітким ступенем їх відповідності моделі-запиту. Обґрунтовано двоетапну процедуру обчислення ступеня відповідності моделі-еталона S моделі-запиту : 1) обчислення ступеня відповідності за окремими ознаками ; 2) обчислення інтегрального ступеня відповідності запиту на основі отриманих відповідностей за окремими нечіткими ознаками. Як правило, модель-еталон і модель-запит – не є повними (модель-еталон і модель-запит задані, відповідно, на підмножинах і ). Зівставлення проводиться на підпросторі ознак (у випадку порожнього підпростору отримаємо невизначеність – на практиці такі випадки запропоновано розглядати як особливі ситуації).
Для першого етапу – знаходження ступеня нечіткої відповідності моделі-еталона запиту – обґрунтовано використання ступеня нечіткого входження однієї нечіткої множини в іншу. Аналіз класичного ступеня входження: з нечіткою імплікацією Гьоделя показав, що мають місце випадки, коли даний вираз дає суперечний результат. Для подолання виявлених протиріч запропоновано ступінь відповідності:
де – ступінь нечіткого розрізнення на R(E); .
Наведено виведення спрощеного варіанта формули (4), для чого сформульована і доведена теорема, що задає явно ступінь нечіткого входження:
де G – нечітка міра.
Для вирішення другої задачі обґрунтовано використання avg-критерію:
де .
У третьому розділі досліджено метод пошуку в базі даних інформації за запитом, репрезентованим фотопортретом обличчя людини. Введена нечітка модель обличчя, заснована на даних сучасної психології сприйняття та психофізики. Аналіз експериментів, проведених психологами в галузі фотометрії (а саме, дослідження зареєстрованих сакадичних рухів очей людини, отриманих під час дослідження фотографії), показав, що при візуальному сприйнятті інтерес людини до різних ланок зображення розподілений нерівномірно. При вільному дослідженні фотографії людини найбільшу увагу привертають ланки зображення, що відповідають очам, носу та роту людини.
У зв`язку з цим запропоновано процес ідентифікації обличчя будувати на гіпотезі, згідно з якою для впізнавання достатньо порівняти найбільш інформативні області зображення, які запропоновано називати “особливими областями”. Під час аналізу отриманих психологами графів сакадичних рухів, зареєстрованих при вільному дослідженні фотографії обличчя людини в фас, виявлено п`ять таких особливих областей: “права зінична”, “ліва зінична”, “передньоносова”, “ротова” та “средньоносова”. Таким чином, модель фотопортрета обличчя є набором моделей особливих областей зображення. Формально це подано таким чином.
Вхідне зображення представлене функцією яскравості , яка задана на піксельній площині . Задані координати центрів особливих областей: відповідно “правої” і “лівої зіничних”, “передньоносової”, “ротової” та “средньоносової”. Координати точок вводяться в автоматизованому або автоматичному режимах, координата обчислюється із співвідношення: .
Відповідно до висунутої передумови, модель фотопортрета обличчя є набором моделей особливих областей:
де – моделі “правої”, “лівої зіничних”, “передньоносової”, “ротової” та “средньоносової” особливих областей відповідно.
Для того, щоб нечітка модель фотографії була інваріантною до поворотів зображення та до зміни його масштабу, введені такі характеристики особливої області, як базовий напрямок та радіус околу , що залежать від координат центрів особливих областей і не залежать віт орієнтації або розмірів всього зображення, тобто ; , де .
Напрямок особливих областей запропоновано задавати кутом між віссю ординат та векторами : ; ; ; ; . Радіуси особливих областей знаходяться із співвідношень: ; ; ; , де – евклідова відстань між точками і .
Для зручності опису моделі особливої області запропоновано перейти до полярної системи координат із початком відліку в особливій точці , нульовим напрямком та одиничним радіусом . Модель особливої області запропоновано задавати нечіткими характеристиками:
де – нечіткий напрямок контуру в околі контрольної точки . Координати задані залежно від ступенів градації радіальної і кутової складових та відповідно, а також коефіцієнту перенесення радіальної складової : , ; , .
Нечітка множина (9) задана на , де . Функція приналежності відображає впевненість у тому, що напрямок контуру в точці відповідає напрямку :
де – функція яскравості, , , і – нечіткі піксельні області, задані на , із функціями приналежності:
де – координати пікселя у полярній системі координат із центром у контрольній точці , нульовим напрямком та одиничним відрізком радіальної складової, що відповідає розміру –околу контрольної точки.
За допомогою цих множин, що описують: –окіл контрольної точки ( ); наближення до прямої, що проходить через контрольну точку в напрямку ( ); і піксельні області, які знаходяться з умовної позитивної ( ) та негативної сторін відносно цієї прямої ( ).
Вираз (11) відображає різницю у середній освітленості між центральною відносно напрямку частиною околу контрольної точки ( ) та однією із двох периферійних частин – позитивною ( ) або негативною ( ). Сигма-функція, яка бере участь у виразі (10), відображає особливості суб`єктивного сприйняття зображення та є функцією переходу від розрізнення середньої освітленості нечітких областей до суб`єктивної впевненості у наявності контуру в контрольній точці у заданому напрямку.
Порівняння нечітких моделей запропоновано проводити аналогічно процедурі порівняння моделей нечіткого словесного портрета. Ступенем подібності моделей і є:
де – ступінь нечіткої подібності моделей k-х особливих областей.
Нечіткий ступінь подібності особливих областей і аналогічно ступеню подібності моделей подана у вигляді:
|