Электронная библиотека
Меню
Размещение литературы
Доставка литературы
Доставка диссертаций
Реклама на сайте
Цели библиотеки
Контактные данные
Я ищу:

Библиотечный каталог авторефератов Украины


По вопросу доставки диссертации по этой теме пишите на электронный адрес: info@lib.ua-ru.net
Тема автореферата диссертации: Ідентифікація форми рухомих об'єктів на основі сигнально та спектрально-структурних моделей 2002 года.
Источник: Автореф. дис... канд. техн. наук: 05.13.06 / С.В. Лавріненко; Одес. нац. політехн. ун-т. — О., 2002. — 18 с. — укp.
Аннотация: Досліджено вплив динамічних спотворень зображень об'єктів на якість методів ідентифікації зображень об'єктів заданої форми. Запропоновано моделі представлення зображень розпізнаваних об'єктів, інваріантних для динамічних спотворень: моделі Променевих Сум та Моментно-Кутових Функцій (у сигнально-структурному просторі ознак) і Модель Характерних Точок (у спектрально-структурному просторі ознак). Розроблено методи й алгоритми формування й аналізу даних моделей для ідентифікації динамічних зображень і доведено їх ефективність. Висвітлено загальні підходи до проектування програмного забезпечення аналізу та розпізнавання образів.

Текст работы:

ОДЕСЬКИЙ НАЦІОНАЛЬНИЙ ПОЛІТЕХНІЧНИЙ

УНІВЕРСИТЕТ




На правах рукопису



Лавріненко Сергій Вадимович



УДК 62-506.223.001.57:62-501



ІДЕНТИФІКАЦІЯ ФОРМИ РУХОМИХ ОБЄКТІВ НА ОСНОВІ СИГНАЛЬНО ТА СПЕКТРАЛЬНО-СТРУКТУРНИХ МОДЕЛЕЙ



05.13.06 - Автоматизовані системи управління та прогресивні інформаційні технології




АВТОРЕФЕРАТ

дисертації на здобуття наукового ступеня кандидата технічних наук










Одеса 2002

Дисертацією є рукопис


Робота виконана в Одеському національному політехнічному університеті Міністерства освіти та науки України на кафедрі Інформаційні системи



Науковий керівник:        доктор технічних наук, професор

       Власенко Віктор Олексійович,

       Одеський національний політехнічний університет,

       професор кафедри інформаційних систем



Офіційні опоненти:        доктор технічних наук, професор,

Кондратенко Юрій Пантелєєвич,

Миколаївська філія Національного університету “Києво-Могилянська академія”, професор кафедри компютерних технологій



кандидат технічних наук, доцент,

Купріянов Андрій Борисович,

Одеська державна академія харчових технологій,

доцент кафедри прикладної математики та обчислювальної техніці



Провідна установа:        Інститут космічних досліджень Національної академії наук України та Національного космічного агентства України,

       відділ космічних інформаційних технологій і систем




Захист відбудеться “25” квітня 2002р. о 1330 год. на засіданні спеціалізованої вченої ради Д41.052.01 в Одеському національному політехнічному університеті (65044, м. Одеса, проспект Шевченка, 1).




З дисертацією можна ознайомитись у бібліотеці Одеського національного політехнічного університету за адресою: (65044, м. Одеса, проспект Шевченка, 1).

Автореферат розісланий “25” березня 2002 р.


Вчений секретар спеціалізованої вченої ради,

кандидат технічних наук        _________        Ямпольський Ю. С.

ЗАГАЛЬНА ХАРАКТЕРИСТИКА РОБОТИ


Актуальність теми. Системи автоматизованого управління на основі візуальної інформації в наш час стали необхідною ланкою в роботизації складних процесів у виробництві, системах автоматизованої навігації на складноструктурованій місцевості, медичній діагностиці, криміналістиці тощо. Оскільки більшість таких відеоінформаційних систем призначена для роботи в режимі реального часу та рішення відповідальних задач, до методів аналізу і розпізнавання зображень, що використовуються в них, ставляться різносторонні і часто суперечливі вимоги. З одного боку - це вимоги високої швидкодії та якості, з іншого - потреба в малих обчислювальних та інших ресурсах, а також доступна вартість апаратної і (або) програмної реалізацій. Крім цих питань, в наш час особливо важливим вважається питання створення універсальних (хоч би в деякому класі візуальної інформації, яка обробляється системою) відеоінформаційних систем, пов'язане зі створенням повнофункціональних робототехнічних систем. Проте, ще не створено всеосяжної теорії розпізнавання зображень через те, що ця задача в більшості випадків є математично некоректною і такою, що важко формалізується. Практичні підходи, що описані в літературі, призначені для вузькоспеціалізованих застосувань і часто непорівнянні по багатьох параметрах. Сьогодні ще відсутні практично завершені системи обробки і розпізнавання зображень, які повністю задовольняють перерахованим вимогам.

Усе попереднє показує, що задача дослідження та розробки нових ефективних методів і засобів розпізнавання зображень ще далека від повного завершення і є дуже актуальною в цей час.

Звязок роботи з науковими програмами, планами та темами. Робота виконувалась в рамках наступних держбюджетних тем Міністерства Освіти та Науки України, проведених Одеським національним політехнічним університетом, “Розробка методів та інформаційних технологій моделювання та ідентифікації зображень вихрових хвильових структур та звуко-імпульсних ДНЧ-багатовимірних сигналів для вирішення задач розпізнавання обєктів та текстур в системах дистанційного зондування та аналізу фоно-цільової обстановки” (1997-1999, Договір №264-121, р. н. 0197U001839), “Методи та інформаційні технології моделювання та оцінки ефективності обробки та розпізнавання зображень та векторних сигналів у класі нелінійних гібридних алгоритмів за допомогою нейроних мереж” (2000-2002, Договір №373-121, р. н. 0100U001403). Матеріали дисертаційної роботи використані при проведенні фундаментальної науково-дослідної роботи в галузі телекомунікацій, інформаційних систем та технологій за темою “Розробка моделі людського зору для дослідження і вдосконалення цифрових телевізійних, мультимедійних та інших відеосистем” (Шифр “HVMVS-2001”). Також результати використані в учбовому процесі кафедри “Інформаційні системи” за дисципліною Розпізнавання образів та при розробці тем дипломних робіт.

Мета і задачі дослідження. Метою даної роботи є розробка нових методів аналізу і розпізнавання зв'язних зображень динамічних об'єктів і сцен та дослідження їх ефективності.

Обєктом дослідження є системи автоматизованого управління, в яких для прийняття рішення використовується візуальна інформація.

Предметом дослідження є моделі представлення зображень рухомих обєктів та методи їх ідентифікації.

Для досягнення поставленої мети необхідно вирішити задачі:

  1. Дослідження видів спотворень зображень динамічних об'єктів і їх впливу на показники якості систем спостереження і контролю, які реалізуються за допомогою відомих методів обробки і розпізнавання зображень.
  2. Розробки нових підходів до представлення зображень об'єктів заданої форми, ефективних при розвязанні задачі розпізнавання, з урахуванням динамічних спотворень, виникаючих в системах спостереження і контролю, на основі сигнально- і спектрально-структурних моделей зображень.
  3. Розробки, аналізу і оцінки ефективності алгоритмів розпізнавання, що реалізують запропоновані моделі представлення зображень, підвищення швидкодії і точності цих алгоритмів.
  4. Розробки методів ефективного проектування і створення на їх основі програмного забезпечення моделювання запропонованих методів і алгоритмів розпізнавання.

Методи досліджень. При вирішенні означених задач в дисертаційній роботі використані методи статистичної теорії рішень - для розробки критеріїв ідентифікації, загальної теорії образів, теорії розпізнавання образів - для розробки нових моделей представлення зображень, аналітичні і чисельні методи - для оцінки ефективності моделей і алгоритмів обробки і розпізнавання зображень, методи математичного моделювання на ЕОМ - для імітаційного моделювання розроблених моделей та алгоритмів.

Наукова новизна дисертаційної роботи полягає у наступному:

  1. Розвинена система оцінки роздільної здатності відеоінформаційної системи (ВІС), необхідної для можливості ефективного розпізнавання заданих класів зображень [6].
  2. Вперше запропоновані нові ефективні механізми сигнально-структурного та спектрально-структурного представлення зображень об'єктів складної форми в просторах ознак [1-5, 8-11].
  3. Створені інформаційно-технологічні системи аналізу і розпізнавання зображень рухомих об'єктів, які мають підвищену точність та швидкодію [1-5, 8-11].
  4. Вперше запропоновані обєктно-орієнтовані шаблони розробки програмних сегментів інформаційних технологій, призначених для моделювання систем розпізнавання рухомих об'єктів заданої форми [7].

Практичне значення отриманих результатів дисертаційної роботи полягає у:

  1. Розробці методики проектування ВІС на алгоритмічному та програмному рівнях, що дозволяє істотно підвищити перешкодостійкість, економічність та ефективність формування просторів ознак і розпізнавання динамічних зображень рухомих обєктів заданої форми (ОЗФ).
  2. Проведенні комплексів експериментальних досліджень ефективності сигнально-структурного і спектрально-структурного представлення зображень на основі створених алгоритмічних і програмно-аналітичних комплексів, що реалізують запропоновані методичні підходи.
  3. Розробці алгоритмічних і програмно-аналітичних сегментів інформаційних технологій для застосування в інтелектуальних системах технічного зору, які вирішують задачі спостереження та контролю.

Особистий внесок здобувача. Основні результати дисертаційної роботи отримані автором особисто. В роботах опублікованих у співавторстві, автору належить: [1] вдосконалення моделей променевих сум (МПС) та проведення експериментів, [2] запропоновано критерій розпізнавання зображень обєктів за МПС, розвинена МПС для фрагментів зображень та проведені експерименти, [3] запропоновані методи формування моделі характерних точок (МХТ), розроблено програмне забезпечення, проведені експериментальні дослідження, [4] запропоновано модель полярних функцій, розроблено програмне забезпечення, проведені експериментальні дослідження, [5] розроблено математичну модель спотворень, проведені експериментальні дослідження, [6] розроблені математичні моделі та програмне забезпечення, проведені експериментальні дослідження, [8] розроблено програмне забезпечення, проведені експериментальні дослідження, [10] запропоновані критерії ідентифікації, розроблено програмне забезпечення, проведені експериментальні дослідження, [11] запропоновані нові моделі та критерії ідентифікації цих моделей, розроблені схеми та матеріали, проведені експериментальні дослідження.

Апробація результатів дисертації. Основні положення роботи докладалися та обговорювалися на науково-технічних конференціях Одеського національного політехнічного університету (2001) та Міжнародних конференціях: Сучасні інформаційні і електронні технології2001, м. Одеса, 2001; Автоматика2001, м. Одеса, 2001.

Публікації. За темою дисертації опубліковано 8 статей та тези 3 доповідей.

Структура роботи. Дисертація складається з вступу, п'яти розділів, висновку та додатків; містить 149 сторінок основного тексту, 88 рисунків, 11 таблиць, список літератури з 99 назв і 3 додатки.

ЗМІСТ РОБОТИ


Перший розділ присвячений аналізу сучасного стану теорії розпізнавання і, зокрема, ідентифікації зображень об'єктів та аналізу сцен.

Визначені основні складності створення такої теорії. Зазначено, що основною трудністю, яка виникає при аналізі зображень динамічних об'єктів, є вибір моделі представлення зображення в просторі ознак, інваріантному до динамічних спотворень.

Показана необхідність вивчення впливу динамічних спотворень форми зображення розпізнаваних об'єктів на якість роботи методів розпізнавання і визначення вимог до відеосистеми формування динамічних зображень.

Розглянуті сучасні методи представлення зображень в статистичному, структурному і алгебраїчному (зокрема логічному) просторах ознак та означені труднощі, які виникають при формуванні використовуваних векторів ознак і впливають на стійкість таких ознак до динамічних спотворень зображень об'єктів. Основним недоліком широко застосовуваних методів формування ознак, за інформацією про контур зображення об'єкта є неінваріантність методів виділення контуру до динамічних спотворень форми, їх слабка стійкість до перешкод і необхідність обчислювально складної передобробки для підвищення стійкості таких методів.

Другий розділ присвячений аналізу базових алгоритмів передобробки та ідентифікації рухомих об'єктів заданої форми і дослідженню їх динамічних характеристик.

Для моделювання динамічних спотворень форми зображення об'єкта (лінійних, ротаційних, масштабних і ракурсних) застосовується наближена формула (афінне перетворення з матрицею А):

,                        (1)

де та - координати відповідних точок на вихідному і спотвореному зображеннях. Показано, що модель (1) є адекватною для будь-яких лінійних, ротаційних і масштабних спотворень і для ракурсних спотворень в межах до в залежності від тривимірної форми розпізнаваного об'єкта.

Проведено моделювання з метою визначення деградації якості кореляційного методу розпізнавання під впливом динамічних спотворень, які можуть бути зумовлені рухом об'єкта відносно відеодатчика і динамічними похибками системи суміщення зображень і компенсації спотворень, і отримані графіки залежності мінімальних розмірів об'єктів від параметрів (показників) розпізнавання і виду спотворень:

,        ,        ,

де         - максимальний лінійний розмір зображення об'єкта в елементах розрізнення;

        - імовірність правильного розпізнавання об'єкта;

        - відношення сигнал/перешкода;

        - лінійний зсув зображення відносно еталонного в елементах розрізнення;

        - довжина змазаних країв зображення в елементах розрізнення;

        - поворот зображення.

Розроблена система дальнісно-швидкісних характеристик (ДШХ) ВІС - залежності максимальної швидкості рухомого об'єкта, при якій його можна розпізнати з необхідною імовірністю, від його лінійних розмірів і відстані до нього. При цьому тривалість телевізійного кадру і розмір елемента розрізнення відеодатчика ВІС фіксуються. ДШХ дозволяють оцінити можливість розпізнавання зображення об'єкта із заданими характеристиками, отриманого ВІС при заданих умовах роботи.

Проведені дослідження характеристик методів виділення контурів на зображенні шляхом локального диференціювання для операторів Робертса, Девіса, Собеля показують, що найбільш стійкими до динамічних спотворень є дискримінатори на основі операторів Девіса.

У третьому розділі розроблена і досліджена сигнально-спектральна модель представлення зображень об'єктів заданої форми (ОЗФ) - модель променевих сум (МПС).

Зображення ОЗФ переводиться в простір променевих сум (ПС) шляхом перетворення вигляду:

,        (2)

де         - зображення об'єкта, розміром ;

- променева сума зображення об'єкта, отримана паралельним скануванням у напрямі (рис.1).

З формули (2) випливають властивості променевих сум:

  1. Якщо , то - спотворення зсуву зображення аналогічно відображаються на його променеву суму у вигляді зсуву, що залежить від напряму сканування.
  2. - ПС, обчислені в різних напрямках , різні.
  3. - в загальному випадку існують два різних зображення, ПС яких однакові.

Наведені обчислювально ефективні методи і алгоритми компенсації ротаційних, лінійних і масштабних спотворень зображення ОЗФ і вибору найбільш відповідних для аналізу ПС. Зокрема, для досліджених об'єктів, що володіють віссю симетрії, критерії компенсації спотворень і вибору наведені в табл. 1.


Таблиця 1

Критерії компенсації динамічних спотворень зображень ОЗФ на основі МПС


Для збільшення відстані між класами ОЗФ в просторі ПС формувалась модель променевих сум (МПС) в комплексному вигляді як:

                               (2а)

,                                (3)

Крім того, показано, що міжкласова відстань збільшується при попередньому переведенні ПС в спектральний простір дискретного перетворення Гілберта (МПС-ДПГ) і фази за Фуко-Гілбертом (МПС-ФФГ) [1, 2]:

                                       (4)

                               (5)

Зображення ОЗФ розпізнаються у просторі векторів характерних ознак (ВХО) МПС за двома кореляційно-екстремальними критеріями:

,                ,                (6)

де         - комплексна функція взаємної кореляції тестуємої та еталонної МПС;

       .

Ефективність методів досліджувалась за допомогою імітаційного моделювання на ЕОМ. Проводилась оцінка як обчислювальної ефективності, так і ймовірності правильного розпізнавання при впливі динамічних спотворень, фонових і випадкових перешкод (рис.2). Так, при впливі випадкових ротаційних і лінійних спотворень, при локальному відношенні сигнал/перешкода 14дБ (загальне по зображенню - 5дБ) імовірність правильної ідентифікації склала .



Четвертий розділ присвячений створенню сигнально-структурних моделей зображень ОЗФ в просторі Анізотропного Двовимірного Дискретного Перетворення Гілберта (АДДПГ).

Основна ідея - створення простого вектора характерних ознак (ВХО), визначеного на допустимій множині динамічних спотворень ОЗФ, з використанням анізотропії двовимірного перетворення Гілберта для збільшення міжкласової відстані. Внаслідок цього визначення ВХО є принципово стійким до допустимих видів динамічних спотворень і дозволяє статистичне розпізнавання ОЗФ методами достатніх статистик.

Розроблена ефективна одновимірна сигнально-структурна модель представлення зображень ОЗФ, названа моделлю моментно-кутових функцій (МКФ), що обчислюються за формулами:

                       (7)

,        .,                        (8)

де , , - математичне очікування, дисперсія та асиметрія відповідно, які залежать від кута повороту зображення , і є моментно-кутовими функціями (рис.3).



Показане [8] істотне збільшення міжкласової відстані між зображеннями ОЗФ різної форми. З метою аналізу стійкості МКФ до динамічних спотворень на ЕОМ був промодельований кореляційно-екстремальний алгоритм розпізнавання зображень ОЗФ в просторі МКФ і отримані залежності ймовірностей правильної ідентифікації ОЗФ від потужності впливу на їх зображення шумів і динамічних спотворень (рис.4). Наприклад, для 14дБ (5дБ) і впливах спотворень, вказаних в пункті 7, отримано .



П'ятий розділ присвячений розробці моделі характерних точок (МХТ), яка дозволяє здійснювати вторинну обробку і попередню класифікацію зображення ОЗФ, а також розробці оптимальних методів її формування і аналізу. Також вирішені питання побудови повної системи ідентифікації зображень ОЗФ на основі МХТ.

Характерними точками (ХТ) називаються точки на зображенні об'єкта, які несуть істотну інформацію про його форму і положення. Сукупність ХТ називається моделлю характерних точок (МХТ) і означається де .

Якщо відома відповідність трьох пар точок на вхідному і еталонному зображеннях, можна компенсувати спотворення в формі (1), заздалегідь обчисливши параметри афінного перетворення за формулами:

,                                (9)

де         - точки еталонної МХТ,

- відповідні ним точки спотвореної МХТ.

Системи рівнянь (9) мають розвязки відносно за умови, що трійки точок і не лежать на одній прямій.

МХТ, що використовується, повинна бути стійка до динамічних спотворень, а метод її формування - обчислювально ефективним. Було розглянуто і досліджено декілька методів отримання МХТ. Їх порівняльні характеристики наведені в табл.2 у вигляді експертних оцінок за 5-ти бальною шкалою.


Таблиця 2

Загальні характеристики методів формування МХТ



Мінімізація МХТ необхідна для прискорення пошуку відповідних одна одній точок моделей і можлива через надмірність цих моделей для рішення задачі компенсації спотворень. Запропоновані методи мінімізації оцінені відповідно до показників ефективності (табл. 3).


Таблиця 3

Оцінки ефективностей методів мінімізації МХТ


Зазначимо, що метод полярних функцій вимагає попереднього застосування методу випуклих багатокутників. Найбільш ефективним виявилося поєднання методу випуклих багатокутників з кластерізацією (подвійна мінімізація).

Метод опуклих багатокутників залишає в МХТ тільки ті точки, які є вершинами мінімального опуклого багатокутника, описаного навколо всіх точок МХТ:

,        (10)

0k1, k2, k31,

Кластерізація МХТ полягає в об'єднанні всіх ХТ, віддалених одна від одної не більш ніж на відстань (в табл. 3 - середня кількість ХТ в кластері):

       (11)

Після мінімізації можливе застосування методу граничного перебору точок та еталонної МХТ, що тестується, і підбору параметрів перетворення по знайдених відповідних ХТ. Такий перебір повинен здійснюватися для всіх типів МХТ ОЗФ, тому для зменшення кількості міжкласових переборів показана можливість виділення загальних класів і попередньої класифікації МХТ (віднесення її до деякого вигляду еталонних МХТ, серед яких здійснюється подальший пошук).

Пошук відповідності МХТ проводиться ітераційним образом в два етапи:

  1. Фіксуються три пари точок еталонної МХТ і МХТ, отриманої з поданого на вхід зображення, для них відповідно до формули (9) обчислюються коефіцієнти перетворення.
  2. Проводиться перевірка відповідності двох МХТ по обчислених параметрах.

Обираються ті коефіцієнти, для яких міра відповідності максимальна. При цьому найбільш складним є питання вибору оцінки такої відповідності. Можливі оцінки локального та інтегрального характеру. Прикладом першої може бути оцінка, рівна зворотній величини суми відстаней ХТ вхідної МХТ (МХТ тестового обєкту) від найближчих перетворених ХТ еталонної МХТ:

,                                (12)

де         - еталонна МХТ;

        - МХТ вхідного зображення ОЗФ

        і - ХТ еталонної і вхідної МХТ, що являють собою вектори;

        - деяка метрика, яка визначає відстань у векторному просторі.

Як метрику можна використати зокрема:

або

Інтегральна оцінка, що використовувалась в експериментах, являла собою величину, зворотну інтегральній відстані контурів, що описуються вхідною МХТ і перетвореною еталонною МХТ:

,                (13)

де         і - параметричний вигляд формул, які описують контури відповідно вхідної МХТ і перетвореної еталонної МХТ.

Запропонована структурна схема пристрою ідентифікації ОЗФ по їх зображеннях на основі попереднього поєднання і класифікації методами МХТ з подальшою кореляційно-екстремальною класифікацією відновлених зображень (рис.5).

Імітаційне моделювання, проведене на ЕОМ, показало працездатність запропонованих моделей характерних точок і підвищення ефективності ідентифікації в порівнянні з класичними методами. На рис.6 представлені робочі характеристики системи розпізнавання, яка реалізує МХТ, а також умови динамічних спотворень. Так, при випадковому впливі усіх видів динамічних спотворень (але при зміні ракурсного кута в межах ), для 14дБ (5дБ) отримали з можливістю підвищення за рахунок додаткового високоточного суміщення на основі багаторівневих МХТ.

Основні переваги і властивості розроблених методів і моделей ідентифікації ОЗФ в порівнянні з класичним кореляційним методом полягають в меншій ресурсоємності і підвищеній якості ідентифікації об'єктів близької форми в умовах динамічних спотворень. Оскільки класичні методи не стійкі в умовах динамічних спотворень, для збереження високої якості ідентифікації застосовуються багатоканальні кореляційні системи. Наприклад, для можливості ідентифікації зображень об'єктів, схильних до ротаційних спотворень, потрібно 18-36 паралельних каналів, працюючих кожний з різним значенням кутового зсуву об'єкта. При зменшенні якість ідентифікації різко падає відповідно до розрахунків розділу 2 даної дисертаційної роботи. Боротьба з ракурсними спотвореннями при таких підходах вимагає ще більшої кількості ресурсів. Характеристики запропонованих в роботі моделей і методів ідентифікації наведені в табл.4.


Страница: 1  Страница: 2 

По вопросу доставки диссертации по этой теме пишите на электронный адрес: info@lib.ua-ru.net

© Научная электронная библиотека, 2003-2008.
info@lib.ua-ru.net
Яндекс цитирования