|
іНСТИТУТ ПРОБЛЕМ Моделювання В ЕНЕРГЕТИЦі
НАН УКРАїНи імені г.е.пухова
Раід м. о. алькавасмі
УДК 007.159.955
когнітивний процесор діалогу на основі
об'єктних моделей сприйняття і уваги
Спеціальність 05.13.06 “Автоматизовані системи управління і прогресивні інформаційні технології”
АВТОРЕФЕРАТ
дисертації на здобуття вченого ступеня кандидата
технічних наук
Київ — 2005
Дисертація є рукописом.
Робота виконана на кафедрі “Інформаційні технології” Одеського державного екологічного університету міністерства освіти і науки України.
Науковий керівник кандидат технічних наук, доцент
кафедри “Інформаційні технології”
Одеського державного екологічного університету Чмир Ігор Олексійович
Офіційні опоненти:
доктор технічних наук, професор Широчин Валерій Павлович, Національний технічний університет "Київський політехнічний інститут".
кандидат фізико-математичних наук, старший науковий співробітник Горошко Іван Олегович, Інститут проблем моделювання в енергетиці НАН України.
Провідна організація:
Інститут кібернетики ім. В.М. Глушкова НАН України.
Захист відбудеться 19 квітня 2005 року о 14 годині на засіданні спеціалізованої вченої ради К 26.185.02 Інституту проблем моделювання в енергетиці НАН України за адресою: 03164, м. Київ, вулиця Генерала Наумова, 15.
З дисертацією можна познайомитися в бібліотеці Інституту проблем моделювання в енергетиці НАН України за адресою: 03164, м. Київ, вулиця Генерала Наумова, 15.
Автореферат розіслан 18 березня 2005 року.
Вчений секретар спеціалізованої вченої ради
к.т.н. Семагіна Е. П.
ЗАГАЛЬНА ХАРАКТЕРИСТИКА РОБОТИ
Актуальність теми. Протягом останніх десятиріч штучний інтелект перетворився з суто академічної дисципліни в напрям, що має багато успішних прикладів практичного впровадження. Найбільш успішне впровадження методів штучного інтелекту спостерігається в системах високоточної зброї, робототехніки (автономні роботи); в системах автоматизованого навчання (інтелектуальні тюторські системи, навчальні середовища з інтелектуальною підтримкою, інтелектуальні репетитори); в комп'ютерних іграх та ін. В публікаціях, присвячених прикладному аспекту штучного інтелекту, зустрічаються терміни “думаючі речі”, “системи вбудованого інтелекту” і їм подібні, підкреслюючи той факт, що йдеться про практично орієнтовані методи і системи. Якщо проаналізувати публікації, присвячені системам вбудованого інтелекту, то легко помітити, що побудова кожної системи, як правило, є приватним рішенням конкретної проблеми, і не спирається на загальний методологічний і теоретичний базис.
Підхід до когнітивних процесів з позицій інформаційної переробки, що припускає існування символьної системи ментального представлення інформації і процесів її модифікації, початок якому поклала робота Герберта Саймона "Гіпотеза фізичної символьної системи", змінив характер досліджень когнітивних процесів, і наблизив роботи в цій області до досліджень в області штучного інтелекту. Прикладом може служити проблематика розпізнавання образів і категоризації, активно досліджувана як в області когнітивних наук, так і фахівцями в області штучного інтелекту.
Дисертаційна робота належить напряму, що розглядає інтелектуальні системи з позицій симуляторів ментальних процесів, і присвячена дослідженню застосування формалізованих моделей феноменів сприйняття і уваги як теоретичної бази для проектування одного класу систем вбудованого інтелекту – систем, що базуються на еротематичному діалоговому процесі.
Зв'язок роботи з науковими програмами, планами, темами. Тема дисертаційної роботи відповідає науковому напрямку і планам кафедри інформаційних технологій Одеського державного екологічного університету. Робота виконувалася в рамках ряду проектів, в яких знайшли віддзеркалення результати, отримані в дисертаційній роботі:
- Проект "Об'єктне моделювання когнітивних систем" (дослідження застосування методів об'єктно-орієнтованого моделювання і уніфікованої мови моделювання UML (Unified Modeling Language) для формалізованого уявлення і уніфікованого опису когнітивних процесів і систем);
- Проект "Когнітивний процесор діалогу" (розробки інструментального середовища для генерації, зберігання і використання прикладних діалогових систем силами кінцевого користувача);
Мета і задачі досліджень. Вивчення результатів досліджень, опублікованих за темою когнітивного моделювання і моделювання діалогової взаємодії, дозволяє відзначити, що в області теорії і практики діалогових систем залишаються невирішеними наступні питання:
- Яким чином при моделюванні діалогових процесів враховуються не тільки зовнішні вияви діалогу, але і когнітивні процеси, що беруть участь в діалозі: сприйняття, увага, категоризація та ін.? За допомогою якої ідеї можна об'єднати результати, отримані в когнітивних науках з моделями діалогової взаємодії, отриманими в області систем вбудованого інтелекту?
- Наскільки принципи об'єктно-орієнтованого підходу до моделювання систем можуть бути застосовані до області когнітивного моделювання таких феноменів як сприйняття, увага, категоризації та ін.?
- Не розроблені об'єктно-орієнтовані моделі як базових психологічних феноменів: сприйняття, увага, категоризація та ін., так і інтегрованих моделей типу сприйняття-увага і увага-категоризація.
- Відсутня когнітивна модель діалогового процесу двох агентів.
- Відсутня когнітивна модель штучного діалогового агента.
- Не вивчені можливості комп'ютерної системи, спроектованої на основі когнітивної моделі штучного діалогового агента і симулюючі її основні структурні відносини.
Метою дисертаційної роботи є розробка об’єктно-орієнтованих моделей когнітивних проесів сприйняття і уваги, їх інтеграція в єдину модель типу сприйняття-увага, та застосування одержаних результатів для проектування штучного діалогового агента.
Досягнення мети дисертаційної роботи здійснювалося шляхом рішення наступних задач:
- Вивчення існуючих когнітивних моделей сприйняття і уваги, які беруть участь в діалоговому процесі, і їх класифікація.
- Вивчення існуючих формалізованих моделей діалогової взаємодії двох агентів.
- Розробка об’єктно-орієнтованих моделей сприйняття, що відображають базові гіпотези сприйняття.
- Розробка об’єктно-орієнтованих моделей уваги, що відображають базові гіпотези уваги.
- Розробка інтегрованих об’єктно-орієнтованих моделей типу сприйняття-увага.
- Розробка когнітивної моделі діалогового процесу, що базується на отриманій раніше інтегрованій моделі типу сприйняття-увага.
- Розробка когнітивної моделі штучного агента діалогу, що базується на отриманій раніше когнітивній моделі діалогового процесу.
- Розробка і дослідження програмового прототипу когнітивної моделі діалогового агента.
Наукова новизна отриманих результатів. В дисертаційній роботі отриманий ряд нових наукових результатів:
- Запропонований підхід до трансформації моделей когнітивних процесів, отриманих в когнітивних науках в об’єктно-орієнтовані формалізовані специфікації в нотації уніфікованої мови моделювання UML.
- Розроблена об’єктно-орієнтована модель сприйняття згідно гіпотезі циклу перцепції Найсера.
- Запропонована теорія сприйняття і детектування підозрілих сенсорних подій.
- Розроблена об’єктно-орієнтована модель сфокусованої уваги, що базується на перемиканні сенсорних подій згідно гіпотезі Бродбента.
- Розроблена об’єктно-орієнтована модель сфокусованої уваги, що базується на ослаблені сенсорних подій згідно гіпотезі Трейсман.
- За допомогою розроблених моделей сфокусованої уваги пояснені результати експериментів по дихотичному слуханню, проведених Черрі і Бродбентом.
- Розроблена об’єктно-орієнтована модель уваги згідно гіпотезі Канемана. Запропонована концепція, що трактує феномен уваги у вигляді тернарного відношення між класами: ментальних задач, релевантних схем довготривалої пам'яті і сенсорних подій.
- Розроблена циклічна модель сприйняття-увага на базі моделей сфокусованої уваги.
- Розроблена циклічна модель сприйняття-увага на базі ресурсної моделі уваги.
- Досліджена сенсорна подія в контексті еротематичного діалогового процесу і запропонована структура полімодальної сенсорної події.
- Запропонована когнітивна модель еротематичного діалогового процесу двох агентів.
- Розроблена когнітивна модель штучного агента діалогу.
Практичне значення отриманих результатів. В дисертаційній роботі отриманий ряд результатів, що мають практичне значення:
- Когнітивна модель штучного агента діалогу лягла в основу програмної системи Когнітивний процесор діалогу.
- Клас-структурований опис Когнітивного процесора діалогу (у вигляді діаграм класів) дозволив розробити специфікації програми, яка має ряд практично значущих властивостей, головне з яких полягає в тому, що діалогові додатки генеруються, редагуються і інтерпретуються безпосередньо кінцевим користувачем.
- Розроблений прототип Когнітивного процесора діалогу, який підтвердив правильність запропонованих моделей, використаних при його проектуванні.
- Спосіб формалізації когнітивних процесів, запропонований в даній дисертаційній роботі може служити основою для розробки учбових матеріалів по когнітивному моделюванню, орієнтованих на студентів, що навчаються за напрямками комп'ютерні науки і комп'ютерна інженерія.
Особистий внесок здобувача полягає в аналітичному огляді публікацій за темою дисертації, розробці об’єктно-орієнтованих моделей сприйняття і уваги, синтезі, на їх основі когнітивної моделі еротематичного діалогового процесу двох агентів і когнітивної моделі штучного діалогового агента. Здобувачем розроблена також архітектура Когнітивного процесора діалогу, на основі якої розроблена програма прототипу і проведено експериментальне підтвердження правильності запропонованих теорій і моделей. Співавторам, спільно з якими були опубліковані основні результати роботи, належить, головним чином, постановка задачі дослідження.
Апробація результатів дисертації. Матеріали дисертаційної роботи доповідались на:
- Четвертому міжнародному науково-методичному семінарі “Інформаційні технології в учбовому процесі” 25-28 червня 2003, Південно-український державний педагогічний університет ім. К.Д. Ушинського, Одеса
- Міжнародної науково-технічної конференції ІМС’2003 “Інтелектуальні і багатопроцесорні системи” 22-27 вересня 2003, Дивноморське , Росія.
- XXII Науково-технічної конференції “Моделювання” 9-10 січня 2003, Інститут проблем моделювання в енергетиці, Київ.
- Міжнародної наукової конференції “Управління активними системами в бізнесі, освіті, техніці”, 2003, Черкаська академія менеджменту. Черкаси.
Публікації. Основний зміст роботи опублікований в 4 статтях в науково-технічних журналах і в 4 статтях в матеріалах конференції.
Обсяг роботи. Дисертаційна робота висловлена на 160 сторінках машинописного тексту, містить 31 малюнок і 13 таблиць, складається з вступу, чотирьох глав, висновків і списку літератури, що включає 101 найменування і 3 додатки.
ОСНОВНИЙ ЗМІСТ РОБОТИ
У вступі висловлена загальна характеристика роботи, актуальність проблеми, ціль і задачі дослідження і основні положення, які виносяться на захист.
В першому розділі проведений огляд публікацій, присвячених теоріям і моделям сприйняття і уваги, а також формальним моделям проблемно-залежного діалогу. Істотною частиною функціонування діалогової програми є перманентне спілкування з користувачем. Тому при розробці архітектури проблемно-незалежного діалогового агента важливим є її адекватність процесам сприйняття і переробки інформації людиною. В тому випадку, коли в основу формальної моделі діалогу покладені “вдалі” когнітивні моделі, можна чекати, що “штучні” діалогові агенти найбільш природним чином успадковують гнучкість і універсальність системи сприйняття і переробки інформації людиною.
Теорії сприйняття (перцепції) згруповані в теорії прямої перцепції і теорії непрямої перцепції.
Теорії прямої перцепції припускають, що сенсорна система продуктує інформацію, достатню для формування відповідних образів. Тому теорії прямої перцепції розглядають процес сприйняття як процес керований даними або висхідний процес. В розділі розглянута теорія прямої візуальної перцепції Гібсона, часто звана екологічним підходом до теорії сприйняття.
Теорії непрямої перцепції (конструктивність теорії) припускають, що сенсорна система виробляє лише первинну інформацію, яка необхідна, але не достатня для формування образів. Необхідні додаткова інформація і додаткові процеси для остаточного формування образів. Ці теорії розглядають процес сприйняття як процес, керований концептами або низхідний процес. В розділі розглянута основоположна теорія непрямої перцепції Гельмгольца. Описані експерименти Палмера, що досліджують зв'язок між сприйняттям і контекстом. Розглянута теорія Іттельсона, присвячена помилкам сприйняття, а також дослідження Грегорі, присвячені візуальним ілюзіям. Особлива увага надана теорії сприйняття Найссера, яка інтегрує висхідні і низхідні процеси в уніфікований цикл перцепції. Сприйняття переміщення є важливим елементом загальної теорії сприйняття. В розділі проведений огляд робіт Вертеймейера, присвячених дослідженням і теорії сприйняття переміщення.
В розділі приведена існуюча класифікація теорій і моделей уваги. Проте огляд публікацій в цій області присвячений, головним чином, моделям фільтрації уваги і ресурсним теоріям уваги.
Огляду моделей фільтрації уваги передує опис експериментів по дихотичному слуханню, результати яких послужили основою для розробки цих моделей. Описані експерименти Черрі і Бродбента. Приведений опис моделей сфокусованої слухової уваги Бродбента і Трейсман, а також модель сфокусованої візуальної уваги Трейсман.
Ресурсні моделі уваги представлені моделлю Канемана і результатами досліджень, пов'язаних з цією моделлю. Зокрема описаний закон Йеркса-Додсона, що зв'язує ступінь збудження з продуктивністю рішення ментальних задач.
Проблемно-залежні моделі діалогу представлені, головним чином, публікаціями радянських і українських дослідників.
В розділі зроблений огляд автоматних моделей діалогу, заснований на роботах: Кузіна С.Г., Сергієвського А.В., Амеліної Є.Г., Затуливітер Ю.С., Демідова Н.Н., Злочевської А.А., Форсюк Н.Г., Павлюка О.В., Россікова У.В. і ін. Окрім алгебраїчних версій автоматних моделей розглянуті також їх графічні версії представлені, головним чином, в публікаціях Кокоревої Л.В., Перевозчикової О.В., Ющенко Е.Л.
В розділі зроблений також огляд мережних моделей проблемно-залежного діалогу, в основі яких лежить концептуальний базис сітей Петрі. Ця частина огляду базується на публікаціях Павлова Ю.Б., Ракаліна А.В., Чмиря І.А.
Другий розділ присвячений об'єктному моделюванню процесів сприйняття і уваги, що є фундаментальними когнітивними процесами, що лежать в основі діалогу. Метою моделювання є отримання уніфікованого і формалізованого опису структур систем сприйняття і уваги, необхідної для синтезу Когнітивного процесора діалогу. В якості базового засобу моделювання вибрана формальна система UML (Unified Modeling Language).
На мал. 1 приведена запропонована модель структури системи сприйняття, отримана на основі теорії сприйняття Найссера і представлена у вигляді UML -діаграм класів.
Мал. 1. Модель системи сприйняття
Головними класами, що формують структуру системи сприйняття, є класи:
- Когнітивний сценарій (CognitiveScript), що моделює довготривалу пам'ять, і є базовим для класів: природжений сценарій (NativeScrip) і благоздобутий сценарій (AcquiredScrip);
- Чекаючий набір схем (RelevantSchemata), що є “молекулою” класу CognitiveScript, моделюючий сприйняття, очікувані на деякому кроці перцепції і є базовим для класів природжені схеми (NativeSchemata) і благоздобуті схеми (AcquiredSchemata);
- Сенсорна подія (SensoryEvent), моделююча інформаційний образ сприйманого фрагмента середовища, що однозначно категоризується в одну з схем довготривалої пам'яті, і є базовим для класів візуальна подія (Visual) і звукова подія (Sound).
Два направлених відношення типу асоціація з іменами identification (ідентифікація) і renovation (оновлення) моделюють структурну можливість циклічного характеру перцепції. Атрибути і операції, що описують класи на мал. 1, відображають, головним чином, опубліковані характеристики циклу перцепції Найссера.
В розділі запропоновано також дві моделі сфокусованої уваги: модель, що базується на перемиканні сенсорних подій і модель, що базується на ослаблені сенсорних подій. Як когнітивні прототипи цих моделей вибрані теорії сфокусованої уваги Бродбента і Трейсмана, відповідно. Клас моделей, що базуються на послаблені сенсорних подій розглядається як розширення класу моделей, що базуються на перемиканні сенсорних подій. Головна особливість відзначених моделей полягає в тому, що навколишній світ розглядається як клас черг сенсорних подій (або сенсорних сегментів), а структура уваги будується по відношенню до двох класів сенсорних сегментів: рутинні сенсорні сегменти (RoutineSS) і підозрілі сенсорні сегменти (SuspiciousSS). Сприйняття рутинних сенсорних подій уривається при появі підозрілої події. Ознакою підозрілості є вхідний стимул “підозріло” високої або “підозріло” низької інтенсивності. Наприклад, гучний звук або звук підвищеної частоти для звукового стимулу; висока швидкість переміщення об'єкту в полі зору для зорового стимулу, і т.п. Введення відзначених класів сенсорних сегментів в структуру системи уваги привело до необхідності введення класу детекторів підозрілих сенсорних подій. На мал.2 приведена запропонована модель структури сфокусованої уваги, що базується на перемиканні сенсорних подій.
Діаграма класів, приведена на мал. 2, моделює випадок слухової уваги, тому класи, що моделюють сенсорну систему, представлені парами для лівого і правого слухових аналізаторів:
- Клас правих черг сенсорних сегментів (RightQueueOfSS) і клас правих детекторів підозрілих подій (RightDetector), що моделює правий слуховий аналізатор;
- Клас лівих черг сенсорних сегментів (LeftQueueOfSS) і клас лівих детекторів підозрілих подій (LeftDetector), що моделює лівий слуховий аналізатор;
Таким чином, структура, приведена на мал.2, моделює випадок, коли увага може фокусуватися на одному з двох потоків сенсорних сегментів, відповідних лівому або правому вуху. Клас управління фокусом уваги (AttentionFocusControl) управляє вибором одній із двох черг. Як видно на мал.2, цей клас асоційований з обома детекторами підозрілих подій. Клас релевантний сенсорний сегмент (RelevantSS) моделює поточний сенсорний сегмент з вибраної черги сенсорних подій, що піддається категоризації. Функції категоризації реалізуються класом Розпізнавач (Recognizer), що є зовнішнім, по відношенню до класу RelevantSS.
|