Практична цінність
У передмові до "Граматики-70" зазначено, що всі граматичні формалізми, які зібрані в цьому академічному виданні, не можуть визначатися в межах якоїсь узагальненої моделі мови (Грамматика современного русского литературного языка. Наука, М., 1970). Стан справ суттєво не змінився і зараз. На цьому тлі практична цінність поданих матеріалів виявляється в тому, що:
1. Запропоновано формальну модель мовної організації, яка з системних позицій висвітлює таке складне явище, як мовна діяльність і практично тією чи іншою мірою, з єдиних узагальнених позицій, висвітлює основні складові мовної системи та особливості її функціонування:
- інформаційне забезпечення мовної діяльності,
- розвиток мови (стадії онтогенезу та філогенезу і їхній взаємозв'язок),
- особливості відтворення середовища засобами мови,
- формальне визначення базової семантико-синтаксичної структури,
- графічну інтерпретацію базової семантико-синтаксичної структури,
- аналіз схем трансформування базової структури,
- різновиди взаємодії монопредикатних структур,
- комунікативний аспект організації повідомлення,
- зв'язність текстової інформації.
2. Створення формалізованої моделі мови дозволило вирішити ряд питань прикладного характеру, що стосуються формування сучасних інформаційних технологій, орієнтованих на опрацювання природно-мовного матеріалу:
- особливості процесу породження окремого повідомлення,
- кількісні оцінки актуалізації базової структури,
- цілісність відтворення категорій дійсності мовними засобами,
- рекурсивна схема організації мовного матеріалу,
- структура лінгвістичного процесора,
- структурна організація бази знань,
- рекурсивна організація синтаксичного аналізатора,
- функціонально-структурна єдність лінгвістичного процесора та бази знань.
3. На шляху моделювання мовної діяльності реалізовані наступні практичні розробки:
- програма аналізу (“розуміння”) мовного повідомлення, яка для вузької сфери просторових відношень за вхідним текстом формує модель середовища (тобто система працює в режимі аналізу текстової інформації);
- програма синтезу мовного повідомлення, що виконує перетворення “Дійсність –Текст” (для довільної сцени, заповненої об'єктами, система генерує її опис мовними засобами); тут реалізовано концепцію інтегрування систем обробки образної та символьної інформації;
- програма опрацювання мовного матеріалу, де на структурно-функціональному рівні закладається єдність лінгвістичного процесора та бази знань ЛП-БЗ з урахуванням вимог запропонованої формальної моделі; на рівні формування БЗ було перевірено можливість актуалізації “семантичного поля часу”.
4. Використання запропонованої формальної моделі мови визначено двома напрямами: з одного боку, це - інтерпретація відомих мовних явищ у межах поданої моделі, а з іншого - подальший розвиток запропонованої моделі в межах поглибленого вивчення та моделювання окремих виявів мовної діяльності.
5. В плані розвитку прогресивних інформаційних ПМ-технологій вбачаються наступні перспективи:
- проектування лінгвістичного процесора,
- формування системи подання, накопичення та використання знань,
- моделювання процесів розуміння мови (синтез та аналіз повідомлення),
- розробка систем автоматичного перекладу,
- інтегрування систем обробки образної та символьної інформації,
- системи автоматичної обробки ПМ-інформації.
Реалізація результатів
Запропонована формальна модель мови та експериментальні розробки у напряму моделювання мовної діяльності використовуються як для подальших наукових досліджень і підготовки фахівців, так і для створення перспективних систем та технологій, орієнтованих на опрацювання природно-мовної інформації. На цьому шляху отримані наступні результати:
1. Деякі розділи запропонованої формальної моделі пройшли апробацію через студентську аудиторію, коли з 1985 року для студентів спеціальності “Робототехнічні системи та комплекси” було започатковано лекційний курс “Системи відчуття та штучний інтелект”, в якому окремі теми були присвячені сенсорному рівню сприйняття інформації людиною та питанням взаємодії систем обробки образної та символьної інформації.
2. У 1992 році вийшов друком навчальний посібник "Інформаційне забезпечення інтелектуальних моделей", де подано загальну структуру інформаційного забезпечення та частково вже окреслено контури формальної моделі мови.
3. Окремі практичні розробки на програмному рівні (програми аналізу та синтезу мовного повідомлення, що орієнтовані на інтегрування образної та символьної інформації) використовуються з 1985 р. у навчальному процесі кафедри як лабораторний цикл з курсу "Інтегральні роботи" а також як теми дипломного проектування.
4. Починаючи з 1995 року започатковано лекційний курс "Лінгвістичне забезпечення інтелектуальних інтегрованих систем", що грунтується на запропонованій моделі мови. Він увійшов до навчальних планів кафедри технічної кібернетики Київського політехнічного інституту і викладається студентам зі спеціальності “Гнучкі комп'ютеризовані системи та робототехніка”.
5. З 1995 року запропоновану модель мови перенесено також і на шкільний рівень; вона проходить апробацію в межах навчально-практичної роботи Технічного ліцею КПІ, де викладається курс "Лінгвістичне забезпечення систем штучного інтелекту".
6. З 1997 року запропоновану модель мови внесено до навчальних планів лінгвістичного факультету КПІ для спеціальності "Переклад", де викладається курс ”Системна організація мови”.
7. Формалізована модель мови стала підгрунтям для відкриття з 1997 року на кафедрі технічної кібернетики нової спеціалізації "Гнучкі комп'ютеризовані системи в природно-мовних технологіях”, яка орієнтована переважно на інформаційні ПМ-технології.
8. У 1997 році надруковано монографію “Системна організація мови”, де в повному обсязі викладено запропоновану формальну модель мовної організації.
9. У 1998 р. вийшов друком навчальний посібник “Архітектура мови” (Лінгвістичне забезпечення інтелектуальних інтегрованих систем), де викладено формальну модель мови, подано загальну структуру інформаційного забезпечення людини та розглянуто деякі прикладні аспекти формування інформаційних природно-мовних технологій.
10. У вересні 1999 р. в м. Варна (Болгарія) відбулася установча міжнародна конференція з проекту “Комп'ютеризація природних мов”, де формальну модель було запропоновано вже як основу формування природно-мовних технологій.
11.У лютому 2000 р. в Рівненському державному гуманітарному університеті для викладачів та студентів прочитано цикл лекцій “Формальна модель мовної організації”.
12. У березні 2000 р. для студентів Острозької академії прочитано цикл лекцій з системної організації мови.
Апробація результатів
1. Формальну модель мови вперше було оприлюднено на V міжнародній конференції KDS-95 (Знання – Діалог – Рішення) в Ялті у жовтні 1995 р. (матеріали в збірнику наукових праць), ще й був отриманий приз “За оригінальну та нестандартну інформаційну теорію та її використання” з боку FOІ Іnstіtute for Іnformatіon Theorіes and Applіcatіons (Софія, Krassіmіr Markov).
2. На VІ міжнародній конференції KDS-97 (Знання – Діалог – Рішення), що відбулася в Ялті 15 – 20 вересня 1997 р.), було продовжено плідну дискусію навколо системної організації мови та прикладних аспектів її використання. Схвальний відгук було отримано від одного з фундаторів комп'ютерної техніки та інформатики в Болгарії - професора ф-ту математики та інформатики Софійського університету, кандидата математичних наук та доктора технічних наук Димитъра Петров Шишкова.
3. Презентація формальної моделі мови в Росії відбулася на міжнародному семінарі “Діалог'99” в Тарусі, куди автор подав роботу “Явище рекурсії в природній мові”.
4. У вересні 1999 р. в Болгарії (м. Варна, курорт “Святого Костянтина”) модель було презентовано на міжнародній конференції у зв'язку з проектом “Комп'ютеризація природних мов”, де вона вже розглядалася як основа формування прогресивних природно-мовних технологій.
5. Окремі напрями роботи доповідалися на семінарах Наукової ради НАН України з проблеми “Кібернетика”:
Семінар 6.3. “Автоматизація обробки математичних текстів та інтелектуальні машини”, керівник : д-р фіз.- мат. наук Капітонова Ю. В., чл.- кор. НАН України Летічевський О. А.
Семінар 9.3. “Розпізнавання образів та конструювання читаючих автоматів”, керівник : д-р фіз.- мат наук Шлєзінгер М. І.
Семінар 9.4. "Аналіз, розпізнавання та інтеграція сигналів в технічних системах", керівник: д-р. техн. наук Вінцюк Т.К.
Семінар 9. 10. “Проблеми розвитку розуму та взаємодії розумних систем і їх підсистем”, керівник : канд. філол. наук Крейн І. М.
6. У лютому 2000 року формальну модель мови було оприлюднено в Рівненському державному гуманітарному університеті, де було проведено науково-методичний семінар з викладачами кафедри української філології та прочитано цикл лекцій студентам п'ятого курсу. Модель отримала схвальні відгуки на обох рівнях.
7. У березні 2000 року в Острозькій академії для студентів та викладачів також було прочитано цикл лекцій “Системна організація мови”; отримано схвальні відгуки та цікаві пропозиції.
Публікації
З теми дисертації опубліковано понад 30 праць, серед них три книжкових видання; переважну більшість становлять одноосібні роботи.
Структура та обсяг роботи
Дисертація складається зі вступу, основної частини, висновків, списку використаних джерел та додатків; обсяг основної частини складає 313 сторінок
( 9 розділів, що містять 78 рисунків та 11 таблиць), обсяг додатків сягає
97 сторінок ( 7 розділів, що містять 19 рисунків та 1 таблицю).
У вступі обгрунтовано актуальність теми дослідження, визначено його мету та здійснено порівняння запропонованого підходу до розбудови моделі мовної системи з досі відомими.
Основна частина присвячена розбудові формальної моделі мови (подано узагальнену схему інформаційного забезпечення людини, розглянуто найважливіші складові мовної системи та їхню взаємодію, ретельно аналізуються етапи розвитку мови на стадіях онтогенезу та філогенезу, подано формалізми, що визначають структуру базової семантико-синтаксичної конструкції, схеми її трансформування та правила поєднання подібних структур).
Додатки подають вже можливі перспективи використання запропонованої моделі мови на шляху формування прогресивних інформаційних технологій, орієнтованих на опрацювання природно-мовної інформації. З урахуванням формалізмів моделі запропоновано рекурсивну схему організації мовного матеріалу, проаналізовано кількісні аспекти актуалізації базової структури, визначено структуру лінгвістичного процесора та бази знань в їх структурно-функціональній єдності. Для обмежених предметних сфер практично реалізовано системи синтезу та аналізу текстової інформації, моделюється співвідношення “Дійсність-Текст” (в тому чи іншому напрямку), перевірено концепцію функціональної єдності бази знань та лінгвістичного процесора.
Висновки - подано основні результати і висновки щодо запропонованої формальної моделі мови та її використання в природно-мовних інформаційних технологіях.
Основний зміст роботи
Робота починається вступом, в якому розв'язано два питання: визначено місце запропонованої моделі серед інших розробок та встановлено основні принципові моменти даного підходу.
Системний підхід до вивчення мови започаткований був ще Ф. де Соссюром, проте задовільного розв'язання цієї проблеми нема ще й досі. Однією з найповніших синтаксичних концепцій слід вважати "Структурний синтаксис"
Л. Теньєра, де ретельно проаналізовано основні аспекти синтаксичної будови речення. Проте ця концепція не виходить за межі окремого повідомлення і не подає цілісної картини мовної організації.
Інший напрям пошуків стосується формально-логічного підходу до будови мови і пов'язується з іменем С.К. Шаумяна (аплікативна модель мовного повідомлення). Проте після багаторічних спроб практичної реалізації його концепції фахівці дійшли висновку, що формальна логіка не в змозі подати задовільну інтерпретацію багатьох мовних явищ.
Нарешті, ще раз нагадаймо принциповий висновок великого творчого колективу "Граматики-70" про відсутність узагальненої моделі мови, яка б могла на системному рівні об'єднати всі багатопланові матеріали цього академічного видання. Адекватної узагальненої моделі розвитку та функціонування мовної системи не маємо ми ще й досі.
Автором запропоновано формальну модель мови, яка грунтується на єдиній базовій семантико-синтаксичній структурі атомарного речення, що отримує однозначне визначення; довільне мовне повідомлення визначається через цю базову структуру. Співвідношення між конкретним повідомленням та базовою структурою зумовлюється двома схемами перетворень; перша - визначає монопредикатний рівень організації повідомлення і породжена явищем трансформування базової структури, тоді як друга схема (поліпредикатний рівень) визначає різновиди зв'язку монопредикатних структур. Такий системний підхід до структурної організації мовного повідомлення дав змогу запропонувати несуперечливу модель організації мови, що знімає багато суперечностей сучасних граматичних концепцій.
Розбудова мовної системи починається з формування системного підходу - сукупності базових положень та понять, які стосуються аналізу такого складного явища людського буття, як мова. Системний підхід - це, з одного боку, ідеологія дослідження, яка потребує одночасного урахування багатьох підходів до аналізу складного явища, а з іншого - це використання узагальнень та положень конкретної прикладної сфери досліджень, які завжди займатимуть вищий рівень відносно конкретного питання і якраз вони, в загальному випадку, визначатимуть особливості функціонування всіх нижчих рівнів певного явища.
Якщо в нашому випадку об'єктом дослідження постає мова, то системний підхід повинен спиратися на узагальнення більш високого рівня, тобто на загальні особливості сприйняття та обробки інформації людиною. Таким узагальненням, для нашого випадку, постають питання інформаційного забезпечення людини та особливості відтворення середовища мовними засобами. Ці узагальнення, зібрані в систему, формують аксіоматику мовної системи, яка постає плідною основою моделювання мовної діяльності.
Розділ 1. Інформаційне забезпечення мовної діяльності
Основна частина пов'язана з поданням формальної моделі природної мови, яка постає плідною основою моделювання мовної діяльності людини. Оскільки мовна діяльність – явище складне й багатогранне і враховує не лише мовну складову, то дослідження починається з аналізу узагальненої схеми інформаційного забезпечення людини, що відтворює сенсорний рівень сприйняття інформації людиною. Тут інтегруються системи обробки як образної (зорової, акустичної, дотичної ….), так і символьної інформації. Центральна частина інформаційного забезпечення – це пам'ять людини, де зберігаються всі знання, здобуті людиною або безпосередньо з довкілля на сенсорному рівні, або через мовний матеріал, що надходить в писемному чи мовленнєвому вигляді.
Пам'ять людини (або база знань, як можемо вважати) реалізується одночасно на двох рівнях - образному та символьному, і часто зміст окремої лексичної одиниці визначається через його образний еквівалент. Таке поєднання в одній системі особливостей сприйняття і обробки образної та символьної інформації постає характерною особливістю мовної діяльності людини і визначає новий напрям сучасних досліджень - когнітивну графіку.
У загальному випадку конкретній мовній одиниці (на лексичному рівні) відповідатиме концептуальна модель об'єкта/явища, яка поєднує в собі образну інформацію, що надходить до нашого мозку за всіма каналами відчуттів. Ця властивість відтворює взаємодію І та ІІ сигнальної системи і буде важливою конструктивною характеристикою на шляху моделювання мовної діяльності.
Іншим важливим моментом загальної схеми інформаційного забезпечення постає дихотомія база знань / лінгвістичний процесор. Тут уже на найвищому рівні подаються головні контури лінгвістичного процесора, який окрім системи граматичних правил враховує також і об'єктивні особливості відтворення середовища мовними засобами ( категорій часу, простору, дії тощо). Принципово важливою для моделювання мовної діяльності вбачається концепція функціонально-структурної єдності лінгвістичного процесора та бази знань; без такої єдності неможливо ефективно моделювати різні аспекти мовної діяльності людини.
Розділ 2. Загальна характеристика мовної системи
Після визначення загальної схеми інформаційного забезпечення більш ретельно аналізується мовна система, яка подається через множину окремих індивідуальних мовних систем. Кожна така система функціонує в мовному матеріалі і складається з двох частин - лінгвістичного процесора та бази знань, які знаходяться в діалектичній єдності і взаємно визначають розвиток один одного.
Продуктивною вбачається концепція, згідно з якою мова - це вища форма відтворення зовнішнього середовища, що існує в триєдності часу, простору та дії. В роботі проаналізовано особливості відтворення середовища в неорганічному та живому світі. Конструктивною вбачається теза, що особливості існування найважливіших категорій дійсності відповідним чином відтворюються і на рівні організації та використання мовних засобів. У подальшому це відкриває цілий напрям цікавих досліджень, що стосуються сприйняття та відтворення просторових і часових відношень, відтворення мовними засобами цілісності елементів довкілля, особливостей породження мовного повідомлення тощо.
Отже, перші розділи роботи пов'язані з визначенням загальних особливостей організації та функціонування мови, які в подальшому отримують конкретне наповнення та постають конструктивною основою розбудови моделі мови. Наступні два розділи пов'язані з дослідженням розвитку мови на стадіях онтогенезу та філогенезу, що власне і стало поштовхом до розбудови формальної моделі мови.
Розділ 3. Розвиток мови (онтогенез)
Ця частина безпосередньо пов'язана вже з аналізом мовної діяльності і зачіпає фундаментальні питання розвитку мови як окремої людини (онтогенез мови), так і суспільства (філогенез мови). Ретельний аналіз онтогенезу мови спирається на дослідження О.М. Гвоздєва (Формирование у ребенка грамматического строя русского языка – М.: Изд-во академии пед. наук, 1949) і дає змогу відтворити та простежити часову послідовність найважливіших етапів опанування дитиною граматичного ладу мови.
Десь уже через півроку після народження в дитини з'являються перші комунікативні інтенції, які реалізуються на мовленнєвому рівні у вигляді нестандартного звукокомплексу і поступово завершуються (десь біля 11 місяців) формуванням стандартного слова. Для нас важливим буде висновок, що за кожним таким повідомленням (окремим словом) криється ціла ситуація зовнішнього середовища.
Наступні етапи вже пов'язані з оволодінням дво- та трискладовими повідомленнями, які знову ж таки відтворюють окрему ситуацію зовнішнього середовища. Це будуть найважливіші кроки опанування предикатної структури, яка потім вже визначатиме головні особливості квантування та відтворення зовнішнього середовища. На цьому шляху дитина спочатку оволодіває такими частинами мови, як іменник та дієслово, які постають ідентифікаторами об'єкта та дії, що сприймаються дитиною ще як щось неподільне та цілісне. Категорію прикметника дитина опановує трохи важче, бо це вже потребує певної процедури абстрагування - відлучення прикмети від конкретного її носія.
Розділ 4. Розвиток мови в суспільстві (філогенез мови)
Згідно з біогенетичним законом Геккеля, який стверджує, що особливості онтогенезу проявляються і на певних стадіях філогенезу, ми вже можемо використати певні об'єктивні фактори онтогенезу мови для формування узагальненої моделі філогенезу - особливостей розвитку мови в суспільстві. Модель розвитку мови, у такому випадку отримує вже об'єктивне підгрунтя і не буде суто суб'єктивною побудовою того чи іншого дослідника.
Головні етапи філогенезу мови, таким чином, матимуть наступну послідовність: поява першого звукокомплексу (словоречення), за яким стоїть окрема ситуація зовнішнього світу, номінація окремих складових середовища (об'єкти позначаються іменником, дія отримує ідентифікатор – дієслово). Комунікативно-інформаційні обмеження ситуаційного спілкування зумовили поступову диференціацію відношень між окремими складовими ситуації. Відношення опановуються за двоскладовою схемою; з поступовим накопиченням цього досвіду людина від словоречення переходить до використання двоскладових, трискладових повідомлень. Цей процес закінчується опануванням n-актантної предикатної структури, обсяг якої зумовлений психо-фізіологічними обмеженнями короткочасної пам'яті людини. Ця структура постає основою формування мовного повідомлення і водночас вона визначається як основа квантування зовнішнього середовища за окремими ситуаціями для його відтворення мовними засобами.
Використання атрибутивного рівня опису складових для більш повного відтворення елементів зовнішнього середовища починається значно пізніше, бо це потребує вже певних процедур абстрагування. Далі відбувається процес опанування певними формами трансформування базової структури. Одночасно починається перехід від монопредикатного повідомлення до поліпредикатного (людина вже опрацьовує різні схеми поєднання окремих монопредикатних структур в межах окремого повідомлення).
Це, по суті, основні етапи опанування граматичного ладу мовної системи (модель становлення та розвитку мови). Але на противагу існуючим суб'єктивним побудовам ця модель спирається вже на об'єктивні орієнтири, що визначаються онтогенезом мови. Отже, даний розділ подає нові важливі вихідні дані для розбудови мовної системи.
Розділ 5. Формальне визначення базової семантико-синтаксичної структури
Даний розділ безпосередньо стосується розбудови моделі мовної організації і пов'язаний з формальним визначенням базової семантико-синтаксичної структури, яка закладається в основу моделі. Це визначення спирається на узагальнене сприйняття мови як найвищої форми відтворення навколишнього середовища. Модель довкілля подається через сукупність об'єктів/суб'єктів, що існують в триєдності часу, простору та дії. Складові середовища пов'язані між собою відношеннями статичними або ж динамічними. Через інформаційну обмеженість органів відчуття людини та, значно більшою мірою - через дискретний та послідовний характер актуалізації мовленнєвої діяльності, відтворення зовнішнього світу відбувається не безперервно, а дискретно.
За дискрету вибирається певний квант (частка) середовища, що, у загальному випадку, визначає окрему ситуацію довкілля; складовими такої ситуації постають об'єкти, суб'єкти, що пов'язані між собою відповідними відношеннями. Можемо подати формальне визначення мовної структури для відтворення опису такої ситуації. Базова семантико-синтаксична структура (SBO) – це двоскладова монопредикатна структура опису довільної ситуації, всі складові якої актуалізовані виключно на атрибутивному рівні їх опису. Таке визначення базової семантико-синтаксичної структури відрізняється від існуючих (а їх, за визначенням Г.В. Колшанського, існує десь близько трьох сотень ) за двома позиціями: по перше, воно заперечує використання словосполучень в межах простого речення, по-друге, це буде максимально повна схема відтворення довільної ситуації, тоді як існуючі граматики просте речення визначають переважно як мінімально-можливу схему опису ситуації.
Для переведення цього визначення на формальний рівень використаємо усталену систему відповідності частин мови окремим категоріям довкілля (чотири частини мови: іменник, дієслово, прикметник та прислівник - вважаються достатніми для опису довільної ситуації зовнішнього середовища, бо займенник та числівник завжди функціонально еквівалентні іменнику, а інші частини мови виконують службові функції).
Якщо умовно позначити суб'єкт через SUBJ, об'єкт через OBJ, дію через MOV, а їх атрибути - відповідно через Attr(Obj), Attr (Mov) та Attr (Attr) і скористатися символікою металінгвістичних формул мов програмування, то отримаємо відповідні вирази для опису окремих складових довільної ситуації.
Компоненти навколишнього середовища (об'єкти, суб'єкти та дію) людина завжди сприймає як деяку цілісність, що часто актуалізується на множині своїх прикмет. Окрема прикмета об'єкта може бути подана у вигляді:
ATTR(OBJ) = Attr(Obj) /Attr(Attr) * Attr(Obj) /Attr(Obj) * Attr(Attr). (1)
Прикмета дії визначатиметься відповідним чином:
ATTR(MOV) =Attr(Mov) /Attr(Attr) * Attr(Mov) /Attr(Mov)*Attr(Attr). (2)
Вирази (1) та (2) подають узагальнену схему опису прикмети дії та об'єкта, які можуть бути реалізовані або виключно на рівні відтворення своїх прикмет Attr(Obj) та Attr(Mov), або з урахуванням засобів подвійної атрибуції Attr(Attr), що використовуються у пре- та постпозиційному варіантах ( складова Attr(Attr) визначає міру або ступінь прикмети Attr(Obj) чи Attr(Mov) ). Повні схеми опису об'єкта, суб'єкта та дії матимуть вже наступний вигляд:
OBJ = OBJ / ATTR(OBJ) * OBJ / OBJ * ATTR(OBJ), (3)
MOV= MOV / ATTR(MOV) * MOV / MOV * ATTR(MOV). (4)
Якщо розкрити можливі схеми формування ATTR(OBJ) та ATTR(MOV), то матимемо всі варіанти опису об'єкта/суб'єкта та дії на атрибутивному рівні
OBJ = OBJ / Attr(Obj) * OBJ / Attr(Attr) * Attr(Obj) * OBJ /
Attr(Obj) * Attr(Attr) * OBJ / OBJ * Attr(Obj) (5)
OBJ * Attr(Attr) * Attr(Obj) /OBJ * Attr(Obj) * Attr(Attr),
MOV = MOV / Attr(Mov) * MOV / Attr(Attr) * Attr(Mov) * MOV /
Attr(Mov) * Attr(Attr) * MOV / MOV * Attr(Mov) / (6)
MOV * Attr(Attr) * Attr(Mov) / MOV * Attr(Mov) * Attr(Attr) .
Якщо ще врахувати, що кожен об'єкт, суб'єкт, дія можуть визначатися на множині своїх прикмет (що часто трапляється в мовній практиці), то загальні схеми опису окремих складових довкілля ще більше ускладнюються
OBJ = OBJ / ATTRі (OBJ), і=1, k)*OBJ / OBJ*(ATTRі (OBJ), і=1, k), (7)
MOV = MOV/(ATTRj(MOV), j=1,l)*MOV/MOV*(ATTRj(MOV), j=1,l). (8)
Отже, вирази (7) та (8) визначаються як узагальнена схема опису складових середовища, і скрізь надалі при використанні мовних засобів ми враховуватимемо цю можливість.
Атомарне речення (за визначенням) - це, перш за все, двоскладова конструкція відтворення довільної ситуації, що поєднує суб'єкт з певним предикатом.
SB0 = SUBJ - Ro - P, (9)
де SB0 – семантико-синтаксична структура атомарного речення , SUBJ - активний суб'єкт/об'єкт, що ініціює використання предиката P, який визначає дію на множині об'єктів/суб'єктів, а Ro - відношення “бути суб'єктом”. Предикат тут використовується в традиційному значенні n - актантної характеристики дії, де кожен актант відтворює ту чи іншу схему зв'язку ядра предиката - предикатора (Pred) з об'єктним оточенням середовища ( це відношення типу “бути об'єктом”, “бути інструментом” тощо). Якщо розкрити n - актантну будову предиката, то структура атомарного речення вже матиме вигляд:
SB0 = SUBJ – Ro - Pred - (Rі*OBJі, і =1, n; rj*OBJj, j=1, m). (10)
Вираз (10) визначає монопредикатну структуру опису окремої ситуації; лише зауважимо, що актанти ( а відповідно до них, і відношення) поділяються на дві частини - предикативну та ситуаційну, що дещо різняться своїм семантичним навантаженням. Якщо перша складова Rі*OBJі визначає сукупність складових, характерних виключно лише для конкретного предикатора Pred, і буде його іманентною характеристикою, то інша - rj*OBJj визначає сукупність зв'язків, що задають просторово-часові, причинно-наслідкові та інші “координати” відтворюваного кванта в навколишньому середовищі (за термінологією Л.Теньєра - це сірконстанти предиката).
У загальному випадку кількість усіх актантів (як предикативних, так і ситуаційних) не може перевищувати граничного значення одночасного сприйняття людиною сукупності прикмет описуваної ситуації, що визначається числом 7 і зумовлюється обмеженнями короткочасної пам'яті людини. Якщо ще врахувати атрибутивний рівень опису об'єктів/суб'єктів, поданих виразами (3), (4) та (1), (2), то отримаємо формальне визначення базової семантико-синтаксичної структури у вигляді
| SB0 = SUBJ-Ro-MOV-(Rі*OBJі, і=1, n; rj*OBJj, j=1,m), де |
| OBJ = OBJ / (ATTRі (OBJ), і = 1, k) * OBJ / |
| OBJ * (ATTRі (OBJ), і = 1, k), |
| MOV = MOV / (ATTRj (MOV), j = 1,l) * MOV / |
| MOV ATTRj (MOV), j = 1, l), | (11)
| ATTR(OBJ) = Attr(Obj) / Attr(Attr) * Attr(Obj) / |
| Attr(Obj) * Attr(Attr), |
| ATTR(MOV) = Attr(Mov) / Attr(Attr) * Attr(Mov) / |
| Attr(Mov) * Attr(Attr), де |
| Ro - відношення "бути суб'єктом", Rі – предикативні |
| відношення, rj - ситуаційні відношення, 1 <= n < = 6, |
| 1<= m <= 4, a m + n= 7,1< = k <= 6, 1 <= l < = 3. |
Сукупні умови (11) відтворюють на формальному рівні будову базової мовної конструкції - атомарного речення. Ці умови визначають лише загальну структуру опису довільної динамічної ситуації довкілля. Проте, реалізація цієї структури у вигляді мовного повідомлення у кожному конкретному випадку визначається актуальним членуванням дійсності та комунікативною інтенцією мовця і приймає той чи інший вигляд (маємо тут на увазі порядок відтворення цієї структури мовними засобами).
Формальне визначення атомарної структури розкриває організацію мовних засобів для відтворення окремої ситуації зовнішнього середовища. Продуктивною вбачається також запропонована графічна інтерпретація базової семантико-синтаксичної структури, що, з одного боку, адекватно відтворює окрему ситуацію довкілля, а з іншого – узагальнює графічну інтерпретацію синтаксичної структури через дерево залежностей та безпосередньо складові. Надалі поряд з формальним поданням базової структури будемо часто користуватися також і її графічним відтворенням. Отож, тепер можемо працювати з формальним або графічним поданням базової структури, послідовно розглядаючи монопредикатний та поліпредикатний рівні організації мовного повідомлення. Монопредикатний рівень структурної організації повідомлення не виходить за межі однієї предикатної структури і включає до свого складу або, власне, атомарне речення, або окремі його трансформації; поліпредикатний рівень охоплює мовні повідомлення, структура яких перевищує обсяг окремої предикатної структури.
Розділ 6. Монопредикатний рівень організації повідомлення
Мовна практика подає багато прикладів організації мовного повідомлення, що структурно відрізняються від базової конструкції SB0 (вираз (11) ). В роботі показано, що такі утворення будуть похідними від структури атомарного речення і вважатимуться її трансформаціями. Трансформуватися може лише частина структури, що охоплює суб'єкт та предикат, за винятком ситуаційних складових - сірконстант. Ці складові визначають положення описуваної ситуації в навколишньому середовищі і лишаються незмінними за будь-яких умов. Отже, видозмін може зазнавати лише структура Subj - Ro - Pred - (Rі * Objі), і=1, n. У цілому, схеми трансформування вихідної структури зумовлюється загальними принципами розвитку мови. Здобувачем проаналізовані найважливіші принципи актуалізації мовної діяльності, що закінчуються поданням аксіоматики мовної організації. Розбудова аксіоматики – це один з найперших та й найважливіших кроків на шляху пізнання та моделювання такої важливої інтелектуальної функції як мовна діяльність.
Трансформування структури атомарного речення відбувається за кількома напрямами; одним з найважливіших - є явище згортання, згідно з яким із повідомлення вилучаються (згортаються) окремі його складові, що однозначно сприймаються як мовцем, так і реципієнтом і через це будуть “надлишковими” (враховуючи принцип економії мовних засобів). Стосовно базової конструкції SB0 явище згортання означатиме вилучення із структури окремих її складових - суб'єкта, предикатора, часом об'єкта. Коли йдеться про згортання предикатора, то це найчастіше стосується квантора існування (проте, у загальному випадку, згортатися можуть як динамічні предикатори, так і статичні). У випадку згортання суб'єкта мова йдеться про якийсь нечітко окреслений суб'єкт, що спричиняє конкретну дію або стан середовища і який може бути визначений із контексту. Іншим продуктивним шляхом трансформування базової структури постає інверсія головного відношення Ro. В роботі аналізуються можливі схеми зміни напрямку цього відношення. Нарешті, розглядаються схеми трансформування структури, що пов'язуються із зміною комунікативного навантаження окремого речення. Це будуть трансформації ствердження, заперечення, порівняння, побажання, або запитання. В роботі всі схеми трансформування розглядаються на формальному рівні (визначаються відповідною формулою) а інтерпретацію отримують на графічному. Тут ми обмежимося лише їх коротеньким переліком; у загальному випадку він лишається відкритим для поповнення.
Подамо у стислому вигляді можливі трансформації базової структури. Зауважимо лише, що, у загальному випадку, кожна трансформація (як окремий тип речення) може бути інваріантною стосовно як атрибутивного рівня, так і використання сірконстант. Трансформації визначаються наявністю/відсутністю окремих складових, напрямком відтворення відношень, конкретним типом предикаторів, та окремими морфологічними маркерами.
Згортання окремих складових базової структури. Продуктивними схемами трансформування базової семантико-синтаксичної структури постають: згортання предикатора існування або довільного предикатора, згортання невизначеного суб'єкта або змістовного, одночасне згортання суб'єкта та предикатора (коли в повідомленні лишається тільки атрибутивний член предикатора). Цікавою уявляється також трансформація, що пов'язана із згортанням об'єкта і подає цілу гаму структур синтаксичних, що визначаються як іменний присудок. Інша схема трансформування пов'язана з явищем згортання статичних предикаторів “бути частиною”, “бути в родинних стосунках”, “займати посаду”, “бути назвою” (щоправда, на монопредикатному рівні це явище використовується рідко).
Явище згортання має різноплановий характер – це по суті певні варіанти використання “неповних речень”, і тут слушно нагадати висловлювання Дж. Ріса, що за кожним таким повідомленням людина вбачає образ “повного речення”, який завжди пропливає в нашій уяві, проте має нечіткі, неокреслені контури. На статус такого “повного речення” і претендує базова семантико-синтаксична структура, контури якої вже окреслені чітко та однозначно; лише завдяки цьому так широко може використовуватися в мовній практиці явище згортання окремих складових.
Інверсія головного зв'язку. Іншою продуктивною основою трансформування виступає інверсія головного зв'язку базової структури – відношення Ro, яке в прямому напрямку підкреслює активний характер впливу суб'єкта (SUBJ) на предикатор (P). У випадку зміни напрямку Ro на протилежний матимемо ситуацію, коли вже на суб'єкт діє інший об'єкт чи суб'єкт. Залежно від форми предикатора актуалізується та чи інша схема трансформування.
Узагальнені схеми трансформування атомарного речення. Лишається проаналізувати ще деякі схеми трансформування базової синтаксичної структури, які будуть інваріантними щодо змістовної сторони предикатора. Це - трансформації ствердження, заперечення, побажання, порівняння та запитання.
У загальному випадку їх формули визначатимуться повними базовими структурами але з відповідними службовими елементами мови.
На цьому закінчується аналіз монопредикатного рівня організації мови. Для моделювання мовної діяльності лінгвістичний процесор однозначно повинен виявляти та ідентифікувати всі трансформації базової структури. У загальному випадку, поданий перелік схем трансформування базової семантико-синтаксичної структури лишається відкритим для поповнення.
Розділ 7. Поліпредикатний рівень формування повідомлення
Після аналізу монопредикатного рівня організації повідомлення слід подати особливості формування поліпредикатного рівня; в роботі проаналізовано найважливіші схеми поєднання структур монопредикатного рівня.
Явище однорідності. В межах запропонованої моделі мови явище однорідності розглядається як різновид поліпредикатного рівня організації мови, де об'єднуються кілька базових структур в межах окремого повідомлення.
У випадку існування двох ідентичних ситуацій довкілля, що різняться лише однією складовою, наприклад SUBJ і можуть відтворюватися відповідно структурами SB01 та SB02, мовна практика (згідно з принципом економії мовних засобів ) замість двох повних базових конструкцій опрацювала форму повідомлення, яка подає повністю опис однієї ситуації, а з іншої використовує лише відповідний елемент. Таке синтаксичне явище визначається Л.Теньєром як юнкція. Слід зазначити, що явище однорідності може одночасно стосуватися кількох складових повідомлення. При наявності N однорідних суб'єктів та M однорідних об'єктів, що об'єднуються L однорідними предикаторами, матимемо випадок, коли в одному повідомленні відтворюються ( L * M * N ) окремих ситуацій довкілля.
Ускладнення предикатора. Відомі схеми ускладнення предикатора (явище модальності, фазисний характер реалізації дії, можливість навчання певній дії тощо) традиційно знаходять свою інтерпретацію на рівні формування допоміжного ускладнення змістовного дієслова - присудка. Але зовсім іншу інтерпретацію цього явища можемо подати на поліпредикатному рівні організації повідомлення.
Нехай наше довкілля характеризується сукупністю N ситуацій, ініційованих одним суб'єктом. Відтворення такого стану може здійснюватися послідовно через N базових структур, проте мовна практика, виходячи із загальних принципів організації повідомлення, опрацювала свої конкретні та більш ефективні схеми формування опису такої сукупності ситуацій. У такому випадку для відтворення середовища використовується одна вихідна (базова) конструкція із загальним суб'єктом SUBJ, що доповнюється ієрархічно організованою множиною предикаторів Pred1, Pred2,..., PredN, де останнє місце займає змістовне дієслово, а всі попередні - послідовно його доповнюють та уточнюють. Це відома схема формування складного присудка.
Згортання статичних предикаторів. При аналізі використання статичних предикаторів раніше наголошувалося, що головна схема їх використання - поліпредикатний рівень формування повідомлення. У такому випадку схема поєднання кількох базових структур вбачається наступною: одна структура атомарного речення (залежно від комунікативної інтенції мовця) визначається як коренева - SB0k, інші структури будуть їй підпорядкованими - SB0п. Входження (інкорпорування) однієї базової структури в іншу відбувається наступним чином: по-перше, суб'єкт підпорядкованої структури SUBJп повинен бути тотожним одному з об'єктів або суб'єкту кореневої структури, по-друге, цей суб'єкт SUBJп (разом із актантним оточенням свого згорненого предикатора) входить в кореневу структуру, займаючи відповідне місце, а подальше розгортання усього повідомлення реалізується за схемою кореневої структури. Канцелярський стиль діловодства досконало опрацював таку схему формування повідомлення: часто зустрічаємо приклади поєднання в окремому повідомленні до семи-восьми підпорядкованих базових структур (хоча і спрощених, звичайно). Глибина вкладання підпорядкованих структур в кореневу, загалом також не перевищує семи.
Поліпредикатна інтерпретація мовних зворотів. Далі подається аналіз вже більш відомих схем організації поліпредикатного повідомлення, що визначаються схемами субстантивації, ад'єктивації та адвербіалізації монопредикатних структур. У всіх зазначених випадках матимемо схеми взаємодії кількох базових структур, одна з яких визначатиметься як коренева, а інша - як підпорядкована. Входження підпорядкованої структури до кореневої супроводжується явищем трансляції (згідно структурного синтаксису Л. Теньєра) предикатора Predп з дієслівного рівня відповідно до іменника, дієприкметника або дієприслівника; все актантне оточення практично лишається незмінним і враховується відповідним чином.
Субстантивація монопредикатних структур. У цьому випадку взаємодія двох монопредикатних структур (SBOk та SBOп) визначається схемою, коли одна з них - SBOп виступає аргументом породжувальної функції F1 (бути об'єктом). Це означає, що предикатор SBOп після трансляції отримує статус іменника, а все його оточення практично лишається незмінним.
Ад'єктивація монопредикатних структур (дієприкметниковий зворот). Це добре відома схема формування дієприкметникового звороту. У цьому випадку також матимемо взаємодію двох структур SBOk та SBOп, коли одна з них постає аргументом породжувальної функції F2, яка переводить предикатор (з усім його актантним оточенням) на роль атрибутивного члена об'єкта Attr(Obj).
Адвербіалізація монопредикатних структур (дієприслівниковий зворот). Формування дієприслівникового звороту теж відбувається за аналогічною схемою, проте функціональна залежність тут інша. Функція F3 переводить предикатор підпорядкованої структури в ранг атрибута предикатора кореневої структури Attr(Mov). Оточення предикатора підпорядкованої структури практично лишається повним і не змінюється.
Підрядні/сурядні схеми об'єднання монопредикатних структур. Аналіз поліпредикатного рівня закінчується розглядом підрядних та сурядних схем поєднання кількох монопредикатних повідомлень. Це відомі схеми формування складного повідомлення.
Розділ 8. Комунікативний аспект організації повідомлення
Монопредикатний та поліпредикатний рівні повністю охоплюють все структурне різноманіття синтаксичної організації мовного повідомлення, що не виходить за межі атомарного речення. Проте, часом в повідомленні зустрічається інформація, що не пов'язана безпосередньо із змістовною стороною відтворюваної ситуації. Інформація подібна визначається комунікативним аспектом організації мовного повідомлення і відтворює ті чи інші аспекти процесу комунікації.
Особливістю комунікативної організації є факт, що відповідні мовні засоби впливають лише на організацію процесу спілкування. Та все ж, можливість вилучення цих характеристик з мовного матеріалу, з подальшим їх використанням, постає однією з обов'язкових умов функціонування систем обробки природно-мовної інформації. В роботі аналізуються особливості організації комунікативних засобів та подається їх класифікація. Вилучення таких засобів із повідомлення постає суттєвим допоміжним етапом на шляху аналізу мовного повідомлення. Це буде, по суті, перший етап обробки мовної інформації, що пов'язаний з розподілом повідомлення на змістовну та комунікативну складові; змістовна інформація у подальшому структурується за синтактичними складовими (структура SBO та її трансформації), а комунікативна складова подає допоміжну інформацію щодо характеру спілкування.
Розділ 9. Зв'язність текстової інформації
Подано аналіз структурного оформлення мовного матеріалу, що виходить вже за межі окремого повідомлення. У роботі запропоновано схему "координатного" зв'язку тексту, що пояснює, яким чином одне повідомлення пов'язується з наступним для відтворення цілісності зовнішнього середовища. Розглядаються схеми послідовного, паралельного та комбінованого типів опису певного фрагмента довкілля та відповідне використання мовних засобів. Цей розділ практично завершує подання формальної моделі мови, яка охоплює головні особливості структурної організації довільного мовного повідомлення на монопредикатному та поліпредикатному рівнях.
Якщо простежити витоки формального підходу до розбудови моделі мови та урахувати науково-методологічні засади системного підходу до аналізу мовної діяльності взагалі, то можемо зробити висновок, що запропоновані формалізми спираються на загальнолюдські особливості опрацювання символьної інформації і постають як плідна основа формування універсального синтаксису.
Основна частина дисертації окреслює найважливіші моменти розбудови формальної моделі мови, що постають плідною основою не лише організації мовного матеріалу, але й мовної діяльності, взагалі. Використання запропонованих формалізмі на шляху створення сучасних інформаційних технологій, орієнтованих на опрацювання природно-мовного матеріалу (читай, на моделювання мовної діяльності людини), вимагає ретельного дослідження цілого спектру важливих та цікавих проблем. У цьому напряму здобувачем виконані вже вагомі напрацювання, що дозволяють вирішувати окремі вузлові питання формування сучасних інформаційних ПМ-технологій. Певним чином ці проблеми значно поглиблюють конкретні напрями розбудови формальної моделі. Проте, щоб не порушувати цілісність подання запропонованої моделі, такі питання винесені до додатків.
У додатках наведені найважливіші пропозиції щодо використання запропонованої формальної моделі для сучасних технологій, орієнтованих на опрацювання ПМ-інформації.
|