Электронная библиотека Веда
Цели библиотеки
Скачать бесплатно
Доставка литературы
Доставка диссертаций
Размещение литературы
Контактные данные
Я ищу:
Библиотечный каталог российских и украинских диссертаций

Вы находитесь:
Диссертационные работы России
Технические науки
Системный анализ, управление и обработка информации

Диссертационная работа:

Бондаренко Михаил Федорович. Математические модели мирфологических и фонетических отношений и их применение для автоматизации обработки речевых сообщений : ил РГБ ОД 71:85-5/192

смотреть содержание
смотреть введение
Содержание к работе:

Стр.
ВВЕДЕНИЕ 6

ГЛАВА I. СОСТОЯНИЕ ВОПРОСА И ПОСТАНОВКА ЗАДАЧ ИССЛЕДОВАНИЯ

I.I. Обзор разработок в области автоматизации

языковой деятельности 12

1.2. Обзор исследований в области моделирования

механизмов естественного языка 19

1.3. Анализ состояния исследований в области моделирования механизма словоизменения ... 24

1.4. Анализ литературных данных по моделированию механизмов словообразования и акустико- фонетической обработки словесного материала 28

1.5. Постановка задач исследования 33

ГЛАВА П. АНАЛИТИЧЕСКОЕ ОПИСАНИЕ СТРУКТУРЫ СЛОВА

2.1. Членение словоформы на лингвистически зна
чимые элементы 40

2.2. Аналитическое описание структуры окончания 48

2.3. Сегментация суффиксов и классификация сег
ментов 52

2.4. Исследование структуры корневых морфем . . 59

2.5. Математическое описание структуры приставок 63

Выводы по второй главе 69

ГЛАВА Ш. РАЗРАБОТКА МАТЕМАТИЧЕСКОЙ МОДЕЛИ МОРФЕМЫ

3.1. Построение математической модели словоиз
менения 70

3.2. Формализация распределения суффиксальных

морфов в морфеме 85

3.3. Разработка математической модели грамматики

Стр.
корневых структур 92

3.4. Математическое описание законов сочетае
мости морфов в префиксальном словообразо
вании 105

Выводы по третьей главе III

ГЛАВА ІУ. РАЗРАБОТКА МЕТОДА ФОРМИРОВАНИЯ СМЫСЛОВЫХ ОТТЕНКОВ И ПРИЗНАКОВ ЭЛЕМЕНТОВ СЛОВА 4.1. Постановка задачи моделирования смысловых

связей в слове 112

4.2. Формирование смысловых оттенков морфов 118 4.3. Формирование смысловых признаков морфов 122 4.4. Выявление порядка на множестве признаков 128

Выводы по четвертой главе . . 133

ГЛАВА У. МОДЕЛИРОВАНИЕ СМЫСЛОВЫХ СВЯЗЕЙ В СЛОВЕ

5.1. Формирование суффиксальных смысловых от
тенков и признаков 134

5.2. Формализация смысла суффикса 144

5.3. Формирование префиксальных смысловых от
тенков и признаков 148

5.4. Математическое описание смысла префикса 151 5.5. Формирование смысловых оттенков и признаков

для корней 158

5.6. Моделирование семантики корня слова . . . 170

Выводы по пятой главе 175

ГЛАВА УІ. МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ СИНТАКСИЧЕСКИХ СВЯЗЕЙ

6.1. Постановка задачи 176

6.2. Математическое описание локальных связей

в предложении 185

Стр.

6.3. Математическое описание глобальных связей

в предложении 191

6.4. Построение отмеченного дерева зависимостей
простого предложения и перспективы даль
нейших исследований 198

Выводы по шестой главе 204

ГЛАВА УП. МАТЕМАТИЧЕСКОЕ ОПИСАНИЕ СЛОГОВЫХ, АКЦЕНТНЫХ И ОРФОЭПИЧЕСКИХ ОТНОШЕНИЙ

7.1. Формальное описание фонетической послоговой

сегментации 205

7.2. Математическое описание акцентных типов

русского языка 212

7.3. Математическое описание орфоэпических связей для согласных звуков русского языка 222

7.4. Математическое описание орфоэпических

связей для гласных звуков русского языка 236

Выводы по седьмой главе . . . 244

ГЛАВА УШ. ДИСКРЕТИЗАЦИЯ АКУСТИЧЕСКОГО ПРЕДСТАВЛЕНИЯ СЛОВА

8.1. Эффект сглаживания в слухе и его использование для дискретизации речевых сигналов 245

8.2. Экспериментальное исследование дискретизи-

рованных фонограмм 252

8.3. Нормализация акустической диаграммы рече
вого сообщения. 263

8.4. Использование эффекта сглаживания в слухе

для распознавания гласных звуков речи . . 267

8.5. Построение дискретного портрета слова . . 279

8.6. Принцип фонемного синтеза речи 286

Выводы по восьмой главе 291

Стр. ГЛАВА К. ПРАКТИЧЕСКИЕ ПРИЛОЖЕНИЯ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ СЛОВА 9.1. Разработка методов решения лингвистических

уравнений 292

9.2. Автоматическое обнаружение и исправление

ошибок в русских словоформах 302

9.3. Пример практического использования математических моделей лингвистических отношений в

диалоговом тренажере 308

ЭЛ. Использование результатов исследований при построении системы автоматической обработки

речевых сообщений "Фонема" 321

Выводы по девятой главе 326

ОСНОВНЫЕ ВЫВОДЫ 327

ЛИТЕРАТУРА 329

ПРИЛОЖЕНИЕ. Акты о внедрении результатов диссертационной

работы 351

Введение к работе:

Взяв курс на интенсификацию всего народного хозяйства СССР, ХХУІ съезд КПСС сформулировал задачи дальнейшего роста производства, повышения эффективности и качества общественного труда /I/. Решение этих задач требует дальнейшего быстрого увеличения производительности труда на базе автоматизации производства. Это, в свою очередь, приводит к необходимости широкого применения средств автоматической обработки информации и автоматического управления, робототехники, к повсеместному использованию автоматизированных систем.

Достижение всех этих целей требует быстрейшего развития вычислительной техники, в особенности ее программного обеспечения. Запросы автоматизации требуют от ЭВМ способности к пониманию человеческого языка, достаточной 'сообразительности", способности к мышлению и к элементам творчества. В связи с этим перед разработчиками средств вычислительной техники ставится задача: обеспечить эту технику достаточно высокоорганизованным "интеллектом", основанном на машинном языке, приближающемся по своим функциональным возможностям к естественному языку человека.

Эта задача не допускает простого и быстрого решения. Возникают серьезные трудности принципиального характера. Из-за этих трудностей пока не дают желаемых результатов работы по автоматизации программирования, созданию автоматических систем высококачественного перевода с одного языка на другой, построению систем для автоматического распознавания достаточно сложных объектов, формированию способности машины понимать увиденное и услышанное и многие другие работы, направленные на решение иных, столь же важных вопросов.

Многие исследователи считают, что главная трудность, о ко-

_ 7 -

торую разбиваются все попытки радикально поднять интеллектуальные возможности ЭВМ, заключается в несовершенстве машинных языков. Последние существенно уступают по своим выразительным возможностям естественным языкам. Растет число сторонников того взгляда, что создание машинного "интеллекта" требует изучения и моделирования человеческого интеллекта и, в первую очередь, лезкащего в его основе естественного языка. Становится все более ясным,что при дальнейшем усовершенствовании машинных языков необходимо шире использовать принципы организации человеческого языка.

Существует большое число научных дисциплин, изучающих естественные языки: фонетика, морфология, синтаксис, лексикология, семасиология, стилистика и др. Однако обширные данные, накопленные этими науками за многие века их существования, не могут быть непосредственно использованы для совершенствования языка машины. Дело в том, что знания, содержащиеся в лингвистических трудах, предназначены для усвоения человеком, а не машиной. Эти знания неформализованы, поэтому они не могут быть непосредственно использованы для расширения возможностей вычислительной техники. Они должны быть предварительно математически описаны и промоделированы. Положение осложняется еще и тем, что явления языка даже на формальном уровне зачастую описаны недостаточно полно. Такое положение наблюдается уже в грамматике - наиболее простом разделе учения о языке. Академик В.В.Виноградов пишет: "Грамматический строй русского языка плохо изучен. Освещение многих грамматических вопросов основывается на случайном материале. Отсутствуют прочные теоретические основы, отсутствуют определения или точные описания основных грамматических понятий, особенно понятие слова и предложения" /93, с.9/.

Научные работы в области моделирования механизмов естественного языка находятся в настоящее время на начальной стадии своего

развития. Еще не сформирован общий подход к моделированию языка, нет ясности в вопросе о том, какой математический аппарат более всего подходит для формального описания языка. История развития моделирования естественных, языков изобилует случаями, когда попытки математического описания сложных явлений языка (например, грамматической или семантической структуры предложения) оказывались малоэффективными из-за не изученности более простых механизмов языка, на которых основаны эти более сложные структуры.

В настоящей работе в качестве главного объекта исследования и моделирования выбрано слово, представленное в звуковом или акустическом виде, а точнее - система различных механизмов его информационной обработки, которую осуществляет в процессе речевой деятельности носитель русского языка. Слово - это простейший и, вместе с тем, центральный объект в языке, поэтому моделирование слова должно рассматриваться как первоочередная задача при моделировании языка. Хотя слово - это всего лишь элемент языка, тем не менее оно имеет весьма тонкое строение, а процессы обработки слова сложны и многообразны. Проф.В.А.Звегинцев пишет: "Слово есть тонкий элемент речи, в котором, как в фокусе, сходятся все конструктивные стороны языка: лексика, грамматика и фонетика" /115, с.121/. Лингвистические знания о структуре слова и процессах его обработки весьма неполны, работы по математической формализации этих знаний находятся в начальной стадии развития. Недостаточная изученность слова серьезно тормозит работы по моделированию механизмов языка более высоких уровней и поэтому не позволяет эффективно использовать многие важные для народного хозяйства технические системы, которые основаны на автоматической обработке информации, представленной на естественном языке.

В диссертации на основе исследования иерархической структуры языка разработана и обоснована математическая модель лингви-

стических связей (законов языка) на уровне словесной обработки текстов русского языка, представленных в знаковом или акустическом виде.

Краткая аннотация нового, что вносится автором в исследование проблемы:

  1. Проведены исследования по созданию универсального математического аппарата для формального описания произвольных конечных отношений. В результате развита алгебра конечных предикатов и изучены ее свойства применительно к описанию лингвистических уравнений. Используемый математический аппарат обладает полнотой, универсальностью, единством выразительных средств и наглядностью формульных конструкций.

  2. Осуществлено формальное членение слова на иерархически взаимосвязанные части. Введены лингвистические переменные и области их определения, а также понятия ближнего и дальнего текста. Математически описаны связи между лингвистическими переменными, задающими отношения между отдельным морфом и окружающим его ближним текстом, механизм чередования и беглости букв.

  3. С целью исследования и математического описания влияния дальнего текста на морф разработан метод формирования смысловых признаков морфов и их значений - смысловых оттенков, описаны отношения порядка, выявленные на множестве' найденных признаков. Формально представлены связи между смысловыми признаками.

4-. Построены математические модели лингвистических связей для отдельных видов морфем: префиксов, корней, суффиксов, окончаний. Введено понятие семантической сети признаков и разработан метод ее математического описания. Построена семантическая сеть признаков для корней слов и выполнено ее математическое описание.

5. Осуществлено математическое описание морфологического отношения. За счет введения промежуточных логических переменных

и индивидуальных предикатов, формализующих лингвистические понятия, проведена минимизация системы уравнений, описывающих морфологическое отношение.

  1. На основе разработанной математической модели морфологического отношения описаны грамматические связи, существующие в беспредложном и предложном словосочетаниях, построена математическая модель простого распространенного предложения.

  2. На базе эффекта сглаживания в слухе разработаны метод и аппаратура для перехода к дискретному образу речевого сообщения и его нормализации. Выполнены эксперименты по определению частоты дискретизации речевых сообщений. Разработаны программные и аппаратурные средства ввода-вывода в ЭВМ речевых сигналов.

  3. Математически описаны связи между дискретным образом слова и его орфографическим представлением. Формализована и программно реализована процедура слогоделения.

  4. Математически описаны процедуры распознавания и синтеза гласных и согласных звуков слога, слова в целом. Разработанные методы распознавания позволяют осуществлять фонетическую классификацию звуков независимо от диктора.

10. В целом выполненвьв исследования представляют собой
единый комплекс научных и практических результатов, нацеленных
на решение задач автоматической обработки речевых сообщений,
представленных в знаковой или акустической формах.

В результате выполненных исследований на защиту выносятся основные научные результаты:

  1. Методология и метод математического описания лингвистических связей (законов языка) на уровне словесной обработки текстов русского языка, представленных в знаковой и акустической формах.

  2. Уравнения, математически описывающие морфологические

- II -

(словоизменительные и словообразовательные) связи в слове и синтаксические связи между словами (словосочетание и простое предложение).

  1. Уравнения,математически описывающие связи между осциллограммой, дискретным портретом, фонетической и орфографической представлениями речевого сообщения.

  2. Система программных и технических средств решения задач автоматической обработки текстовой информации, представленной в графической и акустической формах.

Совокупность научных результатов диссертации защищается как новое перспективное научное направление в области технической кибернетики и теории информации - математическое описание уравнениями алгебры конечных предикатов лингвистических связей (законов языка), важное для автоматизации обработки информации, представленной на естественном языке.

Выполненные в работе исследования проведены в соответствии с планом научно-исследовательских работ на 1976-1980 годы, утвержденным постановлением Президиума АН УССР № 229 от 26.06.76 г. по проблеме I.I.I7.5 "Математическое моделирование", планом важнейших научно-исследовательских работ на 1980-1985 годы, утвержденным постановлением Президиума АН УССР № 520 от 19.12.79 г., тема I.I2.9.7 "Разработать и исследовать программные и технические средства обработки словесной информации в человеко-машинных системах", планом важнейших научно-исследовательских работ на 1982-1985 годы, утвержденным планом АН СССР по проблеме "Кибернетика", тема 1.12.9.4(6) "Создание систем анализа и синтеза текстов".

Основные результаты и работа в целом апробированы на более чем 35 Всесоюзных, Республиканских и ведомственных симпозиумах, совещаниях, конференциях, заседаниях в 1967 * 1984 гг.

Подобные работы
Усачёв Михаил Валерьевич
Применение обработки видеоизображений для автоматизации учета круглого лесоматериала на предприятиях деревообрабатывающей промышленности
Кузнецова Ирина Альфредовна
Гомеостатическая модель конкурентных отношений в социально-экономической системе
Воробьев Виктор Михайлович
Автоматизация проектирования диагностического обеспечения цифровых программно-управляемых устройств с применением технологии экспертных систем
Евдокимов Даниил Александрович
Средства автоматизации сбора и обработки медицинской статистической информации
Капустин Антон Николаевич
Автоматизация тепловизионного контроля и мониторинга промышленного и транспортного электрооборудования на основе обработки термо- и видеоизображений
Шкурко Михаил Игоревич
Программные средства автоматизации обработки информации в системе документооборота на базе распределённой архитектуры с применением smart-технологий
Котов Андрей Александрович
Автоматизация обработки и анализа интегрированных данных при изысканиях инженерных сооружений с распределенной структурой с применением геоинформационных технологий
Зулкарнеев Михаил Юрьевич
Разработка математических моделей и алгоритмов поиска ключевых слов в аудио-сообщениях
Шумилов Сергей Александрович
Модель и методика проектирования адаптивных систем мониторинга рассредоточенных объектов на основе сетей передачи тревожных сообщений
Лысаков Алексей Викторович
Модели договорных отношений в управлении проектами

© Научная электронная библиотека «Веда», 2003-2013.
info@lib.ua-ru.net