SUMMARY
Chukhray A.G. Methods and facilities of data quality improvement in automated systems of organizing management.
Thesis as manuscript is presented for getting of Technical Sciences Candidate’s degree on speciality 05.13.06 – automated control systems and progressive information technologies. – National aerospace university “Kharkov aviation institute”, Kharkov, 2003.
The dissertation is devoted to development of new approach to data quality improvement in automated systems of organizing management on a basis of principles of system approach to support of necessary quality of technical system’s functioning. These principles include consequent removing an equivocation about data state, making diagnosis on the basis of indirect signs of presence of errors from given set, determination and correction of wrong data through their comparison with etalon values. The model of choice of architecture of heterogeneous and distributed databases is offered. For finding redundancy data, diagnosing and recovering data productive and exact methods and facilities are elaborated.
Keywords: automated system of organizing management, data quality, diagnosing and recovering data.
АННОТАЦИЯ
Чухрай А.Г. Методы и средства повышения качества данных в автоматизированных системах организационного управления.
Диссертацией является рукопись, представленная на соискание ученой степени кандидата технических наук по специальности 05.13.06 – Автоматизированные системы управления и прогрессивные информационные технологии. – Национальный аэрокосмический университет им. Н.Е. Жуковского “Харьковский авиационный институт”, Харьков, 2003.
Достижение высокой производительности труда в современных организациях невозможно без применения автоматизированных систем организационного управления (АСОУ). Одной из составляющих успешного внедрения и функционирования АСОУ является разработка решений, нацеленных на повышение качества вводимых и обрабатываемых данных. Как правило, такая необходимость обусловлена двумя основными факторами: относительно высокой интенсивностью ошибок, допускаемых человеком в силу ограниченных психофизиологических возможностей, и поддержкой в составе АСОУ множества неоднородных распределенных и избыточных друг относительно друга источников данных.
Разрешение указанной проблемы возможно только благодаря использованию базирующихся на научно обоснованных методах повышения качества данных эффективных инструментальных средств, позволяющих в полной мере учитывать специфические ошибки, допускаемые работниками на стадиях сбора данных и их ввода в АСОУ. Вместе с тем существующие методы и средства не только не позволяют решать проблему комплексно, но и не всегда удовлетворяют требованиям по точности и быстродействию.
Выбор научного направления данной работы обусловлен подобием задач повышения качества данных в АСОУ и функционирования технических систем в аварийных режимах, а также конструктивизмом решений последних. Таким образом, цель диссертационных исследований – повышение качества данных в АСОУ посредством методов и средств, разработанных на основе принципов диагностирования и восстановления работоспособности технических систем.
Для выбора способа интеграции неоднородных и распределенных данных в АСОУ, предоставляющего потенциальную возможность повышения качества данных за счет избыточности, была построена модель выбора архитектуры баз данных на физической страте. Ее применение позволило научно обосновать общее превосходство хранилищ данных над остальными альтернативами в контексте задачи повышения качества данных.
Центральным положением разработанного подхода к повышению качества данных в АСОУ стали принципы последовательного снятия неопределенности о состоянии данных, формирования диагноза по косвенным признакам наличия ошибочных данных из заданного множества и выявления ошибочных и восстановления качественных данных на основе определения эталонных значений, сформулированные на основе успешно применяющихся при решении практических задач принципов диагностирования и восстановления работоспособности технических систем.
Задача обнаружения избыточных данных в АСОУ была решена посредством разработки новых методов поиска избыточных реквизитов в неоднородных справочниках, а также поиска избыточных кортежей в реляционном отношении. Полученные методы базируются на свойствах адекватной наиболее распространенным орфографическим ошибкам персонала метрики Левенштейна и ограничивающих необходимые условия похожести данных строго доказанных утверждениях. Теоретически установлено, что разработанные методы превосходят по точности известные и характеризуются линейным быстродействием.
Предложенный метод индексно-реквизитного диагностирования и восстановления данных основан на использовании диагностических моделей данных, связывающих косвенные признаки наличия ошибочных данных с прямыми, что позволяет сформировать диагноз и восстановить данные за линейное относительно количества диагностируемых реквизитов время. Теоретически доказано, что диагностические модели позволяют обнаруживать в одном из реквизитов однократную транскрипцию, транспозицию смежных символов либо двукратную транскрипцию смежных символов, с высокой вероятностью не пропускают прочие ошибки.
Разработанные методы повышения качества данных стали математической базой для реализации программных средств в составе подсистемы обеспечения качества данных АСОУ. В результате экспериментальных исследований, проведенных на реальных данных о сотрудниках университета “ХАИ”, доказано превосходство в точности и быстродействии полученных методов поиска избыточных данных над известными методами, основанными на лексикографическом упорядочении данных, а также в быстродействии метода индексно-реквизитного диагностирования и восстановления над методом, основанным на попарном сравнении реквизитов.
Применение созданных средств в процессе интеграции неоднородных и распределенных данных автоматизированной системы управления административно-финансовой деятельностью университета “ХАИ” позволило повысить достоверность данных подсистемы “Бухгалтерский учет” на 38%, достоверность данных подсистемы “Учет кадров” на 8%. Доступность данных подсистем повысилась на 6 и 11% соответственно. Полученные показатели свидетельствуют о достижении основной цели диссертационного исследования – повышении качества данных в АСОУ.
Ключевые слова: автоматизированная система организационного управления, качество данных, диагностирование и восстановление данных.
|