|
Міністерство промислової політики України
Науково-виробнича корпорація
“Київський інститут автоматики”
УДК 002.6:347.77:004.93
Камишин Володимир Вікторович
Методи і засоби організаційного і технічного проектування центру автоматизованої обробки і видання патентної інформації
05.13.06 – автоматизовані системи управління та прогресивні інформаційні технології
Автореферат
дисертації на здобуття наукового ступеня кандидата технічних наук
Київ – 2004
Дисертацією є рукопис.
Робота виконана в Українському інституті науково-технічної і економічної інформації Міністерства освіти і науки України.
Захист відбудеться “ 9 ” червня 2004 р. о “ 13 ” годині на засіданні спеціалізованої вченої ради К 26.818.01 НВК “Київський інститут автоматики” за адресою: 04107, Київ-107, вул. Нагірна, 22, корп. 1, к. 219.
Відгуки на автореферат у двох примірниках, засвідчених печаткою установи, просимо надсилати за адресою: 04107, Київ-107, вул. Нагірна, 22, НВК “КІА”, вченому секретарю.
З дисертацією можна ознайомитись у бібліотеці НВК “Київський інститут автоматики”.
Автореферат розісланий “ 6 ” травня 2004 р.
Вчений секретар
спеціалізованої вченої ради
кандидат технічних наук Л.П.Тронько
ЗАГАЛЬНА ХАРАКТЕРИСТИКА РОБОТИ
Актуальність теми. Патентна система є одним із найважливіших елементів надійного управління науково-технічною політикою України, заснованою на заохоченні винаходів і раціоналізаторських пропозицій. Державна політика України передбачає створення відповідних структур науково-дослідних і дослідно-конструкторських робіт, включаючи обслуговуючі організації, такі, як центри технічної документації, які повинні бути спрямовані на надання технічної та інформаційної допомоги для розробки і впровадження винаходів, налагодження більш ефективної координації між науково-дослідними установами і промисловістю.
Основного значення в цьому розумінні набуває технічна інформація, заснована на патентній документації. Патентні документи розкривають технічну документацію шляхом опису винаходів відповідно до вимог чинного патентного законодавства і вказівки на новизну та винахідницький рівень шляхом посилання на існуючий рівень техніки.
Об’єми наукової та технічної інформації, у тому числі патентної документації, в усьому світі і в Україні безперервно зростають. Виникає насущна необхідність створення загальнодержавного та регіональних центрів патентної інформації та документації, що виконуватимуть функції обробки та видавництва патентної інформації, оперативного забезпечення цією інформацією споживачів: промислових підприємств, науково-дослідних установ, навчальних закладів, індивідуальних споживачів.
Підготовка, видання і формування електронних моделей даних патентних описів (ПО) України – складова частина державної програми створення єдиної національної бази даних науково-технічної інформації (НТІ) і інтеграції її з глобальною інформаційною мережею Інтернет, “... забезпечення широкого доступу до цієї мережі громадян та юридичних осіб усіх форм власності в Україні, належне представлення в ній національних інформаційних ресурсів є одним з пріоритетних напрямів державної політики в сфері інформатизації, задоволення конституційних прав громадян на інформацію, побудови відкритого демократичного суспільства, розвитку підприємництва” (Указ Президента України № 928/2000 від 31.07.2000 р.).
Роботи в цьому напрямку курирує департамент інтелектуальної власності Міністерства освіти і науки (МОН) України. Одним з технічних виконавців робіт є Український інститут науково-технічної й економічної інформації (УкрНТЕІ).
Проектування та введення в експлуатацію центрів автоматизованої обробки та видавництва патентної інформації (ЦАОВПІ) пов’язані з необхідністю рішення широкого кола завдань організаційного та технічного характеру. Це, в свою чергу, потребує створення відповідного методологічного апарата, який забезпечуватиме рішення цих задач на основі єдиного системного підходу.
В зв’язку з вищесказаним, тема дисертаційних досліджень присвячена розробці та застосуванню на практиці методів та технічних засобів проектування центрів автоматизованої обробки та видання патентної інформації в Україні на базі сучасних інформаційних технологій, є актуальною.
Зв’язок роботи з науковими програмами, планами, темами. Представлені в дисертації дослідження проводились в рамках тематичного плану науково-дослідних робіт, що фінансуються з коштів державного бюджету Міністерством освіти і науки України “Теоретичні та практичні основи системи інформаційно-аналітичного забезпечення науково-технологічного та інноваційного розвитку України” (№ державної реєстрації – 0103U000309), державного замовлення “Розроблення технологій збору, обробки, узагальнення та використання інформаційних ресурсів великих масивів” (№ державної реєстрації – 01984007444) та госпрозрахункової роботи “Виконання комплексу робіт по формуванню в електронному вигляді формул винаходів (корисних моделей) і текстів описів до патентів України”.
Ціль та задачі досліджень. Ціллю досліджень, які проводяться в даній дисертаційній роботі, є забезпечення високої оперативності та якості процесів обробки та видавництва патентної інформації за рахунок розробки та впровадження центру автоматизованої обробки та видання патентної інформації на базі сучасних інформаційних технологій.
Об’єктом дослідження є процес обробки та видавництва патентної інформації.
Предмет дослідження – методи організаційного та технічного проектування центру автоматизованої обробки та видання патентної інформації.
Для досягнення поставленої цілі в дисертаційній роботі розв’язується наукова задача розробки методів та засобів проектування та впровадження центру автоматизованої обробки та видання патентної інформації.
Розв’язання вказаної наукової задачі забезпечується її декомпозицією на ряд тісно взаємозв’язаних частинних задач дослідження в рамках системного підходу. Це наступні задачі:
- Розробка методики реалізації системного підходу стосовно організаційного ергономічного проектування діяльності ЦАОВПІ.
- Обґрунтування складу та функціональних обов’язків персоналу центру.
- Формальна постановка та розв’язання задачі раціонального вибору технічних засобів ЦАОВПІ за рахунок застосування методів та алгоритмів нечіткої багатокритеріальної оптимізації.
- Розробка методики обробки вхідних даних про важливість та потрібний рівень частинних показників якості технічних засобів ЦАОВПІ на основі застосування теорії нечітких множин.
- Вибір раціонального складу технічних засобів центру та програмна реалізація інформаційної системи центру.
Для розв’язання вказаних частинних задач застосовувались методи системного аналізу, теорія нечітких множин, методи багатокритеріальної оптимізації, теорія графів, математична статистика, ергономіка.
Наукова новизна отриманих результатів. До числа нових наукових результатів, отриманих в дисертаційній роботі, слід віднести:
1. Методику організаційного проектування центру автоматизованої обробки та видання патентної інформації на основі системного підходу, яка включає:
- узагальнений алгоритм системного проектування організаційної структури центру;
- методику визначення чисельності персоналу центру на основі комплексного врахування вартості утримання персоналу, якості виконання ним своїх функціональних обов’язків та завантаження виконавців;
- методику та евристичний алгоритм розв’язання задачі розподілу функцій між персоналом центру;
- математичну модель синтезу алгоритмів розв’язання задач виконавцями.
Новизна методики заключається в реалізації системного підходу стосовно проектування організаційної структури центру, включаючи обґрунтування принципів, методів, критеріїв та системно-погоджених процедур проектування.
2. Методику обробки вхідних даних, яка дозволяє проводити оцінку важливості вимог, які пред’являються до технічних засобів центру, і ступінь виконання цих вимог на основі побудови функцій приналежності.
Новизна методики заключається в застосуванні нечітких множин для отримання вказаних вхідних даних.
3. Методики та алгоритми розв’язання задачі нечіткої багатокритеріальної оптимізації вибору раціонального складу технічних засобів центру, в основу яких покладені максимінний і лексикографічний методи оптимізації.
Новизна методик заключається в комплексному врахуванні кількісних та якісних вимог при виборі технічних засобів центру та обґрунтованому застосуванні конкретних методів нечіткої багатокритеріальної оптимізації.
Практичне значення отриманих результатів. Практичне значення результатів роботи полягає в тому, що вони дозволили:
- розв’язати задачу організаційного проектування ЦАОВПІ, яка включає обґрунтування чисельності персоналу, розподілу функцій між виконавцями та алгоритмів розв’язання конкретних задач;
- вибрати раціональний варіант технічних засобів центру;
- забезпечити програмну реалізацію інформаційної системи центру;
- значно знизити собівартість виконання робіт з обробки та видання патентної інформації;
- сформувати повнотекстові електронні інформаційні ресурси патентної інформації.
Отримані в роботі методики та алгоритми організаційного та технічного проектування можуть бути практично використані при розробці та впровадженні складних інформаційних систем різноманітного призначення.
Результати досліджень реалізовані в НДР “Розробка програмного забезпечення ведення патентного обліку та контролю за виконанням робіт” (акт впровадження УкрІНТЕІ від 17.02.2004 р.) та при формуванні системи обробки та видання патентів України (акт впровадження ДП “Інститут промислової власності (Укрпатент)” від 20.02.2004 р.)
Особистий внесок здобувача. Основні наукові результати дисертаційної роботи належать здобувачу. Із спільних публікацій особисто здобувачу належать наступні: проведено аналіз використання сучасних інформаційних ресурсів та технологій в формуванні інформаційного середовища [1]; запропоновано застосувати метод Дельфи для формування системи критеріїв оцінки науково-технічних програм [2]; обґрунтовані принципи системного проектування організаційних структур та розроблено загальний алгоритм синтезу структур [3]; проведено аналіз стану розробки та застосування систем автоматизованого документообігу [5] та аналіз математичних моделей розподілу функцій між персоналом в ергатичних системах та розроблений евристичний метод розв’язання задач [6]; запропоновано алгоритм використання пошукової системи в обчислювальних мережах за рахунок розподіленого програмування [7]. проведено аналіз вирішення задачі та запропоновано алгоритм реалізації методу визначення чисельності персоналу [8]
Із спільних публікацій в дисертаційну роботу включені лише результати, отримані автором самостійно.
Апробація результатів дисертації. Наукові і практичні результати роботи доповідались на наступних науково-технічних конференціях та семінарах в період 2001 – 2003 рр.: VIII міжнародній науково-практичній конференції “Система науково-технічної інформації. Проблеми розвитку та функціонування” (м. Київ, 30-31 травня 2001 р.); III Міжнародній конференції по психології та ергономіці (мм. Москва – Твер, Росія, 5-7 червня 2003 р.); VII міжнародному симпозіумі Seventh International symposium on Human Factors in Organizational Design and Management Held (Aachen, Germany, October 1-2, 2003р.).
Публікації. Основні наукові результати дисертації опубліковані в 16 роботах, з них 8 [1-8] статей у виданнях, наведених у переліку ВАК України, 4 тезах доповідей на науково-технічних конференціях і семінарах [9-12], 1-му методичному посібнику [13], 3-х звітах по НДР [14-16].
Структура й обсяг дисертації. Дисертація складається з вступу, чотирьох розділів, списку літератури і додатків. Список використаних джерел містить 81 найменування. Основний матеріал викладений на 147 сторінках машинописного тексту, у роботі мається 27 ілюстрацій, 12 таблиць.
ОСНОВНИЙ ЗМІСТ РОБОТИ
У вступі відображені актуальність тематики, мета, наукова задача та частинні задачі дослідження, наукова новизна отриманих результатів та їх практичне значення, наведені відомості про обсяг, публікації та апробацію роботи.
У першому розділі проведено аналіз задач, що розв’язуються центром автоматизованої обробки і видавництва патентної інформації. Здійснена класифікація патентної документації, яка підлягає обробці центром за наступними видами: офіційні патентні бюлетені, описи заявок на винахід, опис патентів, опис корисних моделей, опис промислових зразків, офіційні публікації про зміну стану правового захисту, офіційні патентні показники. Розглянуто особливості забезпечення патентною документацією основних споживачів: урядових організацій, науково-дослідних і проектно-конструкторських організацій, промислових підприємств, наукових бібліотек університетів.
Дано загальну характеристику та опис задач організаційно-технічного проектування центру. На основі аналізу літератури показано, що при організаційному проектуванні вирішуються наступні частинні задачі: вибір типу організаційної структури; визначення числа рівнів структури по вертикалі; визначення кількості функціональних груп на кожному рівні.
Оцінюється необхідна кількість виконавців у кожній групі і визначаються їх функції; синтезуються алгоритми рішення окремих задач виконавцями.
Дані, отримані при організаційному проектуванні центру, використовуються як вихідні вимоги при технічному проектуванні. На основі цих вимог вирішуються задачі обґрунтування технологічного процесу обробки і видання патентної інформації, раціонального вибору технічних засобів, розробки програмного забезпечення, розміщення робочих місць персоналу.
Формальна постановка задачі проектування центру має вигляд:
знайти при , (1)
де R - множина припустимих проектів центру; R0 – оптимальний (раціональний) проект; C(R) – вартість розгортання центру, технічних засобів, утримання персоналу, експлуатації центру; W(R0), Wдоп – відповідно якість та допустима якість вирішення задач центром.
Показано, що задача проектування центру відноситься до класу слабоструктурованих задач, а основними принципами її рішення є принципи декомпозиції, послідовних наближень, генерування обмеженого числа варіантів на основі використання знань і досвіду експертів. В якості формального апарата для рішення задачі обрані методи нечіткої багатокритеріальної оптимізації. Застосування зазначених принципів дозволило представити задачу організаційного і технічного проектування у вигляді сукупності системно-погоджених процедур, виконуваних послідовно. Зміст цих процедур і методи реалізації їх розглядаються в наступних розділах дисертації.
В другому розділі розглядається методика організаційного проектування діяльності центру.
Проведено аналіз і розглянута класифікація типових організаційних структур складних систем. Показано доцільність вибору в якості базової структури центру лінійно-функціональної структури.
Обґрунтовано основні принципи реалізації системного підходу при проектуванні центру: цілеобумовленості, адаптивності, зв’язності, моделюємості, рефлексивності. Розроблено узагальнений алгоритм організаційного проектування діяльності центру, структура якого наведена на рис. 1. Показано, що найбільш складними питаннями проектування є визначення чисельності персоналу центру і розподіл функцій між посадовими особами.
Формальна постановка задачі визначення чисельності персоналу має вигляд:
знайти
при обмеженнях С(N) ≤ Сдоп , W(N) ≥ Wдоп , ρmin ≤ ρ (N) ≤ ρmax (2)
де N0 – оптимальна (раціональна) чисельність персоналу; W(N) – значення якості виконання функцій; Wдоп – допустиме значення якості виконання функцій; ρ – завантаження персоналу; ρmin, ρmax - допустимі значення тимчасового завантаження, що визначає умови роботи персоналу; Сдоп – допустиме значення вартості утримання персоналу.
Розроблено графічний метод рішення задачі, що включає виконання наступних етапів:
- Будуються графіки залежностей C(N), W(N), ρ(N) у границях зміни аргументу Nmin≤ N≤ Nmax на основі експериментальних даних і експертного опитування фахівців.
- Графічно відображається область, у якій виконується умова W(N) ≥ Wдоп.
- Графічно відображається область, у якій ρmin ≤ρ (N) ≤ ρmax .
- Визначається значення аргументу N1, при якому значення функції W(N1)≥Wдоп .
- Визначається значення аргументу N2, при якому ρ (N2) ≤ ρmax , а також N3, при якому ρ(N3)≤ρmin .

Рис. 1. Узагальнений алгоритм проектування організаційної структури (ОС)
- Визначається виконання умови N2≤N1≤N3 .
- Якщо зазначені умови виконуються, то раціональну чисельність можна вибирати в межах N1≤N0≤N3 .
- Розраховується вартість утримання персоналу C(N0), перевіряється виконання умови С(N0)≤Сдоп .
- У випадку невиконання останньої умови виробляється коректування значень Wдоп , ρmin , ρmax і процес рішення повторюється.
Задача розподілу функцій між виконавцями сформульована як задача цілочислового лінійного програмування:
знайти ; (3)
при обмеженнях (4)
де 
аij – ступінь близькості i-ї і j-ї задач, обумовлений експертами як “подібність” задач; 0 ≤ аij ≤ 1; Bi – обсяг трудовитрат на виконання i-ї функції; B(k) – допустимий обсяг трудовитрат k-го виконавця.
Задача інтерпретується як задача розрізування кінцевого орієнтованого зваженого графа G (Y, V), у якому вершинам множині Y ставляться у відповідність значення Bi, а множині дуг V – ступінь близькості i-ї і j-ї функцій. Рішення задачі складається в розрізуванні графа G на N0 підграфів <Gk>, , що задовольняють вимогам мінімуму цільової функції (3) при обмеженнях (4).
Для вирішення задачі розроблений евристичний алгоритм, основна ідея якого полягає в послідовному виділенні вершин для шуканих підграфів шляхом вибору базової вершини, що має найбільший локальний ступінь зв'язку, і “притягуванні” до неї вершин, найбільше всього зв'язаних з цією базовою вершиною. Для обмеження “обсягу” підграфів використовуються ваги вершин Bi.
Помилка результату рішення, отриманого за допомогою евристичного алгоритму в порівнянні з точним методом рішення задачі (3), (4), не перевищує 20-25%, що цілком відповідає точності вихідних даних. Однак пропонований евристичний алгоритм менш трудомісткий і значно більш наочний.
Заключним етапом організаційного проектування є синтез алгоритмів реалізації функцій виконавцями.
Формальна постановка задачі синтезу алгоритму полягає в знаходженні такого його варіанта, при якому час виконання алгоритму ТА мінімальний при допустимому рівні помилок РА, тобто
ТА → min при РА ≥ Рдоп , (5)
де Рдоп – мінімально допустима імовірність безпомилкового виконання алгоритму.
В основу побудови математичної моделі алгоритму покладений його опис у виді зваженого орієнтованого графа G.
Множина вершин графа V відповідає виконуваним операціям алгоритму, а множина ребер У – логічним переходам між операціями. Кожна i-а вершина має вагу Wi={mi, pi}, де mi – середній час виконання i-ї операції; pi - імовірність безпомилкового виконання i-ї операції.
Для розрахунку характеристик алгоритму ТА і РА були отримані основні наступні співвідношення, що дозволяють здійснювати еквівалентні перетворення зваженого графа:
1) об'єднання шляхів без розгалуження

; (6)
2) об'єднання шляхів з розгалуженнями
 
mе = m1 + γ m2 + ( 1 - γ ) m3 + m4;
pе = p1 p4 [ γ p2 + (1 - γ ) p3 ]; (7)
де γ - імовірність переходу;
3) перетворення контурів з одним виходом

(8)
4) перетворення контурів із двома виходами

(9)
Вибір оптимального варіанта алгоритму в постановці (5) здійснюється в такий спосіб. Генеруються можливі варіанти алгоритму. Для кожного варіанта за допомогою правил еквівалентного перетворення графа алгоритмів (6) – (9) розраховуються значення ТА, РА. Відкидаються варіанти реалізації алгоритму, для яких не виконується умова РА Рдоп. З варіантів, що залишилися, вибирається такий, у якого ТА→min.
У третьому розділі розглядається методика раціонального вибору технічних засобів, що забезпечують діяльність центру.
Формальна постановка задачі може бути описана в такий спосіб.
Існує множина варіантів технічних засобів . Кожний i-й варіант характеризується вектором технічних характеристик . Для кожного варіанта існує вектор показників якості . Будемо вважати, що серед показників є l кількісних , приведених до нормованого виду , і m-l якісних, представлених у виді функцій приналежності заданому рівню якості . Необхідно вибрати такий варіант технічних засобів, що забезпечить оптимальне (раціональне) значення векторного критерію , тобто
. (10)

У приведеній постановці задача відноситься до класу задач нечіткої багатокритеріальної оптимізації. Вибір методу рішення визначається тим, у якому виді представлена експертна інформація про перевагу показників або їхньої важливості (табл. 1).
Таблиця 1
При кількості показників більш двох застосування адитивного і мультиплікативного показників у нечіткій постановці задачі викликає значні обчислювальні труднощі. Тому як основні методи обрані максимінний (з урахуванням важливості показників і без урахування) і лексикографічний.
Розроблено методику обробки експертної інформації для визначення вагових коефіцієнтів показників і побудови функцій приналежності показників заданому рівню.
Проведено детальний аналіз літератури, що дозволив визначити основні фактори, що впливають на вибір методу оцінки вагових коефіцієнтів: фізична сутність показників і відносини між ними; складність проведення експертизи і трудомісткість одержання експертної інформації; ступінь погодженості думок експертів; трудомісткість обробки експертних даних.
З урахуванням зазначених факторів для визначення вагових коефіцієнтів обрано метод Сааті. У цьому методі вихідною експертною інформацією є результати попарного порівняння важливості показників, представлені у виді матриці ; .
Вагові коефіцієнти визначаються з рівняння Сааті
, (11)
де Е – одинична матриця; – вектор вагових коефіцієнтів.
Проведено детальний аналіз методів побудови функцій приналежності показників заданому рівню якості. Для побудови функцій приналежності обраний наближений метод Ротштейна.
Співвідношення для розрахунку функцій приналежності мають вигляд:
. (12)
Тут rl+1, …rn – ранги показників, обумовлені експертами.
Приведено приклад побудови функцій приналежності для трьох рівнів якості: низький, середній, високий.
Обґрунтовано систему показників якості технічних засобів центру, що включає показники ефективності, економічні, експлуатаційні і конструктивні показники.
На основі максимінного і лексикографічного методів рішення багатокритеріальних задач розроблені методика та алгоритми їхнього застосування для раціонального вибору технічних засобів центру.
Правила вибору раціонального варіанта i0 при максимінному методі мають вигляд:
при відсутності інформації про важливість показників
; (13)
при наявності інформації про важливість показників
, (14)
де λj – коефіцієнти важливості показників, отримані методом Сааті.
Розроблений алгоритм застосування лексикографічного методу, який включає виконання наступних операцій:
1°. Впорядкувати показники по важливості Q1>Q2>...>Qj>...>Qm; j= .
2°. При згоді особи, що приймає рішення (ОПР), для кожного показника назначається величина допустимої уступки ΔQj, j= , в межах якої розглянуті альтернативи приймаються “практично рівноцінними”.
3°. Для першого показника Q1 формується множина π1 “практично рівноцінних” альтернатив, які задовольняють умові
.
4°. Якщо множина π1 містить рівно один варіант, то він є найкращим. Якщо множина π1 містить більше однієї альтернативи, то переходимо до розгляду всіх варіантів множини π1 по показнику Q2.
5°. Для другого показника Q2 формується множина π2 варіантів з множини π1, які задовольняють умові
.
6°. Якщо множина π2 містить рівно один варіант, то він є найкращим; якщо більше одного, розглядаємо ці варіанти за умовою Q3.
7°. Якщо всі умови послідовно розглянуті і в результаті отримано π множин π = π×π×...×πn, які містять більше однієї альтернативи, то можна застосувати два підходи:
- зменшити величину допустимої уступки ΔQj, починаючи з першого по важливості показника та повторити всі кроки рішення;
- представити ОПР остаточний вибір кращого варіанта.
Приведено схему алгоритму роботи програмного забезпечення за лексикографічним методом.
У четвертому розділі надані результати організаційного і технічного проектування центру, а також оцінюється техніко-економічна ефективність його діяльності.
Патентна інформація в центрі представляється у вигляді електронних моделей даних патентних описів (ПО). Для обробки і видання патентних описів була розроблена схема технологічного процесу, яка наведена на рис. 2.
На основі застосування методики, описаної в розділі 2, обґрунтовано склад і функціональні обов'язки персоналу центру. Склад центру включає: начальника відділу, 2-3 диспетчерів патентів, 4-5 операторів, 3 редактори, техніка. Схема взаємодії виконавців у технологічному процесі обробки і видання ПО наведена на рис. 3.
Після попереднього розрахунку чисельності персоналу була проведена експериментальна оцінка якості роботи виконавців (середня кількість помилок, що припускаються) і середнє завантаження виконавців. Оцінка показала, що при запропонованій структурі та чисельності персоналу середня кількість помилок, які припускаються, не перевищує 2-3%, а часове завантаження виконавців знаходиться в межах 0,8-0,9, що цілком відповідає ергономічним вимогам, при цьому час виконання замовлень знаходиться у допустимих межах.
|