logo
МІНІСТЕРСТВО ОСВІТИ І НАУКИ

4.3. Основні поняття й розробка класифікаторів інформації.

Методи організації і пошуку економічної інформації в умовах її автоматизованої обробки потребують попередньої класифікації і кодування.

Класифікація – обов’язковий етап попередньої підготовки економічних даних до автоматизованої обробки, а також передумова раціо­нальної організації інформаційної бази і моделювання інформаційних процесів. ЇЇ можна схарактеризувати як складову інформаційного забезпечення будь-якої інформаційної системи, яка належить до мовних засобів управління. Тому класифікація – поділ множини об’єктів на підмножини за їх подібністю або відмінністю згідно з прийнятими методами класифікації – і є основою для кодування інформації і наступного її пошуку за допомогою обчислювальної техніки.

Під класифікацією інформації розуміємо не лише інформацію, яка є у масивах і повідомленнях, а й класифікацію безпосередньо інформаційних повідомлень (документів) і масивів.

Система класифікації є сукупність методів і правил класифікації та її результат.

Об’єкт класифікації – елемент класифікаційної множини (предмети, поняття, властивості тощо).

Ознака (критерій) класифікації – властивість чи характеристика об’єкта, за яким здійснюється класифікація. Кількісні та якісні вирази ознаки класифікації є її значенням.

Класифікаційне групування – підмножина об’єктів, які отримані в результаті класифікації.

Ієрархічна система класифікації інформації.

Ієрархічна система будується на основі багаторівневих відносин. Об'єкт

що класифікується може потрапити тільки в одну класифікаційну групу. Вони послідовно діляться по тому самому підставі розподілу.

Результатом ієрархічної класифікації може бути наочно відбиті деревоподібні структури. Отже ієрархічна система має чітку, заздалегідь структури, що задається, що не дозволяє здійснювати класифікацію об'єктів по непередбачуваних класифікаційних ознаках.

Така твердість досить утрудняє виконання ієрархічних систем класифікації й не можна передбачити резервну ємність класифікаційних угруповань усередині кожної системи й надлишкову глибину класифікації.

Багатоаспектна система класифікації інформації.

Багатоаспектна система передбачає розподіл об'єктів класифікації по декільком ознакам, причому найчастіше вони є незалежними. При такій системі кожний об'єкт може бути віднесений до незалежних різних класифікаційних угруповань, наявність яких визначається припустимою комбінацією ознак класифікації з їхнього заданого набору.

Алфавітно-предметна система класифікації інформації.

Алфавітно-предметна класифікація системних класів, кожний з яких відповідає одному виду предметів або факторів, і, розташованих за абеткою, їх імен.

Дескрипторна система класифікації інформації.

Дескрипторна система - базується на виконанні координатного або асоціативного методу (використання) індексована інформації. Цей метод передбачає опис класифікаційних об'єктів за допомогою спеціальної мови, до складу яких входять дескриптори, тобто семантичні конструкції, що відображають нормалізовані ключові слова або фрази однозначного ідентифікуючі класифікаційні ознаки.

Фасетна система класифікації інформації.

Фасетна система — припускає використання паралельних фасеток, тобто деякий набір ознак класифікації. Ознаки усередині фасеток можуть мати ієрархічну структуру.

Порядок проходження фасеток для конкретних кодованих систем задається структурною формулою кодування й визначається умовами конкретних завдань, для розв'язку яких здійснюється кодування інформації.

Слід зазначити, що фасетна система кодування зручна для складної логічної обробки інформації, однак їй властиве ті ж вимоги надмірності, що й ієрархічній системі.

Важливо мати через, що вибір системи кодування, якщо не регламентується відповідними нормативними документами, те повинен визначатися наступними вимогами:

- необхідністю обліку міжкласифікаційных зв'язків;

- вимогами простоти розробки й впровадження системи кодування, використовуваною проектованою інформаційною системою;

- можливостями побудови ефективних систем кодування.

Ієрархічний метод класифікації – послідовний поділ множини об’єктів на підлеглі класифікаційні групування.

Множину, яка класифікується, поділяють на підпорядковані підмножини спочатку за деякою ознакою (основою поділу) на великі групування, потім кожну з них – на ряд наступних групувань, які в свою чергу поділяють на дрібніші, поступово конкретизуючи об’єкт класифікації. Між цими угруповуваннями встановлюються відношення підпорядкованості (ієрархії).

Ієрархічна класифікація характеризується кількістю ступенів класифікації, глибиною, обсягом і гнучкістю.

Сукупність класифікаційних групувань є ступенем класифікації.

Кількість ступенів класифікації визначає глибину класифікації, яку встановлюють залежно від ступеня конкретизації групування і кількості ознак, необхідних для розв’язання конкретних задач.

Від глибини класифікації й кількості групувань, які створюються на кожному ступені класифікації, залежить обсяг класифікації.

Як правило, найбільша кількість групувань, на яку може поділятися дане групування, що встановлюється постійним для всієї класифікації чи для даного ступеня, звичайно є кратною десяти.

Переваги: логічність побудови, чіткість виділення ознак, великий інформаційний обсяг, традиційність і звичність використання, добра пристосованість для ручної обробки інформації, можливість створення мнемонічних кодів, які несуть смислове навантаження.

Недоліки: жорстка структура, зумовлена фіксованістю ознак і заздалегідь встановленим порядком їх проходження, які не допускають включення за відсутності резервного обсягу нових об’єктів, класифікаційних групувань і ознак; неможливість групувати за будь-якою, наперед не заданою ознакою; для стабільності класифікаторів потрібні великі резервні обсяги.

Фасетний метод класифікації – паралельний поділ множини об’єктів на незалежні класифікаційні групування.

При цьому множина об’єктів, що характеризується деяким набором однакових для всіх об’єктів ознак (фасет), значення яких відповідають конкретним виразам зазначених ознак, може поділятися багаторазово і незалежно. У класифікаторах фасети найчастіше розміщуються простим переліком і мають свій код.

Класифікаційні групування створюються з об’єктів, які мають конкретні комбінації ознак, взяті з відповідних фасет. Послідовність розміщення фасет при створенні класифікаційного групування задається фасетною формулою

.

У кожному окремому випадку фасетна формула визначається залежно від характеру розв’язуваних задач і алгоритму обробки даних. Можуть створюватись одночасно різні незалежні підмножини класифікаційних групувань:

,

,

,

.

Обсяг залежить від кількості фасет і кількості конкретних значень ознак у фасеті. Фасети у створюваному класифікаторі мають строго фіксоване місце. Їх ідентифікують за кодовим позначенням фасета, найчастіше це його порядковий номер.

Переваги: гнучкість структури, яка може пристосовуватися до змін у задачах; можна включати нові фасети чи видаляти старі.

Недоліки: недостатньо повне використання обсягу через відсутність практично багатьох із можливих комбінацій фасет; нетрадиційність і незвичність при використанні для ручної обробки даних.

Вибраний метод класифікації має задовольняти такі вимоги.

1. Мати достатній обсяг і необхідну повноту, які б гарантували охоплення всіх об’єктів класифікації в заданих межах.

2. Не перетинати груп об’єктів, які виділяються.

3. Мати достатню та економічно обгрунтовану глибину.

4. Мати гнучкість і надмірність для можливого збільшення множини об’єктів, які класифікуються.

5. Забезпечувати розв’язання всього комплексу задач.

6. Забезпечувати сполучення з іншими класифікаціями однорідних об’єктів.

7. Бути погодженим з алгоритмами і забезпечувати найбільшу ефективність обробки.

8. Забезпечувати простоту і автоматизацію процесу ведення класифікатора.

9. Лаконічність, чіткість і ясність класифікаційних ознак.

Для інформаційної сумісності різних систем потрібно використовувати однакові класифікатори. Класифікатор – це офіційний документ, який являє собою систематизований перелік найменувань і кодів класифікаційних групувань і (чи) об’єктів класифікації.

Позиція – найменування і код класифікаційного групування і (чи) об’єкта класифікації.

Місткість класифікатора – найбільша кількість позицій, які може мати класифікатор.

Резервна місткість класифікатора – кількість вільних позицій у класифікаторі.

Класифікатори можуть бути: державні (затверджені Держстандартом для використання в ІС різних міністерств і відомств); галузеві (введені в установленому порядку для використання в ІС даної галузі); підприємств (уведений в установленому порядку для використання в ІС цього підприємства).

Для цього створено Єдину систему класифікації і кодування техніко-економічної інформації (ЄСКК).

Єдина система класифікації і кодування техніко-економічної інформації є частиною інформаційного забезпечення системи і становить сукупність взаємопов’язаних державних класифікаторів техніко-економічної інформації, системи ведення і керівних нормативних документів за їх розробки, впровадження, ведення, вдосконалення й контролю за впровадженням.

Створенням ЄСКК керує Держстандарт України.

ЄСКК містить понад 20 класифікаторів, які можемо поділити на 4 групи:

1) класифікатори інформації про трудові та природні ресурси, професії робітників і посади службовців за категоріями, спеціальностями, освітою і т.п.;

2) класифікатори інформації про продукти праці, виробничу діяльність та послуги, промислову та іншу продукцію, роботи й послуги в різних галузях;

3) класифікатори інформації про структуру народного господарства і адміністративний поділ, підприємства, організації, галузі народного господарства і т.п.;

4) класифікатори управлінської інформації і документації, позначення одиниць вимірювання, техніко-економічних показників, стандартів тощо.

Процес створення класифікаторів економічної інформації можемо розглядати як сукупність організаційних, технічних і економічних заходів. Методика створення складається з чотирьох етапів.

1-й етап – на основі матеріалів обстеження об’єкта і технічного завдання розроблюють перелік необхідних класифікаторів.

2-й етап – на основі переліку необхідних класифікаторів, методичних матеріалів, вимог системи користувача і загальних параметрів створення інформаційної бази будують систему класифікації і кодування. При цьому:

1. Визначають найбільш суттєві ознаки, за якими систематизуються інформаційні сукупності в конкретному класифікаторі.

2. Визначають значність об`єктів, які будуть кодуватися.

3. Обирають метод класифікації і систематизують інформацію в класифікаторі.

4. Обирають метод кодування, розроблюють структуру коду і надають коди кожній позиції номенклатури.

5. Загальний перелік номенклатур оформлюють у вигляді класифікаторів, у яких розміщують коротку інструкцію про порядок застосування кодів.

6. Розроблені класифікатори погоджують і затверджують у замовника і призначають підрозділи і осіб, відповідальних за ведення класифікатора.

Закінчують розробкою опису класифікатора і технічного завдання на класифікатор.

3-й етап – на основі опису класифікатора, технічного завдання на його створення, опису програмної системи чи документації на ППП розроблюють чи прив’язують ППП. На виході етапу маємо технологічну документацію на створення і ведення класифікатора, ППП.

4-й етап – на основі технологічної документації, ППП і матеріалів обстеження об’єкта створюють класифікатор у пам’яті ЕОМ, який роздруковується і передається відповідним підрозділам для користування.

Також розроблюється технологія ведення класифікаторів, де потрібно вирішити питання внесення нових записів, корекція старих, при необхідності видалення окремих записів а при необхідності збереження старих записів (ведення бази даних з історією).