Інформаційне забезпечення видавничої діяльності

2.1. Інформаційні агрегати видавничої діяльності

Інформаційні агрегати видавничої діяльності являють собою засоби накопичення інформаційних ресурсів. Ключовими інформаційними агрегатами видавничої діяльності виступають електронні бібліотеки, інформаційні колекції та сховища даних.

Електронна бібліотека являє собою систему, яка забезпечує користувачам доступ зрозумілим для них способом до великих репозиторіїв мультимедійної інформації та знань, які організовані при відсутності будь-яких відомостей про способи їх застосування [1].

Поряд з розумінням електронної бібліотеки як інформаційної системи нового класу, існує й буквальна трактовка терміну «електронна бібліотека» як системи, яка забезпечує «електронізацію» традиційних бібліотечних технологій з поданням повнотекстових і/або мультимедійних електронних копій інформаційних ресурсів її користувачам [2].

У той же час не треба отожнювати електронні бібліотеки з сукупністю оцифрованих колекцій і інструментаріїв управління ними. Електронні бібліотеки слід розуміти більш широко: як середовище, що об’єднує інформаційні колекції, сервіси та людські ресурси для підтримки повного життєвого циклу створення, розповсюдження, використання та збереження інформації, даних і знань.

Електронні бібліотеки не обов’язково мають бути орієнтовані на глобальне співтовариство користувачів. Коло користувачів конкретної електронної бібліотеки визначається соціальною значущістю тих інформаційних ресурсів, які вона надає, можливістю та доцільністю їх використання у видавничій справі.

Інформаційні колекції являють собою систематизовану сукупність інформаційних ресурсів, які об’єднані за будь-яким критерієм приналежності, наприклад, за загальністю змісту, джерел, призначення, колом користувачів, способом доступу тощо [3].

Інформаційні колекції - найбільш поширена форма організації інформаційних ресурсів в електронних бібліотеках.

З функціональної точки зору інформаційні ресурси колекції поділяються на дані (інформація) та метадані (метаінформація).

Ресурси у вигляді даних (інформація) являють собою відомості які цікавлять користувачів цієї колекції, про предметну область інформаційної колекції.

Метадані кодекси характеризують властивості ресурсів інформаційної колекції як сутності реального світу.

Таке розділення інформаційних ресурсів колекцій є досить умовним. IP, які є метаданими відносно до деяких інших інформаційних ресурсів колекції або до колекції в цілому, в деяких випадках (коли предметна область розглядається користувачем на метарівні) відіграють роль даних.

Сховище даних являє собою агрегований інформаційний ресурс, що містить консолідовану інформацію з усієї проблемної області та використовується для підтримки прийняття рішень [4].

Консолідована інформація являє собою одержані з декількох джерел та системно інтегровані різнотипні інформаційні ресурси, які в сукупності наділені ознаками повноти, цілісності, несуперечності та складають адекватну інформаційну модель проблемної області з метою аналізу її опрацювання та ефективного використання у процесах підтримки прийняття рішень.

Основними характеристиками сховищ даних є такі [5].

■ Предметна орієнтація. Дані в сховищі зорієнтовані на бізнес-поняття, а не на бізнес-подїі.

■ Інтегрованість. Перш ніж потрапити до сховища оперативні дані перевіряють, очищують та певним чином агрегують.

■ Підтримка хронології. Дані в сховищі даних накопичуються у вигляді історичних пластів.

■ Незмінність. Дані у сховищі даних, на відміну від бази даних, не підлягають будь-яким змінам.

■ Мінімальна надлишковість. Не дивлячись на те, що інформація до сховища даних потрапляє від багатьох OLTP-систем, надлишковість інформації в сховищі даних зведено до мінімуму.

Сховище даних має такі особливості проектування та побудови [4]:

■ отримання інформації з різних джерел (у тому числі і з реляційних баз даних) у деталізованому та агрегованому вигляді (зберігаються результати застосування функцій агрегації - суми, середнього значення, максимуму, мінімуму тощо);

■ багатовимірне подання інформації: ігноруються деякі вимоги нормалізації (дотримують максимум третьої нормальної форми), що значно підвищує швидкість опрацювання інформації, оскільки зменшує кількість операцій з’єднання;

■ наявність метаданих для опису їх джерел та структури самого сховища - у базах даних також використовують словники для опису структур даних, а у сховищах метадані (словники, дані про дані) мають будуватися за класифікаційною схемою Захмана. За цією схемою описують об`єкти (що?), суб`єкти (хто?), місцезнаходження (де?), час (коли?), фактори впливу, чинники (чому?)> способи (як?);

■ наявність пакетного завантаження даних в сховище та їх вивантаження;

■ наявність процедур аналізу даних та отримання нових даних;

■ орієнтованість даних на аналітичне, а не на статичне опрацювання.

Розглянуті інформаційні об’єкти видавничої діяльності становлять технологічну основу вирішення основних задач інформаційного забезпечення видавничої діяльності.