Інформаційне забезпечення видавничої діяльності

Розділ 3. Семантичний аналіз документів на основі онтології предметної області

Основна ідея розділу

Розділ присвячено питанням опису інформації певної предметної області, семантичного аналізу інформаційних документів (рис. 7), дослідженню специфіки роботи з тезаурусом і автоматичного реферирування.

Ключові поняття розділу

Рис. 7. Ключові поняття розділу З

3.1. Тезауруси в описі інформації видавничої діяльності.

3.2. Аналіз документа як інформаційного об`єкта.

3.3. Автоматичне реферирування.

Цілі вивчення розділу

Метою розділу є: 1) розгляд інформації щодо використання тезаурусів у видавничій справі; 2) дослідження технологій аналізу документа як інформаційного об’єкта та автоматичне реферирування у видавничій діяльності.

Інформація, викладена в розділі, надає студенту можливість сформувати такі групи компетенцій:

1) аналітичні компетенції, пов’язані з аналізом загальних особливостей побудови тезаурусів;

2) управлінські компетенції, пов’язані з прийняттям рішень щодо процесу аналізу інформаційних документів;

3) технічні компетенції, пов`язані зі створенням тезаурусів для опису інформації видавничої справи; здійсненням автоматичного реферирування документів.

Вступ до розділу

Інформацію, що циркулює в системі видавничо-поліграфічного виробництва, має бути певним чином структуровано та систематизовано з метою ефективного пошуку даних, формування масивів релевантних відомостей, опису змістовних особливостей інформаційних об’єктів відповідної предметної області. На вхід системи інформаційного забезпечення видавництва найчастіше поступають «сирі» дані, які характеризуються хаотичністю, відсутністю адекватного розподілу для вирішення локальних завдань видавничої справи. Систематизація інформаційних потоків стає можливою завдяки методиці семантичного аналізу Документів на основі онтології предметної області.

Практика семантичного аналізу документів передбачає формування відповідного набору термінів предметної області, пов’язаних один з одним змістовними зв’язками; створення адекватного контенту інформаційних об’єктів і їх сегментацію; здійснення автоматичного реферирування документів. Вказані аспекти дозволяють структурувати та оптимізовувати потоки інформації в системі інформаційного забезпечення видавничої діяльності.