Використання онтологій в організації електронних бібліотечних інформаційних ресурсів наукової бібліотеки

ЗаявникПеренесієнко Ігор Петрович (Україна)
ФорумМіжнародна наукова конференція «Бібліотека. Наука. Комунікація: формування національного інформаційного простору»
ЗахідСекція 4. Інтеграція національних наукових ресурсів та інтелектуальний доступ до інформації
Назва доповідіВикористання онтологій в організації електронних бібліотечних інформаційних ресурсів наукової бібліотеки
Інформація про співдоповідачів
Презентаціяне завантажено
Статтяне завантажено


Тези доповіді

Масштаби збільшення обсягів інформації на сьогодні і простота доступу до неї, як не парадоксально, ускладнюють пошук для користувача. Кількість у даному випадку не завжди переростає у якість – позбавлені організації ресурси в веб-мережі перетворюються на хаотичний масив документів. Виникає протиріччя між одночасною легкодоступністю та відсутністю експертної оцінки інформації, що призводить до її неякісності та недостовірності [1, c.2]. В таких умовах бібліотеки виступають своєрідним когнітивним фільтром між інформацією та читачем, тож їхня діяльність, природно, залежить від ступеня інтегрованості власних виробничих процесів у веб-середовище. Необхідність цього наразі вже навіть не є питанням дискусій чи полеміки – це вимога, головна умова існування бібліотек на сьогодні. Створення ж та представлення електронних бібліотечних ресурсів в свою чергу безпосередньо залежить від використання онтологій.
Провідний фахівець з онтологічного інжинірингу сучасності Грубер Т. термінологічно визначає онтологію специфікацією концептуалізації [6]. На думку дослідника вона становить собою сукупність об’єктів і концепцій, що взаємопов’язано існують у певній предметній області. Соловйов В.Д. трактує твердження Губера Т. як окреслення під концептуалізацією певної структури реальності незалежної від словника предметної області [5, с.9].
Бібліотеки традиційно оперують ґрунтовними схемами класифікації та правилами каталогізації. Проте в сучасних умовах вони не самодостатні, потребують представлення у придатному для машинної обробки вигляді, що пояснює популярність звернення до онтологій. Оскільки система використовуваних понять обмежена предметною областю і обсяги даних не зпівставні з наявними у веб-мережі, побудова максимально структурованої онтології є більш реальною. Важливо, що використання єдиної онтології верхнього рівня чи навіть онтології предметної області сприятиме інтеграції даних [5, c.36].
Дослідники відзначають – удосконалення онтологій безперервний процес. Це пов’язано з постійним розвитком людського знання і потребою актуалізації предметних областей котрі його розкривають. В першу чергу йдеться про необхідність уникнення появи лакун – жодна з предметних підобластей не повинна залишитися поза системою предметних рубрик яка використовується бібліотекою. Найханова Л.В. стверджує – повну систему знань створити складно, тому онтології повинні орієнтуватися на конкретні, часом досить обмежені практичні завдання [4, с.454]. Таким чином, існує проблема створення онтологій конкретної предметної області, що витікає з поставлених перед бібліотекою цілей і очікуваних в подальшому результатів.
Онтологічні підходи були застосовані до організації тематичних електронних бібліотечних ресурсів електронної бібліотеки «Україніка» у НБУВ. Даний ресурс кумулює повнотекстові документи з питань українознавства – історії, літератури, мовознавства, географії тощо. Для структурованого подання інформації було проведено певне узагальнення предметної області (у даному випадку українознавства), що забезпечує, управління, представлення, розкриття та пошук інформації в межах всієї БД.
Онтологія предметних областей побудована у вигляді термінологічного апарату. В середині розділів одиниці тезаурусу пов’язуються ієрархічними та неієрархічними зв’язками. Таким чином будується система організації знань які в цілому, на думку Лобузіної К.В, призначені для організації пошуку інформації та обслуговування колекцій електронних документів, забезпечують можливість пошуку необхідних користувачеві інформаційних джерел навіть без попереднього знання про їх існування [2, c.63].
Так, в електронній бібліотеці «Україніка» за принципом тематичної зв’язності з документом виділяються важливі за змістом зв’язки (поняття, ознаки), відбувається формалізація галузі знання. Технологічно їх виділення виконується на двох етапах – на рівні бібліографічного опису видання (де вказуються автори, рецензенти, видавництва і т.д.) та на рівні опрацювання безпосередньо змісту документа для співвіднесення його з предметними рубриками та тематичним деревом знань [3].
Ієрархічні предметні зв’язки в обраній онтологічній структурі реалізовані на основі дерева знань з питань «Україніки», яке забезпечує зазначення приналежності документа до певного узагальненого розділу знань. Для уточнення та деталізації предметного образу документа використовується система неієрархічних змістових зв’язків на основі предметних рубрик. Паралельне використання цих двох способів організації знань забезпечує користувачу можливість формування як загальних пошукових запитів, так і проведення більш детального пошуку конкретних понять.
Предметні рубрики призначені для закріплення у першу чергу синонімічних та асоціативних зв’язків понять предметної галузі. Виявлені зв’язки закріплюються в предметних рубриках, котрим відповідають довідкові записи (фрейми). Кожна довідка має однакові поля : «Заголовок», «Різночитання», «Пов’язані заголовки», «Коментар», «Дати», «Категорія», «Тип об’єкта», «Код мови», «Гіперспосилання», які заповнюються відповідно до виявлених змістових зв’язків та знайдених інформаційних джерел. Структурно, кожна така довідка становить собою сукупність полів, що містять формалізовану інформацію про приналежність поняття до певної категорії об’єктів предметної галузі, їх лінгвістичні та міжпредметні зв’язки. Система взаємопов’язаних фреймів-довідок створює семантичну мережу зв’язків об’єктів онтології, яка забезпечує користувачу зручний інтуїтивнозрозумілий механізм пошуку необхідних інформаційних джерел.
Розглянемо розкриття змісту одного окремо взятого документу та шляхи його інтеграції в загальну онтологічну систему – «Бойко Юрій. Творчість Тараса Шевченка на тлі західньоевропейської літератури / Юрій Бойко; Укр. Вільний Ун-т. – Мюнхен, 1956. – 79 c.». Запис про відповідний документ в електронній бібліотеці «Україніка» окрім бібліографічного опису книги містить посилання до таких предметних рубрик: «Бойко Юрій Гаврилович», «Шевченко Тарас Григорович», «Український Вільний Університет». Кількість предметних рубрик для різних документів може різнитися, в залежності від кількості авторів (рецензентів, редакторів), змісту видання, кількості установ причетних до видання. З їхньою допомогою інформаційний пошук можна продовжувати – кожна з них надає доступ до документів об’єднаних у цій предметній рубриці. Наприклад, в предметній рубриці «Бойко Юрій Гаврилович» у полі «Бібліотека» відображаються наявні в БД праці цього ж автора; «Шевченко Тарас Григорович» –документи пов’язані з Т.Г. Шевченком ; «Український Вільний Університет» – документи про УВУ в Мюнхені.
Кожна предметна рубрика містить розділ «Бібліотека» де відображаються співвіднесені з нею документи електронної бібліотеки. Таким чином, по суті, формується інформаційо-пошукова система, яка : а) забезпечує читачеві доступ до повнотекстового документу; б) є наслідком попереднього опрацювання фахівцями інформаційного масиву, тож репрезентує добірку документів, котрі попередньо пройшли експертну оцінку; в) надає можливість читачеві корегувати початковий інформаційний запит шляхом обмеження певним розділом знань або переходом до семантичної мережі предметних рубрик (довідок).
В електронній бібліотеці «Україніка» виходячи з відношення змісту документа, до теми предметної рубрики застосовується диференціація в межах підзаголовків поля «Бібліотека». Так підзаголовок «Твори» використовується якщо у довідці йдеться про автора документа, «Джерела» – у випадках коли мова йде про предметну область документа (наприклад про історичну подію, установу чи біографічні факти з життя особи), «Видання» – якщо конкретна установа котрій відповідає предметна рубрика причетна до публікації документа.
Гіпотетично, можуть створюватися довідки без поля «Бібліотека», тобто предметна рубрика по факту не матиме віднесених до неї за змістом документів. У такому разі вони повинні містити у собі комплекс посилань на інші довідки, ієрархічно підпорядкуванні їй за логікою онтологічних зв’язків. Наприклад, предметна рубрика «Літературні об’єднання України» може не містити переліку документів, але матиме посилання на вже існуючі в БД предметні рубрики : «ВАПЛІТЕ», «Горно», «Плуг» і т.д. Логіка при цьому наступна – читачеві простіше вести концентрований пошук поетапно в межах кількох компактних предметних рубрик, ніж відразу в одній з величезним списком віднесених до неї за змістом документів.
Таким чином можна стверджувати – питання онтологій на сьогодні актуальне і широко досліджуване. В умовах необхідності входження бібліотек у конкурентне веб-середовище розробка та впровадження онтологій є однією з базових умов якісного представлення власного інформаційного продукту. На прикладі роботи з бази даних електронної бібліотеки «Україніка» ми можемо побачити модель побудови онтології для вирішення цих завдань. Це багатоаспектний та складний процес, проте він вкрай необхідний для сучасного читача, адже сприяє результативності його інформаційного пошуку.
Список використаної літератури
1. Лобузіна К. В. Створення інтегрованого бібліотечного простору: основні проблеми та шляхи вирішення / К.В. Лобузіна // Бібліотекознавство. Документознавство. Інформологія. – 2012. – № 2. – С. 34 – 40.
2. Лобузіна К. Технології організації знаннєвих ресурсів у бібліотечно-інформаційній діяльності : монографія / К. Лобузіна ; відп. ред. О.С. Онищенко ; НАН України, Нац. б-ка України ім. В.І. Вернадського. – К., 2012. – 252 с.
3. Лобузіна К. В. Фундаментальна електронна бібліотека «Україніка»: технологічна організація та основні принципи управління інформаційними ресурсами [Електронний ресурс] / К. Лобузіна // Бібліотека. Наука. Комунікація : матеріали міжнар. наук. конф. (Київ, 6-8.10.2015 р.). – 2015. – Режим доступу: http://conference.nbuv.gov.ua/report/view/id/656.
4. Найханова Л.В. Основные аспекты построения онтологий верхнего уровня и предметной области // «Интернет-порталы : содержание и технологии». Выпуск 3. / Л.В.Найханова // Редкол.: А.Н. Тихонов (пред.) и др.; ФГУ ГНИИ ИТТ «Информика». – М.: Просвещение, 2005. – С. 452 – 479.
5. Соловьев В.Д. Онтологии и тезаурусы / В.Д. Соловьев, В.И. Добров, В.В. Иванов, Н.В. Лукашевич // – Казань, Москва, 2006 – 156 с.
6. Gruber T. Ontology [Electronic resource] / T. Gruber. – Access mode : http://tomgruber.org/writing/ontology-definition-2007.htm. – The name of the screen.