Пов’язані дані: основа організації семантичних бібліотечних веб-ресурсів

ЗаявникЛобузіна Катерина Вілентіївна (Україна)
ФорумМіжнародна наукова конференція "Бібліотека.Наука.Комунікація"
ЗахідСекція 5. Електронні інформаційні ресурси наукової бібліотеки в сучасному веб-середовищі
Назва доповідіПов’язані дані: основа організації семантичних бібліотечних веб-ресурсів
Інформація про співдоповідачів
Презентаціяне завантажено
СтаттяЗавантажити статтю


Тези доповіді

ПОВ’ЯЗАНІ ДАНІ: ОСНОВА ОРГАНІЗАЦІЇ СЕМАНТИЧНИХ БІБЛІОТЕЧНИХ ВЕБ-РЕСУРСІВ

LINKED DATA: THE BASIS OF THE ORGANIZATION OF SEMANTIC LIBRARY WEB RESOURCES


Користувачі інтернет-ресурсів мають різні психологічні, освітні та соціальні навички та способи роботи з інформаційними ресурсами, що висуває підвищені вимоги до користувацького інтерфейсу бібліотечних пошукових веб-сервісів. Сучасні користувачі надають перевагу пошуку інформації засобами пошукових систем Інтернету. Пошук за допомогою бібліотечних електронних каталогів виявляється набагато менш зручним та складнішим. Для того щоб зробити бібліотечні інформаційні ресурси привабливими та зручними в користуванні, наблизити їх до функціональності інтернет-пошуку, покращити їх видимість у веб-середовищі сучасні бібліотеки впроваджують низку заходів, пов’язаних з розвитком методів управління знаннями (Knowledge Management) та концепції Веб 3.0 (Semantic Web) – Семантичного Вебу [3].
Підхід до створення користувацького інтерфейсу на основі впровадження певної системи організації знань, особливо важливий для наукових інформаційних ресурсів, бо створює передумови для проведення наукового пошуку джерел та ресурсів з дослідницькою метою. Проведена американськими вченими з Університету Колорадо робота з визначення потреб науковців в організації доступу до інформаційних джерел (особливо, першоджерел) засвідчила необхідність зазначення для документів не лише бібліографічних даних, а й певного тематичного, географічного, персонального та хронологічного контексту. Контекстуалізація даних про документ може також включати інформацію про мову, орфографію, пов’язані документи, відповідальні інституції та історичні умови [8].
Перспективною технологією організації доступності та зв’язків фактографічних даних у веб-середовищі сьогодні є впровадження одної з ключових технологій Семантичного Вебу – принципів пов’язаних даних (Linked Data) [7]. Технологія пов’язаних даних надає такі переваги: (1) агрегування даних з розподілених онлайн першоджерел, (2) створення нових зв'язків між ними і візуалізування їх, (3) збагачення даних за допомогою посилань на зовнішні ресурси, такі як WikiData. Отже, не лише інформаційні джерела, а й самі дані та їх семантичні зв’язки стали сьогодні важливим елементом інфраструктури знань веб-середовища. Проект ВікіДаних (WikiData) https://www.wikidata.org/ – призначений для подання структурованих даних, що містяться у матеріалах Вікіпедії. Практично він виконує функцію авторитетного контролю, традиційну для бібліотечних каталогів. Кожна стаття ВікіДаних містить унікальний ідентифікатор, заголовок та синоніми заголовка, зображення із WikiMedia, посилання до пов’язаних понять та статей Вікіпедії, варіанти подання поняття в Вікіпедіях різними мовами. Дані з централізованого сховища можуть вільно використовуватись різними вікі-проектами, сьогодні вони також впроваджені для виведення інформаційних панелей Вікіпедії під час Google-пошуку. Основу для створення списку статей ВікіДаних становить англомовна версія Вікіпедії. Так стаття про Національну бібліотеку України імені В. І. Вернадського (https://www.wikidata.org/wiki/Q592734) має ідентифікатор Q592734, англомовний заголовок Vernadsky National Library of Ukraine, можна також виявити інформацію про наявність статті про НБУВ у Вкіпедіях 15 різними мовами (англійською, вірменською, астурійською, варайською (Філіпіни), іспанською, китайською, корейською, малаяламскою (Індія), німецькою, португальською, російською, турецькою, українською, фінською, французською). Цікавим є той факт, що у польській Вікіпедії стаття про НБУВ відсутня, згадується лише Biblioteka Narodowa Ukrainy noszą imię Władimira Wiernadskiego в статті про Володимира Вернадського (Władimir Wiernadski).
База даних ВікіДані надає також можливість вільно використовувати структуровані дані у власних веб-проектах, зокрема, бібліотечних. Технологія пов’язаних даних була також використана під час створення міжнародного бібліотечного сервісу VIAF – Віртуальний міжнародний авторитетний файл (Virtual International Authority File). Зокрема, статті ВікіДаних містять ідентифікатори та посилання до різних сервісів авторитетного контролю VIAF, ISNI, авторитетний файл Бібліотеки Конгресу США, предметні рубрики Національної бібліотеки Франції, авторитетний файл Бібліотеки Ватікану тощо. Все це дає змогу перейти до пошуку відповідних інформаційних джерел у бібліотеках та агрегованих бібліотечних ресурсах таких як World Cat.
Сучасні бібліотеки активно включаються в процес створення структурованих веб-даних, який є частиню руху «Відкритих Даних» (Open Data) – глобальної ініціативи щодо надання доступу до публічних даних з метою їх подальшого вільного використання та поширення. Будь-яка особа може їх вільно копіювати, публікувати, поширювати, використовувати, зокрема в комерційних цілях, у поєднанні з іншою інформацією або шляхом включення до складу власного продукту з обов’язковим посиланням на джерело їх отримання. Умовою будь-якого подальшого використання відкритих даних є обов’язкове посилання на джерело інформації. У 2016 році Україна взяла на себе зобов’язання виконувати принципи Хартії відкритих даних [6].
Серед бібліотечних проектів відкритих даних слід відзначити проект Національної бібліотеки Франції (НБФ) data.bnf.fr (http://data.bnf.fr/), метою якого є: зробити бібліотечні дані більш видимими в Інтернеті, об'єднати бібліотечні дані, як в каталогах, так і поза ними; сприяти створенню зв'язків між структурованими та довіреними веб-ресурсами, забезпечити повторне використання метаданих (під відкритою ліцензією) третьою стороною. До важливих бібліотечних даних відносяться назви творів, персоналії та організації. Сторінки структурованих даних наділяють певне зафіксоване поняття ідентифікатором, збирають доступну інформацію про нього з різних довідкових веб-джерелах, забезпечують користувачу зручний перехід до відповідних інформаційних джерел із фондів НБФ (цифрова бібліотека Gallika, генеральний електронний каталог, каталог архівних та рукописних документів) та зовнішніх бібліотечних та інформаціних проектів WorldCat, Europeana, Wikipedia. Такі сторінки даних гарно індексуються пошуковими роботами і з’являються у перших рядках відповідей на інформаційний запит, що значно покращує видимість і доступність бібліотечних ресурсів в Інтернеті. Між даними НБФ та Вікіданими забезпечено зв’язок, що дає змогу актуалізувати та поповнювати бібліотечні дані, зокрема, із Вікіпедії автоматично виводяться зображення та стислі анотації для відповідних даних НБФ [5]. НБУВ представлена на data.bnf.fr статею Bibliothèque nationale V. I. Vernadsky d'Ukraine, з якої можна отримати інформацію про те, що бібліотека знаходиться в Україні, заснована в 1918 р., у фонді є п’ять видань національної бібліографії, виданих НБУВ, є відповідний запис у VIAF.
Ці сучасні підходи організації доступу до бібліотечних інформаційних ресурсів спонукали ініціювати в Національній бібліотеці України імені В. І. Вернадського впровадження структурованих пов’язаних даних в межах двох інформаційних проектів: «Наука України: доступ до знань» та електронна бібліотека «Україніка».
Портал «Наука України: доступ до знань» містить структуровані дані про наукові установи, наукові бібліотеки та їх ресурси, науковців України. Авторські пошукові профілі використовуються для виявлення бібліографічної інформації в різних наукових інформаційних ресурсах НБУВ: електронному каталозі, електронній бібліотеці «Наукова періодика України», реферативній базі даних, користувач також інформується про наявність відповідних творів в електронній бібліотеці «Україніка», архівному та рукописному фонді НБУВ. Забезпечена можливість пошуку колег за науковою спеціальністю та співавторів творів. Сторінка авторського пошукового профілю має унікальний ідентифікатор та посилання до авторських сторінок в інших інформаційних системах (ORCID, Google Scolar, ResearcherID, Scopus, Wikipedia тощо) [4].
Електронну бібліотеку «Україніка» супроводжує унікальний довідковий апарат структурованих пов’язаних даних, що відносяться до інформаційного поля знань про Україну. Кожна сторінка даних містить унікальний ідентифікатор, заголовок, інформаційне зображення, категорію, варіанти написання заголовка, інформацію про пов’язані дані, гіперпосилання до довідкових інтернет-ресурсів. Для кожної довідки автоматично з’являється інформація про наявність відповідних творів в електронній бібліотеці, для кожного твору – інформація про наявні довідкові ресурси. Для автора-науковця наводиться посилання до його авторського профілю на порталі «Наука України: доступ до знань» [2].
Впровадження системи структурованих пов’язаних даних до ключових пошукових сервісів НБУВ забезпечує поступову розбудову онтологічної бази знань про Україну та її науку, удосконалює доступ до національних та наукових ресурсів НБУВ, сприяє видимості електронних ресурсів НБУВ пошуковими системами Інтернету. Паралельно з розвитком довідкового апарату пов’язаних даних в НБУВ також проводяться роботи із створення національних авторитетних файлів осіб та установ. Авторитетні файли супроводжує інформація про наявні ідентифікатори відповідних даних в інших міжнародних системах авторитетного нормативного контролю: WorldCat, ISNI, VIAF, WikiData [1]. Всі ці роботи мають забезпечити активне входження інформаційних ресурсів НБУВ в систему семантичного пошуку сучасного веб-середовища.

Список літератури:

1. Авторитетний файл імен осіб [електронний ресурс]. Національна бібліотека України імені В. І. Вернадського – URL: http://www.irbis-nbuv.gov.ua/cgi-bin/irbis_nbuv/cgiirbis_64.exe?c21com=f&i21dbn=athec&p21dbn=athec
2. Електронна бібліотека «Україніка» [електронний ресурс]. Національна бібліотека України імені В. І. Вернадського – URL: http://irbis-nbuv.gov.ua/cgi-bin/ua/elib.exe?c21com=f&i21dbn=nav&p21dbn=ukrlib
3. Лобузіна К. В. (2012) Бібліотека 3.0: знання, сховища даних, експерти / К. В. Лобузіна. Бібліотекознавство. Документознавство. Інформологія, 1, 26–35. – http://nbuv.gov.ua/UJRN/bdi_2012_1_7
4. Наука України: доступ до знань [електронний ресурс]. Національна бібліотека України імені В. І. Вернадського – URL: http://irbis-nbuv.gov.ua/cgi-bin/suak/corp.exe?c21com=f&i21dbn=saua&p21dbn=saua
5. Bermes E., Boulet V., Leclaire C. Améliorer l’accès aux données des bibliothèques sur le web : l’exemple de data.bnf.fr. IFLA World Library and Information Congress, 2016. URL: http://library.ifla.org/1447/1/081-bermes-fr.pdf .
6. G8 Open Data Charter [electronic resource]. – URL: https://opendatacharter.net/g8-open-data-charter/
7. Heath T., Bizer C. (2011). Linked data: Evolving the web into a global data space. Synthesis lectures on the semantic web: theory and technology, 1(1), 1-136. – URL: http://linkeddatabook.com/editions/1.0/#htoc8
8. Lindquist T., Long H. (2011) How Can Educational Technology Facilitate Student Engagement with Online Primary Sources?: A User Needs Assessment. Library Hi Tech, 29(2), 224-241.
УДК 025:004