Інтелектуальні технології організації електронних реферативних ресурсів

ЗаявникГарагуля Сергій Сергійович (Україна)
ФорумМіжнародна наукова конференція «Бібліотека. Наука. комунікація: актуальні тенденції у цифрову епоху» (2019)
ЗахідСекція 3. Наукові бібліотеки в дослідницькій інфраструктурі України
Назва доповідіІнтелектуальні технології організації електронних реферативних ресурсів
Інформація про співдоповідачів
Презентаціяне завантажено
СтаттяЗавантажити статтю


Тези доповіді

УДК 025.5:004.65
Гарагуля Сергій Сергійович,
кандидат наук із соціальних комунікацій,
в. о. зав. відділу наукового формування
національних реферативних ресурсів,
Національна бібліотека України імені В. І. Вернадського,
Київ, Україна
ORCID: https://orcid.org/0000-0002-5564-9494

ІНТЕЛЕКТУАЛЬНІ ТЕХНОЛОГІЇ ОРГАНІЗАЦІЇ ЕЛЕКТРОННИХ РЕФЕРАТИВНИХ РЕСУРСІВ

Розглянуто специфіку організації реферативної інформації у веб-середовищі. Проаналізовано широкий спектр інтелектуальних засобів організації електронних бібліотечних ресурсів. Виокремлено інструментарій, що максимально відповідає потребам опрацювання та репрезентації бібліотекою масиву реферативної інформації. Узагальнено досвід НБУВ із упровадження семантичних бібліотечних технологій. Наведено методичні рекомендації щодо імплементації реферативними сервісами новітніх інтелектуальних веб-технологій.
Ключові слова: бібліотечні онтології, інтелектуальних аналіз даних, метадані, парсинг даних, пов`язані дані, реферативні ресурси, семантичний веб, управління знаннями.

Формування науковою бібліотекою масиву реферативної інформації є одним із ключових засобів подолання комунікативної кризи, що полягає у неспівмірності обсягів нової інформації, що мають сталу тенденцію до зростання, та операційної здатності людської пам’яті та уваги. Реферативний ресурс бібліотек завдяки концентрації на сутнісних характеристиках документа (мета, джерельна база, методологія, висновки дослідження) виокремлює для дослідника ключові аспекти ресурсів та дозволяє сфокусуватися на роботі з ними.
Питанню впровадження інтелектуальних технологій у роботу бібліотек, і зокрема, їх реферативних служб, присвячена низка публікацій вітчизняних (К. В. Лобузіна, О. Ю. Мар’їна, Н. Е. Кунанець) та зарубіжних (C. Bailey, K. Calhoun, S. Kelsey) авторів. Дослідники одностайні щодо потенціалу веб-технологій у заощадженні часових, матеріальних та людських ресурсів завдяки уніфікації опрацювання документального потоку на рівні методології, технології та дескриптивних стандартів.
Серед інтелектуальних технологій організації електронних реферативних ресурсів варто передусім виокремити інтегровані бібліотечні бази знань, семантичний пошуковий та аналітичний інструментарій, засоби наукометрії тощо.
Інтеграцією, тобто поєднанням в єдиному вікні доступу всіх ресурсів бібліотеки з можливістю одночасної роботи з ними, досягається низка важливих властивостей електронного реферативного ресурсу:
1. Однозначність. Інтеграція усуває розбіжності, зумовлені використанням різного програмного забезпечення, різних форматів метаданих, локальним характером авторитетного контролю тощо, уніфікуючи вихідний інформаційний потік за заздалегідь визначеними правилами.
2. Консолідація. Інтеграція реферативної інформації створює єдину інформаційну інфраструктуру держави замість розподілених локальних ресурсів, що створюються автономно й здебільшого хаотично та дублюють один одного.
3. Аналітичність. Завдяки надбудові дослідницьким інструментарієм, мультидисциплінарний масив реферативної інформації набуває систематичності, чіткої ієрархічної структури, встановлюються глибинні взаємозв’язки між окремими джерелами, з’являється можливість здійснювати аналітико-синтетичну обробку інформації.
Розвиток діяльності бібліотек у веб-просторі передбачає широке застосування семантичних технологій. Завдяки впровадженню семантичного пошукового та аналітичного інструментарію, використанню пов'язаних даних (linked data), зокрема бібліотечних онтологій, реферативні сервіси отримують сучасні інструменти для організації відповідних методів обслуговування та підвищення його якості; формування іміджу й авторитетної позиції установи в інтернет-комунікаціях через створення інтелектуальних агрегованих ресурсів, відбір, оцінку та координацію їхнього використання цільовою аудиторією.
Інтелектуальні технології не в останню чергу сприяють й упорядкуванню бібліографічної інформації у реферативних базах даних. Скажімо, наявність у дескриптивному масиві омогліфів (символів, що візуально подібні, але мають різне функціональне навантаження) вносить чималий хаос у структуру метаданих, і водночас ця проблема майже не придатна для розв'язання людським оком. Лише спеціальне програмне забезпечення здатне усунути дескриптивні розбіжності (найчастіше йдеться про сплутування кириличних та латинських символів на клавіатурі) та відновити релевантність пошуку.
Сьогодні процеси інтеграції бібліотечних та веб-технологій особливо інтенсивно розвиваються у галузі організації доступу до наукової інформації, зокрема наукометрії та бібліометрії. Набуття популярності у всьому світі ідеї відкритого доступу до наукової інформації спричинилося до накопичення величезних обсягів наукових та освітніх ресурсів в електронному вигляді. Було створено низку агрегаторів наукових публікацій, проте здебільшого ті функціонують на умовах передплати (Scopus, Web of Science, галузеві бази даних компаній Clarivate Analytics та Elsevier тощо) Загальнодоступним інтегратором цих ресурсів стала глобальна пошукова система Google Академія (Google Scholar), призначена для виокремлення із глобального інформаційного потоку реферативних джерел наукової інформації. Останнім часом відбулись істотні зміни в наукометричних та бібліометричних можливостях системи. Зокрема, було удосконалено алгоритми екстрагування метаданих веб-сторінок та автоматичного виявлення цитування наукових публікацій, забезпечено можливість створення наукометричних профілів вчених та наукових фахових видань, що дає змогу авторам стежити за цитуванням своїх статей, автоматично вибудовувати мережі співавторства.
Цікавою з огляду на впровадження семантичних технологій є дослідження проблеми виявлення нового знання у сховищах даних електронних документів – Knowledge Discovery in Databases і основний алгоритм цього процесу – Data Mining – інтелектуальний аналіз даних або, дослівно, «добування даних». Йдеться про аналітичний процес дослідження людиною великого обсягу інформації із залученням засобів автоматизованого сканування даних з метою виявлення прихованих у них структур або залежностей. Застосування методів Data Mining (побудова моделей аналізу, використання моделі, спостереження за нею, опрацювання даних та інтерпретація отриманих результатів, висновки систем звітності) в електронній бібліотеці спрямоване поліпшити інформаційне обслуговування користувачів завдяки глибинному скануванню повнотекстових баз знань й встановленню неочевидних концептуальних взаємозв'язків між масивами наукової інформації.
Новою та малодослідженою є співпраця реферативних сервісів та веб-маркетингу у царині пошукової оптимізації сайтів, досліджень у фокус-групах та таргетуванні контенту. Важливою є роль інтеграції видавництв та бібліотечної сфери у контексті технологій «книги на замовлення» (book-in-print, print-on-demand). Краудфандингові та фандрайзингові платформи на кшталт Kickstarter, Gofunded, Patreon, і зокрема українські BigIdea, Komubook та Спільнокошт украй зацікавлені у парсингу даних, зокрема, у вивченні користувацького попиту електронних бібліотек, позаяк поточний досвід їхньої діяльності свідчить про певний користувацький волюнтаризм, за якого чималу кількість проектів не вдалося забезпечити належним фінансуванням — пропозиції окремих учасників краудфандингу не знаходили підтримки у решти.
Потенціал цих технологій у розвитку реферування є великим, зокрема, й тому, що передбачене семантичними алгоритмами делегування все більшої операційної діяльності комп'ютерам звільняє нові часові та людські ресурси для виконання бібліотечними фахівцями питомо консультативних, модераторських, кураторських функцій тощо.

Бібліографічні посилання
1. Гриценко Н. О. Реферативні бази даних у системі інформаційного забезпечення освіти та науки / Н. О. Гриценко, О. В. Клюшнікова, О. Г. Сандул // Наукові праці Національної бібліотеки України імені В. І. Вернадського. 2018. Вип. 50. C. 308-320. https://doi.org/10.15407/np.50.308
2. Кропочева Н. М. Перспективи застосування технологій краудсорсингу у формуванні галузевого реферативного ресурсу // Вісник Книжкової палати. 2017. № 1. C. 33-36.
3. Кунанець Н. Е. Консолідація інформаційних ресурсів бібліотек, архівів, музеїв: світовий досвід / Н. Е. Кунанець, Г. І. Липак // Бібліотекознавство. Документознавство. Інформологія. 2016. № 3. C. 11-19.
4. Лобузіна К. В. Електронні інформаційні ресурси наукової бібліотеки в сучасному веб-середовищі / К. В. Лобузіна, Л. В. Коновал // Бібліотечний вісник. 2018. № 6. C. 51-53.
5. Мар’їна О. Ю. Веб-орієнтована концепція розвитку бібліотек у контексті еволюції веб-технологій // Вісник Книжкової палати. 2016. № 10. C. 24-27.
6. Ямчук А. В. Реферативні інформаційні ресурси як інтеграційна основа системи наукової комунікації / А. В. Ямчук, В. М. Євтушенко, Т. К. Куранда // Науково-технічна інформація. 2010. № 4. C. 3-6.

References
1. Hrytsenko Nataliia, Kliushnikova Olena, Sandul Oksana (2018). Referatyvni bazy danykh u systemi informatsiinoho zabezpechennia osvity ta nauky [Abstract Databases in the System of Information Providing of Education and Science]. Academic Papers of The Vernadsky National Library of Ukraine, (50) 308-320. (In Ukrainian). https://doi.org/10.15407/np.50.308
2. Kropocheva Nataliia (2017). Perspektyvy zastosuvannia tekhnolohii kraudsorsynhu u formuvanni haluzevoho referatyvnoho resursu [Perspectives of application of technologies of crowdsourcing in formation of branch abstract resource]. Book Chamber Herald, (1) 33-36. (In Ukrainian).
3. Kunanets Nataliia, Lypak Halyna (2016). Konsolidatsiia informatsiinykh resursiv bibliotek, arkhiviv, muzeiv: svitovyi dosvid [Consolidation of information resources of libraries, archives, museums: a global experience]. Library, Document & Information Sciences, (3) 11-19. (In Ukrainian).
4. Lobuzina Katherina, Konoval Liudmyla (2018). Elektronni informatsiini resursy naukovoi biblioteky v suchasnomu veb-seredovyshchi [Electronic information resources of the scientific library in modern web- environment]. Library Herald, (6) 51-53. (In Ukrainian).
5. Marina Olena (2016). Veb-oriientovana kontseptsiia rozvytku bibliotek u konteksti evoliutsii veb-tekhnolohii [Web-based concept for library development in the context of the evolution of web-technologies]. Book Chamber Herald, (10) 24-27. (In Ukrainian).
6. Iamchuk A., Ievtushenko V., Kuranda T. (2010). Referatyvni informatsiini resursy yak intehratsiina osnova systemy naukovoi komunikatsii [Abstract information resources as an integration basis of the system of scientific communication]. Scientific & Technical Information, (4) 3-6. (In Ukrainian).

UDC 025.5:004.65
Harahulia Serhii,
PhD in Social Communications,
Head of Abstract Department
Vernadsky National Library of Ukraine
Kyiv, Ukraine
ORCID: https://orcid.org/0000-0002-5564-9494
INTELLECTUAL TECHNOLOGIES OF THE ELECTRONIC ABSTRACT RESOURCES ORGANIZATION
The specificity of the organization of abstract information in the web environment is considered. A wide range of intellectual resources for the organization of electronic library resources is analyzed. The toolkit that maximally meets the needs of processing and presentation of abstract information in libraries is separated. The VNLU's experience of implementing semantic library technologies is generalized. Methodical recommendations for the implementation of the latest intellectual web technologies by abstract services are given.
Keywords: abstract resources, data mining, data parsing, knowledge management, library ontologies, linked data, metadata, semantic web.