Відкрита наука і штучний інтелект як фактори трансформації науково-технічних бібліотек

ЗаявникТульчинський Вадим Григорович (Ukraine)
КонференціяМіжнародна наукова конференція «Бібліотека. Наука. Комунікація. Пріоритети сьогодення та перспективи» (2025)
Захід2 Секція. Відкрита наука в Україні.
Назва доповідіВідкрита наука і штучний інтелект як фактори трансформації науково-технічних бібліотек
Інформація про співдоповідачівМаслова Марина Анатоліївна, провідний інженер-програміст, Інститут кібернетики імені В.М. Глушкова НАН України; Тульчинський Петро Григорович, к.ф.-м.н., старший науковий співробітник, Інститут кібернетики імені В.М. Глушкова НАН України
ПрезентаціяЗавантажити презентацію
Текст доповідіЗавантажити статтю


Тези доповіді

Тульчинський Вадим Григорович,
ORCID https://orcid.org/0000-0002-0280-223X,
доктор фізико-математичних наук, старший науковий співробітник,
завідувач відділу,
відділ автоматизації програмування,
Інститут кібернетики імені В. М. Глушкова Національної академії наук України,
Київ, Україна
e-mail: dep145@gmail.com

Маслова Марина Анатоліївна,
ORCID https://orcid.org/0009-0007-4451-9321,
провідна інженерка,
відділ автоматизації програмування,
Інститут кібернетики імені В. М. Глушкова Національної академії наук України,
Київ, Україна
e-mail: mma021038@gmail.com

Тульчинський Петро Григорович,
ORCID https://orcid.org/0000-0002-0680-2675,
кандидат фізико-математичних наук,
старший науковий співробітник,
лабораторія високопродуктивних і розподілених обчислень,
Інститут кібернетики імені В. М. Глушкова Національної академії наук України,
Київ, Україна
e-mail: p.tulchinsky@gmail.com

Відкрита наука і штучний інтелект як фактори трансформації науково-технічних бібліотек

Інтенсивне впровадження принципів відкритої науки робить наукові публікації та інші наукові тексти легко доступними поза науково-технічними бібліотеками, а великі мовні моделі створюють кращі можливості пошуку серед відкритих джерел, ніж можуть надати співробітники науково-технічної бібліотеки. В таких умовах традиційна роль науково-технічної бібліотеки як структури, що надає послуги читачеві, втрачає перспективу. Щоб зберегтись як явище, науково-технічні бібліотеки мають трансформувати власні функції та змінити власну роль подібно до того, як бібліотеки трансформувались після винайдення друку.
Ключові слова: відкрита наука, бібліотечна справа, науково-технічні бібліотеки, наукові тексти, препринти, дослідницькі дані, репозитарій, інфраструктура

Прогрес штучного інтелекту і, зокрема, поява великих мовних моделей викликають багато дискусій щодо перспективи зникнення у близькому майбутньому багатьох професій. В цьому контексті не варто недооцінювати загрозу професіям, що пов’язані з бібліотечною справою, насамперед – в галузі науки і техніки. Останні опинились під подвійною загрозою: все більш масштабне і успішне впровадження відкритої науки робить наукові результати безпосередньо і безкоштовно доступними для широкого загалу, в той час як штучний інтелект надає користувачам можливості пошуку публікацій за природно-мовними формулюваннями з складними умовами та врахуванням всього тексту наукової роботи, а не просто її формалізованих атрибутів (і теж безкоштовно).

У таких умовах актуальності набуває цілий ряд запитань. Чи можуть взагалі зберегтись науково-технічні бібліотеки? За яких умов, в якій формі? Який процес трансформації мають вони пережити, хто буде його ініціювати і проводити?
У цій доповіді ми намагаємось проаналізувати причини і мотиви змін, а в кінці пропонуємо деякі варіанти відповідей виходячи зі свого досвіду використання бібліотек у науковій роботі, створення інфраструктури відкритої науки, розробки і впровадження інтелектуальних систем з використанням великих мовних моделей.
Головним рушієм, що зсунув наукову спільноту в напрямку відкритого доступу, стало драматичне зменшення вартості копіювання текстів. До розповсюдження персональних комп’ютерів науковець мав небагато способів поповнювати персональну бібліотеку. Передплата журналів, купівля монографій, фотокопіювання окремих сторінок наукових робіт вимагали помітних фінансових внесків, тому найпопулярнішим способом залишалось конспектування. В Україні це була золота доба науково-технічних бібліотек ще й тому, що жодного способу прочитати іноземну наукову роботу поза бібліотеками не існувало.
Поява персональних комп’ютерів, електронної пошти та форматів файлів, здатних включати у текст формули і зображення, призвели до першої зміни парадигми: автори почали обмінюватись між собою ще не опублікованими, а інколи ще навіть не поданими до журналу чи конференції електронними рукописами, що тоді звались е-принтами, а зараз відомі під назвою препринтів. Вже у 1991 р. молодий фізик Пол Гінспарг створив для е-принтів співробітників Лос-Аламоської національної лабораторії спеціальну поштову скриньку, що була доступна з усіх комп’ютерів лабораторії, та почав накопичувати колекцію, яка з часом перетворилась на всесвітньо відомий архів препринтів arXiv.org. Аналогічні колекції, хоча і в меншому масштабі, з’явились і в інших науковців, що освоїли комп’ютер, зокрема, і в нас. Крім препринтів, ми почали зберігати скановані копії наукових робіт, а коли пам’ять персональних машин зросла – то й цілих монографій.

У науковців не було особливої фінансової зацікавленості у збереженні цих колекцій від копіювання колегами: навіть якщо видавництва платили гонорари авторам, ці гонорари, як правило, були одноразовими та не ставали значним джерелом доходів. З появою Інтернету деякі великі колекції наукових текстів перетворились на публічні електронні бібліотеки. Видавництва співпрацювали з ними чи створювали власні електронні бібліотеки, бо робота з файлами, зокрема, пошук документів та їх фрагментів у електронному вигляді, виявилась набагато зручнішою та ефективнішою за пошук у паперових виданнях за традиційними бібліотечними каталогами, що породило великий попит саме на цифрові формати наукових текстів. При цьому видавництва вели жорстку боротьбу з електронними бібліотеками, які порушували їхні авторські права. Але виграючи окремі справи, вони програвали стратегічно, бо такі бібліотеки та неофіційне розповсюдження копій на особистому рівні зростали лавиноподібно.

На цьому тлі почалась трансформація економіки наукових видань. Авторські гонорари за статті зникли, повсюдно замінюючись на сплату за публікацію з боку автора. Частка читачів (покупців чи підписників) у доходах видавництв науково-технічної літератури поступово зменшувалась, а частка авторів зростала.
Але науково-технічні бібліотеки ще зберегли свою традиційну роль: завдяки договорам з виданнями вони продовжили надавати легальний безкоштовний доступ до наукових текстів. Вони лише поповнили свій інструментарій програмними системами, почали видавати поряд з паперовими документами файли, та до певного ступеню вийшли в Інтернет.
Наступний етап припадає на початок 2000-х, коли серед науковців та спонсорів науки поширились уявлення про паразитизм наукових видань. На той час про авторські гонорари вже не йшлось, а вартість оприлюднення результатів зростала понад десятиріччя. Наукову роботу і текст створюють вчені, рецензують його вчені (зазвичай безкоштовно). За що гроші отримує видавець? За паперовий примірник, що вже не потрібен, і необов’язкове в контексті науки літературне редагування? До того ж, видання гальмують оприлюднення та обмежують доступ вчених-аматорів і науковців з бідних країн. Постало питання, а чи не варто повністю перейти на препринти? У 2002 р. Григорій Перельман виклав у препринті доведення гіпотези Терстона про геометризацію, включно з гіпотезою Пуанкаре як окремим випадком. Він відмовився публікувати цю роботу в будь-якому з рецензованих журналів, проте математична спільнота визнала її, присудивши Перельману медаль Філдса та премію Інституту Клея (від яких він, щоправда, відмовився).
Тоді ж виникла спрямована на відкритий доступ Коаліція S, що за 20 років оприлюднила вже кілька версій Плану S, зокрема щодо обов’язкового права автора на оприлюднення препринту, чи постпринту (останньої авторської версії статті, що пройшла рецензування, але не редагування). Її ініціативи були підтримані, зокрема, європейською Рамковою програмою «Горизонт Європа», численними державними й професійними спільнотами. Тут варто послатись на Рекомендацію Європейської комісії 2018/790 від 25.04.2018 щодо доступу до наукової інформації та її збереження, Директиву 2019/1024 Європейського парламенту та Ради ЄС від 20.06.2019 щодо відкритих даних і повторного використання інформації державного сектору (нова редакція), Регламент (ЄС) 2021/695, Рекомендації ЮНЕСКО щодо відкритої науки 2021 р. тощо. Вимоги до видавців були доповнені вимогами до науковців: оприлюднювати у відкритому доступі дані (зокрема, відкриті коди програм), що отримані за суспільні кошти в тій чи інший формі. Також з’явилась вимога до наукових установ надавати іншим доступ до коштовного наукового обладнання, придбаного за суспільні кошти (держфінансування, чи гранти). Використання обладнання не має бути безкоштовним, але має надаватись з метою проведення власних досліджень чи перевірки отриманих результатів. Кабінет Міністрів України теж схвалив розпорядження «Про затвердження національного плану щодо відкритої науки» від 08.10.2022 № 892-р, у реалізацію якого активно включилась НАН України, побудувавши власну Інфраструктуру відкритої науки, інтегровану до Європейської хмари відкритої науки.
Зараз ДНТБ України та НБУВ активно залучені до впровадження відкритої науки через перетворення власних електронних бібліотек на повноцінні репозитарії з відкритим доступом до повних текстів та передаванням їх метаданих до міжнародних пошукових систем. Але що буде, коли цю роботу буде виконано?
Звичайно, підтримка і оновлення власних репозитаріїв наукових текстів вимагає певної невеликої, але стабільної роботи. Звичайно, залишається задача фізичного збереження фондів, якнайменше тих, що мають історичну, чи культурну цінність. Якийсь час може піти на цифрування фондів (чи скоріш їх частини, обраної з урахуванням морального старіння наукової літератури та російської мови більшості накопичених видань). Але ґрунтовних підстав сподіватись, що науковці масово звертатимуться на сайти наших бібліотек замість універсальних пошукових систем і штучного інтелекту, нема. Повоєнні (а може й наступні воєнні) бюджети України будуть вимушено економними. Що робити?

Два напрямки трансформації здаються найбільш ймовірними. Перший – поглинання великих науково-технічних бібліотек державною службою, ймовірно – архівною, та ліквідація решти, що не мають достатньо цінних фондів. Другий – розширення функціональності. Тут можна казати про додаткові послуги, наприклад, відслідковування публікації за певними підписками зареєстрованих читачів, про переорієнтацію на обслуговування видавців, наприклад, послуги з оприлюднення даних і препринтів, про мотивацію авторів, наприклад, через послуги просування у пошукових системах, про активізацію роботи з студентами тощо.
Реалізувати шлях розширення функціональності можна лише за умови доброго розуміння потреб цільових спільнот та тісної співпраці з їх представниками. Збереження поточного стану в жодному разі вже неможливе.

Vadim Tulchinskyi,
ORCID https://orcid.org/0000-0002-0280-223X,
Doctor of Physical and Mathematical Sciences, Senior Researcher,
Head of Department,
Automated Programming Department,
V. M. Glushkov Institute of Cybernetics, National Academy of Sciences of Ukraine,
Kyiv, Ukraine
e-mail: dep145@gmail.com

Maryna Maslova,
ORCID https://orcid.org/0009-0007-4451-9321,
Leading Engineer,
Automated Programming Department,
V. M. Glushkov Institute of Cybernetics, National Academy of Sciences of Ukraine,
Kyiv, Ukraine
e-mail: mma021038@gmail.com

Petro Tulchynskyi,
ORCID https://orcid.org/0000-0002-0680-2675,
Candidate of Physical and Mathematical Sciences,
Senior Researcher,
High Performance and Distributed Computing Lab,
V. M. Glushkov Institute of Cybernetics, National Academy of Sciences of Ukraine,
Kyiv, Ukraine
e-mail: p.tulchinsky@gmail.com

Open Science and Artificial Intelligence as Factors in Transformation of Scientific and Technical Libraries

The active implementation of the principles of open science makes scientific publications and other scientific texts easily accessible outside scientific and technical libraries when large language models create better search capabilities among open sources than can be provided by scientific and technical library staff. In such conditions, the traditional role of the scientific and technical library as an institution that provides services to the reader is losing its perspective. To survive as a phenomenon, scientific and technical libraries must transform their functions and change their role like libraries were transformed after the invention of printing.
Keywords: open science, librarianship, scientific and technical libraries, scientific texts, preprints, research data, repository, infrastructure