Чому вчить наукометриста та бібліометриста досвід Google Flu Trends

ЗаявникКубко Анастасія Юріївна (Україна)
ФорумМіжнародна наукова конференція «Бібліотека. Наука. Комунікація. Інноваційні трансформації ресурсів і послуг» (2022)
ЗахідСекція 2. Цифрові бібліотечні технології організації знань
Назва доповідіЧому вчить наукометриста та бібліометриста досвід Google Flu Trends
Інформація про співдоповідачів
Презентаціяне завантажено
СтаттяЗавантажити статтю


Тези доповіді

Розглянуто літературу стосовно Google Flu Trends: проведено аналіз інфо- та вебометричної складової, виявлені можливі причини похибок. Оцінено перспективи використання інструментарію вебо- та інфометрії в дослідженнях універсального патерну стресової відповіді наукового товариства.
Ключові слова: Google Flu Trends, вебометрія, бібліометрія, наукометрія, альтметрія, інфометрія, стресова відповідь наукового товариства.

Ще на початку виникнення вебометрії її засновники наголошували на наявності тісної взаємодії між всіма складовими інфометрії, в тому числі – між вебометрією та науко- і бібліометрією, що обумовлено тим, що саме галузі бібліотечної справи та інформаційних технологій разом з дотичними галузями соціальних наук згенерували цілий ряд теорій та розробили методології обрахунку генерації, організації, поширення та використання різними користувачами в різних контекстах різних типів інформації. Подальші дослідження довели, що аналогічно статистичним законам Лотки, Бредфорда і Ципфа відбуваються закони розподілу і для Інтернету, а процеси, що лежать в основі індексів цитування та аналізів мереж цитування та взаємодій між гіпертекстуальними міждокументними структурами Мережі, подібні між собою. Також одні з центральних бібліометричних методів (співцитування та бібліографічного поєднання) були застосовані до досліджень Мережевих кластеризації, зростання та пошуку. Але, хоча інструментарій вебометрії й походить напряму від інструментарію бібліометрії і (в широкому сенсі) інфометрії, вебометрія збагатила його також і новими, власними розробками, зокрема підходами, що включають методології комп’ютерних наук, аналізу соціальних мереж, досліджень гіпертексту, медіадосліджень тощо.
Наразі все більше наукових заходів відбуваються в Інтернеті, що зумовлює тісну взаємодію вебометрії та бібліо-/наукометрії та стрімке зближення методологій субгалузей інфометрії, – так званий третій етап еволюції інфометричного дослідницького інструментарію, який отримав назву кіберметричного й особливостями якого саме і є виникнення вебометрії та альтернативних метрик (альтметрії). Останні виникли в 2010 році, коли була зроблена спроба створити додатковий інструмент оцінювання наукових результатів через неспроможність традиційних бібліометричних показників достовірно визначити якість будь-якої окремо взятої статті чи вагомість дослідження та однозначно висвітлити рівень вченого, – і з того часу їх поширеність поступово зростає: так, наразі з альтметричними сервісами співпрацюють Web of Science та Scopus. Водночас досить довгий час в наукових колах відношення до альтметрії залишалось стриманим. Це було обумовлено низкою лімітуючих факторів: неможливістю самостійного використання методики, її залежністю від маніпуляцій автором, відсутністю кореляції між альтметричними індикаторами та показниками цитування і залежністю від інтересів широкої громадськості, що цікавиться переважно популярними темами. Але бібліо- та наукометричні дослідження епідемій, на матеріалах яких ще з 1998 року вивчають єдиний глобальний патерн, за яким відбувається реакція академічної спільноти на критичне наукове навантаження, допомагають більш чітко окреслити місце вебометричних методик в сучасних бібліометрії та наукометрії. Так, вже початкові роботи на матеріалі COVID-19 показали, що бібліометричні бази даних, які індексують літературу поза звичайним колом наукових публікацій, більш оперативно і чітко відображають тренди відповіді наукових колективів і окремих дослідників на критичні академічні навантаження, а попередня публікація в соцмережах збільшує цитованость публікації в короткостроковій перспективі (безпосередній зв’язок індексу Гірша вченого із його соціальною активністю в Мережі).
Ми дослідили літературу стосовно аналітично-прогностичної служби Google – Google Flu Trends, яка побудована на методології аналізу великих (переважно) даних і має базою обробку пошукових запитів та сповіщень в Інтернеті за відповідними ключовими словами, як еталонний взірець спроби використання інструментарію вебометрії для «цифрового» дослідження епідемій. Цей проєкт був розпочатий в 2008 р. і, після початкових вдалих прогнозів, закритий у 2015 р. через численні помилки, після чого конфіденційні дані розробника стали частково доступними для науковців.
При аналізі оглядових публікацій та ретроспективних і проспективних досліджень, в тому числі із відновленням алгоритмів Google Flu Trends, виявилось, що: в дослідженнях з перерахунком наявних даних чи модифікацією алгоритму спостерігалося загальне зниження похибки служби до 80%; на пошукові запити, аналіз яких є базою для алгоритмів Google Flu Trends, впливають зміни, внесені в алгоритми пошуку з комерційними цілями командою інженерів Google (т. зв. «blue team»); в цілях покращення обслуговування клієнтів Google змінює також й процес генерування даних, що впливає на кінцеві результати пошуків в цій системі; такі самі підходи використовуються й соцмережами, звідки збирають дані програми альтметрик – Twitter, Facebook тощо.
Таким чином, можна констатувати, що: досвід Google Flu Trends загалом доводить можливість використання методик вебометрії для прогнозування; аналітичні інструменти, які використовують можливості комерційних систем Інтернету (Google, платформи Twitter і Facebook), в тому числі і альтметрія, за допомогою якої наразі широко досліджують універсальний патерн стресової реакції наукового товариства, залежать від впливу blue team, і результати, отримані за їх допомогою, не можуть бути повністю релевантними.
Загальне перенесення подій, документів і взаємовідносин в Мережу обумовлює нагальну потребу вивчення інструментарію інфометрії загалом і вебометрії зокрема для вдосконалення методик традиційної науко- та бібліометрії, особливо інструментів оцінки використання результатів наукової діяльності та прогнозів. Доцільне подальше дослідження інструментарію інфометрії та вебометрії з метою запозичення методологій для виокремлення та уточнення патерну стресової реакції академічної спільноти на надкритичні наукові навантаження та можливостей прогнозування на його основі. Для остаточного вирішення питання місця інструментарію вебометрії в галузі науко- та бібліометрії потрібні подальші розвідки.