Реєстр оцифрованого культурного надбання

ЗаявникКлочок Станіслава Григорівна (Україна)
КонференціяМіжнародна наукова конференція «Бібліотека. Наука. Комунікація» (2015)
ЗахідСекція 4.Електронні бібліотеки. Автоматизація бібліотечної технології
Назва доповідіРеєстр оцифрованого культурного надбання
Інформація про співдоповідачів
Презентаціяне завантажено
Статтяне завантажено


Тези доповіді

Сьогодні оцифрування культурної спадщини проводиться масово у бібліотеках, архівах, музеях, галереях, та інших аналогічних установах по всьому світу. Для структурування, обліку, та зручності використання цифрових копій використовують бази даних. Вони лежать в основі масштабних інформаційних ресурсів, що надають онлайновий доступ до оцифрованого культурного надбання, створюваних установами пам’яті. Інформаційні і комунікаційні технології, мають такі переваги як можливість представлення і популяризації культурної спадщини світу. Із зростанням обсягів оцифрування з’явилася велика кількість різноманітних ресурсів, що репрезентують оцифроване культурне надбання. Серед цього розмаїття цифрових репозиторіїв іноді важко знайти необхідні цифрові об’єкти, а деякі з них представлені у багатьох варіантах, тому що вони оцифровані різними установами. Для архівних документів, багатьох творів мистецтва і рукописів така проблема, як багаторазове оцифрування не стоїть, так як вони унікальні, а наприклад газети, журнали, книги, стародруки та інші не унікальні видання часто стикаються з нею.
Створення центрального реєстру оцифрованого культурного надбання, допомогло би вирішити як проблему пошуку, так і проблему багаторазового оцифрування. Реєстр матиме зведений перелік усіх оцифрованих об’єктів, та інформацію про доступ до них, крім того надасть можливість координувати зусилля культурних установ. Зараз багато країн вже створили подібні проекти – колекції оцифрованих документів, що являють собою національне надбання. Ці проекти частково пов’язані між собою великими міжнародними проектами. Національні проекти агрегують метадані з цифрових ресурсів у рамках конкретної країни, іноді за її межами, за умови що матеріали відповідають заданим вимогам, міжнародні проекти можуть агрегувати метадані звідусіль.
У статті розглянуто досвід створення реєстрів у країнах світу, таких як Америка, Німеччина, Іспанія, Росія, Сербія, Франція, Фінляндія, тощо. Національними установами культурної спадщини, вже накопичено великий досвід створення цифрових колекцій і тільки відносно нещодавно постала задача створення єдиного інформаційного простору що об’єднає національні колекції. Відображено багато питань, які необхідно вирішити для створення національного реєстру. Досвід Росії та Сербії є для України найближчим.
Із створенням центрального реєстру оцифрованого культурного надбання постають такі проблеми:
- проектування, пов'язане з ресурсами та відповідними джерелами (метадані, джерела інформації, організація контенту у колекції);
- безпека (безпека даних, політики доступу, повноваження користувача, допустимих операцій і т.д.);
- доступ та представлення цифрових об’єктів;
- адміністрування (у тому числі завантаження інформації (цифрових об’єктів або метаописів) на сервер, оновлення інформації та створення резервної копії контенту);
- проблеми, пов'язані з проектуванням інтерфейсу для користувачів.
Загалом міжнародні і загально національні проекти являють собою колектори метаописів, самі ж цифрові копії документів – зберігаються у постачальників (на сайтах бібліотек, музеїв, архівів, тощо). Метадані агрегуються за допомогою спеціальних харвесторів, які використовують протоколи передачі бібліографічних даних Z39.50 і OAI-PMH. Метаописи, містять посилання на джерело, де можна продивитися документ повністю – вільно, або на умовах постачальника. Якщо один документ представлено у декількох джерелах він міститиме посилання на всі джерела. Крім того, до метаданих обов’язково включається елемент, що точно ідентифікує документ і не допускає дублювання опису. Подібні ідентифікатори можуть мати не лише документи, а також імена (автор, герой твору, тощо) або назви (географічні, організацій, видавництв, тощо), що мають відношення до створення документу, або до його змісту. Таким чином, кожен документ, має спеціальні ідентифікатори (наприклад Name Assigning Authority Number (NAAN), або Archival Resource Key (ARK), або Persistent Identifier (PI), тощо), що також сприяє вирішенню проблеми повторного оцифрування.
Вибір стандарту метаданих для великих проектів дуже серйозне і складне питання, оскільки стандарт метаданих має відповідати великій кількості вимог, серед яких сумісність з системами управління колекціями, підтримка багатомовності, включати у себе всі необхідні елементи опису, бути досить розповсюдженим, щоб будь-яка організація могла представити опис документів у цьому форматі, тощо. Зараз, немає достатньо поширеного стандарту метаданих для опису цифрових документів. Не дивлячись на те, що більшість установ, які піклуються про національну спадщину почали процес оцифрування, немає узгодженого стандарту метаданих офіційно прийнятого на державному рівні. Різні постачальники ресурсів (бібліотеки, музеї, архіви, деякі дослідницькі інститути) використовують міжнародні стандарти, які відповідають вимогам конкретних галузей, або правилам опису культурної спадщини (сформульованим у 1980-х або на початку 1990-х років). На міжнародному рівні, є багато стандартів метаданих для опису ресурсів спадщини, наприклад: Dublin Core, EAD, MARC, METS, ALTO, TEL AP, FRBR і т.д.
Поміж цим, необхідно відобразити у метаописі, якомога точнішу інформацію, наприклад, чи дана цифрова копія зроблена з оригіналу документу, чи з його копії або факсиміле.
Іноді, проекти збирають не лише метаописи, а і страхові копії документів (World Digital Library). Це передбачає великі фінансові можливості, для утримання цифрового сховища, адже кількість інформації буде постійно зростати. Крім того, необхідно визначити мінімальні вимоги до якості інформації що передаватиметься культурними установами.
Один із шляхів комплектування цифрових колекцій новими виданнями, є домовленості з видавництвами, про надання електронних копій зверстаних документів, у тому числі отримання готових цифрових архівів періодичних видань (backfiles) з ретроспекцією номерів. Таким чином заощаджується час, на оцифрування, обробку, розпізнавання, редагування тощо, крім того зберігається оригінальна верстка.
Найчастіше ресурси організовано за колекційним принципом, таким чином користувачу легше працювати з ними. Використовуються системи управління колекціями, та даними. Такі системи розробляються спеціальними організаціями і адаптуються під вимоги конкретного проекту. Вони полегшують роботу з контентом, створюють необхідні точки доступу для пошукових систем.
Документи завжди представлені таким чином, щоб завантаження, було не можливе, або (як мінімум) ускладнене. Деякі проекти пропонують за окрему платню не лише можливість завантажувати повні тексти, а й оцифрування на замовлення, запис на диск, або навіть виготовляють факсимільні видання документів.
У більшості таких проектів, політика доступу залежить від постачальника джерела, але іноді, за вимогами проекту ресурс має бути у вільному доступі. Різні електронні документи можуть мати різні політики доступу, навіть в рамках одного ресурсу, що пов’язано, у першу чергу з авторським правом.
Також важливим питанням є якість представлених документів. Вимоги до скануючого обладнання та страхових копій у даному випадку не є критичними, але вимагати забезпечення читабельності тексту – реєстр має право. Якщо, реєстр збирає самі електронні документи – тоді, можливо використовувати страхові копії, для обробки яких необхідно мати спеціальне програмне забезпечення і працівників.
Частіше за все, проекти агрегують метадані за допомогою спеціальних харвесторів, але зустрічаються проекти де метадані вводить і перевіряє оператор. Звичайно можливості харвестора ширші, але оператор, вводить більш точну інформацію. Оновлення інформації як і резервне копіювання, може проводитися автоматично або оператором.
Інтерфейс може бути адаптованим безкоштовним рішенням, або його проектують на замовлення сторонні організації, партнери або організатори проекту. Вигляд і можливості інтерфейсу, залежать від системи управління контентом, що використовується проектом. Деякі системи управління контентом – мають вбудовані інтерфейси для представлення колекцій в Інтернеті. Зазвичай їх доводиться доробляти, щоб ресурси були представлені якомога повніше.
Першочерговим завданням для українських бібліотек є відпрацювання технології формування реєстру цифрових ресурсів україніки. Сьогодні певні зусилля здійснюються у Національній бібліотеці України імені В. І. Вернадського (НБУВ) у напрямі формування фундаментальної електронної бібліотеки «Україніка». Реалізація такого масштабного проекту передбачає необхідність об’єднання зусиль провідних бібліотек України та інших культурних установ. Організація спільних зусиль із створення загальнонаціонального ресурсу, який надасть можливість пошуку документів наявних у різних культурних установах, ставить перед НБУВ багато технологічних завдань.
Передбачається, що за прикладом багатьох успішних міжнародних проектів, у реєстрі будуть збиратись та зберігатись лише метаописи документів. Доступ до самих електронних документів буде надаватись постачальниками документів (у тому числі вони будуть визначати їх правовий статус). Обов’язковими елементами інформації, щодо електронного документа у реєстрі, крім бібліографічного опису, мають бути інформація про постачальника ресурсу, умови доступу, посилання до самого ресурсу (інтернет-адреса), приналежність до певної історичної або тематичної колекції. Як окремий напрям розвитку проекту електронної бібліотеки «Україніка», передбачається надати можливість партнерам і користувачам НБУВ замовляти документи для оцифрування. Таким чином, з’явиться можливість складати перспективний і більш релевантний план оцифрування документів. Крім того, можна буде розподілити навантаження і об’єднати зусилля бібліотек, які мають змогу оцифровувати документи.