29 November 2022

Internet Archive запустил исследовательский поисковик по своим архивам

Он уже включает в себя более 25 миллионов статей и других научных документов, хранящихся в Архиве Интернета.

Internet Archive сообщил о запуске полнотекстового поискового индекса «Исследователь Архива Интернета» (Internet Archive Scholar), который включает в себя более 25 миллионов научных статей и других научных документов, хранящихся в нём.

Данные в этот поисковой индекс поступают в одной из трех форм:

  • общедоступный веб-контент, сохраненный в партнёрских коллекциях The Wayback Machine и Archive-It;
  • оцифрованные печатные материалы из бумажных коллекций и микроформ;
  • общие материалы из коллекций archive.org, включая сотрудничество с партнерами.

Метаданные берутся из fatcat.wiki, открытого редактируемого пользовательского каталога научных работ.

Создатели «Исследователя Архива Интернета» заявляют:

«Мы намерены предоставить исследователям доступ к полному массиву для анализа текстов и данных. Полученные наборы данных также могут быть опубликованы в открытом доступе для анализа, например, графика цитирования или частоты N-грамм по годам. Если вы заинтересованы или хотели бы видеть конкретные наборы данных, пожалуйста, свяжитесь с нами».

Информацию специально для авторов исследовательских работ можно найти по адресу https://guide.fatcat.wiki/authors.html. Сюда входят инструкции по исправлению библиографических метаданных и обновлению опубликованных работ. Аналогичную информацию специально для издателей можно найти по адресу https://guide.fatcat.wiki/publishers.html. Сюда входят рекомендации по индексированию и сохранению контента.

Контактная информация организации для Интернет-архива указана по адресу https://archive.org/about/contact.php. Запросы об этой поисковой службе и каталоге fatcat можно направлять по адресу [email protected] Существует общедоступный канал чата по адресу https://gitter.im/internetarchive/fatcat.

Поделитесь материалом

Похожие статьи

Контакты

По общим вопросам

[email protected]

По юридическим вопросам

[email protected]

Для СМИ (Telegram)

+7 903 003-89-52

18+

23 декабря 2022 года Минюст включил Роскомсвободу в реестр незарегистрированных общественных объединений, выполняющих функции иностранного агента. Мы не согласны с этим решением и обжалуем его в суде.