Technology • 2026-05-02 04:42

SNEWPAPERS предоставляет полнотекстовый архив газет 1730–1960-х годов с возможностью поиска.

Fast facts

  • Category: Technology
  • Language: EN
  • Published: 2026-05-02 04:42 UTC
  • Sources: Hacker News

Новый проект с открытым исходным кодом под названием SNEWPAPERS предлагает полнотекстовое извлечение, высокоточное распознавание символов и семантический поиск в газетных архивах, охватывающих период с 1730-х по 1960-е годы. После почти 3000 часов разработки платформа предоставляет подробную таксономию категоризации и возможности поиска на основе агентов, устраняя ограничения существующих сервисов, которые допускают только запросы по ключевым словам и датам. Создатель стремится сделать исторические исследования более доступными, предоставляя текст с возможностью поиска, а не отсканированные изображения.

Источники

Related stories