SNEWPAPERS предоставляет полнотекстовый архив газет 1730–1960-х годов с возможностью поиска.
Fast facts
- Category: Technology
- Language: EN
- Published: 2026-05-02 04:42 UTC
- Sources: Hacker News
Новый проект с открытым исходным кодом под названием SNEWPAPERS предлагает полнотекстовое извлечение, высокоточное распознавание символов и семантический поиск в газетных архивах, охватывающих период с 1730-х по 1960-е годы. После почти 3000 часов разработки платформа предоставляет подробную таксономию категоризации и возможности поиска на основе агентов, устраняя ограничения существующих сервисов, которые допускают только запросы по ключевым словам и датам. Создатель стремится сделать исторические исследования более доступными, предоставляя текст с возможностью поиска, а не отсканированные изображения.