ASARP

ASARP – Automatizovaný systém analytického rozpisu periodik

 

 

 

 

Na začátku roku 2022 začala realizace projektu ASARP – Automatizovaný systém analytického rozpisu periodik zaměřeného na vývoj systému pro automatizaci a katalogizaci digitalizovaných periodik na úrovni článků s využitím strojového učení. Ve spolupráci členů konsorcia bude vytvořeno softwarové řešení, které umožní obohacení digitální knihovny o další funkci v podobě vytvořených záznamů analytického rozpisu.

Paměťové instituce (a zejména knihovny) mají bohatý zdroj digitalizovaných periodik, který ale není využívaný. Partner projektu – Moravská zemská knihovna – má fond čítající několik set tisíc článků, které jsou sice převedeny do digitální podoby, ale nejsou plně katalogizované, a proto je pro uživatele těžké efektivně najít relevantní výsledky.

U digitalizovaného obsahu knihoven je problém přístupnosti. Sice existuje hodně digitalizovaného materiálu, ale je velmi těžce přístupný pro badatele. Obsah a anotace jsou v podstatě skryty v textu, těžko se v něm vyhledává. Jednotlivé ročníky jsou navíc často svázané do jednoho pdf souboru. V tomto pdf souboru se sice dá vyhledávat fulltextově, vzhledem k množství článků a textů je to však neefektivní.

Jediným současným nástrojem pro indexace článků na úrovni analytického rozpisu je manuální zpracování, což je obrovsky časově (a tím i finančně) náročné. Z toho důvodu je tento krok při digitalizaci periodik opomíjen a téměř se nedělá. Současné nástroje tak svými vlastnostmi, kvalitou výstupu a možností adaptace nevyhovují pro zpracování rozsáhlých knihovních fondů. Proto se hledá cesta k trvalé automatizaci tvorby analytického rozpisu periodik.

Cílem projektu je spojit efektivní uživatelské rozhraní a nejnovější metody strojového učení a vytvořit software použitelný paměťovými institucemi pro zpracování a kategorizaci sbírek digitalizovaných periodik, který nahradí současné nástroje svými vlastnostmi, kvalitou výstupu a možností adaptace nevyhovující pro zpracování rozsáhlých knihovních fondů kvůli obrovské potřebě manuální práce.

 

Doba realizace projektu:  1. 1. 2022 – 31. 5. 2023

Celkové způsobilé výdaje projektu: 10. 960 792 Kč

Partneři projektu: Cosmotron Bohemia, s.r.o., Moravská zemská knihovna v Brně

Projekt je financován z finančních prostředků Evropské unie prostřednictvím Operačního programu Podnikání a inovace pro konkurenceschopnost.