Ve spolupráci se specialisty z Massachusettského technologického institutu (MIT) ve Spojených státech amerických vzniká v Masarykově ústavu a Archivu AV ČR unikátní software, který umožní prohledat a spojit obrovské množství digitalizovaných historických pramenů a pomocí umělé inteligence je vyhodnotit. V průběhu příštího roku bude software na webové stránce přístupný veřejnosti. Ambicí vědců je propojovat nový software s archivy, knihovnami a dalšími institucemi po celém světě.
Například k badatelce z Argentiny se dostane originál německy psaného dopisu z protektorátu Čechy a Morava, dejme tomu z okresu Kladno. Dopis pečlivě naskenuje a vloží do specializovaného softwaru. Ten jí dopis přečte a přeloží. Píše se v něm mimo jiné o jistém úředníkovi vyhlášeném postihy za nedodržování vyhlášky o zákazu domácích porážek prasat. Historička si pročte vyhlášku, rozklikne si mapu okresu Kladno. Vyhledá, jak moc byly postihy za domácí zabijačky na Kladensku obvyklé, kdo, kde a jak byl za ně postihován, životopis onoho úředníka, zda byl přistižen i pisatel dopisu aj.
Tak bude zřejmě za pár let vypadat práce historiků – anebo zájemců o historii z řad veřejnosti. Týdny a měsíce objíždění archivů nebo desítky hodin vyhledávání a třídění pramenů a vytváření databází nahradí sofistikovaná práce s počítačem.
První takový komplexní software dokončují vědci z Masarykova ústavu a Archivu AV ČR. V minulých dnech jej představili na prestižní třídenní konferenci Asociace německých studí v Montrealu, jíž se účastnilo přes 1000 vědců a vědkyň z celého světa. „Software umí propojit digitalizované vyhlášky, zákony, úřední protokoly nebo dopisy z jednoho regionu, konkrétně okresu Kladno, nabídne překladač a také služby umělé inteligence k osvětlení tématu a vyhodnocení konkrétního dotazu,“ vysvětluje Jan Vondráček, který vedl projekt českých historiků a amerických vývojářů z MIT, financovaný z programu MISTI-Czech Seed Fund, v němž se jedinečný software zrodil.
Archiv na psacím stole
Software, jehož zveřejnění se plánuje v příštím roce, spojuje několik v současnosti horkých technologických novinek: strojové učení, které umožňuje počítači přečíst rukopis a převést jej do textu, a také umělou inteligenci ChatGPT, kterou ovšem historici „odpojí“ od internetu a „nakrmí“ historickými dokumenty. Dalším krokem je třídění dat a jejich vizualizace, například do map.
„V budoucnu bychom chtěli přidat i překladač, aby byla data přístupná ve všech jazycích, a velkým snem je propojit software i s dalšími archivy nebo knihovnami po celém světě,“ říká Jan Vondráček.
Vzdáleným cílem, na nějž se hodlá vědec zaměřit v některém z dalších projektů, je software důkladně zdokonalit, případně převést do digitální podoby i další regiony. „Počítače, a hlavně ChatGPT je pro mě opravdu průmyslová revoluce, v níž žijeme. Nám historikům umožní úplně jiný styl práce, umožní klást nám jiné otázky a dovědět se odpovědi na ně radikálně rychleji,“ zdůrazňuje badatel.
Šance pro studenty i vědce
Program MISTI – Czech Seed Fund vznikl ve spolupráci MIT, Akademie věd ČR, Ústavu organické chemie a biochemie AV ČR a jeho dceřiné společnosti IOCB Tech. Nyní jej financuje Nadační fond IOCB Tech.
Projekt Jana Vondráčka Institutional Data Shaping Digital History byl první spoluprací z oblasti společenských věd. Česká strana digitalizovala archiv, v MIT vyvíjeli software. Spolupráce se odvíjela na základě online setkávání a jedné týdenní stáže přímo na MIT.
Dr. phil. Jan Vondráček se zabývá zejména dějinami druhé světové války a historií každodennosti a politické správy protektorátu Čechy a Morava. Vystudoval Technickou univerzitu v Darmstadtu, Univerzitu Ludvíka Maxmiliána v Mnichově a Technickou univerzitu v Chemnitzu. V Masarykově ústavu a Archivu AV ČR působí od roku 2019, soustředí se na nové přístupy pro digitální humanitní vědy (digital humanities) prostřednictvím digitalizace, tvorby databází a digitální analýzy.