Projekt Malach - archiv výpovědí svědků holocaustu

9. prosinec 2007

Slovo "malach" znamená hebrejsky anděl, ale též "kraloval". Záleží na tom, jak se slovo píše. O tom, co znamená projekt Malach, však žádných pochyb není: Jeho cílem je zpřístupnit rozsáhlý audiovizuální archiv nahrávek výpovědí svědků nacistického holocaustu, vytvořený americkou nadací pro zachycení výpovědí o šoa. Na tomto mezinárodním projektu se podílejí přední světové univerzity a výzkumná střediska - například IBM, Univerzita v Marylandu, ale také dvě česká univerzitní pracoviště.

Archiv výpovědí svědků nacistického holocaustu, vytvořený americkou Nadací pro audiovizuální zachycení výpovědí o šoa, obsahuje celkem 116 000 hodin digitalizovaných rozhovorů s více než 52 000 lidmi z celého světa, celkem ve 32 jazycích. Využít takto nashromážděné informace podle jejich druhu, zajistit přepis a vyhledávání podle klíčových slov - to vše navíc v různých jazycích - představuje velice nesnadný úkol. U nahrávek pořízených v češtině se na jeho řešení podílejí Ústav formální a aplikované lingvistiky Matematicko-fyzikální fakulty Univerzity Karlovy v Praze a Katedra kybernetiky fakulty aplikovaných věd Západočeské univerzity v Plzni.

Konkrétně se jedná o zpracování přibližně 700 dvouhodinových nahrávek v českém jazyce. Ty byly jednotlivě anotovány, digitalizovány a zpracovány systémem automatického rozpoznání mluvené řeči. Kvalita automatických přepisů rozhovorů velice závisí na konkrétních podmínkách: stáří a zdravotním stavu mluvčího, projevených emocích, znalosti jazyka, technické kvalitě záznamu. Ne vždy lze proto automatický přepis označit za dokonalý.

Součástí projektu je též vytvoření systému, který umožní rychlý přístup k obsahu zaznamenaných rozhovorů - především historikům, studentům, učitelům, novinářům a spisovatelům. Systém dokáže vyhledávat v nahrávkách úseky, které se týkají předem vytčeného tématu. Má-li například uživatel zájem o osobu Oskara Schindlera, systém vyhledá všechny úseky ve všech výpovědích, které se k této osobě vztahují, a uživatel si může takto vybrané nahrávky poslechnout.

Je zřejmé, že díky takovému počítačovému programu je možno získat nejen souhrnné informace o jednotlivých osobách, pokud se jejich jména vyskytují ve více výpovědích, ale též o událostech vztahujících se k různým místům, především koncentračním táborům. Program tak dokáže lépe než dosud sledovat různé souvislosti a vztahy, které mohou vrhnout nové světlo na události okolo šoa. Výsledky ocení především historikové, ale i knihovníci a archiváři, všichni, kdo se zabývají dějinami druhé světové války a holocaustu.

autor: Marcela Folprechtová
Spustit audio