Kézírást felismerő fejlesztés

A Magyar Tudományos Akadémia (MTA) Könyvtárában őrzött Arany János hivatali iratok kereshetővé tételét segíti az a fejlesztés, amelyért Társadalmi Innovációs Díjat kapott a Digitális Örökség Nemzeti Laboratórium.


Arany János (Kép: wikipédia.org – Barabás Miklós/Walzel Ágost Frigyes)

A fejlesztésnek köszönhetően rendkívül értékes anyag válik hozzáférhetővé úgy a kutatók, mint a nagyközönség számára. A fejlesztés azért egyedi és innovatív, mert hazánkban még nem történt ilyen nagyságrendű, AI-alapú kézírás-felismerés magyar digitális bölcsészek és AI-szakértők közreműködésével, magyar szakemberek és számítástechnikai eszközök használatával. A projekt keretében olyan általános kézírás-felismerő modell jött létre, amelyet a közgyűjtemények szabadon felhasználhatnak. Így a jövőben szinte korlátlan mennyiségű, magyar nyelvű, 19. századi kéziratoldalt dolgozhatnak fel. Ezek a szövegek eddig nem képezték a kulturális örökség integráns részét.

A saját HTR (Handwritten Text Recognition) modell tanításához 200 lapnyi Arany-kézírás mellett Arany titkárának, Ring Adorjánnak a kezétől származó, valamint további, csaknem 30 kéz írását tartalmazó korpuszt készítettek a szakértők. A modellt összesen 874 átírt kéziratlapon tanították. A hivatali iratok publikálása jelenleg folyamatban van az MTA Könyvtár dokumentumszerve­rén (repozitórium), kereshető PDF-ek formájában.

A kifejlesztett módszertan olyan piaci területen is újabb innovációk kiindulópontja lehet, mint például a céges dokumentumok AI-alapú feldolgozása. A technológiát olyan, a Nemzeti Kutatási, Fejlesztési és Innovációs Hivatal minősítésével rendelkező kiváló kuta­tási infrastruktúrák integrálják munkameneteikbe, mint a DH-LAB-QULTO közös kutatási infrastruktúra vagy a HUN-REN BTK EtnoLab projektje.•

Címlapkép: antikvarium.hu


 
Archívum
 2011  2012  2013  2014  2015  2016  2017  2018  2019  2020  2021  2022  2023  2024
Címkék

Innotéka