fbpx
Laden Evenementen
  • Dit evenement is voorbij.

Digital Heritage Seminar: Layout Analysis and OCR with Deep Learning and Heuristics

Online evenement

11 april 2022
14:00 - 15:30

Dit evenement is voorbij.

Tijdschema

11 april 2022
14:00 - 15:30

Eventsoort

Online evenement

Prijs

Free

Tags

Digital Heritage Seminar: Image Processing

 

KBR nodigt u uit voor een wetenschappelijke serie over digitaal cultureel erfgoed: het KBR Digital Heritage Seminar. Deze reeks wordt mee georganiseerd door het Digital Research Lab van KBR, in samenwerking met de Université libre de Bruxelles, de Vrije Universiteit Brussel, de Université catholique de Louvain en de Universiteit Gent.

In deze reeks, die loopt van februari tot juni 2022, zullen we virtueel drie academische wetenschappers ontvangen die hun onderzoek over cultureel erfgoed en specifieker over beeldverwerking voorstellen.

Alle lezingen zijn in het Engels. Vragen kunt u stellen in het Frans, Nederlands of Engels.

 

Erfgoed en beeldverwerking

“De duivel zit in de details” hoort u weleens, maar als het gaat om digitaal cultureel erfgoed kan men ook zeggen “De duivel zit in de afbeeldingen”. Er zijn al grote inspanningen geleverd om culturele erfgoedcollecties te digitaliseren. Het is een goede manier om collecties te promoten en om het grote publiek gemakkelijker toegang te geven tot die collecties (bv. door de beelden te publiceren op websites zoals onze digitale bibliotheek Belgica).

Toch moeten de technologieën nog verder ontwikkeld worden om de informatie (bv. teksten) die achter deze gedigitaliseerde beelden schuilgaat, ten volle te kunnen benutten.

De sprekers hebben heel wat ervaring in beeldanalyse en in het bijzonder in het extraheren van informatie uit gedigitaliseerde collecties.

 

Programma

Clemens Neudecker, Staatsbibliothek zu Berlin

 

“New Tools for Old Documents – Layout Analysis and OCR with Deep Learning and Heuristics”

This talk will discuss the main achievements and experiences of the QURATOR project at the Berlin State Library (SBB) for document layout analysis. Historical documents that are being digitized in large quantities by libraries and archives frequently exhibit a wide array of features that disturb layout analysis, such as complex layouts with multiple columns, drop capitals and illustrations, skewed or curved text lines, noise, annotations, etc.

In order to deal with these challenges and defects, a robust document layout analysis was developed that is implemented by pixel-wise segmentation using convolutional neural networks. In addition, heuristic methods are applied to detect columns or marginalia, and to determine the reading order of text regions. A key objective lies in feeding the resulting outputs to subsequent processes like a text recognition (OCR) engine or an image similarity search.

Bekijk de slides

 

 

Inschrijven

Registratie is verplicht. De ochtend van het evenement ontvangt u de link naar het webinar. Nog vragen? Stuur dan een e-mail naar gna.yh@xoe.or.

Duur: 1,5 uur

Inschrijven

 

 

Over de spreker

Clemens Neudecker studeerde filosofie, computerwetenschappen en politieke wetenschappen aan de Ludwig Maximilian University (LMU) in München. Hij werkt ruim 15 jaar in O&O bij verschillende digitale bibliotheken, waaronder de Bayerische Staatsbibliothek en de Koninklijke Bibliotheek van Nederland. Clemens is momenteel onderzoeker en projectcoördinator bij de Staatsbibliothek zu Berlin. Hij is ook bestuurslid bij Europeana, het digitale platform voor cultureel erfgoed van de Europese Unie.