From OCR to Content Interpretation: Towards a Scalable Workflow for Arabic Literature in the Digital Humanities

Autori

  • Maura Tarquini Università degli Studi di Sassari
  • Elisa Gugliotta Université Grenoble Alpes

DOI:

https://doi.org/10.58015/2036-2293/806

Parole chiave:

Digital Humanities, Arabic literature, OCR

Abstract

Questo articolo esplora come i testi letterari arabi possano funzionare come dispositivi epistemici nelle Digital Humanities quando i metodi computazionali sono allineati con l’interpretazione qualitativa. Dopo aver collocato le DH arabe all’interno degli sforzi globali di digitalizzazione e dei quadri pedagogici, presentiamo un workflow dall’OCR all’analisi, specificamente adattata all’arabo, confrontando Tesseract e Qari-OCR. Infine, una lettura qualitativa di Awrāq ʿIṣṣām ʿAbd al-ʿĀṭī di al-Aswānī mette in evidenza rabbia, odio e tristezza come emozioni dominanti che plasmano una narrazione di alienazione e critica. Lo studio dimostra come digitalizzazione, analisi e interpretazione convergano per arricchire la ricerca e la didattica all’interno del nostro progetto.

Biografia autore

Maura Tarquini, Università degli Studi di Sassari

Maura Tarquini è titolare di un contratto di ricerca presso l'Università degli Studi di Sassari sul progetto RĀBIṬA, per la digitalizzazione della letteratura araba. Inoltre insegna lingua araba all'Università degli Studi di Cagliari dal 2017. Ha conseguito un dottorato di ricerca nel 2015 in dialettologia araba presso Sapienza, Università di Roma, con una tesi sull'arabo tunisino.

##submission.downloads##

Pubblicato

09 dic 2025

Come citare

Tarquini, M., e E. Gugliotta. «From OCR to Content Interpretation: Towards a Scalable Workflow for Arabic Literature in the Digital Humanities». Testo e Senso, vol. 1, n. 29, dicembre 2025, pagg. 115-28, doi:10.58015/2036-2293/806.

Fascicolo

Sezione

Digital Humanities