La codifica elettronica dei testi rappresenta uno dei temi fondamentali della riflessione e della sperimentazione nel dominio dell’Informatica umanistica. Come è noto la soluzione considerata teoricamente ottimale e ampiamente diffusa nella pratica dalla comunità scientifica consiste nell’adozione dei markup language descrittivi basati su XML . Lo sviluppo e la diffusione della Text Encoding Initiative ha sancito questa scelta. XML può essere considerato sia un formalismo sia un modello di dati espresso da quel formalismo, e tale (meta)modello è appunto un albero ordinato etichettato. In altri termini XML considerato come linguaggio di modellizzazione può esprimere solo modelli la cui struttura è un albero. Il modello gerarchico si presta naturalmente a descrivere la struttura di numerosi livelli testuali scientificamente rilevanti: i livelli editoriale, morfosintattico, metrico, tanto per fare alcuni esempi, sono in linea generale descrivibili come strutture gerarchiche ordinate. I problemi emergono si pensa di eleggere XML a formalismo generale per la rappresentazione complessa dei testi in ambito umanistico e letterario. Le manifestazioni di queste difficoltà sono state comunemente rubricate come il problema delle gerarchie sovrapposte (overlapping hierarchies). Negli ultimi venti anni, proprio in parallelo con la diffusione di XML nel mondo dell’elaborazione testuale e della TEI nella comunità umanistica si sono moltiplicati i tentativi di trovare delle soluzioni definitive al problema. Le soluzioni proposte si possono dividere in due classi: soluzioni interne e soluzioni esterne al paradigma XML. Questo lavoro propone una analisi approfondita di queste soluzioni innovative e ne valuta la praticabilità in confronto a XML.
Ciotti, F. (2011). La rappresentazione digitale del testo: il paradigma del markup e i suoi sviluppi. In La Macchina nel Tempo: Studi di informatica umanistica in onore di Tito Orlandi (pp. --). Firenze : Le Lettere.
La rappresentazione digitale del testo: il paradigma del markup e i suoi sviluppi
CIOTTI, FABIO
2011-01-01
Abstract
La codifica elettronica dei testi rappresenta uno dei temi fondamentali della riflessione e della sperimentazione nel dominio dell’Informatica umanistica. Come è noto la soluzione considerata teoricamente ottimale e ampiamente diffusa nella pratica dalla comunità scientifica consiste nell’adozione dei markup language descrittivi basati su XML . Lo sviluppo e la diffusione della Text Encoding Initiative ha sancito questa scelta. XML può essere considerato sia un formalismo sia un modello di dati espresso da quel formalismo, e tale (meta)modello è appunto un albero ordinato etichettato. In altri termini XML considerato come linguaggio di modellizzazione può esprimere solo modelli la cui struttura è un albero. Il modello gerarchico si presta naturalmente a descrivere la struttura di numerosi livelli testuali scientificamente rilevanti: i livelli editoriale, morfosintattico, metrico, tanto per fare alcuni esempi, sono in linea generale descrivibili come strutture gerarchiche ordinate. I problemi emergono si pensa di eleggere XML a formalismo generale per la rappresentazione complessa dei testi in ambito umanistico e letterario. Le manifestazioni di queste difficoltà sono state comunemente rubricate come il problema delle gerarchie sovrapposte (overlapping hierarchies). Negli ultimi venti anni, proprio in parallelo con la diffusione di XML nel mondo dell’elaborazione testuale e della TEI nella comunità umanistica si sono moltiplicati i tentativi di trovare delle soluzioni definitive al problema. Le soluzioni proposte si possono dividere in due classi: soluzioni interne e soluzioni esterne al paradigma XML. Questo lavoro propone una analisi approfondita di queste soluzioni innovative e ne valuta la praticabilità in confronto a XML.File | Dimensione | Formato | |
---|---|---|---|
misc_orlandi_Ciotti.pdf
accesso aperto
Licenza:
Copyright dell'editore
Dimensione
732.49 kB
Formato
Adobe PDF
|
732.49 kB | Adobe PDF | Visualizza/Apri |
I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.