Glossario di Analisi Automatica dei Testi

L’analisi automatica dei testi (AAT) è un trattamento che possiamo definire di tipo metrico, per sottolineare la sua vocazione a fornire “misurazioni oggettive” dei fenomeni: i) misurazioni nel senso di valutazioni basate su analisi matematico-quantitative, ii) oggettive non tanto per esprimere una intersoggettività condivisa, quanto perché mantengono uniformi i criteri di osservazione lungo l’intera superficie dell’oggetto di studio, costituito dalla collezione dei testi raccolti.

L’analisi automatica, grazie al computer, permette di essere liberi dall’ampiezza e numerosità dei testi. Questo implica rapidità nelle operazioni, garantisce omogeneità nei criteri di ricerca di informazioni in ogni parte del testo, senza distorsioni “cronologiche”, lungo lo sviluppo della ricerca e dello studio. Se il testo non si legge, la sua lettura avviene per rappresentazioni e “modelli” (queries, concordanze, funzioni obiettivo e per confronto con risorse linguistiche) a due livelli di analisi: lessicale e testuale.

Se la lettura avviene per modelli, ognuno di questi costituisce di per sé una “metrica”, ovvero una rappresentazione, ora di tipo lessicale, come ricostruzione paradigmatica del linguaggio utilizzato, ora di tipo testuale, come ricostruzione sintagmatica del discorso, inteso sia come “senso” complessivo presente nel corpus, sia come significato di singole frasi.

[Estratto da: Sergio Bolasco, Sulla costruzione di un corpus per l'analisi automatica del linguaggio parlamentare dei leader, in Il linguaggio della leadership politica tra la Prima e la Seconda Repubblica (a cura di Luca Giuliano e Paola Villlani), Camera dei Deputati, Roma, 2015, pag. 44]

L'AAT utilizza numerosi termini tecnici. Il link seguente rinvia al Glossario che Sergio Bolasco ha preparato come appendice online al suo volume: L'analisi automatica dei testi. Fare ricerca con il text mining, Carocci editore, Roma, 2013.

Glossario