Il corpus LP

Vi è più di un motivo per giustificare le scelte che hanno portato il gruppo di ricerca a focalizzare l’attenzione sulla leadership, sulla figura di alcuni leader identificati come più rappresentativi della vita politica italiana di questi ultimi sessant’anni [1].

La base testuale è vasta e complessa da dominare. Si tratta di circa 10.000 resoconti stenografici, per limitarci solo alle sedute in Assemblea della Camera dei Deputati, più 30.000 resoconti delle commissioni parlamentari, per i quali, conteggiando 70.000-100.000 occorrenze di parole per documento, si possono stimare da due a quattro miliardi di occorrenze. Il nostro corpus rappresenterebbe circa il 2,5‰ del totale, se ci riferiamo ai soli discorsi in Aula. Tuttavia rispetto alla leadership, se dovessimo considerarlo un campione, la proporzione sarebbe maggiore del 30% perché i leader, come da noi definiti, sono 85 complessivamente, dalla I legislatura dell’Italia repubblicana (8 maggio 1948 – 24 giugno 1953) alla XVI, fino all’insediamento del governo Monti (29 aprile 2008 – 16 novembre 2011).


Il discorso parlamentare ha caratteristiche proprie [2] e copre solo una parte, in certi casi una piccola parte, di tutta la comunicazione dei leader politici [3]. Si tratta di testi molto eterogenei sulla “scala della formalità”, come facevano notare sia Tullio De Mauro [4] che Paola Villani: «dal parlato-(tra)scritto dei resoconti stenografici ai testi di mozioni, interpellanze e interrogazioni; dalle proposte e disegni di legge alle relazioni previsionali e programmatiche; dagli atti e dalle relazioni conclusive delle commissioni d’inchiesta ai messaggi alle Camere del Presidente della Repubblica» [5].


Certamente, nel sottoporre ad analisi automatica un corpus di discorsi parlamentari, non è possibile ignorare i rilievi e i dubbi che Michele Cortelazzo aveva già segnalato nel suo saggio del 1985 [6]: la storia della trascrizione stenografica alla Camera dei Deputati testimonia bene quanto possano essere “pesanti” gli interventi correttivi ad opera dei resocontisti (o degli oratori stessi in sede di revisione). È sufficiente riportare quanto scrive Aurelia Mohrhoff (resocontista e stenografa della Camera):

Non più tardi di una quindicina di anni fa il comandamento del nostro superiore gerarchico era, per noi giovani stenografi: « Se l'oratore ha parlato male, tu devi farlo parlare bene ». Si pretendeva cioè una rielaborazione che comportava una « composizione » : annullate le disarticolazioni tipiche del parlato, occorreva procedere ad una sorta di standardizzazione, che risentiva di quella concezione « eleatica » del linguaggio come entità omogenea astratta. Il filtro stenografico, per usare una efficace immagine del mio collega Francesco Pariset, si traduceva in una sorta di letto di Procuste, nel quale le espressioni venivano allungate o contratte, a seconda della formazione culturale dello stenografo. Ne risultava un testo asettico, « imbalsamato », e tutto sommato, diciamolo francamente, falso [7].
Sappiamo che a questo “letto di Procuste” reagirono i radicali al loro ingresso nell’Aula parlamentare (protagonista assoluto Marco Pannella); una reazione che però era già nell’aria all’interno della professionalità crescente degli stenografi e resocontisti. Il che fa dire – sempre a Aurelia Mohrhoff:
Abbiamo oramai al nostro attivo una serie di piccole conquiste: se l'oratore si rivolge a qualcuno dandogli del « tu » il suo discorso viene così trascritto; se il deputato si permette audacie verbali magari non troppo consone allo stile parlamentare, queste espressioni vengono mantenute, entro i limiti del rispetto dovuto alle altre persone; se chi parla vuole esordire dicendo «signore e signori», o « colleghi deputati », invece del rituale « signor Presidente, onorevoli colleghi », così appare nel resoconto. Abbiamo contribuito ad una nuova « fisionomia » del testo, tentando di rendere con parentesi, lineette, puntini, virgolette, quegli importantissimi elementi paralinguistici che fanno sì che il parlato si regga in quanto tale. I nostri resoconti parlano oggi non la lingua del Parlamento, ma quella del parlamentare [8].
Pertanto, nell’interpretazione dei testi e delle loro caratteristiche linguistiche, è necessario adottare la massima cautela, tenendo presente la “potenziale” natura ibrida del prodotto testuale che compare pubblicato nei resoconti stenografici: il discorso parlamentare si colloca in una “terra di mezzo” in cui è difficile distinguere tra testi elaborati direttamente dal parlante (con discorsi pronunziati sulla base di un registro parlato-parlato o scritto-parlato), testi elaborati da collaboratori del leader, testi rielaborati successivamente, ancora una volta per intervento del parlante o di collaboratori, e testi riscritti dagli stenografi e dagli addetti alla resocontazione.

Tullio De Mauro [9], già nel 2010, aveva fatto notare come, al di là degli studi che ho già citato in precedenza dedicati in gran parte allo stile dell’oratoria, alla retorica, all’argomentazione, non vi fosse una base di riferimento empirica che permettesse di gettare uno sguardo complessivo sul linguaggio parlamentare, di effettuare qualche confronto, di trarre qualche osservazione generale di sviluppo e cambiamento e forse anche di sottoporre a prova qualche ipotesi di lavoro.


Per avvicinarsi a questo obiettivo, nei limiti definiti dal gruppo di ricerca e pur tenendo conto di questi importanti rilievi metodologici, non si è trovato (ma in effetti non c’è) un approccio più efficace, affidabile e anche “economicamente” affrontabile per effettuare confronti e analisi tra leader di diversa esperienza e orientamento politico, lungo un arco temporale abbastanza esteso da risultare significativo. Se l’intento è di sottoporre il linguaggio parlamentare al “macroscopio” dell’indagine statistica, lo scritto è quanto rimane e quanto abbiamo a disposizione della complessità del linguaggio parlamentare, e di questo ci dobbiamo accontentare.
Ecco dunque che la base testuale è rappresentata, come si è detto, dagli Atti parlamentari che la Camera dei deputati pubblica con riferimento ai resoconti dei dibattiti in Assemblea.


Il corpus è stato estratto dai resoconti stenografici disponibili sul sito della Camera dei Deputati in formato pdf fino alla XII legislatura e poi in formato HTML sul stesso sito dalla XIII legislatura in poi (dal maggio 1996). L’archivio dei documenti in pdf è accessibile anche dal Portale storico della Camera.


Il corpus LP (corpus del linguaggio parlamentare dei leader della Prima e della Seconda Repubblica) ha avuto diverse versioni seguendo le fasi di sviluppo della ricerca e la continua opera di raffinamento della base testuale che si è resa necessaria a causa della pessima qualità dei documenti originali in pdf sottoposti a digitalizzazione tramite OCR (optical character recognition).


La versione LP1 cui fa riferimento la pubblicazione del volume di presentazione generale pubblicato dalla Camera dei Deputati nel dicembre 2015 [10] è costituito di 1608 frammenti (circa 5 milioni di occorrenze di parole), con riferimento a tutte le legislature della Repubblica dalla I alla XVI, interrompendo il periodo di osservazione con l’insediamento del Governo Monti (16 novembre 2011). Ogni frammento rappresenta un intervento in Aula di uno dei 30 leader leader selezionati. Per i dettagli e i problemi che pone la definizione di "intervento" è necessario leggere il documento "Problemi di costruzione del corpus" presente in questo blog sulla colonna di destra della home page. 


La versione del corpus LP2 (che è stata assunta come base di alcune pubblicazioni successive, tra le quali la redazione finale dell'intervento [11] al Convegno ASLI (Associazione per la storia della lingua italiana), è costituito di 1710 frammenti (circa 5.500.000 occorrenze).


La versione LP4, assunta come riferimento nella documentazione di questo blog, è costituita di 1877 frammenti (circa 5.560.000 occorrenze). Di fatto, parlare di un unico corpus è improprio. Forse sarebbe più corretto parlare di trenta corpora costituiti dagli interventi nella Camera dei Deputati dei trenta leader selezionati.



[03/07/2019]


[1] Nella convinzione, come si è detto, che non fosse possibile costituire un corpus "rappresentativo" della leadership politica è stata effettuata una prima selezione secondo due criteri di rilevanza:
  1. Segretari di partito o di movimento politico oppure presidenti o capi di coalizione, quando la funzione del segretario non era identificabile (per esempio nei casi di Berlusconi, Prodi e, in generale, di molti leader della Seconda Repubblica).
  2. Politici “di governo” che hanno occupato ruoli di leader pur non rispondendo al criterio 1 (ad esempio: Giuliano Amato, Giulio Andreotti, Carlo Azeglio Ciampi, Francesco Cossiga, ecc.).
La lista completa dei leader, costituita da 84 nominativi, nel mese di novembre 2011 è stata sottoposta alla valutazione dei componenti del gruppo di ricerca e sono stati selezionati i 30 nominativi più votati. Oggi la scelta per alcuni leader della Seconda Repubblica appare fortemente condizionata dal clima politico di quegli anni.
[2] Teun A. Van Dijk, Parliamentary debates, in Ruth Wodak – Teun A. van Dijk (eds.), Racism at the top. Parliamentary discourses on ethnic issues in six european States, Klagenfurt, Drava Verlag, 2000, pp. 45-78.
[3] Fabrizia Giuliani, Il discorso parlamentare, in Luciano Violante (a cura di), Il Parlamento, «Annali della Storia d’Italia», vol. 17, Torino, Einaudi, 2001, pp. 855-886. Riccardo Gualdo – Maria Vittoria Dell’Anna, La faconda Repubblica. La lingua della politica in Italia (1992-2004), San Cesario di Lecce, Manni, 2004. Maria Emanuela Piemontese – Paola Villani, Lessico, leggibilità e comprensibilità del linguaggio politico-parlamentare, «Bollettino di Italianistica», 2007, 4, pp. 249-269.
[4] Tullio De Mauro, Il linguaggio della Camera, in Aa. Vv. La Camera dei Deputati a Montecitorio: storia fotografica, Milano, 24 Ore cultura, 2010, p. 108.
[5] Paola Villani, Il discorso parlamentare: usi, regole, resoconti, in Luca Giuliano – Paola Villani (a cura di), Il linguaggio della leadership politica tra la Prima e la Seconda Repubblica. Problemi di metodo e di ricerca, Roma, Camera dei Deputati, 2015.
[6] Michele A. Cortelazzo, Dal parlato al (tra)scritto: i resoconti stenografici dei discorsi parlamentari, in Günter Holtus – Edgar Radtke (Hrsg.), Gesprochenes Italienisch in Geschichte und Gegenwart, Tübingen, Narr, 1985, pp. 86-118.
[7] Aurelia Mohrhoff, Dalla lingua del Parlamento alla lingua del parlamentare, «Serie delle verifiche di professionalità dei consiglieri parlamentari», 1987, 1, p. 157.
[8] Ivi, p. 156.
[9] Tullio De Mauro, Il linguaggio della Camera, cit.
[10] 
Luca Giuliano – Paola Villani (a cura di), Il linguaggio della leadership politica tra la Prima e la Seconda Repubblica, cit.
[11] Luca Giuliano, La parola del leader: profili di linguaggio parlamentare a confronto, in L'italiano della politica e la politica dell'italiano (a cura di Rita Librandi e Rosa Piro), Atti del Convegno ASLI (Napoli, 20-22-novembre 2014, pubblicati da Franco Cesati Editore nell'ottobre 2016), pp. 131-152.