domenica 16 febbraio 2025

Proposta di un Dizionario dei Termini Positivi e Negativi (1/3)

In questo post e nei successivi riprendo un tema che mi ha sempre affascinato e che è stato oggetto di una comunicazione che ho presentato con Gevisa La Rocca al convegno JADT del 2010: “Validity and reliability of the automatic classification of texts according to the negative-positive criterion” (2010). Si trattava di un nuovo campo di studi, la sentiment analysis, termine apparso per la prima volta in Nasukawa e Yi (2003), una tecnica di opinion mining che puntava alla identificazione e quantificazione del contenuto emozionale del testo. Il tema non era nuovissimo: già nel 1964 Ole R. Holsti si era posto questo problema in un'analisi delle interazioni diplomatiche sovietico-americane durante la crisi cubana del 1962 (Holsti et al., 1964). La classificazione delle parole in positive e negative appare anche nel General Inquirer di Philip J. Stone, che rappresenta forse il primo tentativo di analisi automatica del contenuto su base computazionale (Stone et al., 1966).

A partire dal 2001-2004, l’analisi del “sentiment” si è affermata nel corso degli anni anche grazie allo sviluppo di modelli matematici sofisticati come le reti neurali e - da ultimo - con le relative applicazioni delle nuove tecnologie di intelligenza artificiale generativa per la elaborazione del linguaggio naturale.

Text mining e analisi del contenuto emozionale del testo

La classificazione dei documenti in base alla individuazione dei loro elementi distintivi ha avuto un impulso decisivo con la crescente disponibilità di testi digitalizzati e con il conseguente sviluppo delle tecniche di estrazione automatica del significato da informazioni non strutturate come siti web, libri, giornali, email e, in generale, di prodotti della comunicazione tramite social media. Tra le tecniche di text mining di maggiore interesse, la sentiment analysis ha immediatamente assunto un ruolo decisivo. 

L’analisi dei tratti emozionali e valutativi nella comunicazione digitalizzata trova delle applicazioni importanti nelle ricerche sull’opinione pubblica in tutti i settori dell’economia e della politica. Utenti e consumatori utilizzano le piattaforme online per lasciare le loro valutazioni su prodotti e servizi. I social media generano ogni giorno una quantità immensa di commenti e discussioni in cui si esprimono il giudizio, il gradimento o il rifiuto del pubblico nei confronti di brand, personaggi politici, il mondo dello spettacolo e dello sport, persone più o meno famose e fatti di ogni genere. Per le aziende e le organizzazioni coinvolte è cruciale poter leggere sinteticamente il senso positivo o negativo di queste valutazioni al fine di prendere delle decisioni informate.

Le tecniche di classificazione automatica dei documenti possono essere suddivise in tre grandi approcci: (i) il machine learning approach che si basa sulla elaborazione del linguaggio naturale (NLP, natural language processing) e che si avvale anche degli sviluppi più recenti dell’intelligenza artificiale; (ii) l’approccio basato sulla redazione di lessici e dizionari tematici; (iii) l’approccio misto che combina entrambi i precedenti (D’Andrea et al., 2015; Xu et al., 2022; Tan et al., 2023).

Nelle argomentazioni che seguono farò riferimento esclusivamente a tecniche che si basano sulla compilazione di lessici e quindi di elenchi di forme flesse classificate secondo il criterio della polarità positivo-negativo. 

La “Pollyanna Hypothesis"

Nella valutazione delle opinioni il “sentiment” rappresenta in prima istanza l’atteggiamento e la disposizione positiva o negativa di un soggetto verso una qualche forma di entità (cosa, persona o concetto) in un determinato momento. Tutto questo trae la sua origine dagli studi di psicologia sociale di Osgood, Suci e Tannenbaum (1957) sulle dimensioni del significato e sulla loro misura; nell’ambito di queste ricerche pionieristiche venne messo a punto lo strumento del differenziale semantico che tanta parte ha avuto nelle ricerche sulla misura degli atteggiamenti sociali e nello sviluppo dei metodi di quantificazione dei caratteri qualitativi.

Nel quadro di questi studi, Boucher e Osgwood (1969) formularono quella che è nota come “Pollyanna Hypotesis”, secondo la quale vi è una tendenza universale nel linguaggio umano a utilizzare parole positive con maggiore frequenza delle parole negative. Il fenomeno è stato studiato ripetutamente in tutti gli ambiti linguistici più noti e anche in culture distanti da quella occidentale (Dodds et al., 2015; Wen & Lei, 2022; Zhan & Jin, 2024) ed è stato associato anche a determinati tratti di personalità e alla propensione degli esseri umani a privilegiare le parole che favoriscono le interazioni sociali (Kelly, 2003; Garcia et al. 2012).

Rispetto alla frequenza delle parole va detto che vi sono due dimensioni da considerare: l’occorrenza delle parole (token frequency) e il conteggio delle parole distinte (type frequency). Studi recenti mettono in evidenza come in molti contesti linguistici le parole negative si presentano con una maggiore diversità lessicale mentre le parole positive hanno una maggiore intensità. Zhan e Jin (2004) fanno notare come a fronte di un generale accordo tra gli studiosi nel considerare non falsificata la Pollyanna Hypothesis a livello di token frequency, non vi sia un consenso unanime per quanto riguarda la diversità a livello di type frequency (Dodds et al., 2015; Kloumann et al., 2012; Rozin et al., 2010).

Il dizionario positivo-negativo e l’indice di negatività

Tra le risorse presenti in TaLTaC (Bolasco et al., 1999-2024), il software che ho utilizzato per le mie analisi, è presente un dizionario tematico messo a punto da Sergio Bolasco e Francesca della Ratta-Rinaldi (2004) che permette di eseguire il tagging semantico dei testi sulla base di una lista di aggettivi classificati come positivi o negativi. Il dizionario è costituito da 2.750 forme positive e 3.250 negative. Come mette bene in evidenza Sergio Bolasco (2013: 246):

Il limitare un dizionario ai soli aggettivi è ovviamente un limite, che tuttavia assicura maggior precisione nelle annotazioni. Infatti la qualificazione è certamente meno ambigua di quanto non siano sostantivi e verbi, utilizzati spesso in contesti contrastanti e sovente opposti.

Il dizionario permette di etichettare la terminologia presente in un testo al fine di valutarne quantitativamente la negatività calcolando un indice basato sulla token frequency: il rapporto tra il totale delle occorrenze negative su quelle positive (OccNeg / OccPos *100). Una serie di esperimenti effettuati su testi appartenenti a diverse tipologie ha dimostrato la validità della Pollyanna Hypothesis attestando una soglia empirica del 40% come riferimento per una connotazione negativa. Nella consapevolezza che qualsiasi metodo di classificazione non sarà mai in grado di tenere conto delle complesse ambiguità semantiche legate al contesto della comunicazione e alle strutture sintattiche della lingua, un metodo fondato sul lessico permette a posteriori di esaminare in dettaglio l’intera lista di aggettivi annotati e di correggerne eventualmente il “valore” (positivo, negativo o neutro).

Il mio obiettivo, pertanto, è stato quello varcare il limite cui fa riferimento Bolasco e di valutare gli effetti di una estensione del dizionario tematico ad altre categorie grammaticali (sostantivi, avverbi e verbi) mettendo a punto una lista selezionata con l’ausilio di diverse fonti informative (*). Lo scopo è di costruire una risorsa statistica che possa superare il vincolo grammaticale della “qualificazione” e che sia in grado di permettere - attraverso le forme selezionate - una lettura automatica più sensibile ed estesa della negatività o positività di un testo, e quindi una interpretazione più orientata alla ricostruzione del significato al di là delle inevitabili ambiguità e complessità del linguaggio.

Il dizionario, denominato d’ora in poi come Dizionario dei Termini Positivi e Negativi (DTPN), in questa prima versione è composto da 33.916 forme flesse. 

Tab. 1 - Composizione del DTPN per categorie grammaticali

Categorie grammaticali

Unità lessicali

A

5.679

AVV

476

N

4.212

V

14.931


A+AVV

10

A+AVV+N

21

A+AVV+N+V

7

A+AVV+V

5

A+N

3.301

A+N+V

1.530

A+V

2.955

AVV+N

3

N+V

786

Totale

33.916

Un confronto tra l’Indice di negatività del Dizionario di aggettivi positivo-negativo implementato in TaLTaC e quello del DTPN mette in evidenza la sostanziale conferma della Pollyanna Hypothesis per il complesso delle categorie grammaticali.

Tab. 2 - Indice di negatività a confronto per tipo di corpus e dizionario utilizzato


Connotazione

Italiano Standard

la Repubblica 1990-1999

Diz. aggettivi

DTPN

Diz. aggettivi

DTPN

Forme con c. negativa

1.443

7.799

2.297

15.331

Forme con c. positiva

1.447

7.239

2.043

11.495

Occorrenze negative (N)

30.330

124.747

2.063.955

9.108.307

Occorrenze positive (P)

81.638

301.605

4.344.352

15.390.601

Indice di negatività
(N/P *100)

37,15

41,36

47,51

59,18

La soglia di negatività del 40% suggerita da Bolasco e Della Ratta per gli aggettivi se calcolata per il DTPN potrebbe essere posizionata a una soglia un po' più alta. Un livello del 45% sembrerebbe ragionevole, come indicato dal valore dell’indice applicato al lessico di forme flesse dell’Italiano Standard, che deriva da un corpus di italiano parlato/scritto tratto da diverse fonti, formali e informali, adatto per essere assunto come benchmark con valore “medio” di negatività.

Lo stesso indice applicato al lessico del Rep90, tratto da un corpus di dieci annate del giornale “la Repubblica” (1990-1999), si presenta con una connotazione marcatamente negativa del tutto coerente con una tipologia di news e commenti che si riferiscono anche a eventi drammatici della cronaca e della storia mondiale.

Nel post successivo saranno effettuati altri confronti tra corpora di diversa composizione con approfondimenti sull’impatto della negazione.

[continua il 19 febbraio in 2/3]

_________________

(*) Il DTPN include il Dizionario di aggettivi positivo-negativo di TaLTaC con estensione alle forme appartenenti ad altre categorie grammaticali selezionate dalle seguenti fonti:

General Inquirer (Stone et al., 1966)

NRC Word-Emotion Association Lexicon (Mohammad & Turney, 2013).


OpeNER Sentiment Lexicon Italian - LMF (Maks et al., 2014; Russo et al., 2016)


_____________________


Riferimenti

Bolasco S. (1999-2024). TalTac: Trattamento Automatico Lessicale e Testuale per l’Analisi del Contenuto. Vedi: https://www.taltac.com per informazioni sulle versioni in download (2.11.3 per Windows e 4.0 multipiattaforma e multicore).

Bolasco S. (2013). L’analisi automatica dei testi. Fare ricerca con il text mining. Pref. di Tullio De Mauro. Carocci, Roma.

Bolasco S., della Ratta-Rinaldi F. (2004). Experiments on semantic categorisation of texts: analysis of positive and negative dimension. In G. Purnelle, C. Fairon, A. Duster (eds). Le poids des mots, JADT04 International Conference on Statistical Analysis of Textual Data, pp. 202-210.

Boucher J. & Osgood C.E. (1969). The Pollyanna hypothesis. Journal of Verbal Learning & Verbal Behavior, vol. 8 (1): 1-8.

D’Andrea A., Ferri F., Grifoni P, Guzzo T. (2015). Approaches, Tools and Applications for Sentiment Analysis Implementation. International Journal of Computer Applications, 125 (3): 26-33.

Dodds P.S., Clark E.M., Desu S., Frank M.R., Reagan A.J., Williams J.R. & Danforth C.M. (2015). Human language reveals a universal positivity bias. In Proceedings of the National Academy of Sciences, 112 (8): 2389–2394.

Garcia D., Garas A., Schweitzer F. (2012). Positive words carry less information than negative words. EPJ Data Science, 1(1): 1–12. 

Giuliano L., La Rocca G. (2010). Validity and reliability of the automatic classification of texts according to the negative-positive criterion. In S. Bolasco, I. Chiari, L. Giuliano (eds). Statistical Analysis of Textual Data. JADT10 International Conference on Statistical Analysis of Textual Data, Vol. 1, pp. 61-71.

Holsti O.R., Brody R.A., North R.C. (1964). Measuring Affect and Action in Inter National Reaction Models: Empirical Materials From the 1962 Cuban Crisis. Journal of Peace Research, Vol. 1 (3-4).

Kloumann I.M., Danforth C.M., Harris K.D., Bliss C.A., Dodds S. (2012). Positivity of the English language. PLoS One, 7(1).

Maks I., Izquierdo R., Frontini F., Cuadros M., Agerri R., Vossen P. (2014). Generating Polarity Lexicons with WordNet propagation in 5 languages. 9th LRECLanguage Resources and Evaluation Conference. May 2014. Reykjavik, Iceland, 1155-1161.

Mohammad S. & Turney P. (2013). Crowdsourcing a Word-Emotion Association Lexicon. Computational Intelligence, 29 (3), 436-465, 2013.

Nasukawa T., Yi J. (2003). Sentiment analysis: capturing favorability using natural language processing. In Proceedings of the 2nd international conference on Knowledge capture, October 23–25, pp. 70–77.

Osgood C.E., Suci G.J. and Tannenbaum H.P. (1957). The Measurement of Meaning. Urbana: University of Illinois Press.

Rozin P., Berman L. & Royzman E. (2010). Biases in use of positive and negative words across twenty natural languages. Cognition and Emotion, 24(3): 536–548.

Russo I., Frontini F., Quochi V. (2016). OpeNER Sentiment Lexicon Italian - LMF, ILC-CNR for CLARIN-IT repository hosted at Institute for Computational Linguistics "A. Zampolli", National Research Council, in Pisa, http://hdl.handle.net/20.500.11752/ILC-73.

Stone P. J., Dunphy D. C., Smith M. S. (1966). The general inquirer: A computer approach to content analysis. M.I.T. Press.

Tan K.L., Lee C.P., Lim K.M (2003). A Survey of Sentiment Analysis: Approaches, Datasets, and Future Research. Applied Sciences, 13: 4550.

Wen J., Lei L. (2022). Linguistic positivity bias in academic writing: A large-scale diachronic study in life sciences across 50 years. Applied Linguistics, 43(2): 340–364.

Xu Q.A., Chang V., Jayne C. (2022). A systematic review of social media-based sentiment analysis: Emerging trends and challenges. Decision Analytics Journal, 3, Elsevier, open access.

Zhan J., Jin B. (2024). Does Pollyanna hypothesis hold true in death narratives? A sentiment analysis approach. Acta Psychologica, 245: 104238.

martedì 28 novembre 2023

I Discorsi Programmatici di Governo su Hyperbase

Il corpus DPG68 è costituito dai 68 discorsi programmatici dei presidenti del Consiglio dei ministri della Repubblica italiana dal 1946 al 2022. La base testuale è stata costruita a partire dal corpus Tpg48 delle dichiarazioni programmatiche di governo delle prime dieci legislature messo a punto da Sergio Bolasco alla fine degli anni Novanta. 

Hyperbase è un software per l'esplorazione dei documenti e l'analisi statistica dei testi. 

Il progetto è a cura del CNRS e dell'Université Nice Sophia Antipolis ed è stato ideato e sviluppato da Étienne Brunet, con la collaborazione di Laurent Vanni, all'interno dell'UMR Bases, Corpus, Langage1. 

Link di accesso a HYPERBASE. Cliccare sull'icona blu e inserire il nome del corpus sulla piattaforma Hyperbase: DPG68H 

Avvertenza: la piattaforma è episodicamente soggetta a blocchi per manutenzione. In caso di difficoltà riprovare il giorno dopo.

I testi dei discorsi interrogabili sulla piattaforma Hyperbase sono stati normalizzati con TalTac2, con riduzione "intelligente" delle maiuscole e suddivisi in paragrafi in base alla presenza del punto fermo.

Il conteggio delle occorrenze è il risultato del parsing "elementare", in cui ciascuna forma è rappresentata da un sequenza di caratteri delimitata da spazi. 

Descrizione: 573.731 occorrenze; 23.524 forme; 10.024 hapax.

Attenzione: 

  • il software Hyperbase conteggia tra le forme sia la punteggiatura che i simboli grafici;
  • le caselle di interrogazione sono sempre case sensitive.

Per la presentazione completa del corpus e di alcuni dati analitici, vedi: 

Settantasei anni di Repubblica nei discorsi programmatici di governo.

Avvertenza: la piattaforma è episodicamente soggetta a blocchi per manutenzione. In caso di difficoltà riprovare il giorno dopo.

lunedì 25 settembre 2023

Settantasei anni di Repubblica nei discorsi programmatici di governo

Un anno è trascorso dal 22 ottobre 2022, il giorno in cui, con la cerimonia di giuramento della presidente del Consiglio dei ministri Giorgia Meloni e della sua compagine governativa, è entrato ufficialmente in carica il sessantottesimo esecutivo della Repubblica italiana. Il primo governo nella storia d'Italia ad essere presieduto da una donna e il primo governo della Repubblica che ha ottenuto la fiducia con il sostegno di una coalizione di destra-centro. Mi è sembrata una buona occasione per aggiornare il corpus Tpg48 delle dichiarazioni programmatiche di governo delle prime dieci legislature messo a punto da Sergio Bolasco alla fine degli anni Novanta e presentato analiticamente nel volume a cura di Massimo Villone e Alberto Zuliani, L'attività dei governi della Repubblica italiana (1948-1994), Il Mulino, 1998 [1].

Qui ho ricostruito un prospetto storico completo dei sessantotto governi della Repubblica, compresi i primi tre governi della transizione costituzionale che ottennero la fiducia all'Assemblea Costituente. 

Tab. 1 - Legislature, governi, durata del governo e della crisi

[Cliccare qui per visualizzare]

Il corpus (che sarà denominato Dpg68) è costituito dalle 68 dichiarazioni programmatiche pronunciate dai presidenti del Consiglio nelle sedi prescelte, la Camera dei deputati o il Senato, al fine di ottenere la fiducia del Parlamento. Diversamente dal Tpg48, non sono comprese nel corpus le repliche del presidente che di consueto portano al completamento della procedura con il voto finale di fiducia. 

Tab. 2 - Misure lessicometriche del corpus Dpg68

OccorrenzeN507.379
Forme graficheV23.641
Type/Token ratio(V/N)*1004,66
Percentuale di hapax(V1/V)*10042,33
Frequenza media N/V21,46

Qui di seguito c'è una descrizione dettagliata di ciascuna dichiarazione. 

Tab. 3 - Lunghezza del discorso delle dichiarazioni programmatiche di governo espressa in numero di occorrenze e di pagine di testo


Il discorso più lungo - 33 pagine - è stato pronunciato da Aldo Moro (1974), per la presentazione del suo quarto governo,  e il discorso più breve - 3 pagine - da Paolo Gentiloni (2016).

L'osservazione e l'analisi statistica dei dati testuali ricavati da un corpus di testi si basa prima di tutto sulla costruzione di una matrice righe per colonne. Il corpus Dpg68 si presenta come una grande tabella che ha sulle righe le 23.641 forme grafiche (le parole) e sulle colonne le 68 dichiarazioni identificate dal nome del presidente del Consiglio (seguito da un numero progressivo quando i governi sono più di uno). Un modello matematico di analisi delle corrispondenze, applicato alle 4.752 forme con soglia di frequenza maggiore o uguale a 10,  permette di calcolare la similarità dei profili riga (forme) e dei profili colonna (dichiarazioni). La distanza tra i profili è rappresentabile su un grafico (Figura 1) che sintetizza la similarità dei discorsi programmatici tra di loro. Semplificando molto il modello possiamo affermare che i punti più vicini tra loro sulla mappa identificano i discorsi che utilizzano le stesse parole, mentre quelli più lontani utilizzano parole diverse [2]. 

Fig. 1 - Mappa di similarità dei discorsi programmatici (Piano F1-F2)


[Cliccare sul grafico per ingrandire]

Come si può osservare il piano fattoriale descrive una nuvola di 68 punti, ognuno dei quali corrisponde a un discorso programmatico. La nuvola si presenta con un tipico andamento a parabola che dal III (--) quadrante prosegue nel IV (-+) per poi estendersi nel I (++) e infine nel II (+-). Questo andamento sembrerebbe l'effetto di un fenomeno complesso spiegato solo in parte dalla disposizione cronologica dei governi lungo l'asse delle ascisse. Infatti in senso orizzontale da sinistra a destra si riproduce marcatamente la distinzione tra i governi della Prima Repubblica (quadranti IV e III: 1948-1992) e i governi della Seconda Repubblica (quadranti I e II).  Tuttavia, in modo altrettanto deciso, vediamo come lungo l'asse delle ordinate, dal basso verso l'alto, si riproducano cronologicamente anche le principali coalizioni che in sede parlamentare hanno offerto il loro sostegno politico alla formazione dei governi: ricostruzione, centrismo, centrosinistra e pentapartito.

Ciò che rende simili i discorsi programmatici dei presidenti del Consiglio nelle fasi qui evidenziate è condizionato da cambiamenti del lessico, delle forme espositive e delle retoriche utilizzate rispetto ai problemi e agli obiettivi esposti in ciascun programma di governo. 

Tab. 4 - Primi dieci sostantivi in ordine di frequenza in tutto il corpus Dpg68 e secondo il periodo politico

Intero corpus dei discorsi
(max: 2.923; min: 599)
governo, paese, Italia, parlamento, sviluppo, problemi, azione, legge, riforma, impegno
Ricostruzione
(max: 71 ; min: 28)
Stato, miliardi, sforzo, programma, trattato, pace, libertà, difesa, ricostruzione, collaborazione
Centrismo
(max: 116 ; min: 58)
Stato, partiti, programma, piano, approvazione, lavoro, situazione, Costituzione, progresso, difesa
Centrosinistra
(max: 221 ; min: 158)
piano, Stato, attuazione, partiti, obiettivi, sistema, lavoro, situazione, regioni, quadro
Pentapartito
(max: 131 ; min: 95)
Stato, sistema, responsabilità, interventi, Europa, attività, società, processo, attuazione, obiettivi
Bipolarismo
(max: 181 ; min: 102)
cittadini, lavoro, sistema, Stato, Europa, mondo, fiducia, crescita, società, imprese

La tabella 4 offre qualche indicazione sul cambiamento avvenuto rispetto ai temi più rilevanti dei programmi di governo. I primi dieci sostantivi dell'intero corpus sono presenti anche tra le prime posizioni nei periodi politici evidenziati e pertanto non sono ripetuti.  Nei discorsi di ciascun periodo alcuni sostantivi hanno un carattere fortemente simbolico: trattatopace e libertà, per la Ricostruzione; Costituzioneprogresso e difesa (della moneta, dei lavoratori, del regime repubblicano), per il Centrismo; piano (bilaterale, comunitario, pluriennale, di rinascita), attuazione (del programma, dell'ordinamento regionale, della Costituzione), regioni, per il Centrosinistra; responsabilità (civile dei magistrati, del governo, della maggioranza), Europaprocesso (di innovazione, di distensione, di riforme istituzionali), per il Pentapartito; cittadinilavorosistema (previdenziale, delle autonomie, tributario), per il Bipolarismo.

Le similarità e le divergenze tra i discorsi programmatici sono più evidenti se si osservano le posizioni di alcuni sostantivi e polirematiche sul piano fattoriale (Figura 2), in particolare rispetto al primo asse (orizzontale) sul quale si contrappongono i temi caratteristici dei programmi della Prima Repubblica (semi-asse con segno negativo), rispetto ai programmi della Seconda Repubblica (semi-asse con segno positivo). 

Fig. 2 - Selezione di sostantivi e polirematiche (Piano F1-F2)


[Cliccare sul grafico per ingrandire]

[La nuvola dei punti che rappresenta la proiezione sul primo piano fattoriale delle 4.752 forme grafiche è visualizzatile qui: Figura 2a]

I programmi dei governi del sistema proporzionale presentano profili simili che si aggregano intorno alle coalizioni politiche storicamente più definite e durevoli. Invece nei governi del maggioritario sembrerebbero avere poco peso i due orientamenti politici maggiori del bipolarismo: centrodestra e centro sinistra. 

Le forme sovra-utilizzate che si dispongono lungo il primo asse rappresentano bene i cambiamenti avvenuti nel corso del tempo sia rispetto al lessico politico che rispetto ai temi illustrati dei presidenti del Consiglio nelle dichiarazioni programmatiche. Ne sono un esempio:

  • politica di sviluppo vs/ crescita
  • miseria vs/ povertà
  • emigrazione vs/ immigrazione
  • mano d'opera vs/ posti di lavoro  
  • patto atlantico vs/ Unione Europea
  • iniziativa privata vs/ sostenibilità

Il primo fattore è fortemente condizionato da alcune forme che si presentano in modo specifico e singolare come pandemiadonnefiscofederalismoidentità. Tuttavia il fattore tempo, come accennato in precedenza, si presenta in modo complesso disponendosi anche significativamente lungo l'asse delle ordinate, in particolare nel semipiano sinistro delle ascisse. Non è difficile identificare le coalizioni politiche della Prima Repubblica nelle aggregazioni di forme vicine tra loro rispetto a quelle che se ne distanziano. 

Un quadro più completo delle forme sovrautilizzate da ciascun presidente del Consiglio è rappresentato dal prospetto seguente.

Tab. 5 - Selezione di sostantivi, polirematiche e lemmi dei verbi più significativi nei discorsi di ciascun presidente del Consiglio dei ministri

[Cliccare qui per visualizzare]

Come si è osservato nel commentare la figura 1, se l'asse delle ascisse riproduce in parte la cronologia e i temi che hanno caratterizzato i discorsi programmatici,  con più difficoltà si riesce a interpretare il contenuto del secondo fattore, rappresentato dall'asse delle ordinate. 

Per tentare una interpretazione possiamo ricorrere al quadro teorico utilizzato da Pascal Marchand per un suo importante lavoro sulle dichiarazioni programmatiche (discours de politique génerale) dei primi ministri della Quinta Repubblica francese [3]. La struttura dei dati, i riferimenti storici e le modalità di comunicazione sono identiche. Tenendo conto delle differenze tra le due lingue, possiamo supporre che le caratteristiche del linguaggio politico individuate da Marchand nel suo corpus siano riscontrabili anche nel corpus Dpg68. 

Pascal Marchand formula le sue ipotesi interpretative basandosi sul lavoro di Jean-Léon Beauvois e Rodolphe Ghiglione [4]. Nella costruzione di una frase il parlante compie due operazioni tra loro indipendenti: la scelta delle parole adatte a esprimere il suo pensiero e la combinazione di esse in una sequenza di senso compiuto. L'operazione di scelta avviene sulla base di associazioni suggerite dalla memoria, in cui le parole (il lessico) sono in relazione tra loro in quanto appartengono allo stesso paradigma, mentre l'operazione di combinazione delle parole in una frase avviene in conformità di un sistema di regole (la sintassi) e quindi sulla base di un rapporto sintagmatico. 

Nella produzione di un discorso, il parlante sviluppa il suo stile personale manipolando queste due diverse disposizioni verso la comunicazione linguistica. Il prevalere dell'una o dell'altra dipende dal contesto e dalle intenzioni del parlante. In sintesi si tratta di decidere se è più importante parlare di qualcosa (e quindi costruire un universo di oggetti) oppure di parlare a qualcuno (e quindi costruire un universo di relazioni). La scelta degli ingredienti di un discorso dipende dal bilanciamento di queste due predisposizioni del parlante.  In un discorso in cui prevale il registro paradigmatico la scelta delle parole è più precisa, il lessico è più articolato; per contro la propensione a utilizzare un registro sintagmatico mette in luce il posizionamento critico del parlante rispetto agli interlocutori e al contenuto stesso della comunicazione.

Negli anni Novanta del secolo scorso, Ghiglione e i suoi collaboratori misero a punto un software dedicato all'analisi cognitiva-discorsiva dei testi denominato Tropes [5] all'interno del quale questi concetti vengono resi operativi fino a identificare degli indicatori linguistici che, con l'analisi automatica del testi digitalizzati, permettono di individuare e classificare le categorie grammaticali e semantiche [6].

Lo schema seguente è il risultato di una equivalenza sostanziale tra gli indicatori dell'atteggiamento sintagmatico (SA) e paradigmatico (PA) in lingua francese e in lingua italiana che qui presento solo come ipotesi di lavoro. 

Nell'atteggiamento SA sono prevalenti i seguenti indicatori:

  • pronomi personali di prima e seconda persona (singolare e plurale);
  • pronomi e aggettivi possessivi di prima e seconda persona (singolare e plurale);
  • sequenze ego e sociocentriche con riferimenti al parlante nel discorso oppure a coloro cui si rivolge (io credoio pensosecondo mevedete..., voi sapete che...).

Un atteggiamento PA vede l'utilizzo prevalente di:

  • Forme verbali alla terza persona singolare, in cui il soggetto è il governo (in massima parte) oppure il paese o il parlamento (il governo dovràproponeintende, si accingesi impegnaconsidera...)
  • Nomi astratti, che denotano la tendenza del parlante all'astrazione concettuale (problemaresponsabilitàcrisisocietàmaggioranzasicurezza...) che si associa all'uso di un vocabolario settoriale o specialistico (stabilitàlegislaturaopportunità, consapevolezzastrategiacongiunturaconvergenza...);
  • connettivi (congiunzioni, avverbi, preposizioni o locuzioni) che indicano una marcata elaborazione sintattica con frasi coordinate e subordinate (eedooppurematuttaviaperchépoichéin primo luogoper quanto riguarda...).

Gli indicatori della disposizione del parlante verso il registro sintagmatico e paradigmatico si presentano in ogni discorso con incidenze diverse; il confronto tra le frequenze relative per 10.000 occorrenze di ciascun "gruppo" di  indicatori permette di apprezzare la prevalenza dell'uno o dell'altro atteggiamento. Il risultato di queste osservazioni nei sessantotto discorsi programmatici è riportato in dettaglio nella tabella 6.

Tab. 6 - Incidenza per 10.000 occorrenze degli indicatori di atteggiamento sintagmatico e paradigmatico del parlante nei discorsi programmatici programmatici di governo

[Cliccare qui per visualizzare]

Nel grafico seguente, in cui si riprende la mappa di similarità dei discorsi programmatici della Figura 1, i discorsi sono evidenziati in rosso, quando è marcatamente prevalente l'atteggiamento sintagmatico, e in blu, quando è prevalente l'atteggiamento paradigmatico. 

Fig. 3 - Disposizione prevalente in senso sintagmatico e paradigmatico dei discorsi programmatici di governo (Piano F1-F2)


[Cliccare sul grafico per ingrandire]

La distribuzione dei punti sul piano fattoriale suggerisce una caratterizzazione in senso paradigmatico dei discorsi programmatici rappresentati nel IV quadrante che fanno riferimento ai governi delle coalizioni di Centrosinistra e del Pentapartito. Nel II quadrante troviamo invece la maggior parte dei discorsi caratterizzati da un atteggiamento sintagmatico. La complessità del modello si evidenzia anche per la presenza di tre discorsi con disposizione sintagmatica nel III quadrante (De Gasperi 3, De Gasperi 4 e Pella). Così come appare con una prevalente disposizione paradigmatica il discorso di D'Alema nella presentazione del suo primo governo. I discorsi di Berlusconi 2, Berlusconi 3, Prodi 2 e Letta, sebbene nettamente orientati in senso sintagmatico, sono egualmente caratterizzati dalla presenza significativa di indicatori del registro paradigmatico.

L'atteggiamento sintagmatico appare coerente con la forte personalizzazione della politica inaugurata nel 1994 con la discesa in campo di Silvio Berlusconi e proseguita fino a oggi arrivando a caratterizzare anche un presidente esterno alla politica, come Giuseppe Conte, e un tecnico a-politico come Mario Draghi. Il presidente del Consiglio di un sistema bipolare, nel quale la sua nomina a "premier", sebbene certificata dalla nomina costituzionale del presidente della Repubblica, è già implicitamente legittimata dal voto, tende a tenere un discorso di insediamento in cui rimarca l'assunzione di responsabilità personali e di punti di vista soggettivi (indicati dalle forme verbali in prima persona singolare), presta la massima attenzione alle forme inclusive della prima persona plurale, declinata anche come quarta persona (il nostro governoil nostro impegno), si rivolge spesso direttamente agli interlocutori presenti nell'aula (chiedo a voi la fiduciasta a voi non deluderci; il presidente del Consiglio ha bisogno del vostro aiuto) [7]. Di certo, l'atteggiamento paradigmatico evita al massimo il ricorso a queste forme di relazione personale e interpersonale, preferendo invece formule astratte o impersonali, evocate dalla terza persona singolare del verbo (il governo auspicaconsideraconfermaintende...).

L'analisi lessicometrica indica un percorso da seguire, ma la validazione di questa ipotesi interpretativa richiede un'attenta osservazione qualitativa delle strutture retoriche, grammaticali e sintattiche. Sempre restando nei confini della statistica linguistica, l'argomento può essere ripreso, riesaminando in questa ottica anche i discorsi del più ampio corpus del linguaggio parlamentare e facendo affidamento su un lungo articolo di Pascal Marchand in cui si presentano più diffusamente gli indicatori dell'atteggiamento paradigmatico e sintagmatico [8].

________________________

mercoledì 26 agosto 2020

Lessico e contenuti della I Legislatura: la Ricostruzione [2/2]

12 aprile 1953

Nel post precedente del 30 maggio ho tentato di individuare alcuni contenuti principali del sub-corpus costituto dagli interventi dei leader nella I legislatura facendo affidamento su un modello statistico di estrazione automatica dell'informazione.

Il modello statistico di analisi multidimensionale utilizzato, noto come ALCESTE [1], è basato su un algoritmo di classificazione (cluster analysis) delle parole cooccorenti in un insieme ordinato (sintagmi) di pezzi di testo (chunks) che permette di ricostruire o "scoprire" modelli di senso. Quelli che Max Reinert  ha definito come "mondi lessicali".

Riprendo qui per comodità di lettura le caratteristiche descrittive del sub-corpus dal punto di vista lessicometrico solo per ricordare che i contributi più robusti dal punto di vista statistico sono quelli di Almirante,  De Gasperi, Nenni, Saragat e Togliatti (indicati in rosso nella tabella).

Tab. 1 - Caratteristiche lessicometriche del sub-corpus LP4 (I Legislatura) secondo i leader

 Leader
Occorrenze
Type/Token ratio %
Giorgio Almirante
155.813
2,6
Giulio Andreotti
1.714
29,2
Alcide De Gasperi
90.115
4,5
Amintore Fanfani
670
33,2
Ugo La Malfa
23.166
10,0
Aldo Moro
7.526
16,1
Pietro Nenni
113.523
3,7
Giuseppe Saragat
39.588
7,0
Palmiro Togliatti
159.290
2,6
Corpus della I Legislatura
591.405
4,7

Lo schema di sintesi delle classi estratte della figura 1 mette in evidenza come siano stati individuati due raggruppamenti principali suddivisi a loro volta in 3 classi (il primo) e 4 classi (il secondo) con delle connessioni gerarchiche ricostruite dall'algoritmo (clicca sull'immagine per ingrandire) [2].

Fig. 1 - Dendrogramma della classi estratte con il metodo Reinert.


Nel post del 30 maggio ciascuna classe è stata descritta sommariamente, individuando nel primo raggruppamento (classi 6, 5, 1)  le tematiche connesse ai simboli di politics (rapporti tra le forze politiche, legittimazione e norme di gestione del consenso).
Nel secondo raggruppamento (classi 3, 2, 4 e 7) sono stati individuati i temi delle altre due modalità tradizionalmente attribuite alla scienza politica: i simboli di polity (valori identificativi della repubblica, dei partiti e della comunità nazionale nel contesto della ricostruzione delle relazioni internazionali) e di policy (programmi d'azione e processi decisionali nell'attività di governo).

Ora con il ricorso a un terzo algoritmo cercherò di approfondire i contenuti - in termini semantici e lessicali - di ciascun raggruppamento. 

Il primo modello statistico, la classificazione gerarchica discendente (Classification Descendante Hiérarchique: CDH), aveva come obiettivo di identificare classi e raggruppamenti indipendenti di parole e forme specifiche, caratterizzanti di ciascuna classe. 

Il secondo modello statistico, l'analisi fattoriale delle corrispondenze (Analyse Factorielle de Correspondances: AFC) si proponeva di mettere in evidenza la vicinanza e la distanza tra le parole in una rappresentazione grafica della nuvola dei punti che rappresentano le parole stesse sul piano multidimensionale dei fattori "comuni" e indipendenti individuati. 
Entrambi questi modelli statistici esprimono un approccio globale al corpus sottoposto ad analisi.

Il terzo algoritmo, l'analisi delle similitudini (Analyse Des Similitudes: ADS) applicato a ciascuna classe rappresenta invece un approccio circoscritto alle diverse classi che punta a mettere in evidenza le proprietà di collegamento tra le forme in una rappresentazione grafica in cui le parole sono nodi e la distanza tra di esse nel contesto sono le connessioni. In sintesi si sottopongono ad analisi e a rappresentazione le "reti di parole" che emergono nei testi appartenenti a ciascuna classe [3].

Riprendo, per comodità di lettura, la tabella riassuntiva delle classi suddivisa per raggruppamenti in tre tabelle distinte. I grafici sottostanti sono in piccolo formato e per la loro lettura possono essere ingranditi cliccando sull'immagine. In ciascun grafico sono state visualizzate solo le forme (in corsivo) e i lemmi ( < in tondo > ) con un chi2 significativo (p < 0,0001). La soglia indicata rappresenta il numero di connessioni minimo richiesto per la visualizzazione. Quanto più la rete di parole è densa, tanto più è necessario mantenere una soglia più alta per visualizzare un grafico leggibile, sebbene con una perdita inevitabile di informazione.

Tab. 2a - Classi connesse ai simboli di politics e posizionamento significativo del lessico dei leader.

 Classi
Leader
chi2 p ≺ 0,0001)
Politics


6 - Rapporti tra i partiti e loro legittimazioneAlmirante
1575,67
5 - Procedure e regole del gioco
Almirante
Moro
1699,28
168.89
1 - Dinamiche d'aula e rapporti tra le istituzioni
Togliatti
Andreotti
465,63
129.27

La prima tabella riguarda i simboli di politics e quindi tutto ciò che più propriamente ruota intorno al gioco della politica: le lotte tra i partiti, il problema del consenso elettorale, le regole che si stabiliscono per trasformare in consenso in delega istituzionale, i rapporti tra maggioranza e opposizione. 

Classe 6 - Soglia 10; chi2 p < 0.0001
L'impronta di Giorgio Almirante è particolarmente evidente nella classe 6: "Rapporti tra i partiti e loro legittimazione". Il tema principale del dibattito in Aula è evidente nel nodo centrale legge con i collegamenti a partito_politico, < reato >,  al ministro_dell'Interno Mario Scelba,  < cittadino > ,  < magistrato >, < penale >, stampa, < colpire >. 
In massima parte i nuclei di contenuto sono riferiti al dibattito che precede l'emanazione della legge Scelba del 20 giugno 1952 che con legge ordinaria renderà permanenti delle limitazioni al diritto di voto in deroga dell'art. 48 della Costituzione stessa che riconosce l'universalità del diritto di elettorato attivo e passivo. La legge attuativa del divieto di ricostituzione del partito fascista introdurrà tra l'altro il reato di apologia del fascismo. 
Dal nodo centrale legge si dirama il nodo partito_fascista con i riferimenti a ricostituzione, < ricostituire >, < disciogliere >, riorganizzazione. Affiancate si notano le diramazioni < sostenere > e Senato  in cui Giorgio Almirante argomenta la propria opposizione richiamandosi alle < tesi > in discussione e al dibattito corrispondente avvenuto in Senato. Al nodo < norma > si collegano i riferimenti alla disposizione_transitoria e al dibattito alla Costituente,  mentre dal nodo < articolo > + Costituzione si collega il testo della legge e delle implicazioni che ne derivano in altre disposizioni legislative come codice_penale, partiti_politici, < prevedere >, < stabilire >. 

Classe 5 - Soglia 4; chi2 p < 0.0001
Giorgio Almirante svolge un ruolo da protagonista anche nella classe 5: "Procedure e regole del gioco", centrata in massima parte sul dibattito intorno alla legge elettorale maggioritaria, voluta da Alcide De Gasperi e dalla DC in vista delle elezioni del 1953. Si tratta di quella che fu poi denominata "legge truffa" e che fu abrogata nel luglio 1954, ad elezioni avvenute, senza che la DC  e le forze ad essa apparentate raggiungessero il quorum del 50% per ottenere l'assegnazione del 65% dei seggi alla Camera dei deputati. 
I partiti di opposizione condussero una battaglia durissima sia in parlamento che nelle piazze contro la legge maggioritaria. La presenza forte di Almirante nel corpus in esame è legato alla lunghezza e numerosità degli interventi, ma anche alla estenuante lotta condotta del Movimento sociale italiano contro la legge. Infatti mentre comunisti, socialisti nenniani e indipendenti di sinistra potevano contare comunque su una alleanza politica forte, i missini e i monarchici erano certamente i più penalizzati e isolati per la scelta decisamente antifascista della DC di De Gasperi, che non cedette alle pressioni di Pio XII e della Chiesa romana che avrebbero voluto un'alleanza con i partiti di destra.
I nodi che si evidenziano intorno al nodo centrale < dire > presentano riferimenti molto chiari:  legge, < partito >, < sistema > e < onorevole > per quanto riguarda gli interlocutori citati negli interventi. 
Il nodo < dire > presenta una rosa di verbi che sostengono le argomentazioni dell'oratore: < dimostrare >, < ripetere >, < documentare >, < determinare >, < sembrare > con riferimenti ai contenuti della legge maggioritaria: < maggioranza >, <minoranza >, maggioranza_assoluta, campagna _elettorale, punto_di_vista, premio_di_maggioranza, < polemica >. Il nodo legge è più direttamente collegato al dibattito in Aula durante la presentazione degli emendamenti: legge_elettorale, < presentare >, < emendamento >, corpo_elettorale, elezioni_amministrative
Il nodo < sistema > con sistema_elettorale rappresenta un approfondimento del dibattito con vivaci critiche alla immoralità (immorale) delle proposte di apparentamento nella presentazione delle liste: < apparentamento >,  < collegamento >, < lista >.
Il nodo < partito > esprime più direttamente le preoccupazioni "tecniche" intorno alla rappresentanza politica: Movimento_Sociale_Italiano, partito_liberale, partito_socialdemocratico, < circoscrizione >, < quoziente >, < seggio >, < percentuale > < eleggere >, < elettore >.

Classe 1 - Soglia 4; chi2 p < 0.0001
La classe 1 identifica l'ambito lessicale delle "Dinamiche d'aula e rapporti tra le istituzioni".  I tre nodi principali rappresentano i poli di riferimento degli interventi parlamentari: Governo, Parlamento, Costituzione. Quest'ultima è richiamata costantemente nella fase di approvazione delle leggi attuative che sulla base delle formulazioni di principio dovranno definire concretamente l'architettura istituzionale della nascente repubblica italiana. Ecco quindi il richiamo a tutte le figure istituzionali deliberative e preparatorie (Senato, Camera, Commissioniregolamento), e ai rapporti tra  potere_esecutivo e potere_legislativo affidati al Parlamento e al Governo. La presenza molto significativa di Palmiro Togliatti in questa sfera della politica è rappresentativa del contributo costruttivo dell'opposizione comunista in questa fase storica di consolidamento delle pratiche istituzionali.
 
Tab. 2b - Classi connesse ai simboli di polity e posizionamento significativo del lessico dei leader.

 Classi
Leader
chi2 p ≺ 0,0001)
Polity
3 - Collocazione negli schieramenti internazionali
Nenni
De Gasperi
La Malfa
801.47
44.43
31.53
2 - Valori identificativi della Repubblica
Togliatti
2097.49
4 - Valori e identità della forze politiche
Saragat
Nenni
La Malfa
1139.36
128.64
24.42


I simboli di polity identificano gli aspetti generali del sistema politico e la loro articolazione è fortemente condizionata dalla fase storica. In una Italia che si rimette in piedi dopo la guerra e dopo il dissolvimento morale indotto dal regime fascista e dalla sua disfatta, le coordinate più significative riguardano la collocazione nel quadro delle potenze internazionali (classe 3), i valori fondanti della nuova istituzione statuale (classe 2) e l'identità dei partiti politici nella raccolta del consenso (4).

Classe 3 - Soglia 4; chi2 p < 0.0001
Nella classe 3 si esprime il lessico riferito alla "Collocazione negli schieramenti internazionali", in cui il protagonista assoluto per la numerosità e densità di interventi è Pietro Nenni. Al centro della rete di parole si colloca il paese per il quale devono essere discussi e firmati i trattati internazionali in campo (< accordo >, Piano Marshall, <firmare>, <dichiarazione >, < impegno >. In questo quadro, oltre alla rilevanza del nodo patto_atlantico è da sottolineare la presenza costante nel dibattito dei riferimenti ai primi passi dell'Unione_Europea con il patto_di_Bruxelles di autodifesa collettivo, firmato da Regno Unito, Francia, Belgio, Paesi Bassi e Lussemburgo, e l'OECE (Organizzazione per la Cooperazione Economica Europea). Gli altri nodi collegati a paese riguardano più direttamente i rapporti dell'Italia con gli Stati Uniti e gli altri paesi  dell'alleanza atlantica (America, Francia, Inghilterra), in cui spicca il nome del ministro degli esteri Sforza, il mantenimento della pace e della sicurezza internazionale. In questo contesto il contributo di Alcide De Gasperi è evidentemente importante, ma nel corpus su questi argomenti gli interventi critici di Pietro Nenni, rispetto ad alcune scelte di schieramento effettuate dal Governo, sono prevalenti.

Classe 2 - Soglia 7; chi2 p < 0.0001
La classe 2 è ancora una volta del tutto caratterizzata dagli interventi di Palmiro Togliatti. Anche in questo caso la rete di parole è focalizzata intorno a paese ( < interesse >, < sviluppo >, < democratico >, rinnovamento, < lotta >, classe_operaia, < movimento >, volontà) al quale sono collegate alcune delle forme più caratteristiche del lessico del leader comunista in connessione con i problemi da affrontare: < guerra > ( mondo, < imperialistico >, imperialismo ); pace (< salvare >); < grande > ( <massa >, < potenza > ); < nuovo > (società, < costruire > ); < capitalistico >, (< vecchio >, capitalismo, < regime > ); < popolo > (libertà, < libero >, < avanzare >, indipendenza, < conflitto >, < coloniale > );  < forza > (unità, < popolare >, < progresso >, < reazionario > ); < sociale > ( < struttura >, < profondo >, < trasformazione >, < azione > ). Il quadro è articolato e complesso perché i temi trattati sono molti e gli interventi abbracciano tutto l'insieme dei problemi in campo.
Su questa classe si potrebbe osservare che in effetti i valori che emergono sono di fatto quelli rappresentati dal partito comunista nel lessico del suo leader. Eppure il riferimento ai "valori della Repubblica" è giustificato - a mio parere - dalla visione "nazionale"  di Togliatti, sempre rivolta a un interesse generale, seppure dal punto di vista della sua parte politica.

Come si vedrà, invece, il lessico della classe 4 è molto più focalizzato sulle dinamiche identitarie dei singoli partiti, in particolare dei partiti che, sebbene facciano riferimento a un quadro di valori e di scelte molto simili, si trovano su schieramenti contrapposti. Il partito socialista di Pietro Nenni, schierato con l'opposizione e in particolare molto vicino al partito comunista. Il partito di Giuseppe Saragat, con Unità socialista prima e con il partito socialdemocratico dopo, schierato con la coalizione di governo. Questo valse a Saragat, da parte del Fronte popolare, l'accusa di "social-traditore" e "rinnegato". Di tutto questo vi è traccia nel dibattito parlamentare. 

Classe 4 - Soglia 4; chi2 p < 0.0001
La classe 4, "Valori e identità delle forze politiche", presenta infatti una rete di parole centrata sulla forma < politico > in cui spicca il collegamento diretto verso sinistra con < socialista > (< comunista >, < cattolico >) e, verso destra con Democrazia Cristiana (< liberale >, < ala >, destra, < sinistra >). Gli altri nodi sono tutti connessi alle relazioni tra le forze politiche: < partito > (< coalizione >, < collaborare >, crisi); < problema > (< affrontare> , < risolvere >, socialisti_democratici); democrazia (< difendere >, libertà, monocolore, < democratico >, < totalitario >). Nel nodo onorevole si evidenziano i nomi di alcuni leader coinvolti in modo rilevante nel dibattito (Saragat, Nenni, De_Gasperi, Togliatti, Romita, Dossetti). Per questa ragione ho ritenuto di sottolineare una sorta di "universalismo" della classe 3 a fronte di un "particolarismo" della classe 4, pur essendo consapevole che si tratta di una semplificazione estrema delle argomentazioni alla base dei rapporti tra maggioranza e opposizione. 

Tab. 2c - Classe connessa ai simboli di policy e posizionamento significativo del lessico dei leader.

 Classi
Leader
chi2 p ≺ 0,0001)
Policy
7 - Programmi d'azione e interventi di governo
De Gasperi
La Malfa
845.23
396.97


Classe 7 - Soglia 3; chi2 p < 0.0001
I simboli di policy sono raccolti tutti nella classe 7 e riguardano le scelte del governo, i processi decisionali e i relativi campi di applicazione. Qui sono posizionati significativamente Alcide De Gasperi come presidente del Consiglio dei ministri e Ugo La Malfa; quest'ultimo più per le argomentazioni di politica economica dei suoi discorsi che per i suoi interventi come ministro del commercio con l'estero.
La mappa dei nodi e dei collegamenti in questa classe è meno compatta. Si individuano agevolmente alcuni nuclei semantici principali intorno ai nodi < problema > + < programma > + < economico > (Mezzogiorno, riforma_agraria, bilancia_dei pagamenti, espansione, Piano_Marshall);  produzione (diminuzione, disoccupazione, < aumentare >, incremento, < occupazione >, < operaio >); < industria > (< meccanico >, < aiuto >, < americano >, < economia >, < nazionalizzare >); < mercato > + < prezzo > (< maggiore >, impianti, < industriale >, < basso >, < costo >, prodotti, grano, carbone); < miliardo > + < spesa > (deficit, < bilancio >, < spendere >, lavoro, disoccupati, pensionati, < aumento >, produzione_industriale). 
I nuclei più isolati individuano in gran parte piccole unità semantiche autonome: < bonifica > + < trasformazione >; navali + < costruzione >; stabilità + < monetario >; risparmio + afflusso; < impiego > + mano_d'opera; < contadino > + < terra >.

Complessivamente l'estrazione della rete di parole per mezzo dell'analisi di similitudine offre un contributo significativo per la lettura dei raggruppamenti tematici. I nodi e le connessioni tra le forme permettono una migliore visualizzazione delle classi individuate e quindi una loro interpretazione più completa in termini di significato. I due leader più rappresentativi di una "politica del fare" sono quelli più direttamente coinvolti nelle scelte di governo: Alcide De Gasperi e Ugo La Malfa. I sintagmi classificati nella classe 7 rappresentano il 9,7% del totale. A questa classe si può associare anche la classe 3 relativa alla politica estera (11,9%) in cui - oltre a De Gasperi e La Malfa - il contributo critico più significativo è offerto dal lessico di Pietro Nenni. Tutto il resto, con diverse sfumature, è imputabile a una "politica dei partiti", alle relazioni tra partiti di governo e partiti di opposizione, oppure alle schermaglie istituzionali sempre fortemente congiunte a visioni ideologiche contrapposte (Giorgio Almirante e Palmiro Togliatti). 
Il sistema politico-istituzionale che si è formato nella prima fase di vita della nuove istituzioni nate dalla Costituente riflette le tante diversità - allora più di oggi - caratteristiche dell'Italia. La frammentazione delle rappresentanze politiche riflessa nella pluralità dei partiti è necessariamente il risultato di differenze molteplici, di interessi contrapposti, di richieste divergenti tra gruppi sociali che i partiti stessi trasformano in azione politica. Nei momenti migliori della Repubblica le contrapposizioni ideologiche e gli antagonismi hanno saputo trovare una sintesi e una convergenza verso l'unità. Verso un accordo.
La prima legislatura ha aperto la strada al centrosinistra che, nel bene e nel male, ha contribuito a ricostruire il paese. 
Non vi sono scorciatoie su questa strada difficile. Anche oggi, più che mai, abbiamo bisogno di ridefinire le regole del gioco con accordi solidi e rispettosi delle reciproche differenze. Ora come allora non servono i "trasformismi" e nemmeno i "pieni poteri" costruiti ad arte creando maggioranze anche là dove non ve ne sono. Serve che ognuno sia se stesso ma sia disponibile alle intese in modo costruttivo.

[26 agosto 2020]