NLP e Analisi di Reti Semantiche

Questo progetto e l’implementazione tecnica alla base della pubblicazione “A Multi-Method Validation Framework for Large-Scale Multilingual Text Analytics” (JADT 2026, in review). Operationalizza l’intero workflow analitico usato nel paper, dalla preparazione dei dati alla validazione cross-method e al confronto dei risultati.

La pipeline combina moduli in R e Python su un grande corpus multilingue di recensioni, includendo: preprocessing e TF-IDF, LDA topic modeling, LSA e Correspondence Analysis, sentiment analysis lessicale e model-based, clustering e analisi di reti di co-occorrenza. Il repository include anche script di validazione cross-platform per confrontare gli output dei metodi e verificare la stabilita strutturale tra implementazioni.

L’obiettivo centrale e la robustezza metodologica: verificare quali risultati restano consistenti quando cambiano metodi, famiglie di modelli e componenti specifiche della lingua. In questo senso, il progetto non e una generica demo NLP, ma una pipeline di ricerca riproducibile progettata per la validazione quantitativa di conclusioni di text analytics.

Research Text Mining Network Science Correspondence Analysis Clustering R

Authors

Stefano Blando (he/him)

PhD Student in Artificial Intelligence

Stefano Blando is a PhD student in the National PhD Program in Artificial Intelligence at Scuola Superiore Sant’Anna and the University of Pisa. His research lies at the intersection of AI, agent-based modeling, and economics. He studies adaptive multi-agent systems, statistical verification of economic simulations, and robust quantitative methods for financial and socio-economic data.

← Analisi della Topologia di Rete per la Previsione del Rischio Sistemico 10 gen 2026

Sistema di Raccomandazione Avanzato 20 giu 2025 →

No results found