<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Text Mining | Stefano Blando</title><link>https://stefano-blando.github.io/it/tags/text-mining/</link><atom:link href="https://stefano-blando.github.io/it/tags/text-mining/index.xml" rel="self" type="application/rss+xml"/><description>Text Mining</description><generator>HugoBlox Kit (https://hugoblox.com)</generator><language>it-IT</language><lastBuildDate>Sat, 10 Jan 2026 00:00:00 +0000</lastBuildDate><image><url>https://stefano-blando.github.io/media/icon_hu_8d0dee6c10a3c598.png</url><title>Text Mining</title><link>https://stefano-blando.github.io/it/tags/text-mining/</link></image><item><title>NLP e Analisi di Reti Semantiche</title><link>https://stefano-blando.github.io/it/projects/nlp-semantic-network-analysis/</link><pubDate>Sat, 10 Jan 2026 00:00:00 +0000</pubDate><guid>https://stefano-blando.github.io/it/projects/nlp-semantic-network-analysis/</guid><description>&lt;p&gt;Questo progetto e l&amp;rsquo;implementazione tecnica alla base della pubblicazione &lt;strong&gt;“A Multi-Method Validation Framework for Large-Scale Multilingual Text Analytics”&lt;/strong&gt; (JADT 2026, in review). Operationalizza l&amp;rsquo;intero workflow analitico usato nel paper, dalla preparazione dei dati alla validazione cross-method e al confronto dei risultati.&lt;/p&gt;
&lt;p&gt;La pipeline combina moduli in &lt;strong&gt;R e Python&lt;/strong&gt; su un grande corpus multilingue di recensioni, includendo: preprocessing e TF-IDF, &lt;strong&gt;LDA topic modeling&lt;/strong&gt;, &lt;strong&gt;LSA e Correspondence Analysis&lt;/strong&gt;, sentiment analysis lessicale e model-based, clustering e &lt;strong&gt;analisi di reti di co-occorrenza&lt;/strong&gt;. Il repository include anche script di validazione cross-platform per confrontare gli output dei metodi e verificare la stabilita strutturale tra implementazioni.&lt;/p&gt;
&lt;p&gt;L&amp;rsquo;obiettivo centrale e la robustezza metodologica: verificare quali risultati restano consistenti quando cambiano metodi, famiglie di modelli e componenti specifiche della lingua. In questo senso, il progetto non e una generica demo NLP, ma una pipeline di ricerca riproducibile progettata per la validazione quantitativa di conclusioni di text analytics.&lt;/p&gt;</description></item></channel></rss>