Generative AI | Stefano Blando

Fine-Tuning Leggero con PEFT e LoRA

Wed, 20 Nov 2024 00:00:00 +0000

Questo progetto si concentra su una domanda pratica in NLP: quanta adattazione utile si puo ottenere da un modello pretrained senza pagare il costo completo del fine-tuning totale?

Usando LoRA su distilbert-base-uncased per sentiment analysis, la pipeline mostra che un sottoinsieme molto piccolo di parametri allenabili puo comunque produrre un netto salto di performance rispetto alla baseline zero-shot. Il progetto riguarda quindi meno la massima benchmark accuracy e piu la comprensione del trade-off tra performance ed efficienza.

Costruita nell’ecosistema Hugging Face, l’implementazione copre valutazione, configurazione LoRA, training e inferenza in un setup leggero che resta accessibile anche su hardware modesto.

Editor Fotografico AI con SAM e SDXL

Sun, 10 Mar 2024 00:00:00 +0000

Questo progetto esplora l’intersezione tra computer vision precisa ed editing generativo delle immagini combinando Segment Anything (SAM) con Stable Diffusion XL.

L’idea di base e semplice: la segmentazione fornisce controllo esatto su cio che va modificato, mentre l’inpainting basato su diffusion offre la flessibilita generativa necessaria per modificarlo davvero. Questo rende il sistema utile non solo come demo, ma anche come esempio concreto di integrazione tra modelli discriminativi e generativi nello stesso workflow.

Sviluppato in Python con PyTorch, Diffusers e Gradio, il progetto supporta masking interattivo, sostituzione di oggetti e generazione dello sfondo mantenendo la pipeline abbastanza leggera da funzionare anche su hardware consumer con le giuste ottimizzazioni.

Chatbot Personalizzato con RAG

Thu, 15 Feb 2024 00:00:00 +0000

Questo progetto usa un dominio volutamente piccolo ma strutturato per esplorare un’idea piu ampia: come rendere piu affidabili gli output dei language model ancorandoli a contesto recuperato.

Il chatbot e costruito attorno a un dataset curato di personaggi immaginari e usa una pipeline RAG completa con embedding, retrieval e prompt conditioning. Il dataset e giocoso, ma il punto metodologico e serio: il retrieval cambia il comportamento del modello da completamento generico a ragionamento vincolato dal contesto.

Poiche i dati sottostanti sono semanticamente ricchi, il sistema puo gestire non solo question answering ma anche confronto tra personaggi, raccomandazione ed esplorazione basata su tratti. Questo lo rende un esempio compatto ma utile di progettazione NLP guidata dal retrieval.