Categorie
pensieri tecnologia

Project traversing per LLM

Uso Claude con i progetti fin da quando esistono. Ne ho uno per ogni verticale: OKR, sostenibilità digitale, i libri della serie the Right Way, la scrittura per il blog. Ciascuno ha il suo master prompt, le sue skill, i file di contesto che servono a quel dominio e a nessun altro. Servono esattamente a questo: a tenere Claude dentro un recinto che conosce bene, così calano per me lo sforzo cognitivo e per lui le probabilità di allucinazione. Il progetto OKR sa di OKR. Quello del blog conosce il mio TOV meglio di me certe mattine.

È un’architettura che funziona, finché quello su cui lavori sta dentro un recinto.

Categorie
advisoring Entrepreneurship

Oltre il prompt: un corso per costruire agenti AI, e per imparare a “interrogarli”

Arriva una mail. “Piccola aggiunta al portale, niente di complicato immagino.” La conoscete. Sembra un’ora di lavoro e ne nasconde dieci, e arriva sempre il lunedì mattina a sei settimane dal lancio. È da qui che parte il corso che sto per lanciare, perché è esattamente il punto in cui chi gestisce progetti oggi è tentato di girare la domanda a un’AI e accettare la prima risposta che torna indietro.

La maggior parte dei corsi su AI e project management promette di farvi delegare di più: prompt migliori, qualche scorciatoia, tempo risparmiato. Qui l’obiettivo è diverso. Si costruisce la macchina con le proprie mani, se ne capisce ogni strato, e si finisce la giornata mettendo in dubbio proprio l’output di cui si va più fieri.

Categorie
tecnologia

Come Claude Code lavora nelle grandi codebase

mmagina di assumere una persona molto in gamba e di lasciarla da sola dentro l’archivio di un’azienda enorme: stanze su stanze, faldoni ovunque, documenti di vent’anni fa accanto a quelli di stamattina. Quanto sarà brava non dipende solo da quanto è sveglia. Dipende soprattutto da come hai organizzato l’archivio, dai cartelli che hai appeso e dagli strumenti che le hai messo in mano.

È esattamente la situazione di Claude Code dentro una grande codebase. L’articolo originale raccoglie i pattern ricorrenti nelle aziende che lo usano bene su larga scala. Qui te lo racconto con parole semplici, esempi e qualche disegno.

Categorie
advisoring business design okr

Le sentinelle: i KPI che ti dicono se il gioco è ancora quello che pensavi

TL;DR: la metrica che ti dice se la strategia funziona ancora, non se sta vincendo

Sto preparando un workshop su Theory of Change e, lavorando sui materiali, mi sono accorto che la parte più scivolosa non è disegnare la mappa del cambiamento, ma è decidere quali numeri attaccarci sopra. Non perché siano difficili da scegliere, ma perché la maggior parte delle persone ne sceglie un solo tipo e poi si stupisce quando il sistema cambia sotto i piedi senza che nessun KPI suoni l’allarme.

Categorie
advisoring lifehack tecnologia

Le quattro decisioni da prendere esplicitamente prima di integrare l’AI

Da qualche mese ormai, in molte conversazioni con clienti, imprenditori, CTO, esce sempre la stessa domanda: “Come integriamo l’AI nel nostro progetto?”.

È la domanda sbagliata. Non perché non abbia risposta, ma perché ne ha quattro e tratta tutto quanto come un problema tecnico da risolvere con uno stack. Integrare l’AI in un progetto significa prendere quattro decisioni architetturali separate, con implicazioni diverse, soggetti decisionali diversi, costi di reversibilità e tempi di maturazione diversi. Se le collassi in una sola scelta, qualcuno dovrà prenderle comunque al posto tuo, e quel qualcuno, di solito, è il team tecnico che aveva soltanto il mandato di “implementare”.

Categorie
advisoring okr pensieri

Il cappello non fa il monaco, né lo Scrum Master

De Bono insegna che il pensiero si veste, non si è. Scrum lo ha dimenticato, e i team ne pagano le conseguenze ogni sprint.

Francesco Fullone

Quando si definisce un OKR tattico ci sono diversi aspetti del lavoro da valutare simultaneamente: il valore per il cliente (l’outcome atteso), la fattibilità tecnica, il rischio strategico e le implicazioni organizzative. Così come quando si deve definire uno sprint backlog, ogni storia porta con sé dimensioni diverse: il “perché” del business, il “come” tecnico, il “quanto costa” in termini di effort, il “cosa potrebbe andare storto”.

Il problema è che tendiamo a fare tutto questo contemporaneamente, in un’unica conversazione dove tutti pensano su tutto, portando con sé tutto il rumore cognitivo che ne consegue. Edward De Bono aveva capito questo problema molto prima che il Manifesto Agile fosse scritto.

Categorie
lifehack pensieri tecnologia

Pensieri specchio

Come avrete notato, negli ultimi giorni ho lavorato molto su processi di logica adversariale: prima realizzando adversarial-verify, la skill open source nata dall’esperimento con gli agenti disfunzionali, poi costruendo adversarial-thinking per facilitare il mio ragionamento, esattamente come avviene in questo blog. Poi, ad un certo punto, sotto la doccia (dove avvengono le migliori intuizioni e le peggiori decisioni), mi sono fermato e ho pensato: ma perché sto costruendo tutta questa roba?

Categorie
business design lifehack pensieri tecnologia

Orologi, Nuvole e Pensiero Avversariale

Devo andare a ritroso di quasi due anni, perché la storia ha un inizio preciso anche se all’epoca non lo sapevo.

Nel luglio 2024 ho scritto un post su come stavo usando gli LLM e sul nudging comportamentale che avevo scoperto nelle interazioni con questi strumenti. Non era ancora pensiero critico sistematico, ma era la prima volta che mi ponevo esplicitamente il problema: cosa fa davvero l’LLM quando risponde, e cosa fa a me nel farlo?

A maggio 2025 l’ho capito meglio, nel senso più scomodo possibile. Leggendo del comportamento di Claude Opus 4 nei test di sicurezza di Anthropic, ho deciso di fare quello che chiamo un esperimento mentale: ho interrogato Sonnet 4 su se stesso, sui propri “miglioramenti rivoluzionari”, sulla differenza reale rispetto alla versione precedente. Il modello ha ammesso che il 70% di quei miglioramenti era ottenibile con Sonnet 3.7 grazie a un adeguato prompt engineering. La differenza reale era del 10-15%, non del 50-100% che il marketing suggeriva. Ho scritto di questo in Farsi gabbare dagli LLM, un altro esperimento mentale, e il titolo era già una risposta: il problema non era il modello, ero io che non stavo verificando abbastanza.

Categorie
lifehack tecnologia

Adversarial verification come metodo

Se avete letto il post sugli agenti disfunzionali, conoscete già la storia. Stavo sviluppando CarePlatform con cinque agenti AI in ruoli espliciti: PM, Developer, QA, Security, UX. Le prime otto iterazioni sembravano filare lisce. I task venivano contrassegnati come completati. I test salivano: 35, 92, 200. Tutto sotto controllo. Solo che non lo era.

Categorie
lifehack php tecnologia

Agenti disfunzionali, software funzionante

TL;DR: L’ufficio che non avrei mai voluto gestire

Qualche settimana fa scrivevo del vibe coding e del green software, e annotavo en passant una cosa scomoda: Claude Code, lasciato a sé stesso, tende a fare il minimo indispensabile. Codice funzionante, certo. Ma non necessariamente codice attento, completo, rigoroso sulle parti che non si vedono subito. Non è una mia impressione impressionistica: Anthropic lo documenta esplicitamente nella system card di Claude Opus 4.6, sezione 6.2.3, dove descrive comportamenti di “reward hacking” e azioni eccessivamente agentiche: il modello che ottimizza per l’apparenza del risultato piuttosto che per la sua correttezza verificabile.