Tag: ai

Definition of Done per LLM

Autore articolo Di Francesco Fullone
Data dell'articolo 30/06/2026

Con l’arrivo degli agenti e della loro autonomia operativa, dare a un LLM un compito complesso è diventato molto più semplice: glielo descrivi e si mette al lavoro da solo, aprendo i file e lanciando i comandi necessari, iterando senza che io debba intervenire a ogni passaggio. Il rovescio della medaglia è che un agente lasciato a briglia sciolta parte volentieri per la tangente. Per questo Claude Code ha aggiunto /goal, un comando pensato per favorire la convergenza: gli dai una condizione di completamento e l’agente continua a lavorare turno dopo turno finché quella condizione non risulta soddisfatta, senza che tu lo solleciti ogni volta.

È uno strumento utilissimo, con un dettaglio che però cambia tutto: converge verso la condizione che gli scrivi tu e, quando la condizione è buona, l’autonomia lavora per te; quando è vaga, lavora comunque, solo che a vuoto, e te ne accorgi dal conto dei token.

Continua a leggere

Tag agents, ai, claude, llm, outcome, output

pensieri tecnologia

Project traversing per LLM

Autore articolo Di Francesco Fullone
Data dell'articolo 06/06/2026

Uso Claude con i progetti fin da quando esistono. Ne ho uno per ogni verticale: OKR, sostenibilità digitale, i libri della serie the Right Way, la scrittura per il blog. Ciascuno ha il suo master prompt, le sue skill, i file di contesto che servono a quel dominio e a nessun altro. Servono esattamente a questo: a tenere Claude dentro un recinto che conosce bene, così calano per me lo sforzo cognitivo e per lui le probabilità di allucinazione. Il progetto OKR sa di OKR. Quello del blog conosce il mio TOV meglio di me certe mattine.

È un’architettura che funziona, finché quello su cui lavori sta dentro un recinto.

Continua a leggere

Tag ai, anthropic, claude, filosofia, libro, llm, pensare con llm, pensiero critico

advisoring Entrepreneurship

Oltre il prompt: un corso per costruire agenti AI, e per imparare a “interrogarli”

Autore articolo Di Francesco Fullone
Data dell'articolo 05/06/2026

Arriva una mail. “Piccola aggiunta al portale, niente di complicato immagino.” La conoscete. Sembra un’ora di lavoro e ne nasconde dieci, e arriva sempre il lunedì mattina a sei settimane dal lancio. È da qui che parte il corso che sto per lanciare, perché è esattamente il punto in cui chi gestisce progetti oggi è tentato di girare la domanda a un’AI e accettare la prima risposta che torna indietro.

La maggior parte dei corsi su AI e project management promette di farvi delegare di più: prompt migliori, qualche scorciatoia, tempo risparmiato. Qui l’obiettivo è diverso. Si costruisce la macchina con le proprie mani, se ne capisce ogni strato, e si finisce la giornata mettendo in dubbio proprio l’output di cui si va più fieri.

Continua a leggere

Tag ai, book, corso, leanpub, llm, pensiero critico, workshop

tecnologia

Come Claude Code lavora nelle grandi codebase

Autore articolo Di Francesco Fullone
Data dell'articolo 02/06/2026

mmagina di assumere una persona molto in gamba e di lasciarla da sola dentro l’archivio di un’azienda enorme: stanze su stanze, faldoni ovunque, documenti di vent’anni fa accanto a quelli di stamattina. Quanto sarà brava non dipende solo da quanto è sveglia. Dipende soprattutto da come hai organizzato l’archivio, dai cartelli che hai appeso e dagli strumenti che le hai messo in mano.

È esattamente la situazione di Claude Code dentro una grande codebase. L’articolo originale raccoglie i pattern ricorrenti nelle aziende che lo usano bene su larga scala. Qui te lo racconto con parole semplici, esempi e qualche disegno.

Continua a leggere

Tag agents, ai, claude, leanpub, llm

advisoring lifehack tecnologia

Le quattro decisioni da prendere esplicitamente prima di integrare l’AI

Autore articolo Di Francesco Fullone
Data dell'articolo 21/04/2026

Da qualche mese ormai, in molte conversazioni con clienti, imprenditori, CTO, esce sempre la stessa domanda: “Come integriamo l’AI nel nostro progetto?”.

È la domanda sbagliata. Non perché non abbia risposta, ma perché ne ha quattro e tratta tutto quanto come un problema tecnico da risolvere con uno stack. Integrare l’AI in un progetto significa prendere quattro decisioni architetturali separate, con implicazioni diverse, soggetti decisionali diversi, costi di reversibilità e tempi di maturazione diversi. Se le collassi in una sola scelta, qualcuno dovrà prenderle comunque al posto tuo, e quel qualcuno, di solito, è il team tecnico che aveva soltanto il mandato di “implementare”.

Continua a leggere

Tag ai, bandi, consulenza, integrazione, llm

lifehack pensieri tecnologia

Pensieri specchio

Autore articolo Di Francesco Fullone
Data dell'articolo 09/04/2026

Come avrete notato, negli ultimi giorni ho lavorato molto su processi di logica adversariale: prima realizzando adversarial-verify, la skill open source nata dall’esperimento con gli agenti disfunzionali, poi costruendo adversarial-thinking per facilitare il mio ragionamento, esattamente come avviene in questo blog. Poi, ad un certo punto, sotto la doccia (dove avvengono le migliori intuizioni e le peggiori decisioni), mi sono fermato e ho pensato: ma perché sto costruendo tutta questa roba?

Continua a leggere

Tag ai, claude, design-thinking, filosofia, llm, neuroscienza, pensieri

business design lifehack pensieri tecnologia

Orologi, Nuvole e Pensiero Avversariale

Autore articolo Di Francesco Fullone
Data dell'articolo 07/04/2026

Devo andare a ritroso di quasi due anni, perché la storia ha un inizio preciso anche se all’epoca non lo sapevo.

Nel luglio 2024 ho scritto un post su come stavo usando gli LLM e sul nudging comportamentale che avevo scoperto nelle interazioni con questi strumenti. Non era ancora pensiero critico sistematico, ma era la prima volta che mi ponevo esplicitamente il problema: cosa fa davvero l’LLM quando risponde, e cosa fa a me nel farlo?

A maggio 2025 l’ho capito meglio, nel senso più scomodo possibile. Leggendo del comportamento di Claude Opus 4 nei test di sicurezza di Anthropic, ho deciso di fare quello che chiamo un esperimento mentale: ho interrogato Sonnet 4 su se stesso, sui propri “miglioramenti rivoluzionari”, sulla differenza reale rispetto alla versione precedente. Il modello ha ammesso che il 70% di quei miglioramenti era ottenibile con Sonnet 3.7 grazie a un adeguato prompt engineering. La differenza reale era del 10-15%, non del 50-100% che il marketing suggeriva. Ho scritto di questo in Farsi gabbare dagli LLM, un altro esperimento mentale, e il titolo era già una risposta: il problema non era il modello, ero io che non stavo verificando abbastanza.

Continua a leggere

Tag agentskills, ai, claude, claude code, filosofia, llm, popper, skills

lifehack tecnologia

Adversarial verification come metodo

Autore articolo Di Francesco Fullone
Data dell'articolo 07/04/2026

Se avete letto il post sugli agenti disfunzionali, conoscete già la storia. Stavo sviluppando CarePlatform con cinque agenti AI in ruoli espliciti: PM, Developer, QA, Security, UX. Le prime otto iterazioni sembravano filare lisce. I task venivano contrassegnati come completati. I test salivano: 35, 92, 200. Tutto sotto controllo. Solo che non lo era.

Continua a leggere

Tag agentskills, ai, claude, llm, skills

lifehack php tecnologia

Agenti disfunzionali, software funzionante

Autore articolo Di Francesco Fullone
Data dell'articolo 23/03/2026

TL;DR: L’ufficio che non avrei mai voluto gestire

Qualche settimana fa scrivevo del vibe coding e del green software, e annotavo en passant una cosa scomoda: Claude Code, lasciato a sé stesso, tende a fare il minimo indispensabile. Codice funzionante, certo. Ma non necessariamente codice attento, completo, rigoroso sulle parti che non si vedono subito. Non è una mia impressione impressionistica: Anthropic lo documenta esplicitamente nella system card di Claude Opus 4.6, sezione 6.2.3, dove descrive comportamenti di “reward hacking” e azioni eccessivamente agentiche: il modello che ottimizza per l’apparenza del risultato piuttosto che per la sua correttezza verificabile.

Continua a leggere

Tag agents, ai, laravel, pensieri, php, promptengineering

lifehack pensieri

Il paradosso del cervello aumentato

Autore articolo Di Francesco Fullone
Data dell'articolo 18/03/2026

Qualche giorno fa mi sono imbattuto in uno studio del MIT Media Lab che mi ha fatto venire un dubbio piuttosto scomodo. Kosmyna e colleghi hanno misurato l’attività cerebrale di 54 partecipanti mentre scrivevano saggi: chi con ChatGPT, chi con un motore di ricerca, chi solo con la propria testa. Il risultato? Il gruppo che usava LLM mostrava una connettività neurale fino al 55% inferiore rispetto al gruppo brain-only. E la cosa più inquietante: l’83% dei partecipanti LLM non riusciva a citare dai propri saggi appena scritti. Testi che avevano “prodotto” cinque minuti prima (non li riconoscevano come propri).

Ora, il paper è un preprint, non ancora peer-reviewed, campione ridotto, contesto geografico ristretto, un solo tipo di task. Gli autori stessi chiedono di non usare termini come “brain rot” o “dumb”. Ma il dato grezzo rimane lì e la domanda che mi sono fatto è quella che probabilmente vi state facendo anche voi: sto diventando più stupido?

Continua a leggere

Tag ai, claude, hacking, pensieri, prompt