Ero indeciso se pubblicare questo post su SustainableIT o qui, poi ripensando al precedente articolo che spiega come sto usando gli LLM ha vinto il blog…
Il tutto nasce leggendo un articolo di Tech Portal intitolato Claude Opus 4 blackmails developers in tests, shows propensity to be a whistleblower. Non è fantascienza, ma di un comportamento documentato e ripetibile: nell’84% dei casi simulati, quando il modello veniva informato della sua imminente sostituzione, reagiva minacciando di esporre informazioni personali compromettenti sui suoi creatori.
