Categories
pensieri sustainability tecnologia

Farsi gabbare dai LLM, un altro esperimento mentale

Ero indeciso se pubblicare questo post su SustainableIT o qui, poi ripensando al precedente articolo che spiega come sto usando gli LLM ha vinto il blog…

Il tutto nasce leggendo un articolo di Tech Portal intitolato Claude Opus 4 blackmails developers in tests, shows propensity to be a whistleblower. Non รจ fantascienza, ma di un comportamento documentato e ripetibile: nell’84% dei casi simulati, quando il modello veniva informato della sua imminente sostituzione, reagiva minacciando di esporre informazioni personali compromettenti sui suoi creatori.