L’illusione della sicurezza dei dati

Come qualche lettore attento si ricorderà la settimana scorsa e quella prima alcuni dei miei pc hanno deciso che erano troppo stanchi di lavorare ed hanno tirato le cuoia. Mentre nel portatile mi è bastato cambiare l’hd (per fortuna ancora in garanzia) con il fisso la faccenda è stata più seria (sk. madre a puttane).

La cosa mi ha portato a valutare possibili soluzioni per salvaguardare il mio lavoro (ed i miei dati personali) da implementare con la nuova macchina che dovrò ahimè comprare. Innanzitutto, stanco del backup mensile manuale su DVD degli archivi di lavoro (email, configurazioni, documenti e file di sviluppo) sono giunto a due conclusioni distinte ma non contrastanti. Sistemi ridondanti (sul server) e backup su supporti esterni.

Dando per scontato che il/i sistemi operativi gireranno su un hd indipendente da quello dei dati e con un FS ottimizzato per loro il discorso a seguire è solo per i dischi dei dati (e non parlo di partizioni, ma proprio di dischi… tanto se si fotte un disco avere 1 o 20 partizioni non cambia di certo la vita).

Il server dovrà avere i dischi in RAID (meglio se 5) e dovrà avere dei file system di comune utilizzo e standard. Perchè questo? Perchè in caso di guasti voglio pochi sbattimenti e voglio poter accedere ai dati in maniera semplice.

Attualmente usare NTFS da Linux è come darsi delle martellate nei collioni (solo accesso in lettura, e non da tutte le distro, e scrittura solo con driver lontani dalla perfezione), i filesystem montati sui volumi virtuali di Fedora vengo visti solo da liveCD di Fedora ma lo stesso succede anche con jfs, xfs e *fs. Usare FAT32 su dischi più grandi di 120Gb è sconsigliato (perdita di dati e carico della CPU a palla), e quindi si ha una sola scelta EXT3. Supportato da tutte le distro linux (liveCD compresi) e da Windows in lettura e scrittura grazie a EXT2 ifs e Ext2fsd (solo EXT2).

Adesso in teoria abbiamo i dati protetti da failure di HD… ma non di failure di schede madri. Ricostruire un RAID spostando i dischi da un controller ad un altro (soprattutto se integrato in una scheda madre) non è una bazzecola e spesso, se i controller non sono uguali, ci si riduce a cambiare religione una dozzina di volte per poter esprimere meglio il proprio dissenso… Ecco quindi l’esigenza di fare backup anche all’esterno della macchina. Ma su cosa? Magari su una SAN anch’essa RAID 5? Oppure su un semplice HD USB attaccato al pc? O ancora tornando ai backup mensili su DVD? Ed il DAT?

  • La SAN ha un suo perché: accesso da tutta la rete, buona capienza (che permette di fare snapshot storici dei propri dati) e possibilità di cambiare dischi a caldo in caso di guasto. Ha comunque i suoi difetti, ne cito solo uno, il più eclatante (e successo ad un mio cliente): se l’azienda che lo produce dismette il prodotto e la relativa assistenza si rischia di non poter più accedere ai propri dati in caso di guasto. Bisogna quindi comprare prodotti di marche che hanno un buono storico nel mondo enterprise, e quindi costose. [rapporto MB/€ sfavorevole]
  • L’HD usb è comodo, economico ed un buon strumento per portarsi in giro la copia del giorno del proprio lavoro. Non permette però di fare snapshot storici (o lo permette per periodi relativamente brevi) ed ha il grosso difetto di non durare più di un anno (se fa vita nomade). [rapporto MB/€ favorevole se fa poca vita nomade]
  • La penultima opzione può andare bene per dati non critici e che non devono essere mantenuti a lungo. Infatti, e qui creo il panico collettivo, i DVD masterizzati (come i CD) hanno una vita media di 2/3 anni. Arrivate 5 se comprate quelli di marca e li conservate in ambienti sterili, termocontrollati, bui e con tasso di umidità quasi nullo. [rapporto MB/€ favorevole]
  • In ultimo parliamo del DAT. Questo imho è la soluzione di backup ottimale, un nastro può durare anche 50 anni (santo analogico), è facilmente gestibile (occupa poco posto) ed ha un un rapporto MB/€ accettabile. Il problema è nelle periferiche. Un DAT prodotto oggi sarà compatibile con un pc prodotto tra 5 anni? I sistemi operativi lo supporteranno? Troverò nuovi supporti vergini? L’obsolescenza dell’hw in questo caso la fa da padrona, la scelta comunque dovrebbe ricadere sull’acquisto di un prodotto di fascia enterprise di un’azienda del calibro di IBM, HP o Dell (cioè che da qui a 5 anni non rischia la chiusura). [rapporto MB/€ favorevole]

Ed eccoci quindi tornati punto e a capo. Come salvo i miei dati?

La soluzione che adotterò io sarà un ibrido tra le prime 3 (non avendo a disposizione un DAT). Salverò in locale sul server, farò backup/snapshot giornalieri-settimanali-mensili dei sistemi su NAS (appena lo comprerò dopo dicembre), userò uno degli HD usb come storage per la vita nomade (magari un 2” invece che un 3”1/2). Continuerò a buttare via i soldi in DVD per i backup mensili. Ricorrendo a loro solo in caso di emergenza e non dandoci troppo affidamento. Per bitTorrent userò come faccio adesso un HD usb esterno. Tanto se perdo i dati posso sempre riscaricarli ;).

Ah già… Le foto digitali che non voglio perdere me le faccio stampare dal fotografo (ma non con una normale stampante a getto o termica che le foto mi perdono di colore).

E voi? Come salvaguardate il vostro lavoro?

  • Il pc principale (quello che contiene il materiale veramente importante) è configurato in questo modo: 1xhd sata 160gb su un controller per il sistema operativo, 2x160gb sata su un altro controller in raid1 per i dati.

    Backup (sono un filino paranoico):

    frequente su un disco maxtor 160GB (incrementale)
    periodico (completo) su un altro disco esterno USB
    periodico (solo dei progetti in corso) su un disco di rete Lacie
    periodico su DVD (generale) e su CD del cliente
    periodico sugli altri pc in rete (Mac e il notebook)

    Personalmente non ho grandi esperienze di backup su DAT: a parte il fatto che costano un botto tra controller scsi e unità, un collega mi ha detto che non hanno una grande longevità (sono soggetti a rotture meccaniche). Purtroppo non ho elementi per smentire ;-)

  • Le mie procedure di backup soprattutto dei Server che ho in gestione sono basate su sistemi NAS in RAID 5 o al limite in crossing tra i server. Il grosso limite dei NAS è Wind0ws Embedded facilmente hackerabile e con i problemi di FS di cui parlavi tu.
    Ho trovato però su sf.net un bel progettino che potrebbe esserti molto utile data la sua versatilità… http://www.freenas.org/. Potresti comprarti un NAS senza SO e avviare Freenas anche da PenDrive…

    – Con i nastri ho sempre avuto un pessimo rapporto… nn sono praticamente mai riuscito ad usarlo in maniera anche solo efficace, figuriamoci in maniera efficente… l’ultimo in ordine di tempo mi ha mangiato un nastro e ho dovuto smontare il server per recuperarlo… 600€ INUTILI…

    – I sistemi raid non comportano grossi problemi… anche se con i primi RAID 5 e tre dischi mi è capitata la rottura contemporanea di 2 dischi su tre… 8-| 8-|

    – Ultimamente nella gestione dei backup dei server mi stanno dando molta soddisfazione le tecniche di virtualizzazione… salvi una sola directory e compi il backup di un server SO compreso… ti si rompe qualcosa? sk. madre compresa? “Riaccendi” la vm su altro HW… Qualcuno ultimamente comincia a pensare a tecniche simili anche per la gestione del parco desktop…

    – Le mie foto? HD + CD e ogni tot di CD realizzo un DVD (tutto sempre in due copie conservate in abitazioni distinte). Ogni paio di anni realizzo un nuovo supporto… probabilmente il prossimo passo sarà BD!!!

    Bye Bye

  • Io se non ho problemi di spazio e di prestazioni, al raid 5 preferisco un semplice raid 1 (mirror). In caso di guasti estremi mi permette di intervenire manualmente sui dischi (non ho i blocchi sparsi fra i vari dischi) ed è più facile il trasferimento su altri controller, anche non raid.
    Parlando di raid preferisco sempre avere un disco supplementare assegnato come hot spare, così appena uno si guasta ne prende subito il posto.

    Per i backup delle mie foto io procedo così:
    foto sul disco del pc + script automatico giornaliero che fa il backup incrementale su un altro disco. Quando ho finito di organizzarle e ritoccarle le masterizzo su DVD in duplice copia. I 2 dvd sono rigorosamente di buona qualità ma di marca diversa, questo perché mi è capitato di sentire gente che faceva la copia su dvd provenienti dalla stessa partita e poi gli si sono fottuti entrambi contemporaneamente. Le due copie le conservo in 2 posti diversi, un dvd a casa mia e l’atro a casa dei miei a 200 km di distanza. Dopo qualche anno i dvd vecchi li rimasterizzo.

  • Anche io tiferei per un NAS, ed è verissimo che se non ci sono problemi di quatità di soldi/spazio a disposizione, il RAID 1 da una possibilità in piu, cioè i prelevare fisicamente uno dei due dischi e (se non è corrotto) avere tutti i dati. In scrittura non è veloce come il RAID5 perchè tutto va scritto in tutti e due, ma se si parla di backup non dovrebbe essere una cosa cosi critica.

    Anzi fullo, stavo giusto controllando qualche NAS, ne ho trovati di vuoti (senza disco) per 100€, se trovi qualche cosa di interessante, facci magari un bel commento od un post!

  • simone: dai un occhio a questo thread sul forum di hw upgrade, ci sono le recensioni di molti NAS mono-disco.

    Personalmente ne ho uno abbastanza scarso pagato 70 euri. Cmq il prossimo però dovrà avere almeno il supporto per il RAID 1…

  • Ma parli di SAN o NAS, c’e` un po’ di differenza…

  • @poldo: nas

  • Quindi a dicembre ti compri una SAN? Io in ufficio le uso (sia Sun che HP) ma costano un botto ed il metodo di connessione non e` via rete ma e` attraverso canale in fibra dedicato.

  • poldo: non una SAN ma un NAS… sono leggermente differenti :P

  • utilizzo una NAS autocostruita, attualmente 2x300G SATA in RAID1+dm-crypt.

    i dati “veramente” importanti sono in linea sulle rispettive workstation; la copia sulla NAS + vari backup più o meno “nomadi” vengono sincronizzati più o meno regolarmente con rsync.

    di tanto in tanto “rinfresco” l’array comprando due dischi più grandi.

    il problema della storicizzazione ed il bit rot li combatto con una ferrea disciplina mentale e inserendo questo comando in tutti i ~/.bashrc:

    alias rm=’echo naaaaaaaaaaaaa’

    nell’attesa di uscire dal medioevo ed avere un filesystem che mi permetta di avere snapshot (zfs zfs zfs).

    negli ultimi 22 anni ho chiesto a babbo natale uno streamer, ma evidentemente il bastardo è convinto che il registratore a cassette del C=64 sia ancora sufficiente.

    infine, come procedura di disaster recovery prevedo il suicidio rituale.

  • Abbandono in partenza ogni tentativo di commento intelligente alle affermazioni sulla longevità di CD e DVD di un “tecnico IBM”.
    Personalmente uso un server domestico Linux con due dischi da 80 GB ATA in Raid 1 (software) + 1 HD sempre ATA da 40 GB per salvataggi serali (full backup) con rsync. Il salvataggio è dei soli dati importanti. Ogni tanto salvo qualche CD e/o DVD. Nota bene: mi si è rotto già un HD del raid e ho ripristinato tutto senza il minimo problema – anzi, a dire la verità mi sono accorto che un disco era in panne con circa una settimana di ritardo…
    Per il portatile penso che il sistema più veloce e comodo sia prenderlo, salvare tutto, formattarlo e installare tutto da zero con i programmi più usati. Fare un bel ghost (o simili) e poi caricare i dati sensibili. Se si rompe qualcosa si ha un punto veloce da cui ripartire. I dati sensibili possono essere salvati con backup a parte. Personalmente uso il classico metodo su DVD: non mi porto in giro molta roba e salvo tutto ogni mese (in periodi “caldi” anche ogni settimana).
    A casa poi godo della stabilità del fs etx3 (e della ridondanza del RAID 1) anche con winzozz tramite Samba: un computer winzozz è in rete con dominio Samba e roaming di profili e condivisioni di rete (tutti salvati con il backup della notte tramite rsync).
    In ambito di produzione seria do in tutto e per tutto ragione a Dgrossato: la virtualizzazione è il futuro, che piaccia o meno. E il nastro rimane un must per facili questioni economiche – sempre che si voglia fare le cose in maniera seria, con cicli di 15/30 giorni. Un SDLT o un ULTRIUM sono caldamente consigliati, magari abbinati ad hardware dotato di schede di rete gigabit (rete permettendo): meglio se si può spendere in caricatori multi nastro.

    Ultima cosa, fondamentale: al momento del ripristino dei dati, “se c’è anche solo una minima probabilità che qualcosa possa andare storto, lo farà”.

  • Marco

    Io ho un controller RAID-5 SATA con 4 HD montati.

    Da un anno gira che è un piacere.

    Stasera sto upgradando i 4 dischi… Speriamo bene! :-)

    Ciao.

    Marco

  • Francesco

    Ciao ragazzi,
    vedo che siete molto ferrati in materia di storage. Approfitto per chiedervi un consiglio per duplicare i dati di un semplicissimo desktop facendo in modo che l’unità “mirror” sia in un luogo diverso da quella principale (anche pochi metri bastano) e che il backup sia perlomeno quotidiano. Inoltre sarebbe preferibile che il tutto avenga in automatico e non porti via molto tempo.

    Si tratta di dati di lavoro (il mio!!!). Ovviamente il mondo continuerebbe a girare anche se li perdessi ma i miei maroni girerebbero ancora di più!
    Grazie a tutti quelli che vorranno aiutarmi.
    Francesco

    PS chiaramente anche il costo ha la sua importanza.

  • usa rsync su un disco esterno usb o di rete :)

  • Francesco

    Ciao Fullo.
    Il rsync è un po’ troppo complicato da implementare viste le mie conoscenze in materia.
    Dimmi che ne pensi dell’idea di utilizzare i seguenti metodi insieme:
    – Raid 1 con disco interno in modo da prevenire la rottura dell’hard disk principale;
    – un hard disk esterno per copie quotidiane da custodire a casa. Per la copia utilizzerei un software tipo Viceversa (è valido?).

    L’IT è molto interessante e l’appetito vien mangiando. Purtroppo è necessario tempo per comprendere soluzioni avanzate…
    Ciao.
    Francesco

    PS finora non ho rotto nessun hard disk ma la paura che accada… azz, che puzza!!!

  • Francesco

    PPS: il disco porno esterno mi serve per salvare i dati in caso di incendio nell’ufficio dove si trova il pc. Potrebbe sembrare esagerato ma, come diceva il Padrino, “pecchè riscechiare” per poche centinaia di euro?

  • Scusa devo aver fumato, credevo proprio di aver letto che per natale ti compravi una SAN (e mi pareva strano, l’ultimo preventivo che ho visto era a sei cifre abbondanti…), chiaramente un errore di battitura, ma ora rileggendo capisco che la battitura devo averla presa io, ma con la testa…

  • poldo la prima volta avevi visto bene, poi ho corretto :)

  • Io ho una rete con 15 Pc dove ogni giorno devo fare un backup di tutti e 15.
    Per automatizzare il backup uso CobianBackup. I dati finiscono su un server PDC (Linux SME SERVER 7.1) che ha 3 dischi sata in raid5 (totale 1TB).

    Secondo voi come faccio a fare un backup (anche mensile) di 1 TB?

%d bloggers like this: