Stockage de donnée très longue durée

chonos

Helper
Salut,

Je suis à la recherche d'un plan de réflexion sur le moyen de conserver pour des durées très longue des documents qui devront rester accessible (fonctionnel) sur des durées supérieures à 40 ans

or la sauvegarde d'un document c'est bien mais conserver pour une réutilisation à une échelle de temps longue c'est pas si simple

J'ai trouvé un tableau dans un livre "Archiving for Dummies"
qui donne que les disques à près 10 ans ne tienne pas
et que les bandes sont faites pour 30 ans
Bien sûr ces valeurs sont des faites dans des conditions super optimale
Perso j'ai vue des bande ultrium 1,2,3,.. qui lâche au bout de quelques mois !
Malgré les salles climatisés (serveur) lieu de l'enregistrement via le robot de sauvegarde
et le local de stockage dans un lieu lui aussi climatisé avec coffre fort résistant au feu avec bien sûr des accès très limiter

et cela n'est que pour la partie sauvegarde fichier brut.

Dans 30/40/50 ans les fichiers Excel / Word / dwg .. qui date de 1990 comment être sûr de les lires ?
au format bit a bit ?

les formats propriétaires de fichiers pause un problème majeur
déjà aujourd'hui qui peut lire rapidement un fichier de la suite Lotus Notes 1,2,3 écrit en 1990 ?

Vat-on vers une sauvegarde des logiciels même ancien ?

Excel IV (je ne vois pas comment on pourra l'installer sur une version de Windows 12 par exemple) ?

les machines virtuel en cascade ?
Merci
a+





 

VaderFR

Grand Maître
Bonsoir,

c'est marrant j'ai eu le même genre de question au concours.

Le plus simple, ce sont les grappes RAID :
1) tu peux remplacer les disques régulièrement, la copie est alors automatique.
2) En cas de RAID logiciel, pas de souci à se faire concernant le contrôleur RAID. En cas de RAID matériel il faudra prévoir des contrôleurs de rechange, de même marque et modèle.
2 bis) durée d'environ 10 ans, il faudra changer le matériel régulièrement donc.
3) les disques sont monitorés en permanence et tu es averti à l'avance en cas de risque de panne (d'un disque, en cas de crash prématuré il reste l'autre/les autres)
4) conséquence du point 3), pas de risque de sortir une bande 30 ans plus tard pour s'apercevoir que surprise ! elle ne fonctionne plus ! (ou est illisible)

Concernant le format, soit :
- format personnel
- format Open Source, avec sauvegarde des sources et de la documentation
- format XML (+fichiers objet type image) ou en base de données avec un squelette permettant de ré-générer le document

Pour information, le format Open Document (LibreOffice, OpenOffice) fonctionne sur le même principe, c'est une archive avec un fichier XML (entre autres) que l'on peut éditer pour, par exemple, corriger un document Calc (équivalent d'Excel, mais en mieux) qui serait corrompu.

Il est préférable de suivre à la fois l'évolution du matériel de stockage, mais aussi des formats, pour éventuellement passer les fichiers d'un format à un autre pour en assurer la lisibilité.
 

Johann May

Grand Maître
C'est tout un apprentissage à l'école comme dit le monsieur. En tout cas pour le gérer soi même.

Sinon je rejoins Vader sur les systemes RAID aussi, c'est bien oui , mais a mon avis stocker sur 10/20/30 ans sur une partition en NTFS pourrai poser des problèmes. A voir si tu peux pas tenir une install en coeur linux qui te laisse libre choix de tout, et eventuellement d'installer des softs de maintenance de data sur disque, pour réécrire les données entre autre.
Ensuite il existe des disques dur spécialisé en stockage, ils sont fermés souvent remplis d'helium ou d'azote, et nécessitent un entretiens particulier en plus des conditions de préservation en milieu ambiant.

Dans tout les cas, prévoir d'acheter le matos du premier coup en double voir triple pour prévenir les pannes au cours du temps, car vu la courbe d’évolution des techno, pas sur de retrouver le même matos dans 10 ans ! regarde les walkmans et lecteurs cd :)

Sinon bonne chance !
 

chonos

Helper
"

Dans tout les cas, prévoir d'acheter le matos du premier coup en double voir triple pour prévenir les pannes au cours du temps, car vu la courbe d’évolution des techno, pas sur de retrouver le même matos dans 10 ans ! regarde les walkmans et lecteurs cd :)"


Oui, c'est bien cela qui me fait peur !
Car le budget sera comme celui de ko qui passe au mo, Go , TO, ...


Je trouve qu'il y aussi un pb majeur dans le fait que si on prend un courrier simple d'une secrétaire fait avec word IV et l'on prend un même courrier fait avec Word 2010, 2013 le poids du fichier n'est pas le même (même style de mise en forme) !
je veux bien que l'encodage en 16bit, 32bit, 64 bit y soit pour quelque chose mais cela n'explique pas tous le poids supplémentaire !


 

chonos

Helper


Tu passe un concours le quel ?

il vrai que les logiciels libres sont pas mal, mais il la question n'est pas a mon sens traiter de façon définitive !
qui dit que le XML tiendra 20,30,40 ans
l'un des langages qui a sauf erreur de ma part tenu le plus long temps c'est le C
hors aujourd'hui qui fait tous en C (pure) pas le c++
le seul qui est commun a tous les machines restera le langage machine car on ne peut faire autrement
mais les langage de haut niveau (couche applicative change trop souvent pour être stable)

a+
 

VaderFR

Grand Maître
Concernant l'encodage des fichiers Word ... et bien transforme les en Open Document, format bien souvent plus léger, et surtout non propriétaire.
Quand au matériel en double, triple, etc, ce n'est pas forcément nécessaire. En effet, le support de stockage étant "vivant", il est possible de le faire évoluer au fur et à mesure en copiant les données, sans engager la totalité des frais dès le départ.

Dans RAID, I signifie Inexpensive, donc pas cher. Il suffit de ne prévoir que quelques disques (2/3) de remplacement pour la grappe RAID (selon le niveau de RAID) et c'est bon. Rien n'empêche de créer une autre grappe RAID ou un autre serveur et d'y recopier les données par la suite.

Tu passe un concours le quel ?
J'ai passé le concours .

il vrai que les logiciels libres sont pas mal, mais il la question n'est pas a mon sens traiter de façon définitive !
d'où l'intérêt du stockage vivant pour faire évoluer le format au fur et à mesure si besoin

qui dit que le XML tiendra 20,30,40 ans
le XML ou la base de données contient les champs, lesquels sont personnalisables. Avec un squelette "perso", cela permet de recréer le document.

l'un des langages qui a sauf erreur de ma part tenu le plus long temps c'est le C
Il y a aussi le Cobol

le seul qui est commun a tous les machines restera le langage machine car on ne peut faire autrement
En fait il évolue lui aussi, avec les processeurs.
 

chonos

Helper


Oui, c'est vrai que le raid est pas mal et en changent les disque de temps a autre
avec un peu de spare

Les transformation en open document, j'ai fait le teste il y quelque temps c'est près
fiable au niveau de mise en page et des format de tableau

Je de faire un nouveau test plus positif mais c'est depuis Word vers OpenDoc que cela se passe le mieux
depuis Libreoffice ouvrir un doc word vers opendoc c'est moins bien
a+

 

VaderFR

Grand Maître
Tout dépend si tu as de l'ancienneté dans le privé sur un poste informatique à relativement haut niveau (pas juste changer le toner de la photocopieuse, hein).
Si c'est le cas, elle peut être récupérée, ce qui permet de commencer avec un indice plus élevé, et donc un traitement plus élevé.

Quand au traitement - car ce n'est pas un salaire - voir :
- un début de réponse sur le forum concours CAP Public : . le post date de 2012, mais vu que la valeur du point d'indice a été gelée, c'est toujours valable.
- qui redirige vers une brochure d'accueil du syndicat solidaires finances publiques, qui te permettra d'en savoir plus, notamment à partir de page 11 sur la rémunération.
l'indice 321 sur le bulletin présenté en page 12 correspond à un tout nouveau, sans ancienneté. En net (ce que tu perçois au final), pour un n00b, c'est mis ~2460 (en 2014). Page 13 tu as le détail du traitement brut (avant primes) selon l'échelon/l'indice.On voit dès lors que la reprise de l'ancienneté dans le privé fera une grosse différence. Tu as tout un tas d'informations sur la rémunération (pendant la scolarité) dans la brochure, c'est assez bien expliqué. Différentes primes, remboursements, retenues et contributions. (et ce jusqu'en page 17)
- On peut aussi consulter leur site.
- le site economie.gouv.fr donne également des infos
À l’issue de votre formation, vous percevrez une rémunération nette annuelle minimum de 31 780 € en tant que titulaire (rémunération d’un inspecteur de la DGFiP programmeur de système d’exploitation débutant, calculée au 1er janvier 2011. Poste en région Ile-de-France dans un centre informatique).
.
(ça fait 2648 par mois au minimum donc, et plus si ancienneté)
 
Vous devez vous inscrire ou vous connecter pour répondre ici.
Derniers messages publiés
Statistiques globales
Discussions
730 134
Messages
6 718 086
Membres
1 586 397
Dernier membre
Chachabidou
Partager cette page
Haut