Microsoft Project Silica offre un stockage robuste de mille ans
Ars s’est entretenu mardi avec Ant Rowstron, chercheur principal chez Microsoft Research à Cambridge, au Royaume-Uni, au sujet d’un projet novateur de stockage frigorifique appelé Silica. La silice vise à remplacer à la fois le ruban et l’optique disques d’archives comme support de choix pour les entrepôts frigorifiques à grande échelle et (très) longue durée. Microsoft Research s’associe au géant du film Warner Bros. qui s’intéresse directement à la réduction des coûts et à l’augmentation de la fiabilité de ses propres programmes de stockage frigorifique.
Il s’agit d’un bloc de verre de haute pureté, qui présente les caractéristiques suivantes voxels gravé dedans avec lasers femtoseconde. Chaque voxel stocke plusieurs bits dans deux propriétés, retard et l’angle, qui peuvent à leur tour être lus à l’aide de l’imagerie microscopique et de la lumière polarisée. Les voxels peuvent être écrits à 100 couches ou plus de profondeur dans un morceau de verre de 2 mm de profondeur, en focalisant le laser à la profondeur désirée à l’intérieur du bloc lui-même.
La vitesse de lecture et d’écriture de Silica laisse actuellement quelque chose à désirer – il a fallu environ une semaine pour graver. SupermanRowstron estime qu’il faudrait environ trois jours pour relire les données, et les progrès réalisés depuis. La technologie n’en est encore qu’à ses balbutiements, bien sûr, et on s’attend à ce que le temps nécessaire à l’écriture et à la lecture diminue considérablement dans l’avenir. Rowstron dit qu’il ne s’attend toujours pas à ce que quelqu’un essaie de jouer. Superman directement de son disque de Silica, mais ce n’est pas ce à quoi il est destiné.
L’archivage à long terme des données est une solution très coûteuse. Lorsque j’étais au collège, j’ai participé à un projet de recherche pour le département des archives de mon université – le département avait besoin d’une application de base de données pour indexer et suivre ses collections de médias numériques, en grande partie pour être en mesure de budgétiser et d’effectuer des opérations de renouvellement des archives dans les délais prévus. Ses anciens enregistrements audio et vidéo analogiques devaient être numérisés, et ses enregistrements optiques sur CD et DVD devaient être lus, vérifiés pour en vérifier l’intégrité et gravés sur de nouveaux supports avant que les disques originaux ne se délaminent.
Ce cycle de rafraîchissement des archives devient rapidement intimidant à n’importe quelle échelle significative. Si vous supposez une collection de 10 000 CD et une équipe de trois ou quatre étudiants de premier cycle avec des lecteurs de CD-RW et une énorme pile de disques, il vous faudra plus d’un an de travail à plein temps pour les rafraîchir. (Warner Bros. qui a un budget un peu plus élevé que le département des collections rares de la bibliothèque de mon alma mater, migre ses propres données d’archives numériques selon un cycle strict de trois ans.)
Pire encore, la durée de vie des CD gravés est souvent très courte – ils peuvent facilement commencer à défaut de après seulement cinq ans, de sorte qu’ils devraient à tout le moins être testés qui souvent, sinon rafraîchis, » qu’ils en aient besoin ou non « . Il est possible de prolonger considérablement la durée de vie des disques optiques en les stockant à 5C/41F et 30 % d’humidité relative, mais cela augmente considérablement les coûts de stockage et de maintenance.
C’est le problème que le projet Silica est prêt à résoudre. Bien qu’il soit actuellement assez lent à lire ou à écrire, le verre moyen de Silica – ni plus ni moins que du verre de haute pureté – ne partage aucun des modes de défaillance des bandes, des disques optiques ou même du papier. Une brique de verre Project Silica n’est pas un support composé ; il n’y a pas de revêtement extérieur en plastique à user comme sur les CD, DVD ou Blu-Ray, et il n’y a pas de support magnétique à perdre physiquement de la surface d’une bande ou d’un disque dur.
On s’attend à ce que la silice survive pendant des milliers d’années dans presque n’importe quelle température, humidité et environnement chimique – c’est littéralement juste du verre, et les propriétés physiques et chimiques du verre sont extrêmement bien comprises. Nous ne pouvons que deviner les propriétés de matériaux manufacturés plus complexes (ruban, disque, etc.) en utilisant des techniques de vieillissement accéléré, mais des artefacts de verre vieux de milliers d’années sont facilement disponibles pour étude.
En plus de la résistance déjà impressionnante du support à la dégradation – on peut s’attendre à ce qu’il ne soit pas touché par un marteau – le projet utilise un véritable système de fichiers avec Correction d’erreur de transfert pour assurer davantage les données stockées contre la corruption ou la perte. De plus, les métadonnées telles que le titre, l’index, la date, etc. peuvent être gravées sur la surface de chaque bloc de Silice de projet dans un texte lisible par l’homme.
En tant que fans de La parole dans l’œil de Dieu déjà connu, il reste une question à laquelle il faut répondre pour toute méthode de stockage de données qui devrait durer des millénaires : que se passe-t-il lorsque le contexte technologique et culturel entourant un support de stockage s’effondre ? La silice s’attaque également à ce problème, en utilisant des pistes initiales de « vérité de terrain ». L’équipe utilise des algorithmes d’apprentissage machine pour relire les données de Silica, et en cas de perte de ces algorithmes formés, de nouveaux algorithmes peuvent s’entraîner très rapidement sur les pistes « vérité de terrain », qui leur apprennent à interpréter le reste des données.
Nous n’avons pas pu résister à l’envie d’interroger M. Rowstron sur la façon dont les Moties de Niven et de Pournelle auraient pu faire face au Projet Silica après un de leurs effondrements cycliques de civilisation. Même sans les techniques d’apprentissage machine, les chercheurs qui ont découvert des données stockées à l’aide des techniques du projet Silica devraient être en mesure de comprendre comment lire ces données armées de bons microscopes et de sources de lumière polarisée, suivant le même chemin de découverte le long des pistes de « vérité de terrain » que les réseaux neuronaux artificiels.