En supercomputación, la mayoría de los proyectos y trabajos de investigación suelen necesitar espacio de almacenamiento para almacenar los datos que están procesando, los que se generan, o ambos.

En un ordenador convencional los datos se almacenan normalmente en el disco duro, que es de tipo magnético. Además, hace relativamente poco existe una nueva tecnología denominada discos de estado sólido (del inglés Solid State Disk o SSD) que permite leer y escribir datos en el disco de forma mucho más rápida.

En centros como el CETA-Ciemat, son necesarios cientos de discos para poder almacenar tanto los datos que se generan de los diferentes investigadores y proyectos así como el espacio que ocupan los diferentes sistemas y aplicaciones desplegados.

¿Cómo se almacenan los datos?

El sistema de bficheros, (la forma en la que se almacenan los datos internamente en los discos) utilizado en el CETA-Ciemat se denomina Lustre y a diferencia de los sistemas de ficheros locales Lustre se conoce como un sistema de ficheros paralelo y distribuido. Esto se traduce en que cuando un usuario crea un archivo, este se divide en un número de porciones determinado (de acuerdo a su tamaño) que se escriben en paralelo en diferentes discos. De esta forma, tanto la lectura, como la escritura se hacen en paralelo, acelerando notablemente la velocidad a la que los usuarios pueden trabajar con sus ficheros.

¿Es seguro este tipo de almacenamiento?

En entornos como el CETA-Ciemat, la seguridad de los datos es algo fundamental, por lo que todo el sistema funciona en lo que se denomina alta disponibilidad (del inglés, High Availability) y de forma redundante. Este sistema permite que si uno o varios discos fallan no se pierda información, ya que otro disco entra en juego y la información que ese disco tenía se reconstruye automáticamente con información redundada (de paridad) que tenían otros discos.

Además, para proteger los datos de los diferentes proyectos y usuarios, teniendo en cuenta que algunos de ellos son especialmente críticos, es necesario contar con un sistema robusto de copias de seguridad (en inglés backup) que tenga la capacidad y frecuencia de copia necesaria para cada caso concreto.

Arquitectura Lustre

Además de los discos que cada máquina posee para almacenar en sistema operativo y demás herramientas de gestión, el CETA-Ciemat cuenta actualmente con una capacidad de almacenamiento de algo más de 1 Petabyte (1024 Terabytes).

ModeloUnidadesTB UnidadTB Total
Bull SAN 2 160 320
Dell PowerVault 1 3,6 3,6
Dell PowerVault 1 7,2 7,2
Supermicro node 10 24 240
IBM DS4100/4110 11 11 121
IBM Tapes 400 0,4 160
NetApp 12 14 168
  Total 1019,8