Tabla de contenido:
- Definición: ¿Qué significa el Sistema de archivos de Google (GFS)?
- Techopedia explica el Sistema de archivos de Google (GFS)
Definición: ¿Qué significa el Sistema de archivos de Google (GFS)?
Google File System (GFS) es un sistema de archivos distribuido escalable (DFS) creado por Google Inc. y desarrollado para adaptarse a los requisitos de procesamiento de datos en expansión de Google. GFS proporciona tolerancia a fallas, confiabilidad, escalabilidad, disponibilidad y rendimiento a grandes redes y nodos conectados. GFS está compuesto por varios sistemas de almacenamiento creados a partir de componentes de hardware de bajo costo. Está optimizado para satisfacer las diferentes necesidades de uso y almacenamiento de datos de Google, como su motor de búsqueda, que genera grandes cantidades de datos que deben almacenarse.
El Sistema de archivos de Google aprovechó la fortaleza de los servidores disponibles al tiempo que minimiza las debilidades del hardware.
GFS también se conoce como GoogleFS.
Techopedia explica el Sistema de archivos de Google (GFS)
El clúster de nodos GFS es un maestro único con múltiples servidores de fragmentos a los que acceden continuamente diferentes sistemas de clientes. Los servidores Chunk almacenan datos como archivos Linux en discos locales. Los datos almacenados se dividen en fragmentos grandes (64 MB), que se replican en la red un mínimo de tres veces. El gran tamaño del fragmento reduce la sobrecarga de la red.
GFS está diseñado para adaptarse a los grandes requisitos de clúster de Google sin sobrecargar las aplicaciones. Los archivos se almacenan en directorios jerárquicos identificados por nombres de ruta. Los metadatos, como el espacio de nombres, los datos de control de acceso y la información de mapeo, son controlados por el maestro, que interactúa y monitorea las actualizaciones de estado de cada servidor fragmentado a través de mensajes de latidos programados.
Las características de GFS incluyen:
- Tolerancia a fallos
- Replicación de datos críticos
- Recuperación de datos automática y eficiente.
- Alto rendimiento agregado
- Se redujo la interacción entre el cliente y el maestro debido al gran tamaño del servidor
- Gestión de espacios de nombres y bloqueo
- Alta disponibilidad
Los clústeres GFS más grandes tienen más de 1, 000 nodos con capacidad de almacenamiento en disco de 300 TB. A esto pueden acceder cientos de clientes de forma continua.
