Hogar Bases de datos ¿Qué es el análisis de datos paralelos? - definición de techopedia

¿Qué es el análisis de datos paralelos? - definición de techopedia

Tabla de contenido:

Anonim

Definición: ¿Qué significa el análisis de datos paralelos?

El análisis de datos en paralelo es un método para analizar datos mediante procesos paralelos que se ejecutan simultáneamente en varias computadoras.

El proceso se utiliza en el análisis de grandes conjuntos de datos, como grandes registros de llamadas telefónicas, registros de red y repositorios web para documentos de texto que pueden ser demasiado grandes para colocarlos en una única base de datos relacional. El método se usa a menudo en Big Data Analytics y en análisis de datos generales.

Techopedia explica el análisis de datos paralelos

El concepto principal detrás del análisis de datos paralelos es el paralelismo, definido en computación como la ejecución simultánea de procesos.

Esto a menudo se logra mediante el uso de múltiples procesadores o incluso múltiples computadoras y es una práctica común en la computación distribuida. En el análisis paralelo de datos, diferentes computadoras que realizan diferentes aspectos del análisis de datos ejecutan simultáneamente estos procesos y luego consolidan los resultados en un solo informe grande.

La razón de este paralelismo es principalmente hacer que el análisis sea más rápido, pero también es porque algunos conjuntos de datos pueden ser demasiado dinámicos, demasiado grandes o simplemente demasiado difíciles de colocar de manera eficiente en una sola base de datos relacional. El resultado sería que esos conjuntos de datos están alojados en diferentes bases de datos optimizadas para ese tipo de datos y en diferentes máquinas, por lo que el análisis lineal simplemente no será una opción eficiente.

¿Qué es el análisis de datos paralelos? - definición de techopedia