Hogar Bases de datos ¿Qué es un extensor paralelo de datastage (datastage px)? - definición de techopedia

¿Qué es un extensor paralelo de datastage (datastage px)? - definición de techopedia

Tabla de contenido:

Anonim

Definición: ¿qué significa DataStage Parallel Extender (DataStage PX)?

DataStage Parallel Extender (DataStage PX) es una herramienta de integración de datos de IBM. Es una de las muchas herramientas de extracción, transformación y carga (ETL) ampliamente utilizadas en la industria del almacenamiento de datos. Esta herramienta puede recopilar información de fuentes heterogéneas, realizar transformaciones según las necesidades de una empresa y cargar los datos en los respectivos almacenes de datos.


DataStage PX también puede llamarse DataStage Enterprise Edition.

Techopedia explica DataStage Parallel Extender (DataStage PX)

DataStage Parallel Extender tiene una arquitectura paralela para procesar datos. Los dos tipos principales de paralelismo implementados en DataStage PX son paralelismo de tuberías y particiones. La capacidad de procesar datos de forma paralela acelera el procesamiento de datos en gran medida.


DataStage Parallel Extender incorpora una variedad de etapas a través de las cuales los datos de origen se procesan y refuerzan en bases de datos de destino. Estos se definen en términos de terabytes. Además de las etapas, DataStage PX usa contenedores para reutilizar los componentes y secuencias de trabajo para ejecutar y programar múltiples trabajos al mismo tiempo.


Las etapas comúnmente utilizadas en DataStage Parallel Extender incluyen:

  • Transformador
  • Agregador
  • Conjunto de datos
  • Copiar
  • El cambio aplica
  • Modificar
  • Filtrar
  • Unirse
  • Unir
  • Buscar
¿Qué es un extensor paralelo de datastage (datastage px)? - definición de techopedia