Q:
¿Cuál es la diferencia entre big data y data mining?
UN:Big data y data mining son dos cosas diferentes. Ambos se relacionan con el uso de grandes conjuntos de datos para manejar la recopilación o el informe de datos que sirven a empresas u otros destinatarios. Sin embargo, los dos términos se usan para dos elementos diferentes de este tipo de operación.
Big data es un término para un gran conjunto de datos. Los grandes conjuntos de datos son aquellos que superan el tipo simple de bases de datos y arquitecturas de manejo de datos que se utilizaron en épocas anteriores, cuando los grandes datos eran más caros y menos factibles. Por ejemplo, los conjuntos de datos que son demasiado grandes para ser manejados fácilmente en una hoja de cálculo de Microsoft Excel podrían denominarse conjuntos de datos grandes.
La minería de datos se refiere a la actividad de pasar por grandes conjuntos de datos para buscar información relevante o pertinente. Este tipo de actividad es realmente un buen ejemplo del viejo axioma "en busca de una aguja en un pajar". La idea es que las empresas recopilen conjuntos masivos de datos que pueden ser homogéneos o recopilados automáticamente. Los tomadores de decisiones necesitan acceso a datos más pequeños y más específicos de esos grandes conjuntos. Utilizan la minería de datos para descubrir las piezas de información que informarán al liderazgo y ayudarán a trazar el rumbo de un negocio.
La minería de datos puede implicar el uso de diferentes tipos de paquetes de software, como herramientas de análisis. Puede ser automatizado, o puede requerir mucha mano de obra, donde los trabajadores individuales envían consultas específicas de información a un archivo o base de datos. En general, la minería de datos se refiere a operaciones que involucran operaciones de búsqueda relativamente sofisticadas que devuelven resultados específicos y específicos. Por ejemplo, una herramienta de minería de datos puede buscar docenas de años de información contable para encontrar una columna específica de gastos o cuentas por cobrar para un año operativo específico.
En resumen, los grandes datos son el activo y la minería de datos es el "controlador" que se utiliza para proporcionar resultados beneficiosos.