Por el personal de Techopedia, 29 de marzo de 2017
Para llevar: El presentador Eric Kavanagh habla sobre inteligencia empresarial con el Dr. Robin Bloor y Stan Geiger de IDERA.
Actualmente no has iniciado sesión. Inicia sesión o regístrate para ver el video.
Eric Kavanagh: Damas y caballeros, bienvenidos de nuevo, es miércoles a las 4:00 hora del este y, durante los últimos años, eso significa que es hora de Hot Technologies, sí, de hecho. Mi nombre es Eric Kavanagh, seré su anfitrión para el programa de hoy. Me encanta este tema: "Verificación de salud: mantenimiento de una BI empresarial saludable", de eso vamos a hablar hoy. Hay un lugar sobre el tuyo de verdad.
Así que este año hace calor: Hot Technologies fue realmente diseñado para definir tipos particulares de tecnología y se puede imaginar que en el mundo del software empresarial hay muchos vendedores que venden todo tipo de productos diferentes y lo que termina sucediendo allí son estas palabras de moda que terminan usándose y siendo engañados por varios proveedores para cosas muy diferentes. Por lo tanto, el propósito de este programa es realmente ayudar a nuestros amigos proveedores y ayudar a nuestra audiencia a identificar y comprender qué tipos específicos de tecnologías son realmente y qué significan estas palabras cuando se trata de tachuelas.
Por lo tanto, voy a presentarme como uno de los analistas de hoy, también tenemos al Dr. Robin Bloor en la línea y Stan Geiger de IDERA. Hablemos rápidamente sobre la importancia de la inteligencia empresarial y el análisis en general. Este es un árbol de decisión básico, si lo desea, o un diagrama de flujo que simplemente habla sobre cómo trabaja a través de los problemas en su empresa, tiene discusiones sobre diferentes temas, reúne propuestas y luego descubre lo que piensa la gente. ¿Están de acuerdo? ¿Están en desacuerdo? ¿Cuál es el consenso, si tiene alguno, y cómo trabaja a través de ese proceso?
Bueno, obviamente todo esto es muy genérico, pero es un buen recordatorio del proceso mediante el cual proponemos ideas en las empresas, tomamos nuestras decisiones y luego avanzamos. Y la conclusión es que se requieren datos para todos y cada uno de esos componentes. Eso es aún más cierto en estos días en el mundo del big data, porque, por supuesto, el big data es como este motor de verdad gigante que existe. Big data es realmente lo que está sucediendo; es representativo de quién es dónde, qué están haciendo, qué están comprando, qué manejan sus redes sociales, por ejemplo, tuiteando. Por supuesto, todas esas cosas pueden ser pirateadas, hay que tener cuidado con eso, pero el punto es que los datos son la arquitectura de referencia, si se quiere, para la realidad.
Por lo tanto, desea datos en cada punto de este proceso de toma de decisiones. Ahora, el consenso es importante. Si desea usuarios felices, a veces un jefe puede tener que ir contra la corriente de lo que todos quieren. Estábamos hablando de Steve Jobs justo antes de que comenzara este webcast y era conocido por ese tipo de cosas. Tiene una cita famosa en la que recomienda que las personas ahoguen el ruido que escuchan y luego se adhieran a su visión, si saben que lo que están haciendo es correcto. Por lo tanto, no siempre se necesita consenso, pero generalmente es una muy buena idea. Pero el propósito general de esta diapositiva y este comentario es llevar a casa la importancia de que queremos tomar nuestras decisiones basadas en datos, no solo en el instinto, aunque el instinto generalmente es realmente bueno para ayudarlo a saber a dónde quiere ir, y luego realmente busca validar eso o invalidarlo con sus datos. Y yo diría que no tenga miedo de mirar hacia atrás allí, solo como un pequeño marcador agradable, o recordarle que cuando mira hacia atrás en ocasiones, al menos puede obtener algún marco de referencia y comprender dónde ha estado viniendo de y sé honesto sobre los errores que has cometido. Todos hemos cometido errores, sucede.
Entonces, si tiene problemas de rendimiento en sus sistemas de inteligencia de negocios, bueno, existe la vieja expresión "la paciencia es una virtud", no en el mundo de TI, puedo decirle ahora. Si los usuarios esperan mucho tiempo para que sus consultas regresen, o no reciben sus informes, eso erosiona la confianza, y cuando la confianza desaparece, es muy difícil recuperarla. Entonces, puse una línea aquí, aproximadamente 40 segundos en estos días es como 40 minutos en muchos casos, si una consulta demorará 40 segundos, la gente olvida de qué están hablando, qué estaban preguntando de los datos. Imagínese en una conversación si le pregunta a alguien, digamos a su jefe, diga: "Oye, me gustaría saber por qué vamos por este camino". Y tuvo que esperar 40 segundos en una conversación. para obtener una respuesta? ¡Saldrías de la habitación! Se podría pensar que su jefe se ha vuelto loco. Entonces, esa latencia que tenemos en algunos sistemas de información, cuando hay problemas de rendimiento, va a truncar el proceso analítico, el flujo analítico o, como algunas personas lo llaman, la conversación que está teniendo con sus datos. Debes acelerar en estos sistemas, lo que sea que tengas que hacer para lograrlo, y vamos a hablar de eso hoy, eso es lo que debes hacer, porque sin ese flujo fluido de ideas de un lado a otro, estás realmente perjudicando todo el proceso de análisis. Entonces, y una vez más, descarto este comentario: la falta de confianza es un asesino silencioso. La gente realmente no levantará demasiado la mano si no confía en ti, pero solo te mirará de reojo y se preguntará qué está pasando. Y una vez que esa confianza haya desaparecido, tendrá dificultades para recuperarla.
Entonces, inteligencia artificial, bueno, seguimos escuchando sobre el aprendizaje automático y la inteligencia artificial y "Oh, ¿eso no va a resolver todos estos problemas?" Robin y yo hemos estado escuchando durante años sobre las bases de datos de autoajuste y todas estas cosas divertidas. está sucediendo algo de eso, pero solo hágase la pregunta: ¿con qué frecuencia Siri lo hace bien para usted? Con qué frecuencia aparece Siri accidentalmente y dice: "Lo siento, no entendí eso". Eso es porque no te estaba preguntando nada. Accidentalmente presioné ese maldito botón. Así que todavía hay muchos defectos, y por cierto en el lado izquierdo, ese es el chip ASIC de un Apple Newton: ¿recuerdas a ese cachorro de años y años atrás? Ese fue uno de los primeros dispositivos inteligentes, y eso fue hace mucho tiempo, eso es como principios de los 90 o mediados de los 90, quiero decir. Que el Newton salió y no fue muy bueno, pero tuvo la visión; sabían a dónde iban, pero incluso ahora, con el iPhone AI y el aprendizaje automático, estos son conceptos ampliamente incomprendidos, diría.
Y, ciertamente, con respecto al aprendizaje automático, puede ser muy útil y, de hecho, puede usarse en algunos de estos entornos en los que intenta comprender qué está pasando con su compleja arquitectura de información, donde las cosas van mal. El aprendizaje automático puede ser muy valioso en ese contexto, pero solo si se aplica de manera muy aguda. Entonces, en realidad, estaba en un gran evento en California, uno de los grandes distribuidores de Hadoop, Cloudera, tuvo su cumbre de analistas y estaba hablando con su director de estrategia y le dije: "Sabes, me parece que realmente el aprendizaje automático solo hace dos cosas: segmenta y afina ”. Esto significa que le dará diferentes segmentos o grupos de actividades, incluidas anomalías, que serían un segmento. Y se refina, lo que significa que te ayuda a mejorar un determinado tipo de decisión. El ejemplo clásico que escuchas es que hay un ser humano en esta fotografía, por ejemplo. Entonces, eso es algo que el aprendizaje automático puede hacer, y es útil en ciertos contextos, cuando se habla de solución de problemas, porque puede buscar patrones de comportamiento en el uso de la CPU, en el uso de la memoria, en la velocidad del disco y en lo que hacen los discos, y todo ese tipo de cosas divertidas. Por lo tanto, puede ser útil, pero realmente es algo que tiene que estar muy enfocado para generar cualquier valor.
Entonces, una de mis otras cosas favoritas de las que hablar, y creo que veremos un poco de esto, creo, cuando tomemos nuestra demostración hoy de IDERA, en muchos sentidos creo que los seres humanos todavía están aprendiendo a hablar de silicio . Debajo de todo esto hay una ciencia de los materiales, y para aquellos de ustedes que han solucionado problemas y realmente analizado las arquitecturas de información complejas, cuando intentan comprender lo que está sucediendo, incluso en un clúster de Hadoop, por ejemplo, realmente usualmente solo estás mirando histogramas. Y luego tienes que correlacionar lo que significan estos histogramas diferentes en un momento particular en el tiempo, y eso requiere inteligencia; eso requiere inteligencia humana y experiencia. Por lo tanto, no tengo miedo de que ML, o el aprendizaje automático o la IA vayan a eliminar demasiados trabajos en este mundo en el corto plazo. Creo que siempre habrá una necesidad de seres humanos, que francamente saben de qué están hablando para ayudarnos y hacer que todo esto suceda.
Entonces, sigamos avanzando. Entonces, ¿qué sucede si no estás basado en datos? Esta es una pintura famosa, "The Blind Leading the Blind" - esto no es lo que están buscando, amigos. No desea este tipo de entorno en su organización. Entonces, lo que queremos es que nuestras decisiones estén basadas en datos y queremos que las decisiones estén basadas en datos buenos, datos de buena calidad y eso solo sucederá si reúne los datos correctos, si son buenos y limpios, y si sus sistemas funcionan correctamente, si sus sistemas de BI están en buen estado, sus sistemas de análisis están en buen estado y los usuarios obtienen lo que desean de manera oportuna.
Así que con eso voy a terminar y entregar al inimitable Robin Bloor. Robin, llévatelo.
Robin Bloor: Bien, bien, gracias por pasarme la pelota. Estaba pensando mientras hablabas, Eric, solo estaba pensando en BI y hubo una presentación de proveedor a la que asistí recientemente cuando alguien comentó que en un proveedor en particular, ejecutando un sistema en particular en un gran almacén de datos defectuosos lo harían, en un determinado momento podría realizar 70, 000 transacciones de BI que conducirían a la presentación de información a muchas personas. Se me ocurrió que si realmente tienes ese tipo de carga de trabajo, e incluso desperdicias unos segundos en términos de ejecución del software, en realidad será muy costoso, y si desperdicias minutos, será terriblemente costoso. Y luego recordé que gran parte del mundo funciona con hojas de cálculo. Hay, creo, que se llamaron "sistemas de sombra", ¿no? En primera instancia, donde las personas simplemente ensamblarían sistemas usando hojas de cálculo y correo electrónico, y harían que las cosas sucedan, porque el departamento de TI no puede crear aplicaciones para todos, por lo que hacen eso. Y creo que mucha BI se involucra en sistemas como ese de todos modos.
De todos modos, habiendo dicho eso, hablemos de lo que voy a hablar. El BI es un ciclo de retroalimentación para los sistemas corporativos, es realmente así de simple o complicado, dependiendo exactamente de qué papel juega en la organización. Pero si miramos este es un diagrama de hace aproximadamente cuatro años, cuando estábamos intentando de una forma u otra entender lo que estaba sucediendo en el lado de la analítica. Pero más o menos, todo lo que es retrospectiva, mirando hacia atrás a lo que sucedió anteriormente, y todo lo que es supervisión, en términos de la forma en que funciona el sistema, tiende a ser BI. No solía ser el caso que lo que era previsión, análisis predictivo era BI, pero en realidad ese es el caso cada vez más. Eric mencionó el aprendizaje automático, una gran cantidad de aprendizaje automático en realidad puede de una forma u otra simplemente ejecutarse contra una secuencia de datos y puede brindarle análisis predictivos durante los próximos cinco minutos, o incluso casi en tiempo real, para que pueda responder a un cliente, con un conocimiento calculado de lo que realmente está sucediendo.
Pero el centro de este diagrama, el interior proviene de la analítica. Lo que normalmente sucede es que varias actividades analíticas apuntan a colecciones particulares de datos y se aprende algo nuevo, se aprende conocimiento sobre el negocio. Y ese conocimiento queda atado a los procesos comerciales que pueden alimentarse de él. Y, por lo general, se manifiesta de una forma u otra cuando aparecen alertas de BI, o simplemente se colocan varias cosas en los paneles, y así sucesivamente. Cuando realmente hicimos esto, hay cuatro términos y terminan con la palabra "vista", que es muy agradable. Pero en realidad no es todo en el campo de lo que la gente quiere hacer, también existe el problema de la optimización y la optimización no produce análisis simples. Es un problema muy complejo y muchos problemas de optimización no son únicamente solubles. Solo puede tener buenas soluciones, no puede probar que tiene una mejor solución. Y esa es un área de actividad, donde hay actividad, pero es menos que la mayoría de las otras áreas de análisis. Entonces, la gente dice que vivimos en la era de la analítica, bueno, lo hacemos en comparación con hace diez años, pero puede ir mucho más allá de lo que ya se fue.
Por lo tanto, el engendrar BI, el deseo de conocimiento engendra las solicitudes de los usuarios, lo que engendra proyectos analíticos, y los proyectos analíticos engendran lagos de datos, y los lagos de datos más análisis engendran percepciones y percepciones engendran BI. Esa es una historia que acabo de contar; Solo pensé en escribir eso. Lo que he hecho aquí, quiero decir, el objetivo de esta diapositiva y, en realidad, la mayoría de las otras diapositivas es enfatizar lo complejo que es el mundo de la inteligencia empresarial. No es una cosa simple, podría haber hecho esta diapositiva en particular mucho más complicada de lo que realmente es, pero aquí en la parte inferior, tiene datos externos y datos internos que de una forma u otra se pondrán en escena área, que hoy en día es una especie de lago de datos, aunque no todos tienen lagos de datos. Y las personas que sí lo hacen no necesariamente tienen éxito. Y luego, hay una actividad de limpieza de ingesta y una actividad de gobierno requerida en los datos antes de que realmente pueda usarla. Y luego, sirve esos datos y los informa o los analiza y el análisis lleva a la acción.
Y si realmente observa los diversos tipos de análisis que existen, esta es una lista increíblemente larga, pero no es necesariamente una lista completamente completa, es justo lo que pensé escribir cuando estaba creando esta diapositiva. Por lo tanto, hay muchas cosas que suceden en un entorno de BI que visualizaciones, OLAP, gestión del rendimiento, cuadros de mandos, paneles, diversos tipos de pronósticos, lagos de datos, minería de texto, minería de video, cosas predictivas, hay un vasto espectro de cosas que En realidad continúa. Si lo miras de una manera diferente, la realidad corporativa, básicamente, este es un diagrama similar al anterior, simplemente se hace de una manera diferente. Separé lo que llamarías BI porque es regular y se sabe lo que se requiere, eso no significa que lo que realmente está sucediendo es eficiente, pero al menos tendrás cosas normales en, digamos Tableau, o en Click, o en Cognos, hay una fuente temática, y así sucesivamente, se realizarán varios informes o capacidades regulares. Y luego tienes las aplicaciones de análisis y son diferentes. Debido a que las aplicaciones de análisis realmente se trata de explorar datos y, en mi opinión, equivale a investigación y desarrollo. Y luego tienes flujo de trabajo. En el flujo de trabajo, mezcle sus cosas con aplicaciones operativas y aplicaciones de oficina, si es necesario, y esa es la realidad corporativa tal como la veo, aunque en la mayoría de las organizaciones no está tan bien organizado.
Entonces, la interrupción de BI, esto es solo un conjunto de cosas que mencionar, hace que BI sea más difícil de lo que solía ser, porque el viejo mundo de BI consistía principalmente en conjuntos de datos bastante limpios capturados de una forma u otra, probablemente desde un almacén de datos y alimentados a Software de BI. Y en esos días, realmente estoy hablando hace cinco o diez años, pero en esos días, los volúmenes de datos no se expandían, las fuentes de datos eran conocidas. Se conocía la velocidad de llegada de los datos, aunque a menudo algunos BI no estarían sucediendo lo suficientemente rápido para el gusto de ciertos usuarios. No había datos no estructurados, casi no había datos sociales, ciertamente no había datos de IoT, no le importaba la procedencia de los datos. El valor de la computadora no tenía paralelismo en términos de infraestructura para poder, de una forma u otra, hacer cosas extraordinariamente rápidas. No tenía aprendizaje automático y el número de cargas de trabajo analíticas era bastante reducido. Y todo eso ha cambiado, el volumen de datos ahora puede estar creciendo dramáticamente. La cantidad de fuentes de datos sigue aumentando. Sí, la llegada de datos de transmisión es muy rápida, muchos datos no estructurados, ciertamente datos sociales que necesitarán limpieza, pero otros datos que podrían necesitar limpieza, ciertamente datos de IoT, es el trato ahora.
La procedencia de los datos es un problema y nos importa. La potencia de la computadora está ahí, lo cual es bueno, porque eso hace que todo tipo de cosas sea factible, y ahora tienes el aprendizaje automático como un fenómeno que conduce a la creación de más capacidad de BI y nuevas cargas de trabajo analítico que harán lo mismo. Entonces, BI no es una situación estática y creo que es lo último que voy a decir, antes de entregárselo a Stan. Oh no, no lo es, hay algo más. Futuro panorama de BI, Internet de las cosas, arquitecturas basadas en eventos, todo en tiempo real, OK. Eso es suficiente BI del usuario, por el usuario, para el usuario los problemas en resumen. La puntualidad del rendimiento del flujo de datos, la cobertura de datos, la limpieza de datos, las habilidades de acceso a datos, la visualización, la compartibilidad y la capacidad de acción.
Así que ahora puedo pasarlo a Stan, a menos que el servicio de BI sea confiable y oportuno, no es un servicio. Stan?
Eric Kavanagh: Muy bien, Stan, te estoy dando la pelota, quítala.
Stan Geiger: OK. Entonces, de lo que voy a hablar es solo mi experiencia. Soy gerente senior de IDERA en gestión de productos y una de las responsabilidades que tengo es nuestro producto de oferta de inteligencia empresarial. Así que voy a expandirme un poco sobre lo que Robin estaba hablando y hablar sobre el área clave con inteligencia empresarial que es monitorear el estado de su plataforma. Es como dijo, ahora solía ser donde teníamos todos estos datos y tomaría semanas analizarlos y luego volveríamos con informes y cosas. Pero el panorama de BI está cambiando de tal manera que ahora nos estamos acercando a los análisis casi en tiempo real. Y en muchos casos, análisis reales en tiempo real. Entonces, hablo un poco sobre esta diapositiva, esto es solo una especie de descripción general, y solo como una revelación completa es que voy a hablar sobre esto desde una perspectiva de Microsoft, pero todos estos conceptos se refieren a si su BI las plataformas están en Oracle, o está utilizando Informatica y Oracle, o simplemente en modo mixto, entornos híbridos. Solo lo voy a usar en referencia al entorno de Microsoft, pero esto es bastante estándar.
Robin tenía una diapositiva que tocaba esto, es que tienes sistemas de origen, donde tengo todos mis datos, y ahora solía ser que todos estaban en bases de datos relacionales y almacenamiento de datos como ese, pero ahora tenemos Hadoop e internet y cosas así, y todos estos datos no estructurados, y ahora podemos incorporarlos a esta arquitectura de BI. Entonces, el nivel medio que habla un poco es el almacenamiento de datos en agregación; Aquí es donde extraemos los datos, podríamos limpiarlos, podríamos reestructurarlos, y luego colocar algún tipo de almacén de datos y luego la capa de presentación se ubica encima de eso, y ahí es donde sus usuarios obtienen acceso. Y estamos haciendo análisis de esos datos en esos almacenes de datos, y estamos haciendo tableros, y tenemos a Tableau sentado allí, reportando servicios, cosas así. Siempre me río porque cuando era arquitecto BA, siempre nos reíamos de Excel, porque seamos sinceros, Excel es la herramienta de BI de las masas, aún.
Entonces, un poco de una visión general allí, pero solo para hablar sobre el tipo de arquitectura de la plataforma, tienes tus datos de origen y lo hablé en múltiples almacenes de datos. Y luego tengo mi almacenamiento en conjunto en el mundo de Microsoft, tendrás tu base de datos de SQL Server, tal vez dónde está tu almacén de datos, tal vez tengas tu almacén de datos en la nube, como tu almacén de datos. Tienes servicios de análisis, que son tus tubos OLAP y cosas por el estilo para hacer agregaciones y cosas alrededor de mirar cosas en múltiples dimensiones y cosas así. Luego tienes tu capa de presentación, de la que hablé brevemente, de todas estas cosas que se encuentran encima de esos almacenes de datos y agregaciones. Y siempre me gusta esta cita, "No sabes lo que no sabes", lo cual es cierto. Si no está monitoreando y no está mirando lo que está sucediendo, en todas estas áreas de su plataforma de BI, ¿cómo sabe cuándo tiene un problema que no sea cuando los usuarios comienzan a enviarle correos electrónicos desagradables y comienza el teléfono? sonando sobre por qué no se están ejecutando mis informes? ¿Por qué todo lleva tanto tiempo?
Entonces, en ese sentido, lo que tienes que hacer, debes ser capaz de monitorear tus plataformas desde las cuales estás sirviendo inteligencia empresarial. Y básicamente dividí eso en tres áreas: tienes disponibilidad, rendimiento y utilización. Disponibilidad significa si el recurso está disponible: ¿está activo o inactivo? Bastante simple allí. Pero también mirando cuándo lo tiene, es posible que la plataforma esté disponible, pero puede tener problemas allí, por lo que debe poder identificar la causa raíz; debe poder recibir alertas y dejar que alguien sepa lo que está sucediendo, antes de que las cosas lleguen a un estado crítico. Eso lleva al lado del rendimiento, también, tiene cosas de un nivel de métrica de rendimiento, en el nivel del servidor, donde se alojan los servicios o los servicios de BI, o las plataformas de BI; tienes un rendimiento a nivel de recursos en el que tal vez estoy accediendo a datos de una SAN, por ejemplo. Como la SAN es el recurso, los recursos de red, debe poder monitorear el rendimiento de todo eso, poder identificar cuellos de botella y mantener felices a sus usuarios, y si se encuentra en un entorno en el que lo está haciendo realmente, análisis de tiempo, debe poder identificar cuellos de botella o problemas antes de que comiencen a suceder.
Y la última teoría es la utilización: ¿qué están haciendo los usuarios? ¿Quién está conectado a mis fuentes de BI? ¿Quién dirige qué? ¿Qué consultas están ejecutando? ¿Qué informes están ejecutando? Conocer esta información ayuda a determinar y planificar la capacidad, por ejemplo. También muestra lo que se está utilizando en su entorno de BI. Teníamos un cliente que quería nuestro producto de monitoreo para BI solo para que supieran qué partes del entorno de BI estaban utilizando para poder mover los recursos. Por ejemplo, si no estuvieran utilizando ciertos informes o ciertos cubos de servicios de análisis, trasladarían recursos de eso a otras áreas que estaban siendo altamente utilizadas. Otra cita que me gusta, me gustan las películas realmente geniales como "Tremors", así que les cuento mi película, así que me gusta esta cita de Burt Gummer, quien fue interpretado por Michael Gross, él es el tipo de arma de supervivencia y dice: aparece y saca este enorme rifle de francotirador de calibre 50, y uno de los muchachos dice: "Maldita sea, Bert". Y él responde: "Cuando lo necesitas y no lo tienes, cantas una melodía diferente. En otras palabras, ¿sabes qué? Estaba preparado para cualquier cosa y vino preparado para cualquier cosa, así que lo que quiero decir con esto es que si no está monitoreando su entorno de BI desde los recursos y la utilización y las cosas de las que acabo de hablar, entonces no se da cuenta de que necesita una herramienta o un entorno o estructura que lo está monitoreando hasta que no lo tenga. Y luego te das cuenta de que realmente lo necesitaba en el futuro, y así son muchos de nuestros clientes.
Entonces, habiendo dicho eso, nos mudaremos y analizaremos lo que estamos haciendo aquí en IDERA para resolver algunos de estos problemas. Y-
Eric Kavanagh: Bien, ahí lo tienes, lo veo.
Stan Geiger: ¿ Lo ves? Bueno. Entonces, lo que tenemos aquí es nuestro producto BI Manager. Y monitoreamos, IDERA ha sido tradicionalmente una empresa en el entorno SQL Server, Microsoft SQL Server. Y luego compramos en Embarcadero, así que ahora nos hemos expandido a otras plataformas, pero nuestro producto de BI tradicionalmente monitorea la pila de BI en el entorno de Microsoft. Y eso serían servicios de análisis para su análisis multidimensional y tabular, servicios de informes, herramienta de informes y luego servicios de integración, que es una plataforma ETL, similar a Informatica.
Y a través de nuestro producto, usted puede monitorear los tres entornos a través de un solo producto, y lo que está viendo aquí es el tablero general, y lo que hay que tener en cuenta aquí es cuando hablé de alertas, es una cosa para monitorear, pero eso no es suficiente: debe tener un mecanismo de alerta. En otras palabras, necesito poder ser notificado antes de que las cosas lleguen a un estado crítico. Entonces, lo que hacemos aquí, hay un conjunto completo de métricas que capturamos que son configurables porque dependiendo de su entorno, ciertos umbrales, puede estar bien con un tiempo de lectura de treinta milisegundos, en su entorno. En otros entornos, puede ser más crítico que ese umbral sea más bajo, por lo que es importante no solo tener alertas, sino que sea configurable porque los entornos son diferentes dependiendo de los recursos.
Entonces, básicamente, esta es una descripción general de todos los entornos que se están monitoreando aquí, y tengo tres instancias aquí: una para servicios de análisis, una para servicios de integración y otra para servicios de informes. Y ves, tengo un par de alertas aquí. Y debido a que estos son rojos, me dice que son críticos, porque tengo múltiples niveles en los que puedo configurar esas alertas, y las alertas pueden enviarse por correo electrónico a las personas responsables de investigar cuál es el problema. Entonces, solo brevemente echaremos un vistazo y volveré a las alertas, para que podamos entrar en el servicio de análisis y está, estoy seguro de que está esperando cargar aquí. Y básicamente, lo que hacemos, tenemos una recopilación de datos; sale periódicamente y sale y recoge e instantáneas de lo que están haciendo sus entornos. Entonces, tengo el mío configurado para cada seis minutos, así que cada seis minutos sale y sondea el medio ambiente. Tuve mi VM dormida por un tiempo, así que tomará un segundo para que esto vuelva a funcionar. Aquí vamos.
Entonces, echamos un vistazo a la pieza de servicios de análisis y voy a hacer clic en mi instancia aquí, y recordar que hablé de una de las cosas que monitoreamos es el rendimiento a nivel del servidor, porque mucha gente tiene múltiples cosas corriendo en su servidor. Es posible que tenga una base de datos ejecutándose en mi servidor, así como servicios de análisis, por ejemplo. Entonces, si algo está sucediendo en la base de datos o tengo un problema a nivel del servidor, va a afectar lo que sea que se esté ejecutando allí. Entonces, monitorearemos cosas a través del servidor a nivel de servidor, cosas como cómo está el rendimiento del disco, y puede ver que capturamos métricas en torno a todo esto. Y todo esto es configurable. Y miro lo que está sucediendo, en cuanto a CPU, solo, y nuevamente, esto es a nivel de servidor, no a nivel de servicios de análisis en mi ejemplo aquí. Pero en realidad a nivel del servidor.
Y puedo ver cosas como cuál es la memoria, el uso general de la memoria, por ejemplo, ¿qué hay disponible? Así que ahora tengo una idea de cuál es el estado del servidor en sí. Entonces podemos comenzar a echar un vistazo a las cosas que son particulares, en este caso los servicios de análisis. Puedo ver y ver cómo va mi procesamiento de cubos aquí, por ejemplo, y esto me da una medida de la salud. Si empiezo a ver que el procesamiento lleva más tiempo, o no es que las filas no se escriben tan rápido, entonces puedo comenzar a echar un vistazo, y esto va a la pieza de correlación de la que creo que Robin estaba hablando, es que todavía se necesita un humano para poder hacer todo esto. Hablamos de IA, aprendizaje automático, pero todavía se necesita un ser humano para poder correlacionar estos eventos en torno a las cosas. Podemos echar un vistazo a cosas como lo que está sucediendo en cuanto a consultas, qué consultas se están ejecutando y cuánto tiempo están tardando. Puedo ordenar, por lo que puedo comenzar a tener una idea de qué consultas están tomando la mayor cantidad de tiempo. Puedes echar un vistazo aquí en el tiempo transcurrido, puedo echar un vistazo y ver OK, ¿cuál fue esa consulta y quién estaba ejecutando esa consulta en ese momento?
Entonces, puedo comenzar a contar una historia sobre esto en cuanto a cuando empiezo a ver que las cosas comienzan a aumentar, puedo regresar y mirar y ver qué estaban haciendo los usuarios en ese momento. Y verá que una de las cosas que hacemos es poner este selector de tiempo aquí para permitirle elegir una ventana de tiempo. Entonces, por ejemplo, puedo volver a esas alertas, y en realidad era un enlace en esas alertas en el que hago clic, y me llevaría ese momento en el tiempo cuando ocurrió esa alerta. Y luego puedo comenzar a reconstruir la historia, puedo ver oh, bueno, las lecturas del disco estaban arriba, o tenían problemas de memoria o lo que sea, y luego puedo saltar sobre la actividad de consulta en ese mismo momento y puedo comenzar correlacionando quién estaba ejecutando qué consultas podrían haber causado esos picos allí. Y luego, puedes comenzar a hacer cosas como que puedo comenzar a sintonizar, ahí es cuando comienzo a sintonizar. Esto es como un auto, si construyes un auto de carreras y solo dejas caer el motor y arrancas la llave, el motor podría arrancar, pero si necesito ir 180 millas por hora para ganar, necesito saber que el motor puede funcionar a 100 millas por hora y necesito ir allí y comenzar a ajustar ese motor para poder llegar allí. Y eso es lo que esto le permite hacer, es poder darle suficiente información para comenzar a ajustar su entorno, aumentar la salud y la producción de ese entorno, y la eficiencia.
Y luego, monitoreamos cosas en la memoria que son particulares de los servicios de análisis, en este caso. Y aquí es donde puedes comenzar a ver dónde las cosas pueden comenzar a salir mal, cuando comienzas a ver cosas que se disparan por encima de tus límites de memoria, cosas así. Otra cosa que es buena de ver, cada vez que está ejecutando cualquier tipo de consulta, desea que los datos se almacenen en caché, porque cuando se almacena en caché, está en la memoria y no tiene que leer desde el disco, que es mucho más eficiente que tener que leer datos del disco. Por lo tanto, puede comenzar a echar un vistazo a las cosas que están sucediendo, discúlpeme, por ejemplo, en el caché de datos. Tuve un montón de consultas ejecutándose antes, para obtener estos datos, y se puede ver que tuve la mayor parte del tiempo, las coincidencias y búsquedas de caché se superponen, lo cual es bueno. Pero tuve un período aquí donde los resultados fueron mucho más bajos de lo que fueron las búsquedas, lo que me dice que estaba sucediendo algo que requería mucha memoria, de modo que el caché se volcó mucho más rápido, por lo que los datos tenían que ser Leer desde el disco. Y podemos ver eso cuando miramos el motor de almacenamiento. Este es el mismo punto en el tiempo que ese otro gráfico, y puede ver el pico allí, donde las consultas del archivo realmente aumentaron durante ese período. Y eso significa que los datos se leían desde el disco. Ahora, puedo retroceder y luego correlacionar eso con las consultas que se estaban ejecutando, y no para hacer sangrar los oídos de todos, pero en los servicios de análisis, usa un lenguaje llamado MDX, hay formas de escribir consultas de manera más eficiente, por lo que usa el caché más eficientemente y menos almacenamiento. Entonces, hay un ejemplo de ajuste de ese motor, y darle todas las piezas necesarias para poder correlacionar eso.
Simplemente rápido, también podemos voltearlo de otra manera, cuando miramos las consultas, podemos ver ahora las sesiones, ¿quién está realmente conectado en este momento y qué están ejecutando? Por lo tanto, este tipo de visión le da una visión opuesta de las consultas y quién las está ejecutando. Este es quién está conectado y luego puedo ver lo que están ejecutando actualmente. La otra cosa, solo para repasar rápidamente, es que puedes ver todos los objetos en mis cubos MOLAP multidimensionales. Y puedo obtener información al respecto. Entonces, por ejemplo, puedo ordenar por esta columna de lectura, y puedo ver que el objeto más utilizado es la dimensión del tiempo y el segundo más utilizado es la dimensión del cliente. Y esto ayuda a las personas que desarrollan y construyen cosas para construir sus cubos de manera más eficiente. Es posible que desee cambiar mi estrategia de partición de los datos, por ejemplo, en estas dimensiones altamente utilizadas en mi cubo, y por lo tanto, eso aumentará el rendimiento de las consultas, por ejemplo. Puede disminuir el rendimiento del procesamiento del cubo, porque ahora tengo más particiones, pero desde la perspectiva del usuario ajustará ese motor, para que sea más eficiente para utilizar estos objetos.
Entonces, avance, hable sobre los servicios de integración aquí. Los servicios de integración, mencioné, son una plataforma ETL en un entorno de Microsoft. Lo que hacemos aquí, y esto es coherente, controlamos el rendimiento del servidor, y estas serían las mismas métricas que analizamos, porque todos mis servicios se ejecutan en el mismo servidor. Pero nuevamente, esta es una descripción general de lo que está sucediendo en el servidor. Y luego puedo ver la actividad de servicios de integración, mis procesos ETL. Entonces, puedo tener una idea de cuándo se ejecutaron estos procesos, si tuvieron éxito o no, puedo resaltar una ejecución particular de un proceso ETL y luego me mostrará el desglose de los pasos dentro de ese proceso ETL, si fue exitoso o no y cuánto tiempo tardó.
Ahora, si tuviera un paquete fallido aquí proceso ETL, podría ir a los detalles y ver el mensaje de error y me mostraría qué paso en ese paquete donde ese proceso ETL falló, junto con todos los mensajes asociados con eso. Entonces, eso es lo que me da, y puedo recibir una alerta si falla, así que si recibo una alerta, puedo entrar aquí, ver, ir a esa alerta, ver la falla del paquete, ver los pasos, vea dónde falló, mire el mensaje de error e inmediatamente sé lo que tengo que hacer para solucionarlo: volver a implementarlo y luego comenzarlo de nuevo. Entonces, lo que esto le permite hacer es llamarlo acortar esa ventana entre la identificación del problema y la resolución del problema. Entonces, en mi vida anterior, cuando era responsable de este tipo de cosas, teníamos un proceso ETL que se ejecutaba de noche para cargar nuestro almacén de datos. Si tenía esta información, a primera hora de la mañana cuando entré, si algo fallaba, entonces puedo abordarla rápidamente y volver a realizar ese proceso para asegurarme de que el almacén de datos esté en funcionamiento y actualizado para cuando los usuarios entró y comenzó a acceder a los informes.
La otra cosa es que tengo dos procesos que se ejecutan, es mirar y ver cómo se ejecutó con el tiempo. Eso es importante porque si empiezo a ver estos procesos, por ejemplo, me toma más tiempo, veo que estos tiempos aumentan, entonces es posible que tenga que mirar, por ejemplo, mi ventana de mantenimiento, es posible que tenga cosas que están sucediendo en ese servidor . Tome, por ejemplo, copias de seguridad; Es posible que tenga una copia de seguridad que está causando que mi proceso espere hasta que esté listo. Es posible que deba reprogramar o hacer malabarismos con mis procesos en torno a cosas que comienzan a afectar mi ETL.
Y la última pieza son los servicios de informes. Los servicios de informes son de Microsoft, básicamente su herramienta de informes empresariales. Y algunas de las cosas, una vez más, podemos ver las cosas a nivel del servidor, podemos ver las cosas en el servidor de informes, el servidor de servicios de informes, en sí mismo. No tengo muchas cosas corriendo aquí; Tengo algunas suscripciones que se ejecutan cada 15 minutos, para ejecutar un informe. Por lo tanto, no verá muchas conexiones activas porque se activa, se conecta, ejecuta informes, se desconecta y se envía.
Pero en entornos de alta transacción donde se realizan muchos informes, es clave poder monitorear estas cosas. Entonces, puedes ver dónde estaba sucediendo aquí, así que te da una idea bastante buena de lo que está sucediendo, desde el nivel real de servicio y plataforma. Y luego, como hablé en las diapositivas, ¿quién está manejando qué y qué están haciendo? Y uno de nuestros clientes compró este producto solo para esta pieza porque querían saber qué informes estaban ejecutando las personas y quién los estaba ejecutando. Esta es una de las cosas en la ejecución de este informe que puede ver aquí. Puedo ver qué informe, puedo ver los parámetros que estaban en ese informe, puedo ver quién lo está ejecutando, puedo ver el formato del informe. Y luego tengo todas estas métricas a su alrededor, por lo que, de nuevo, puedo clasificar estas cosas, por ejemplo, qué informe tardó más en recuperar datos, y puedo ir directamente a eso y ver qué informe es. Y de nuevo, todo esto me da datos para poder, sintonizar ese motor nuevamente. Ahora, puedo comenzar a ajustar mi entorno de informes en torno a eso.
Y lo último, es que puedo echar un vistazo a la actividad del usuario, a quién está conectado nuevamente actualmente, ¿qué están haciendo? De hecho, en un entorno en el que tenía usuarios múltiples, todo esto se puede ordenar, así que puedo clasificar, ver quién utiliza más el entorno. Entonces, solo para regresar rápidamente y echar un vistazo a esas alertas. Aquí estaba esa alerta; Puedo hacer clic en este enlace aquí y me llevará al gráfico para ese punto en el tiempo y me mostrará cuál estaba bajo alerta. Así que puedes ver aquí, ese es el que causaba que fueran los milisegundos promedio para escribir, por ejemplo, leer y escribir. Entonces, nuevamente, solo trato de obtener ese punto de identificación de los problemas. Y es realmente importante tener una herramienta holística, no solo algo que vea esa única cosa, porque los humanos tienen que venir aquí y correlacionar estos eventos que están sucediendo, por lo que deben poder ver lo que estaba sucediendo en ese momento. apunte en el tiempo a través de las múltiples áreas de ese entorno, y esa es una de las cosas que hacemos a través de este selector de tiempo aquí.
Eric Kavanagh: Sí, este es Eric aquí solo con una pregunta rápida, porque creo que probablemente te golpeaste en el clavo, y esto es de lo que estaba hablando en la última hora, que un ser humano tiene que venir y dibuje estas correlaciones entre diferentes entornos. Tengo curiosidad por saber, ¿hay algún material educativo que puedan compartir, o tal vez hacen algún tipo de compromiso con la gente para ayudarlos a identificar algunos de esos patrones? Como si tuvieras un muy buen ejemplo hace un minuto, cuando uno de estos está aumentando, te dice que algo está sucediendo en la memoria porque siguió intentando volcar la memoria. Y le da una pista, pero cómo la gente mapea estas estadísticas contra problemas del mundo real, es la verdadera pregunta.
Stan Geiger: Sí, ese es un buen punto y una de las cosas de las que estaba hablando, la hoja de ruta para el producto, es que más adelante este año vamos a lanzar una versión y una de las cosas que vamos a comenzar a agregar es para cada uno de estos gráficos, es una descripción de lo que significa este gráfico y por qué debería importarle, y cuál es el impacto de esto. Así que puede hacer clic en un signo de interrogación o algo en este cuadro y luego abrir una ventana que le dará mucha información y le dirá que estas son las posibles causas, estas son las áreas que se ven afectadas y para guiarlo en en una dirección de poder ir en este caso, como dijiste, aquí está ese pico, sé por experiencia personal lo que esto significa. Y luego puedo comenzar y comenzar a perforar en un área y encontrar la causa raíz.
Ahora, tenemos mucho de eso, en realidad, en nuestro producto de administrador de diagnóstico para SQL Server, para la base de datos real. Tenemos mucho de ese tipo de funcionalidad en un producto como ese, y también tenemos algunos complementos de análisis para el administrador de diagnósticos que te dan una pista mucho más rápida. Y ahí es donde vamos por el camino con este producto.
Eric Kavanagh: Y supongo que hay firmas para ciertos tipos de actividad. ¿Esta herramienta le permite identificar cuándo ocurrió un cierto tipo de evento y catalogarlo, de modo que con el tiempo reconocerá un patrón similar en el futuro y lo ayudará a descubrir si es un usuario nuevo, por ejemplo, usando el misma herramienta? Ayudarle a comprender, ¿esto se debe a que estos servidores se cayeron o porque esta región se cayó? ¿Hay alguna forma de catalogar las firmas de problemas, de modo que pueda identificarlos fácilmente más adelante?
Stan Geiger: No, en realidad, pero ese es en realidad un concepto interesante, porque es casi como, ¿qué es? Análisis de componentes principales, supongo, donde identifica patrones y registra esos patrones, por lo que si los vuelve a ver, puede volver y miren, esta fue la causa en ese momento. Sí, eso es algo, no está en la hoja de ruta, pero es algo en lo que he estado pensando desde el punto de vista de la gestión del producto.
Eric Kavanagh: Me lo puedo imaginar. Oh, adelante
Stan Geiger: No, iba a decir, y recibimos muchas solicitudes, porque no sé cuál es su experiencia, pero lo que encontramos es que los DBA conocen bases de datos como el dorso de su mano, pero las cosas de BI son como una caja negra cuando se trata del estado de la plataforma. Y no hay, no tienen mucha base de conocimiento al respecto. Lo hago, solo por haber trabajado en él durante cinco o diez años, ¿verdad? Pero las personas típicas que son responsables de encontrarlos, o de recibir alertas y descubrir qué estaba pasando, es una especie de recuadro negro para ellos.
Eric Kavanagh: Sí, me lo puedo imaginar. También me gustaría saber, así que estabas mostrando en esa pantalla cómo puedes ver todas las consultas que están llegando, cuánto tiempo tardaron en ejecutarse y quién las generó. ¿También puede ver la estructura real de la consulta SQL en sí misma y hacer algún análisis al respecto? Como tal vez a veces la gente reúne consultas SQL que son un poco voluminosas, digamos, y engorrosas, en lugar de un maestro que realmente reúne una consulta agradable y ajustada. ¿Es algo que puede visualizar a través de esta herramienta y luego ayudarlo?
Stan Geiger: Sí, entonces lo que puedes hacer es, como lo que he hecho aquí, es que he ordenado por tiempo transcurrido, por ejemplo. Entonces puedo ver los que tomaron más tiempo y luego recibo el texto, pero aún depende de alguien que es más o menos experto en el tema mirar eso y decir: "Oh, está bien, aquí está el por qué eso tomó tanto tiempo . ”Eso es algo de lo que tenemos un tipo de análisis de carga de trabajo, lo llamamos SQL Workload Analyzer para el lado de la base de datos, que he estado engañando con la idea de que tal vez en el futuro surja algo similar, para que identifique estas consultas y luego le da recomendaciones sobre cómo ajustar esas consultas. Pero uno de los problemas es que esta consulta MDX es un lenguaje bastante especializado.
Eric Kavanagh: Sí, me lo puedo imaginar. Pero puede ver, por ejemplo, quiénes son las personas, por lo que no es demasiado difícil determinar si una persona, si un chico es responsable de diez de las consultas de proceso más largas, si no puede llamarlo o llamarlo su gerente o alguien y le dice: "Oye, este tipo está masticando mucho ancho de banda", y tal vez resulte que esas son las consultas más valiosas para el negocio, ¿verdad? Tienes que ponerlo en el contexto de cuál es el valor del negocio, a partir de las consultas mismas, no es solo un juego de números claro, ¿verdad? Es para descubrir, bueno, este tipo es nuestro usuario avanzado, y él es el que está cambiando el negocio, ¿verdad?
Stan Geiger: No, tienes toda la razón. Quiero decir, esa es una de las formas en que los clientes usan esto, es para poder hacer eso. Como dijiste, es posible que encuentres un área, porque una de las cosas de las que hablo es que siempre hago escorias en Excel, pero puedes conectarte a los servicios de análisis en Excel y ejecutar tablas dinámicas fuera de OLAP, y genera sus propias consultas, y los envía y, a veces, no son la mejor forma, por lo que puede volver a identificarlos y reescribirlos y entregárselos al usuario y dejar que los ejecuten fuera de allí para que no demore media hora ellos regresen a su mesa pivote.
Eric Kavanagh: Exactamente. Y cuando hablamos de consultas, ustedes cubren la gama de consultas, por lo que mencionaron MDX, ¿qué pasa con algunas de las otras consultas como una consulta DAX, o alguna de estas otras?
Stan Geiger: Sí, cubrimos, sí, cualquier DAX y MDX. Entonces, una de las cosas que no mencioné, o lo hice, tal vez, pero sí admitimos tanto tabular como OLAP en Microsoft y DAX, creo que usted y yo hablamos sobre esto hace un tiempo, es que estamos viendo mucho ahora más tabular de lo que somos OLAP. Porque es más fácil mostrar los modelos tabulares y cosas así, así que obviamente verás consultas DAX, pero también las recogeremos.
Eric Kavanagh: Sí, eso es interesante. ¿Tienes algún contexto sobre por qué está sucediendo? ¿Es quizás porque cada vez más personas se están metiendo en estas cosas y porque OLAP, por supuesto, no es algo nuevo, que ha existido durante, al menos, 30 años?
Stan Geiger: Correcto, bueno, es una especie de combinación, una de las cosas es diseñar cubos es un arte. Y los cubos se crearon para preagrupar datos, por lo que es muy rápido extraerlos, pero procesar el cubo lleva un tiempo porque tiene que hacer todas esas agregaciones. Y luego, el hardware se volvió más barato y la memoria se hizo más barata y luego todos salieron con una tienda de columnas y bases de datos en memoria, realmente. Y también la tabla es probablemente la más cercana a las bases de datos relacionales tradicionales y es mucho más fácil y rápido mostrar modelos tabulares que con OLAP. Pero el inconveniente es que reside en la memoria, todo reside en la memoria, por lo que requiere mucha memoria y los datos no se agregan hasta que lo solicite. Entonces, pero dicho todo eso, estamos empezando a ver mucho más tabular por ahí.
Eric Kavanagh: Eso es interesante. También podría deberse a que esta industria se está allanando un poco, y lo que quiero decir con eso es que estamos obteniendo muchas más personas que interactúan con los datos y usan varias herramientas, y ciertamente cuando hablas de Microsoft, creo ese es definitivamente el caso de que tiene muchos, muchos más usuarios para pequeñas y medianas empresas, e incluso algunas organizaciones más grandes que están investigando, obteniendo acceso a herramientas, ejecutando consultas, y tal vez no estén tan familiarizados con el todo el proceso y las tecnologías en torno a la construcción de cubos, a su punto, ¿verdad? Porque toma un poco de pensamiento, y también es caro, ¿verdad? Se necesita tiempo, se necesita energía para construir estos cubos a menos que esté utilizando algunas de las tecnologías más nuevas que existen. Por ejemplo, hemos hablado con compañías como Snowflake, por ejemplo, está haciendo cosas bastante interesantes, pero creo que hay muchas más personas que usan las cosas y probablemente estén siguiendo lo que acaba de describir, que es el formato tabular, en oposición a la construcción formal de cubos, ¿verdad?
Stan Geiger: Sí, bueno, quiero decir, supongo que Excel, cuando lo que era, Power Pivot, creo, eso es realmente tabular, si lo miras; es la forma de construir modelos tabulares. Y luego, la siguiente iteración fue: puedo decirles mis modelos tabulares que construyo y los implemento en SQL Server para poder compartirlos con todos los demás. Por lo tanto, es una especie de extensión natural fuera de Excel casi.
Eric Kavanagh: Sí, ese es un buen punto. Lo que hemos visto en los últimos cinco años, diría que es de cinco a siete años, es solo una tremenda expansión del uso de estas tecnologías, ¿verdad? Y, francamente, Microsoft ha sido pionero en eso, realmente democratizando los datos de energía a través de servicios de análisis y a través de Power Pivot, ¿verdad? Quiero decir, eso fue un cambio de juego para la industria, ¿verdad?
Stan Geiger: Sí, no, tienes toda la razón. Quiero decir, tengo una diapositiva cuando doy una presentación más larga que muestra la transición de pasar del modelo semántico, que era el OLAP, al tabular. Y creo que tengo una cita de Microsoft; Quieren tener datos en manos de los usuarios, no solo en el muro de la tienda de TI, sino que quieren obtener más datos en manos de las personas que los consumen.
Eric Kavanagh: Y eso se remonta a la primera diapositiva muy simple que mostré, que fue el proceso básico de toma de decisiones para cualquier organización, y ahora, y creo que es una gran cosa, estamos obteniendo más y más personas de toda la jerarquía de la organización prestando atención a lo que está sucediendo, trayendo su historia a la mesa y lo haces con datos, es decir, puedes usar otros medios, pero si respaldas tu historia con datos, vas a tener argumentos mucho más fuertes que los que no, ¿verdad?
Stan Geiger: Exactamente, sí. Como, sí, eso es exactamente correcto. Quiero decir, por eso ahora, solía ser "Oye, necesito este informe", así que ahora tengo que pasar por la solicitud de informe y tengo que pasar por aquí, y obtener mi informe, y ahora puedo sentarme allí mismo, en mi escritorio y realmente, tengo acceso a los datos generados, tomo mis decisiones comerciales.
Eric Kavanagh: Eso es correcto. Sabes, volví de una conferencia la semana pasada y hubo un comentario histérico de un tipo que maneja un entorno de BI bastante grande para la tienda Target, y estaba haciendo referencia a análisis de autoservicio y BI de autoservicio, y obviamente Ese es un gran problema en estos días. Estoy seguro de que es algo que está impulsando mucha actividad por lo que ustedes hacen en IDERA porque cuando quieren implementar el autoservicio, primero que nada, es mejor tener un entorno de BI saludable, ¿verdad? Si vas a hacer que todo tipo de personas hagan preguntas de todo tipo de formas, querrás tener algo como esta herramienta aquí, para poder entender quién hace qué preguntas y dónde. Y la cita divertida que arrojaré aquí solo por diversión, como dijiste, "hay una línea muy fina entre el BI de autoservicio y el F".
Stan Geiger: Sí.
Eric Kavanagh: Pensé que eso era histérico. ¿Pero está viendo que la tendencia de autoservicio realmente genera mucha conciencia sobre lo que está haciendo con la tecnología?
Stan Geiger: Sí, porque como dijiste, si vas a permitir BI de autoservicio, entonces probablemente tendrás algunos problemas de rendimiento, solo por: A) la cantidad de acceso, la cantidad de personas que van en los datos, y B) la cantidad de consultas mal formadas y las formas de acceso que tiene. Entonces, realmente, es realmente imperativo que supervise el entorno para que pueda mantener a todos contentos tratando de consumir los datos, ¿verdad?
Eric Kavanagh: Sí, creo que eso es exactamente correcto. Es una bendición y una maldición: es bueno que la gente esté tratando de usar las cosas, pero, una vez más, si no tienes la herramienta adecuada en ese momento, serás un campista infeliz porque rodarás sin autoservicio sin una herramienta como esta, me parece que solo está pidiendo una montaña de problemas.
Stan Geiger: Sí, quiero decir, es similar a cuando estaba construyendo almacenes de datos, es como si no obtuvieras correctamente tus dimensiones y tablas de hechos, entonces lo desatascaste para informes ad hoc, es posible que quieras arrastrarte debajo de un rock.
Eric Kavanagh: Eso es asombroso. Sí, es bueno, de nuevo, es una buena noticia que la gente esté usando estas cosas, pero creo que tengo que creer que el autoservicio generará mucha actividad para lo que estás haciendo, porque estás hablando de aumentar aumentar la cantidad de tensión y la cantidad de presión sobre estos sistemas en órdenes de magnitud. No solo por uno o por dos órdenes de magnitud y es ese punto en el que realmente quieres tener algo de visibilidad y quieres poder ver quién está haciendo qué, dónde, cuándo, cómo y por qué. Haga esas preguntas y luego tome algunas decisiones sobre cómo puede monitorear y cambiar el entorno y cambiar sus políticas sobre quién tiene acceso a qué, ¿verdad?
Stan Geiger: Correcto. Y sabes, también, sabiendo, viendo que la utilización también te permite entrar allí, y el potencial, como mencioné el objeto dentro del cubo, puedo hacer cosas para mejorar eso, en lo que respecta a la forma en que construyo y diseño cosas. Por lo tanto, es imperativo que no solo tenga en cuenta el rendimiento de las cosas, sino que también pueda ver cómo se está desempeñando su esquema y su diseño a ese nivel, para poder realizar ajustes. Y será cada vez más grande, ya que cosas como Power BI es el gran problema ahora, con Microsoft, por lo que ahora puedo construir mis propios paneles y widgets y cosas, y no tener que ser un desarrollador de BI.
Eric Kavanagh: Eso es correcto. Sí, es algo bueno, está llegando a todas partes, pero necesitará alguna forma de administrar ese entorno o obtendrá usuarios descontentos. Eso lleva a una gestión infeliz, lo que lleva a que las personas sean despedidas. Hay un efecto dominó bastante claro cuando las cosas comienzan a caerse, pero esto es genial.
Así que me comí los últimos cinco minutos aquí. Robin, ¿tienes alguna pregunta?
Robin Bloor: Bueno, creo que es fascinante, en realidad, para ser honesto. Me hace pensar en el hecho de que teníamos entornos muy limitados y el autoservicio en realidad está cambiando el mundo y mucho de eso está sucediendo realmente porque una cantidad muchísima más de datos ha llegado al entorno de lo que sucedió antes. La única pregunta, porque no tenemos mucho tiempo, pero la única pregunta que me gustaría hacer es que estabas explicando la forma en que, porque pensé que era una muy buena demostración, la forma en que El monitoreo de BI funciona. Me preguntaba qué hacen realmente las personas que no tienen este tipo de cosas. Debido a que debe ser muy difícil, hay varias cosas en las que marca la diferencia, la causa raíz está bien, no siempre llega a la causa raíz, pero puede llegar a la causa raíz con algunas de las cosas que estás viendo, que cuando dijiste que varias personas compran la herramienta solo para saber quién está ejecutando qué, y que mi mente gira, porque es como si no supieras quién está ejecutando qué, entonces las cosas están fuera de control. Entonces, ¿cómo se ve el entorno cuando está fuera de control?
Stan Geiger: Quiero decir, podrías obtener toda esta información que tenemos en la herramienta tú mismo, pero tendrías que escribir un montón de secuencias de comandos de cosecha propia y porque los datos están ahí, solo tienes que saber dónde entiéndelo, lo que requiere un nivel de experiencia, ¿verdad? Entonces, en entornos donde no tienes ese nivel de experiencia, básicamente, lo que obtienes es, oye, ¿está arriba o abajo? Realmente no sé si funciona de manera eficiente o no, pero está funcionando, ¿verdad? Y luego empiezo a recibir llamadas telefónicas o personas que dicen: "Oye, mi informe no está en mi bandeja de entrada, ¿qué está pasando?" O "Acabo de enviar este informe a través de los servicios de informes" o pueden estar haciendo una consulta aquí en los servicios de análisis, pero se tomó como media hora, y solía tomar solo 30 segundos, ¿qué está pasando? Bueno, ahora tienes que hacer el simulacro de incendio e intentar resolverlo, y sin una herramienta se vuelve muy difícil.
Robin Bloor: Bueno, claro, eso era lo que me resultaba cada vez más evidente, ya que demostraste cada una de las dimensiones de lo que realmente tienes aquí. La otra cosa, es como a un nivel muy, muy primitivo, si no tienes alertas que te digan que las cosas van mal, entonces es solo costoso: te encuentras en una situación costosa, tratando de curar lo que sucedió, porque no te enteres hasta que las cosas empiecen a caerse mal, ¿verdad?
Stan Geiger: Correcto, no sabes lo que no sabes.
Eric Kavanagh: Lo tienes. Bueno, amigos, hemos quemado una hora y hemos cambiado, aquí. Muchas gracias a nuestro propio Robin Bloor, y por supuesto a nuestro amigo, Stan Geiger, de IDERA Software. Estarán en Enterprise Data World, de hecho, si alguno de ustedes va a ir allí, el suyo también estará allí en Atlanta. Nuestro buen amigo, Tony Shaw, está haciendo un gran trabajo dirigiendo esa conferencia hace cuatro años, y oye, lo viejo es nuevo otra vez. Todo son cosas interesantes. Con suerte, nos veremos allí, si no, vuelva a consultarnos la próxima semana, tenemos un montón de otras transmisiones por Internet en fila.
Siempre tiene curiosidad por escuchar sus pensamientos, enviar un correo electrónico a, que me llegue directamente, si tiene alguna pregunta o sugerencia, u otras tecnologías que le gustaría conocer en Hot Technologies. Y con eso, se despedirán, amigos. Gracias de nuevo por acompañarnos, hablaremos con usted la próxima vez. Cuídate. Adiós.