Por el personal de Techopedia, 19 de abril de 2017
Para llevar: El presentador Eric Kavanagh discute el pronóstico con el Dr. Robin Bloor, Rick Sherman y Bullett Manale de IDERA.
Debes registrarte en este evento para ver el video. Regístrese para ver el video.
Eric Kavanagh: Damas y caballeros, ¡hola una vez más y bienvenidos de nuevo a la serie de transmisión por Internet de Hot Technologies! Mi nombre es Eric Kavanagh, seré su anfitrión para el seminario web de hoy, llamado "Ahorro de tiempo, dinero y problemas con pronósticos óptimos". Por supuesto, me perdí la primera parte del título, "Los mejores planes establecidos". siempre habla de eso en este programa. Entonces, Hot Technologies, por supuesto, es nuestro foro para comprender cuáles son algunos de los productos geniales que hay en el mundo hoy en día, el mundo de la tecnología empresarial, lo que la gente está haciendo con ellos, cómo funcionan, todo ese tipo de cosas divertidas.
Y el tema de hoy, como sugiero, trata de pronósticos. Realmente estás tratando de entender qué va a pasar en tu organización. ¿Cómo vas a mantener felices a tus usuarios, sin importar lo que estén haciendo? Si están haciendo análisis, si están haciendo un trabajo real, se enfrentan a clientes reales con sistemas transaccionales, sea cual sea el caso, querrá comprender cómo funcionan sus sistemas y qué está sucediendo, y eso es lo que nosotros ' Hablaremos de hoy. Es algo gracioso porque hacer pronósticos no es algo que me gusta hacer, porque soy supersticioso, como creo que si pronostico demasiado, sucederán cosas malas, pero ese soy yo. No sigas mi ejemplo.
Entonces, aquí están nuestros presentadores hoy, el suyo verdaderamente en la esquina superior izquierda, Rick Sherman está llamando desde Boston, nuestro amigo Bullett Manale de IDERA y nuestro propio Dr. Robin Bloor. Y con eso, se lo entregaré a Robin y solo recordaré a la gente: Haga preguntas, no sea tímido, amamos las buenas preguntas, las presentaremos a nuestros presentadores y a otros hoy. Y con eso, Robin, quítatelo.
Robin Bloor: OK, bueno, como estoy en la pole position como dicen, pensé en contar una historia de SQL hoy, porque es el trasfondo de la discusión que se llevará a cabo e inevitablemente no chocará con porque Rick no se está enfocando en esto y no chocará con lo que Rick tiene que decir. Entonces, la historia de SQL, hay algunas cosas interesantes sobre SQL porque es muy dominante. Mira, eso es un error tipográfico, SQL es un lenguaje declarativo. La idea era que pudieras crear un lenguaje en el que solicitarías lo que quisieras. Y la base de datos resolvería cómo obtenerla. Y en realidad funcionó bastante bien, pero hay varias cosas que vale la pena decir al respecto, las consecuencias de basar a toda la industria de TI en un lenguaje declarativo. El usuario no conoce ni se preocupa por la organización física de los datos, y eso es lo bueno del lenguaje declarativo: lo separa de todo eso, e incluso se preocupa, solo solicite lo que quiera y la base de datos. iré y lo conseguiré.
Pero el usuario no tiene idea de si la forma en que estructuran la consulta SQL va a afectar el rendimiento de la consulta y eso es un poco negativo. He visto consultas que tienen cientos y cientos de líneas de largo, que son solo una solicitud de SQL, ya sabes, comienza con "select" y simplemente continúa con subconsultas y así sucesivamente. Y en realidad resulta que si desea una recopilación particular de datos de una base de datos, puede solicitarla de muchas maneras diferentes con SQL, y obtener la misma respuesta si está familiarizado con los datos. Por lo tanto, una consulta SQL no es necesariamente la mejor manera de solicitar datos, y las bases de datos responderán de manera bastante diferente de acuerdo con el SQL que ingrese en ellas.
Y así, SQL en realidad afecta el rendimiento, por lo que las personas que usan SQL, es cierto para ellos, también es cierto para los programadores de SQL que usan SQL y es aún menos probable que piensen en el impacto que tendrán, porque la mayor parte de su atención se centra en la manipulación de datos y no en la obtención y colocación de datos. Y lo mismo también es cierto para las herramientas de BI, he visto el SQL que, si lo desea, se exprime de las herramientas de BI de varias bases de datos y hay que decir que mucho de eso es, bueno, no lo haría No escriba consultas SQL como esa. Alguien ha creado, si lo desea, un pequeño motor que, sean cuales sean los parámetros, arrojará algo de SQL y, de nuevo, ese SQL no será necesariamente un SQL eficiente.
Entonces pensé que mencionaría la falta de coincidencia de impedancia, los datos que usan los programadores son diferentes de los datos, ya que clasifican. Por lo tanto, nuestro DMS almacena datos en tablas, organiza el código orientado a objetos en su mayoría codificadores, está programando formas orientadas a objetos en la actualidad y ordena datos en estructuras de objetos, por lo que no se correlacionan entre sí. Por lo tanto, es necesario traducir de lo que el programador piensa que son los datos a lo que la base de datos piensa qué son los datos. Parece que debemos haber hecho algo mal para que ese sea el caso. SQL tiene DDL para la definición de datos, tiene DML - lenguaje de manipulación de datos - seleccionar, proyectar y unir, para obtener esos datos. Ahora, hay muy pocas matemáticas y muy pocas cosas basadas en el tiempo, por lo que es el lenguaje imperfecto, aunque hay que decir que se ha extendido y se sigue extendiendo.
Y luego, obtienes el problema de la barrera SQL, que siempre es más directo que el diagrama, en el que muchas personas hacían preguntas por razones analíticas, una vez que obtuvieron la respuesta a los términos de datos de la pregunta, quieren hacer otra pregunta. Por lo tanto, se convierte en una cuestión de diálogo, bueno, SQL no se creó para los diálogos, se creó para preguntarle todo lo que quiere de una vez. Y vale la pena saberlo, porque hay algunos productos que realmente abandonan SQL para hacer posible la conversación entre el usuario y los datos.
En términos de rendimiento de la base de datos, y este tipo de propagación se extiende a todo: sí, hay CPU, hay memoria, hay disco, hay sobrecargas de red y existe el problema de bloqueo de más de una persona que desea tener un uso exclusivo de los datos en un determinado punto en el tiempo. Pero también hay malas llamadas SQL, hay mucho que se puede hacer si realmente optimizas el SQL, en términos de rendimiento. Entonces, factores de rendimiento de la base de datos: diseño incorrecto, diseño de programa incorrecto, falta de concurrencia de carga de trabajo, equilibrio de carga, estructura de consulta, planificación de capacidad. Ese es el crecimiento de datos. Y en pocas palabras, SQL es conveniente, pero no se optimiza automáticamente.
Dicho esto, creo que podemos pasar a Rick.
Eric Kavanagh: Muy bien, Rick, déjame darte las llaves del auto de WebEx. Llevatelo.
Rick Sherman: Muy bien, genial. Bueno, gracias Robin, ya que comenzamos al comienzo de la presentación, mis gráficos siguen siendo bastante aburridos, pero seguiremos adelante. Entonces, estoy de acuerdo con todo lo que Robin habló sobre el lado de SQL. Pero en lo que quiero concentrarme un poco ahora es en la demanda de datos, que revisaremos muy rápidamente, la oferta como en las herramientas utilizadas en ese espacio o la necesidad de las herramientas en ese espacio.
En primer lugar, hay algo en cada artículo que lees que tiene que ver con big data, muchos datos, datos no estructurados que provienen de la nube, big data en todas partes que puedas imaginar. Pero el crecimiento del mercado de bases de datos ha sido continuamente con SQL, la base de datos relacional probablemente a partir de 2015, sigue siendo el 95 por ciento del mercado de bases de datos. Los tres principales proveedores relacionales tienen alrededor del 88 por ciento de la cuota de mercado en ese espacio. Entonces, todavía estamos hablando, como Robin habló, sobre SQL. Y de hecho, incluso si estamos buscando en la plataforma Hadoop, Hive and Spark SQL, que mi hijo, que es científico de datos, usa todo el tiempo, es sin duda la forma dominante para que las personas accedan a los datos.
Ahora, en el lado de la base de datos, hay dos amplias categorías de uso de bases de datos. Uno es para los sistemas de gestión de bases de datos operacionales, por lo que la planificación de relaciones empresariales, la gestión de relaciones con los clientes, los ERP de Salesforce, Oráculos, EPIC, N4, etc., del mundo. Y, hay una gran cantidad y una cantidad cada vez mayor de datos que se encuentran en almacenes de datos y otros sistemas basados en inteligencia empresarial. Porque todo, independientemente de dónde y cómo se capture, almacene o transforme, eventualmente se analiza y, por lo tanto, existe una gran demanda y un aumento en el uso de bases de datos, particularmente bases de datos relacionales en el mercado.
Ahora, tenemos la demanda, tenemos grandes cantidades de datos por venir. Y no estoy hablando solo de big data, estoy hablando del uso de datos en todo tipo de empresas. Pero acompañando eso desde el lado de la oferta, para las personas que pueden administrar esos recursos, tenemos, en primer lugar, una especie de escasez de DBA. Según la Oficina de Estadísticas Laborales, de 2014 a 2014, los trabajos de DBA solo crecerán en un 11 por ciento, ahora son personas que tienen títulos de trabajo de DBA, pero hablaremos de eso en un segundo, frente a los 40- más porcentaje de espacio de crecimiento anual de datos. Y tenemos muchos DBA; en promedio, ese mismo estudio habló de que la edad promedio es bastante alta en comparación con otras profesiones de TI. Y luego tenemos a muchas personas que abandonan el campo, no necesariamente jubiladas, sino que cambian a otros aspectos, a la gestión o lo que sea.
Ahora, parte de la razón por la que se van, es porque el trabajo de DBA se vuelve cada vez más difícil. En primer lugar, tenemos DBA que administran muchas bases de datos diferentes, bases de datos físicas, ubicadas en todo el lugar, así como diferentes tipos de bases de datos. Ahora eso puede ser relacional, o pueden ser otras bases de datos, tipos de bases de datos, también. Pero incluso si es relacional, podrían tener cualquiera de uno, dos, tres, cuatro proveedores diferentes que realmente están tratando de administrar. Los DBA generalmente se involucran después del diseño de la base de datos o la aplicación. Robin habló sobre cómo se diseñan las bases de datos o aplicaciones, cómo se diseña SQL. Bueno, cuando hablamos de modelado de datos, modelado ER, modelado ER extendido, modelado de dimensiones, modelado dimensional avanzado, lo que sea, típicamente los programadores de aplicaciones y los desarrolladores de aplicaciones diseñan con su objetivo final en mente: no están diseñando para la eficiencia de la estructura de la base de datos en sí. Entonces tenemos mucho diseño pobre.
Ahora, no estoy hablando de los vendedores de aplicaciones empresariales comerciales; Por lo general, tienen modelos ER o modelos ER extendidos. De lo que estoy hablando es que hay muchos más procesos de negocios y aplicaciones construidas por los desarrolladores de aplicaciones en cada compañía, esas no son necesariamente diseñadas para la eficiencia o efectividad de la implementación. Y los DBA mismos están sobrecargados de trabajo y, a veces, tienen la responsabilidad de 24/7, siguen obteniendo más y más bases de datos. Creo que eso tiene algo que ver con que las personas no entiendan lo que hacen o cómo lo hacen. Su propio pequeño grupo y personas siguen pensando: "Bueno, todas estas herramientas son tan fáciles de usar que podemos seguir lanzando más y más bases de datos sobre su carga de trabajo", lo cual no es el caso.
Lo que nos lleva a los DBA a tiempo parcial y accidentales. Tenemos equipos de TI que son pequeños y no necesariamente pueden permitirse un DBA dedicado. Ahora eso es cierto para las pequeñas y medianas empresas, donde la expansión de la base de datos y las aplicaciones de la base de datos ha explotado en la última década y continúa expandiéndose. Pero también es el caso de las grandes corporaciones, por lo general han estado haciendo análisis de inteligencia de negocios y almacenamiento de datos durante mucho, mucho tiempo. Hace mucho tiempo solíamos obtener DBA dedicados para esos proyectos; nunca más tenemos un DBA dedicado. Somos responsables de diseñar la base de datos, lo cual está bien, si es alguien que tiene experiencia. Pero en general, los DBA son desarrolladores de aplicaciones, a menudo toman ese papel como parte de su trabajo a tiempo parcial, no tienen capacitación formal y, de nuevo, lo están diseñando para sus objetivos finales, están No diseñarlo para la eficiencia.
Y hay mucha diferencia entre diseño y desarrollo, versus implementación y administración. Por lo tanto, tenemos el "centavo, libra tonto", con una pequeña alcancía allí, evitando obtener las habilidades y los recursos necesarios en los proyectos. Pensando que todo el mundo es de "La venganza de los nerds", mi pequeña imagen allí. Ahora, en lo que la gente necesita, tenemos un uso cada vez mayor de bases de datos y datos en SQL. Tenemos un número restringido de DBA: personas que son expertas y expertas en estas situaciones de ajuste y diseño, administración y despliegue. Y tenemos más y más DBA a tiempo parcial o accidentales, personas que no han recibido la capacitación formal.
Entonces, ¿cuáles son algunas de las otras cosas que también se están metiendo en el tema del hecho de que estas bases de datos no se están ajustando o administrando también? En primer lugar, muchas personas suponen que el sistema de la base de datos tiene herramientas suficientes para administrarse. Ahora, las herramientas son cada vez más fáciles de hacer (diseño y desarrollo), pero eso es diferente de hacer un buen diseño y una buena gestión, planificación de capacidad, monitoreo, etc. para la implementación. Entonces, en primer lugar, las personas asumen que tienen todas las herramientas que necesitan. Segundo, si eres un DBA a tiempo parcial o accidental, no sabes lo que no sabes.
Supongo que olvidé algunas de las frases allí, por lo que muchas veces simplemente no entienden lo que incluso necesitan mirar en el diseño o cuando administran u operan las bases de datos. Si esa no es tu profesión, entonces no vas a entender lo que necesitas hacer. En tercer lugar, es que SQL es una herramienta de acceso, por lo que Robin habló sobre SQL y sobre cuán mal a veces se construye SQL, o a menudo se construye. Y también uno de mis manías en el almacenamiento de datos de BI, la migración de datos, el espacio de ingeniería de datos es que, en lugar de usar herramientas, las personas tienden a escribir código SQL, procedimientos almacenados, incluso si están usando una costosa herramienta de integración de datos o una herramienta de BI costosa, a menudo realmente la usan solo para ejecutar procedimientos almacenados. De modo que la importancia de comprender el diseño de la base de datos, de la construcción de SQL, es cada vez más importante.
Y finalmente está este enfoque de silo, en el que tenemos personas individuales que miran bases de datos individuales. No miran cómo funcionan las aplicaciones e interactúan entre sí. Y también a menudo miran las bases de datos en lugar de las aplicaciones para las que las usan. Entonces, la carga de trabajo que obtienes en la base de datos es crítica en el diseño, crítica en el ajuste, crítica en tratar de descubrir cómo planificar la capacidad, etc. Entonces, mirando el bosque desde los árboles, las personas están en las malezas, mirando las tablas y bases de datos individuales y no mirando la interacción general de estas aplicaciones en la carga de trabajo.
Finalmente, las personas necesitan mirar las áreas clave que necesitan mirar. Cuando planean administrar bases de datos, primero deben pensar en, desarrollar algunas métricas de rendimiento centradas en la aplicación, por lo que deben ver no solo cómo está estructurada esta tabla, cómo está particularmente modelada, sino cómo se usa. Entonces, si tiene una aplicación empresarial que se debe en la gestión de la cadena de suministro, si está tomando pedidos de la web, si está haciendo BI, lo que sea que esté haciendo, debe ver quién lo está usando, cómo están usándolo, cuáles son los volúmenes de datos, cuándo va a suceder. Lo que realmente está tratando de buscar es el tiempo de espera, porque no importa qué, todas las aplicaciones se juzgan por el tiempo que lleva hacer algo, ya sea una persona o solo el intercambio de datos entre aplicaciones o procesadores. ¿Y cuáles son los cuellos de botella? Muy a menudo, cuando intentas depurar problemas, por supuesto, realmente estás tratando de ver cuáles son los verdaderos cuellos de botella, no necesariamente cómo ajustar todo, sino cómo deshacerte y aumentar el rendimiento en los tiempos de espera. y rendimiento, lo que sea que necesite mirar.
Y realmente necesita separar la captura de datos, las transacciones, los aspectos de transformación en la base de datos junto con los análisis. Cada uno de ellos tiene diferentes patrones de diseño, cada uno de ellos tiene diferentes patrones de uso y cada uno de ellos debe ajustarse de manera diferente. Por lo tanto, debe pensar cómo se usan estos datos, cuándo se usan, para qué se usan y averiguar cuáles son las métricas de rendimiento y cuáles son las cosas clave que desea analizar relacionadas con ese uso. Ahora, cuando está buscando monitorear el rendimiento, desea mirar las operaciones de la base de datos en sí; desea ver tanto las estructuras de datos, por lo que los índices, el particionamiento y otros aspectos físicos de la base de datos, incluso la estructura de la base de datos, ya sea modelo ER o modelo dimensional, sin embargo, está estructurado, todas esas cosas tienen un impacto en el rendimiento, especialmente en los diferentes contextos de análisis de captura de datos y las transformaciones que suceden.
Y como Robin mencionó en el lado de SQL, mirar el SQL que están ejecutando estas diferentes aplicaciones en estas bases de datos y ajustarlo es crítico. Y observando las cargas de trabajo generales de las aplicaciones y el entorno de infraestructura en el que se ejecutan estas bases de datos y aplicaciones. Entonces, que las redes, los servidores, la nube, lo que sea que estén ejecutando, también observan el impacto que tienen estas aplicaciones y estas bases de datos dentro de ese contexto, todo esto tiene una interacción de poder ajustar la base de datos.
Y, por último, cuando busca herramientas, desea poder ver los tres tipos diferentes de análisis relacionados con eso. Desea ver el análisis descriptivo: lo que está sucediendo y dónde, relacionado con la base de datos y el rendimiento de la aplicación. Desea tener la capacidad de realizar análisis de diagnóstico para descubrir no solo lo que está sucediendo sino por qué está sucediendo, dónde están los cuellos de botella, dónde están los problemas, qué funciona bien, qué no funciona bien. Pero poder analizar y profundizar en las áreas problemáticas para abordarlas, ya sea por diseño o lo que sea que necesite hacer.
Y, por último, el tipo de análisis más agresivo o proactivo es hacer un análisis predictivo, modelar el análisis predictivo, lo que sea. Sabemos que la base de datos y las aplicaciones funcionan en este contexto, si aumentamos la capacidad, si tenemos más usuarios, si hacemos más rendimiento, lo que sea que estemos haciendo, pudiendo proyectar qué, cómo y dónde eso El impacto en la base de datos, las aplicaciones, nos permite planificar y descubrir de manera proactiva, dónde están los cuellos de botella, dónde pueden sufrir los tiempos de espera y qué debemos hacer para arreglar las cosas. Por lo tanto, queremos tener herramientas que puedan implementar las métricas de desempeño, monitorear el desempeño, como lo hacen estos tres tipos de análisis. Y esa es mi visión general.
Eric Kavanagh: Muy bien, déjenme pasarlo, esas son dos grandes presentaciones, por cierto, déjenme pasar esto a Bullett Manale para llevarlo desde allí. Y amigos, no olviden hacer buenas preguntas; Ya tenemos un buen contenido. Llévatelo, Bullett.
Bullett Manale: Suena bien. Gracias Eric Entonces, mucho de lo que Rick dijo y Robin dijo, obviamente estoy de acuerdo con el 100 por ciento. Diría que saqué esta diapositiva hacia arriba, porque creo que es apropiado, no sé para aquellos de ustedes que son fanáticos del "Equipo A" en los años 80, John Hannibal Smith tenía un dicho que siempre diga: "Me encanta cuando se junta un plan", y creo que cuando se habla particularmente de SQL Server, que es donde nos estamos enfocando, que es el producto del que vamos a hablar hoy, Administrador de diagnóstico de SQL, definitivamente es una de esas cosas que debes tener; debe ser capaz de aprovechar los datos que tiene y poder tomar decisiones a partir de esos datos, y en algunos casos, no está buscando una decisión; está buscando algo que le diga cuándo algo va a agotar los recursos, cuándo va a quedarse sin recursos, cuándo va a tener un cuello de botella, ese tipo de cosas.
No se trata solo de monitorear una métrica específica. Por lo tanto, con Diagnostic Manager, una de las cosas que hace muy bien es ayudarlo en términos de pronóstico y comprensión específica de las cargas de trabajo y vamos a hablar mucho de eso hoy. La herramienta está diseñada para el administrador de datos, el DBA o el DBA en funciones, por lo que muchas de las cosas que Rick mencionaba, el DBA en funciones es tan cierto. En muchos casos, si no es un DBA, habrá muchos signos de interrogación que tendrá cuando llegue el momento de administrar un entorno SQL, cosas que no sabe. Entonces, está buscando algo que lo ayude, lo lleve a través de ese proceso y también lo eduque en el proceso. Por lo tanto, es importante que la herramienta que use para ese tipo de decisiones le dé una idea de las razones por las que se toman esas decisiones, no solo le dice: "Oye, haz esto".
Como soy el DBA en funciones, eventualmente podría ser el DBA completo con la experiencia y el conocimiento reales para respaldar ese título. Entonces, dicho esto, cuando hablamos de ser un administrador de base de datos, siempre muestro esta diapositiva primero, porque el DBA tiene algunas funciones diferentes y, dependiendo de la organización con la que esté, tendrá, van a variar de un lugar a otro, pero generalmente, siempre será responsable de su almacenamiento, su planificación de ese almacenamiento y la comprensión de anticipar, debo decir, cuánto espacio va a utilizar necesitar, ya sea para sus copias de seguridad o para las propias bases de datos. Necesitará comprender y evaluar eso.
Además, tendrá que ser capaz de comprender y optimizar las cosas según sea necesario, y a medida que realiza la supervisión del entorno, obviamente es importante que realice los cambios que sean necesarios en función de las cosas que cambiar dentro del entorno mismo. Por lo tanto, cosas como la cantidad de usuarios, cosas como la popularidad de las aplicaciones, la estacionalidad de una base de datos, todo debe tenerse en cuenta al hacer su pronóstico. Y luego, obviamente, mirando otras cosas en términos de poder proporcionar los informes y la información que es necesaria en relación con la toma de esas decisiones. En muchos casos eso significa hacer un análisis comparativo; significa poder observar específicamente una métrica en particular y comprender cuál ha sido el valor de esa métrica a lo largo del tiempo, de modo que pueda anticipar hacia dónde avanzará.
Entonces, lo que hace gran parte de la herramienta Diagnostic Manager tiene esas capacidades y las personas la usan todos los días para poder hacer cosas como hacer pronósticos, y he puesto aquí la definición de planificación de capacidades. Y es una definición bastante amplia y bastante vaga, que es solo el proceso de determinar la capacidad de producción que necesita una organización para satisfacer las demandas cambiantes de sus productos, y al final del día, de eso se trata realmente: es acerca de poder tomar información que tiene de una forma u otra y tomar esa información y tomar decisiones para ayudarlo a avanzar a medida que avanza en el ciclo de vida de sus bases de datos. Y así, los tipos de cosas que son las razones por las cuales las personas necesitan hacer esto son obviamente, ante todo, en la mayoría de los casos, para ahorrar dinero. Las empresas, obviamente, ese es su principal objetivo es ganar dinero y ahorrar dinero. Pero en el proceso junto con eso, eso también significa ser capaz de asegurarse de que su tiempo de inactividad, no haya tiempo de inactividad. Y poder asegurarse de mitigar cualquier posibilidad de que se produzca un tiempo de inactividad, evitando que esto ocurra para empezar, en otras palabras, no esperar a que suceda y luego reaccionar a él.
Además de poder aumentar en general la productividad de sus usuarios, la clave aquí es hacerlos más eficientes para que pueda hacer más negocios, por lo que estos son los tipos de cosas que, como el DBA o alguien involucrado en el pronóstico o la capacidad la planificación tendrá que ser capaz de leer la información para poder tomar esas decisiones. Y luego, en general, esto obviamente lo ayudará a eliminar el desperdicio, no solo el desperdicio en términos de dinero, sino también en términos de tiempo y en términos de recursos en general que podrían usarse para otras cosas, posiblemente. Entonces, poder eliminar ese desperdicio para que no tenga costos de oportunidad vinculados al desperdicio mismo.
Entonces, dicho esto, ¿cuáles son los tipos de preguntas que recibimos, específicas para la persona que es un DBA? ¿Cuándo me voy a quedar sin espacio? Esa es una gran pregunta, no solo cuánto espacio estoy consumiendo ahora, sino cuándo me voy a quedar sin, según las tendencias y la historia pasada. Lo mismo con las instancias reales de SQL, las bases de datos, ¿qué servidores puedo consolidar? Voy a poner algunos en las máquinas virtuales, ¿qué tiene sentido en términos de qué bases de datos voy a consolidar y en qué instancias de SQL deberían residir? Todos esos tipos de preguntas necesitan poder ser respondidas. Porque en la mayoría de los casos, si eres un DBA o un DBA interino, lo consolidarás en algún momento de tu carrera. En muchos casos, lo harás de forma continua. Por lo tanto, debe poder tomar esas decisiones rápidamente, no jugar juegos de adivinanzas cuando se trata de eso.
Hablamos sobre los cuellos de botella y dónde van a ocurrir a continuación, pudiendo anticipar eso, una vez más, en lugar de esperar a que sucedan. Entonces, obviamente, todas estas cosas de las que estamos hablando tienen sentido en el sentido de que se basa en datos históricos, en la mayoría de los casos, para poder generar estas recomendaciones, o en algunos casos para poder formular decisiones usted mismo, para poder llegar a estas respuestas. Pero me recuerda a, cuando escuchas los anuncios de radio de alguien que vende valores o algo así, siempre es "el rendimiento pasado no es indicativo de resultados futuros" y ese tipo de cosas. Y lo mismo es cierto aquí. Tendrás situaciones en las que estos pronósticos y estos análisis pueden no ser 100 por ciento correctos. Pero si estás lidiando con cosas que han sucedido en el pasado y lo conocido, y ser capaz de tomar y hacer el "qué pasaría si" con muchos de estos tipos de preguntas, te vas a encontrar, es muy valioso y te llevará mucho más lejos que jugar al juego de adivinanzas.
Entonces, este tipo de preguntas obviamente van a surgir, así que cómo manejamos muchas de estas preguntas con el Administrador de diagnósticos, en primer lugar tenemos capacidades de pronóstico, pudiendo hacer esto en la base de datos, en la mesa también como la unidad o el volumen. Para poder no solo decir: "Oye, estamos llenos de espacio", sino seis meses a partir de ahora, dos años a partir de ahora, cinco años a partir de ahora, si estoy presupuestando para eso, ¿cuánto espacio de disco voy a utilizar? para tener que presupuestar? Esas son preguntas que voy a tener que hacer, y voy a necesitar poder usar algún método para hacerlo en lugar de adivinar y levantar el dedo en el aire y esperar a ver de qué lado sopla el viento, lo cual es muchas veces, desafortunadamente, la forma en que se toman muchas de estas decisiones.
Además de eso, ser capaz de, parece que mi diapositiva se cortó un poco allí, pero ser capaz de proporcionar asistencia en forma de recomendaciones. Por lo tanto, una cosa es poder mostrarle un tablero lleno de métricas y poder decir: "OK, aquí están todas las métricas y dónde están", pero luego poder hacer algunas o comprender algo de qué hacer, basado en eso es otro salto. Y en algunos casos, las personas están suficientemente educadas en el papel de DBA para poder tomar esas decisiones. Entonces, tenemos algunos mecanismos en la herramienta que ayudarán con eso, que le mostraremos en un segundo. Pero ser capaz de mostrar no solo cuál es la recomendación, sino también proporcionar una idea de por qué se está haciendo esa recomendación y luego, además de eso, en algunos casos, ser capaz de crear un script que automatice La solución de ese problema también es ideal.
Pasando al siguiente aquí, que veremos, en términos generales es solo entender hasta el nivel métrico lo que es normal. No puedo decirte lo que no es normal si no sé lo que es normal. Entonces, tener alguna forma de medir eso es clave y debes tener en cuenta múltiples tipos de áreas, por ejemplo, o debería decir marcos temporales, diferentes agrupaciones de servidores, pudiendo hacer esto dinámicamente, desde una perspectiva de alerta, en otras palabras, durante la mitad de la noche, durante mi ventana de mantenimiento, espero que mi CPU se ejecute al 80 por ciento en función de todo el mantenimiento que está ocurriendo. Por lo tanto, es posible que desee aumentar mis umbrales más altos, durante esos períodos de tiempo en comparación con tal vez durante la mitad del día, cuando no tengo tanta actividad.
Esas son algunas cosas que obviamente serán ambientales, pero cosas que puede aplicar a lo que se está administrando, para poder ayudarlo a administrar ese entorno de manera más eficiente y hacer que sea más fácil hacerlo. La otra área, obviamente, es poder proporcionar en general los informes y la información para poder responder a esos tipos de preguntas de "qué pasaría si". Si acabo de hacer un cambio en mi entorno, quiero entender cuál ha sido el impacto, para poder aplicar ese mismo cambio a otras instancias u otras bases de datos en mi entorno. Quiero poder tener alguna información o municiones para poder hacer ese cambio con cierta tranquilidad y sabiendo que será un buen cambio. Entonces, poder hacer ese informe comparativo, poder clasificar mis instancias de SQL, poder clasificar mis bases de datos entre sí, para decir: "¿Cuál es mi mayor consumidor de CPU?" O cuál está tardando más en términos de espera y cosas así? Por lo tanto, mucha de esa información también estará disponible con la herramienta.
Y luego, por último, pero no menos importante, es solo una habilidad general de que necesitas una herramienta que pueda manejar cualquier situación que se te presente, y lo que quiero decir con eso es que si tienes un entorno grande con un En muchos casos, es probable que se encuentre con situaciones en las que necesite extraer métricas que tradicionalmente no son métricas que un DBA desearía incluso monitorear en algunos casos, dependiendo de esa situación en particular. Por lo tanto, tener una herramienta que pueda, que sea extensible, para poder agregar métricas adicionales y poder usar esas métricas de la misma forma y forma que las usaría si estuviera usando una caja lista para usar métrica, por ejemplo. Por lo tanto, poder ejecutar informes, poder alertar, la línea de base, todas las cosas de las que estamos hablando, también es una parte clave para poder hacer esta predicción y hacer que obtenga las respuestas que está buscando. ser capaz de tomar esas decisiones, seguir adelante.
Ahora, de la forma en que Diagnostic Manager lo hace, tenemos un servicio centralizado, un grupo de servicios que se ejecuta, recopila datos en instancias de 2000 a 2016. Y luego, lo que hacemos es tomar esos datos y ponerlos en un repositorio central y luego lo que haremos con esos datos, obviamente, es que hacemos mucho para poder proporcionar una mayor información. Ahora, además de eso, y una de las cosas que no está aquí, es que también tenemos un servicio que se ejecuta en medio de la noche, que es nuestro servicio de análisis predictivo, y que hace algunos cálculos numéricos y ayuda a comprender y ayudarlo como DBA o DBA en funciones, para poder hacer ese tipo de recomendaciones, para poder proporcionar también una idea en términos de líneas de base.
Entonces, lo que me gustaría hacer, y este es solo un ejemplo rápido de la arquitectura, la gran conclusión aquí es que no hay agentes o servicios que realmente estén presentes en las instancias que está administrando. Pero lo que me gustaría hacer es llevarlo a la aplicación aquí y darle una demostración rápida. Y déjame salir también y hacer que eso suceda. Entonces, hágamelo saber, creo que Eric, ¿puede ver eso bien?
Eric Kavanagh: Lo tengo ahora, sí.
Bullett Manale: OK, entonces voy a llevarlo a través de algunas de estas partes diferentes de las que hablé. Y esencialmente comencemos con el tipo de cosas que están más en la línea de lo que hay que hacer, o aquí hay algo que es un punto en el tiempo en el futuro y le daremos una idea al respecto. Y esto es poder anticipar realmente, o debería decir anticipar dinámicamente, las cosas a medida que suceden. Ahora, en el caso de los informes, una de las cosas que tenemos en la herramienta son tres informes de pronóstico diferentes. Y en el caso, por ejemplo, de un pronóstico de base de datos, lo que probablemente haría en la situación de poder anticipar el tamaño de una base de datos durante un período de tiempo, y le daré un par de ejemplos de eso . Por lo tanto, voy a tomar mi base de datos de auditoría, que es bastante intensiva en E / S; tiene muchos datos. Tenemos, veamos, haremos esto aquí, y escojamos la base de datos de atención médica aquí.
Pero el punto es que no solo estoy viendo cuál es el espacio en esto, sino que puedo decir: "Mira, tomemos el valor del año pasado de datos", y voy a hablar un poco aquí, Realmente no tengo el valor de un año de datos, tengo alrededor de dos meses de datos, pero, como elijo una tasa de muestra de meses aquí, voy a poder anticipar o pronosticar en este en el caso de las siguientes 36 unidades porque nuestra frecuencia de muestreo se establece en meses, es decir, una unidad, es un mes, y luego podría, para luego ejecutar un informe que básicamente me muestre dónde anticiparíamos nuestro crecimiento futuro, para estos Tres bases de datos. Y podemos ver que tenemos un grado variable de diferencia, o variación, entre las tres bases de datos diferentes, en particular a la cantidad de datos que consumen históricamente.
Podemos ver que los puntos de datos aquí representan los datos históricos, y luego la línea nos proporcionará el pronóstico, junto con los números para respaldarlo. Así que podemos hacer eso a nivel de mesa, podemos hacerlo incluso a nivel de unidad, donde puedo anticipar qué tan grandes serán mis unidades, incluidos los puntos de montaje. Podríamos pronosticar este mismo tipo de información, pero una vez más, dependiendo de la frecuencia de muestreo, me permitirá determinar cuántas unidades y de dónde sacamos lo que queremos pronosticar. Observe también que tenemos diferentes tipos de pronósticos. Por lo tanto, tiene muchas opciones y flexibilidad a la hora de hacer el pronóstico. Ahora, eso es algo que haremos, al darle una fecha específica y poder decir "Hola en esta fecha, aquí es donde anticiparíamos el crecimiento de sus datos". Sin embargo, además de eso, podemos proporcionarle otras ideas relacionadas con algunos de los análisis que realizamos durante las horas libres y el servicio cuando se ejecuta. Algunas de las cosas que hace es tratar de anticipar las cosas que probablemente sucederán, basándose en la historia de cuándo ocurrieron las cosas en el pasado.
Así que podemos ver aquí, en realidad, un pronóstico nos proporciona una idea de la probabilidad de que tengamos problemas durante toda la noche a partir de las cosas que una vez más sucedieron en el pasado. Entonces, obviamente esto es genial, especialmente si no soy un DBA, puedo ver estas cosas, pero lo que es aún mejor si no soy un DBA es esta pestaña de análisis. Entonces, antes de que esto estuviera aquí en la herramienta, revisaríamos y mostraríamos el producto a la gente y ellos serían "Eso es genial, veo todos estos números, veo todo, pero no sé qué hacer" (risas) "Como resultado de eso". Y, entonces, lo que tenemos aquí es una mejor manera para que usted pueda comprender, si voy a tomar medidas para ayudar con el rendimiento, si voy a tomar medidas para incluso ayudar con la salud de mi entorno, poder tener una forma ordenada de proporcionar esas recomendaciones, así como consejos útiles en información para aprender más sobre esas recomendaciones y tener incluso enlaces externos a algunos de esos datos, que me mostrarán y llévame a las razones por las cuales se hacen estas recomendaciones.
Y en muchos casos, poder proporcionar un script que automatizaría, como dije, la solución de estos problemas. Ahora, parte de lo que estamos haciendo aquí con este análisis, y le mostraré cuando vaya a configurar las propiedades de esta instancia, y vaya a la sección de configuración de análisis, tenemos muchas categorías diferentes que son enumerados aquí, y parte de eso, tenemos optimización de índice y optimización de consultas. Por lo tanto, estamos evaluando no solo las métricas en sí, y cosas así, sino también cosas como las cargas de trabajo y los índices. En el caso aquí, en realidad haremos un análisis de índice hipotético adicional. Entonces, es una de esas situaciones en las que no quiero, en muchos casos, no quiero agregar un índice si no lo necesito. Pero en algún momento hay una especie de punto de inflexión, donde digo: “Bueno, la tabla está llegando al tamaño o los tipos de consultas que se ejecutan dentro de la carga de trabajo tienen sentido ahora para agregar un índice. Pero no habría tenido sentido tal vez seis semanas antes ”. Entonces, esto le permite obtener dinámicamente esa información sobre cosas que probablemente, como dije, mejorarán el rendimiento en función de lo que sucede en el entorno, lo que sucede dentro de las cargas de trabajo y haciendo ese tipo de cosas.
Y entonces obtienes mucha buena información aquí, así como la capacidad de optimizar estas cosas automáticamente. Entonces, esa es otra área en la que podríamos ayudar, en términos de lo que llamamos análisis predictivo. Ahora, además de eso, debo decir, también tenemos otras áreas que creo que generalmente se prestan para ayudarlo a tomar decisiones. Y cuando hablamos de tomar decisiones, una vez más, poder ver los datos históricos, proporcionar cierta información para llevarnos a donde necesitamos estar para mejorar ese rendimiento.
Ahora, una de las cosas que podemos hacer es tener un visualizador de línea de base que nos permite elegir selectivamente cualquier métrica que queramos, y dejarme encontrar una decente aquí, voy a usar la CPU SQL, pero el punto es usted Sin embargo, puede retroceder tantas semanas para pintar estas imágenes para que pueda ver cuándo están sus valores atípicos, para ver en términos generales dónde cae ese valor dentro de los períodos de tiempo que hemos estado recopilando datos. Y luego, además de eso, también notará que cuando salimos a la instancia en sí, tenemos la capacidad de configurar nuestras líneas de base. Y las líneas de base son una parte muy importante sobre la posibilidad de automatizar las cosas y de recibir notificaciones. Y el desafío, como le diría la mayoría de los DBA, es que su entorno no siempre funciona de la misma manera, a lo largo del día, en comparación con la noche y lo que mencionamos anteriormente en el ejemplo con los períodos de mantenimiento, cuando tener altos niveles de CPU o lo que sea que esté sucediendo.
Entonces, en el caso aquí, con estas líneas de base reales, podemos tener varias líneas de base, por lo que podría tener una línea de base, por ejemplo, eso es durante mis horas de mantenimiento. Pero podría crear una línea de base igual de fácil para mis horas de producción. Y el punto de hacerlo es cuando entramos en una instancia de SQL y en realidad tenemos estas líneas de base múltiples, entonces podríamos anticipar y ser capaces de realizar algún tipo de automatización, algún tipo de remediación o simplemente alertar en general, específicamente diferente a esas ventanas de tiempo. Entonces, una de las cosas que verá aquí, es que estas líneas de base que generamos están usando los datos históricos para proporcionar ese análisis, pero lo más importante, puedo cambiar estos umbrales estáticamente, pero también puedo automatizarlos dinámicamente. Entonces, a medida que aparece la ventana de mantenimiento, o debería decir que aparece la ventana de referencia de mantenimiento, estos umbrales cambiarían automáticamente a las cargas que encuentro durante ese período de tiempo, en lugar de tal vez en el medio del día cuando mis cargas están no tanto, cuando las cargas de trabajo no son tan impactantes.
Entonces, eso es algo más a tener en cuenta, en términos de la línea de base. Obviamente, estos serán realmente útiles para usted, en términos de comprender también lo que es normal y ser capaz de comprender, participar cuando se le acaben los recursos. Ahora, el otro tipo de cosas que tenemos en la herramienta, que lo ayudará a tomar decisiones, además de la línea de base y la posibilidad de configurar alertas alrededor de esas líneas de base y los umbrales que crea dinámicamente, es como dije antes, solo poder ejecutar una gran cantidad de informes que me ayudan a responder preguntas sobre lo que está sucediendo.
Entonces, como ejemplo, si tuviera 150 instancias que estoy administrando, en mi caso no, así que tenemos que jugar el juego de simulación aquí, pero si tuviera todas mis instancias de producción y tuviera que entender dónde está el área en la que necesito atención, en otras palabras, si solo voy a tener una cantidad limitada de tiempo para realizar algún tipo de administración para mejorar el rendimiento, quiero centrarme en las áreas clave. Y así, dicho esto, podría decir: "Basado en ese entorno, clasifique mis instancias una contra la otra, y déme esa clasificación por tubería de contención". Entonces, ya sea el uso del disco, el uso de la memoria, si es espera, ya sea el tiempo de respuesta, puedo correlacionar, o debería decir clasificar, esas instancias entre sí. Obviamente, la instancia que está en la parte superior de cada lista, si es la misma instancia, probablemente es algo en lo que realmente quiero centrarme, porque obviamente está una vez más en la parte superior de la lista.
Por lo tanto, tiene muchos informes en la herramienta que lo ayudan en términos de clasificación del entorno a nivel de instancia; también puede hacer esto a nivel de base de datos, donde puedo clasificar mis bases de datos entre sí. Particularmente a los umbrales y áreas que puedo establecer, incluso puedo configurar comodines aquí si lo deseo, para centrarme solo en bases de datos particulares, pero el punto es que puedo comparar mis bases de datos de la misma manera. Además, en cuanto a otros tipos de análisis comparativo y el más grande en esta herramienta, es el análisis de referencia que tenemos. Entonces, si se desplaza hacia abajo hasta la vista de servicio aquí, verá que hay un informe de estadísticas de referencia. Ahora, este informe obviamente nos ayudará a comprender no solo cuáles son los valores de las métricas, sino que, para una instancia específica, podría salir y, para cualquiera de estas métricas, ser capaz de ver las líneas de base de estas métricas.
Entonces, sea lo que sea, como un porcentaje o lo que sea que pueda salir y decir: "Veamos la línea de base para esta ruptura en los últimos 30 días", en cuyo caso me mostrará los valores reales frente a la línea de base y Podría tomar algunas decisiones utilizando esa información, obviamente, por lo que esta es una de esas situaciones, donde dependerá de qué pregunta se trate, en ese momento. Pero esto obviamente lo ayudará con muchas de esas preguntas. Desearía poder decir que teníamos un informe que lo hace todo, y es algo así como el informe fácil, donde presionas un botón y simplemente responde a todas las preguntas de "qué pasaría si" que pudieras responder. Pero la realidad es que tendrá muchos atributos y muchas opciones para poder elegir en estos menús desplegables para poder formular esas preguntas tipo "qué pasaría si" que está buscando .
Por lo tanto, muchos de estos informes están orientados a poder responder a ese tipo de preguntas. Por lo tanto, es muy importante también que estos informes y, además, todas las cosas que ya le mostramos en la herramienta, como mencioné anteriormente, tengan la flexibilidad de incorporar nuevas métricas, para ser administradas, incluso poder crear contadores o consultas SQL que se incorporan en sus intervalos de sondeo, para poder ayudarme a responder estas preguntas, que tal vez fuera de la caja que no anticipamos monitorear, puede agregar esas cosas. Y podría hacer las mismas cosas que le acabo de mostrar: línea de base, ejecutar informes y crear informes a partir de esa métrica, y ser capaz de responder y hacer muchos de estos diferentes tipos de cosas que le estoy mostrando aquí.
Ahora, además de eso, y una de las cosas con las que obviamente nos hemos topado últimamente es, primero fue, todos volteando o cambiando a máquinas virtuales. Y ahora tenemos muchas personas que se dirigen a la nube. Y hay muchas preguntas que surgen en torno a ese tipo de cosas. ¿Tiene sentido para mí moverme a la nube? ¿Voy a ahorrar dinero mudándome a la nube? Si tuviera que poner estas cosas en una máquina virtual, en una máquina de recursos compartidos, ¿cuánto dinero podría ahorrar? Ese tipo de preguntas, obviamente, también surgirán. Por lo tanto, tenga en cuenta muchas de esas cosas, con Diagnostic Manager, podemos agregar y extraer de los entornos virtualizados tanto de VMware como de Hyper-V. También podemos agregar instancias que están en la nube, por lo que sus entornos como Azure DB, por ejemplo, o incluso RDS, también podemos extraer métricas de esos entornos.
Por lo tanto, hay mucha flexibilidad y mucha capacidad para responder esas preguntas en lo que respecta a esos otros tipos de entornos a los que vemos que las personas se dirigen. Y todavía hay muchas preguntas en torno a estas cosas, y a medida que veamos a las personas consolidando esos entornos, también necesitarán poder responder esas preguntas. Entonces, esa es una buena visión general, diría, de Diagnostic Manager, ya que se relaciona con este tema. Sé que surgió el tema de la inteligencia empresarial y también tenemos una herramienta para la inteligencia empresarial de la que no hablamos hoy, pero también le proporcionará información en términos de responder a este tipo de preguntas en relación con su cubos y todos esos diferentes tipos de cosas, también. Pero, con suerte, esta ha sido una buena descripción, al menos en términos de cómo este producto puede ayudar a formular un buen plan.
Eric Kavanagh: Muy bien, buenas cosas. Sí, se lo arrojaré a Rick, si todavía está ahí afuera. Rick, ¿alguna pregunta tuya?
Rick Sherman: Sí, así que primero, esto es genial, me gusta. Particularmente me gusta extenderme a máquinas virtuales y nubes. Veo que muchos desarrolladores de aplicaciones piensan que si está en la nube, entonces no necesitan ajustarlo. Entonces-
Bullett Manale: Cierto, todavía tenemos que pagar por eso, ¿verdad? Todavía tiene que pagar por lo que sea que la gente está poniendo en la nube, por lo que si está funcionando mal, o si está causando muchos ciclos de CPU, es más dinero lo que tiene que pagar, por lo que no es así, usted Todavía necesito medir estas cosas, absolutamente.
Rick Sherman: Sí, he visto muchos diseños pobres en la nube. Quería preguntar, ¿también se usaría este producto? Sé que mencionó el producto de BI y tiene muchos otros productos que interactúan entre sí, pero ¿comenzaría a analizar el rendimiento de SQL, consultas individuales en esta herramienta? ¿O serían otras herramientas las que se usarían para eso?
Bullett Manale: No, esto sería, absolutamente. Esa es una de las cosas que no cubrí y que pretendía, es la parte de consultas. Tenemos muchas formas diferentes de identificar el rendimiento de las consultas, ya sea que esté relacionado, específicamente con las esperas como vemos en esta vista aquí, o si está relacionado con el consumo de recursos de las consultas en general, hay una gran cantidad de formas en que podemos analizar las consultas actuación. Es si se trata de duración, CPU, E / S y, una vez más, también podemos ver las cargas de trabajo para proporcionar una idea. Podemos proporcionar las recomendaciones en la sección de análisis y también tenemos una versión basada en la web que proporciona información sobre las consultas mismas. Entonces puedo obtener recomendaciones sobre índices faltantes y la capacidad de ver el plan de ejecución y todo ese tipo de cosas; También es una capacidad también. Entonces, absolutamente, podemos diagnosticar las consultas de siete maneras hasta el domingo (risas) y poder proporcionar esa información en términos de la cantidad de ejecuciones, ya sea el consumo de recursos, las esperas, la duración, todas esas cosas buenas.
Rick Sherman: OK, genial. ¿Y cuál es la carga en las instancias mismas con todo este monitoreo?
Bullett Manale: Es una buena pregunta. El desafío de responder esa pregunta es, depende, es como cualquier otra cosa. Mucho de lo que nuestra herramienta tiene para ofrecer, proporciona flexibilidad y parte de esa flexibilidad es que puedes decirle qué recolectar y qué no recolectar. Entonces, por ejemplo, con las consultas en sí, no tengo que recopilar la información de espera, o puedo. Puedo recopilar información relacionada con consultas que superan un período de tiempo de ejecución. Como ejemplo de eso, si tuviera que entrar en el monitor de consulta de configuración y dijera: "Cambiemos este valor a cero", la realidad es que básicamente hace que la herramienta recopile cada consulta que se ejecuta y esa realmente no es la espíritu de por qué está ahí, pero en general si quisiera proporcionar una muestra completa de datos para todas las consultas, podría hacerlo.
Por lo tanto, es muy relativo a cuáles son sus configuraciones, en general, fuera de la caja. Está entre 1 y 3 por ciento de gastos generales, pero hay otras condiciones que se aplicarán. También depende de la cantidad de consultas de puerto que se ejecutan en su entorno, ¿verdad? También depende del método de recopilación de esas consultas y de qué versión de SQL es. Entonces, por ejemplo, SQL Server 2005, no podremos extraer de eventos extendidos, mientras que lo haríamos desde un rastreo para hacerlo. Por lo tanto, sería un poco diferente en términos de la forma en que haríamos para recopilar esos datos, pero dicho esto, como dije, creo que hemos estado presentes desde aproximadamente 2004 con este producto. Hace mucho tiempo, tenemos miles de clientes, por lo que lo último que queremos hacer es tener una herramienta de monitoreo de rendimiento que cause problemas de rendimiento (risas). Y, por lo tanto, tratamos de evitarlo, tanto como sea posible, pero en términos generales, aproximadamente 1 a 3 por ciento es una buena regla general.
Rick Sherman: OK, y eso es bastante bajo, así que es genial.
Eric Kavanagh: Bien. Robin, ¿alguna pregunta tuya?
Robin Bloor: Lo siento, estaba mudo. Tiene una capacidad de base de datos múltiple, y me interesa saber cómo puede ver múltiples bases de datos y, por lo tanto, puede saber que una base de recursos más grande posiblemente se divide entre varias máquinas virtuales, y así sucesivamente. Estoy interesado en cómo la gente realmente usa eso. Estoy interesado en lo que los clientes están haciendo con eso. Porque eso me parece, bueno, ciertamente, cuando estaba jugando con las bases de datos, algo que nunca tuve a la mano. Y solo consideraría una instancia de manera significativa en un momento dado. Entonces, ¿cómo usa esto la gente?
Bullett Manale: En términos generales, ¿habla en general de la herramienta en sí misma? ¿Cómo lo están usando? Quiero decir, en general, se trata de poder tener un punto central de presencia del medio ambiente. Tener tranquilidad y saber que si miran una pantalla y ven verde, saben que todo está bien. Es cuando ocurren los problemas y, obviamente, la mayoría de los casos desde la perspectiva de un DBA, muchas veces esos problemas ocurren cuando están frente a la consola, por lo que pueden ser notificados tan pronto como ocurra el problema. Pero además de eso, poder comprender cuándo ocurre el problema, poder llegar al corazón de la información que les proporciona un contexto en términos de por qué está sucediendo. Y esa es, creo, la mayor parte: ser proactivo al respecto, no ser reactivo.
Lamentablemente, la mayoría de los DBA con los que hablo, y no sé, es un buen porcentaje de ellos, todavía están en el tipo de entorno reactivo; esperan a que un consumidor se les acerque para decirles que hay un problema. Entonces, vemos a muchas personas tratando de romper con eso y creo que esa es una gran parte de la razón por la cual a las personas les gusta esta herramienta es que les ayuda a ser proactivos, pero también les proporciona una idea de lo que está sucediendo., cuál es el problema, pero en muchos casos, lo que encontramos al menos, y tal vez solo los DBA nos dicen esto, pero los DBA, la percepción es que siempre es su problema, incluso si es el desarrollador de la aplicación quien escribió la aplicación que no lo escribieron correctamente, ellos serán los culpables, porque están llevando esa aplicación a sus sistemas o servidores y luego, cuando el rendimiento es malo, todos señalan que el DBA dice: "Hey, es tu culpa".
Entonces, esta herramienta, muchas veces, se utilizará para ayudar a defender el caso de que el DBA diga: "Oye, aquí es donde radica el problema y no soy yo". (Risas) Necesitamos mejorar esto, ya sea cambiando las consultas o lo que sea. En algunos casos, caerá en su cubo en términos de su responsabilidad, pero al menos tener la herramienta para poder ayudarlos a entender eso y saberlo, y hacerlo de manera oportuna es obviamente el enfoque ideal.
Robin Bloor: Sí, la mayoría de los sitios con los que estoy familiarizado, pero ha pasado un tiempo desde que estuve allí, buscando en varios sitios de bases de datos múltiples, pero principalmente lo que solía encontrar era que habría DBA que se centraron en un puñado de bases de datos. Y esas serían las bases de datos, que si alguna vez caen, sería un gran problema para el negocio, y así sucesivamente. Y los otros, solo recopilarán estadísticas de vez en cuando para ver que no se quedaron sin espacio y nunca los mirarán en absoluto. Y mientras estaba haciendo la demostración, estaba mirando esto y pensaba bien, de una forma u otra, se extiende, simplemente al proporcionar algo como esto para las bases de datos que a menudo, a nadie le importaba demasiado, porque tienen un crecimiento de datos, tienen un crecimiento de la aplicación a veces también. Estás extendiendo la cobertura de DBA de una manera bastante dramática. Entonces, de eso se trata realmente la pregunta, ¿es que con un conjunto de herramientas como esta, terminas siendo capaz de dar prácticamente un servicio DBA a cada base de datos que está en la red corporativa?
Bullett Manale: Claro, quiero decir, el desafío es que, como dijiste con bastante elocuencia, es como si hubiera algunas bases de datos que les importan a los DBA y luego hay algunas que no les importan tanto. Y la forma en que este producto en particular, la forma en que tiene licencia es por instancia. Entonces, supongo que diría que hay un umbral de cuando la gente decide "Oye, esta no es una instancia lo suficientemente crítica como para querer administrarla con esta herramienta". Dicho esto, hay otras herramientas que hacemos supongo que tienen más, atendiendo a esas instancias menos importantes de SQL. Uno de ellos sería como el Administrador de inventario, donde hacemos verificaciones de estado de las instancias, pero además de eso, lo que hacemos es hacer un descubrimiento, por lo que identificamos nuevas instancias que se han puesto en línea y, a partir de ese momento, como DBA puedo decir: "OK, aquí hay una nueva instancia de SQL, ¿ahora es Express? ¿Es la versión gratuita o es una versión empresarial? ”Esa es probablemente una pregunta que quiero hacerme a mí mismo, pero en segundo lugar, ¿qué tan importante es esa instancia para mí? Si no es tan importante, podría tener esta herramienta saliendo y haciéndolo, genérico, lo que llamaría controles de salud genéricos en el sentido de que son los tipos elementales de cosas que me interesan como DBA: ¿se está llenando el disco? ? ¿El servidor responde a problemas? Lo principal, ¿verdad?
Mientras que con Diagnostic Manager, la herramienta que le estaba mostrando, se reducirá al nivel de consulta, se reducirá a la recomendación de índices, se analizará el plan de ejecución y todo lo bueno, mientras que esto se centra principalmente sobre quién es el dueño de qué, qué es lo que tengo y quién es responsable de ello. ¿Qué service packs y hotfix tengo? ¿Y mis servidores se ejecutan con los ingredientes principales de lo que consideraría una instancia saludable de SQL? Entonces, para responder a su pregunta, hay una pequeña mezcla. Cuando hay personas que miran esta herramienta, generalmente miran un conjunto más crítico de instancias. Dicho esto, tenemos algunas personas que compran cada instancia que tienen y lo administran, por lo que solo depende. Pero les digo que, en general, definitivamente hay un umbral de aquellas personas que consideran que su entorno es lo suficientemente importante como para tener una herramienta como esta para administrar esas instancias.
Robin Bloor: Bien, otra pregunta antes de dársela a Eric. La impresión que uno tiene, solo de observar la industria, es que las bases de datos aún tienen vida, pero todos los datos se están vertiendo en todos estos lagos de datos, y así sucesivamente. Esa es la exageración, realmente, y la exageración nunca refleja la realidad, así que estoy interesado en qué tipo de realidad estás percibiendo. ¿Son las bases de datos importantes dentro de una organización, están experimentando el crecimiento tradicional de datos, que solía pensar como 10 por ciento al año? ¿O están creciendo más que eso? ¿Big data está haciendo que estas bases de datos se disparen? ¿Cuál es la imagen que ves?
Bullett Manale: Creo que en muchos casos vemos que algunos de los datos se transfieren a esos otros segmentos donde tiene más sentido, cuando hay otras tecnologías que están disponibles. A fecha reciente, algunos de los datos más grandes. Pero diría que estas bases de datos son difíciles de generalizar en muchos casos porque cada persona es un poco diferente. En términos generales, sin embargo, veo cierta divergencia. Veo, como dije, la gente se está moviendo a los modelos elásticos en muchos casos, porque quieren aumentar los recursos y no tanto en otras áreas. Algunas personas se están mudando al big data. Pero es difícil tener una idea de, por ejemplo, la percepción, porque en general las personas con las que estoy hablando tienen todas las bases de datos tradicionales y están usando esto en un entorno de SQL Server.
Dicho esto, diría que en términos de SQL en sí, definitivamente todavía creo que está ganando cuota de mercado. Y creo que hay muchas personas que todavía se están dirigiendo hacia SQL desde otros lugares como Oracle, porque es más asequible y parece ser obvio, a medida que las versiones de SQL se vuelven más avanzadas, y estás viendo esto con las cosas más recientes que están sucediendo con SQL, en términos de encriptación y todas las otras capacidades que lo están convirtiendo en un entorno o una plataforma de base de datos, que obviamente es muy capaz para la misión crítica, supongo. Entonces, creo que también estamos viendo eso. Donde estás viendo un cambio, todavía está sucediendo. Quiero decir, estaba sucediendo hace 10 años, creo que todavía está sucediendo en términos de SQL Server, donde el entorno está creciendo y la cuota de mercado está creciendo.
Robin Bloor: OK, Eric, ¿supongo que el público tiene una o dos preguntas?
Eric Kavanagh: Sí, déjame lanzarte uno rápido. Es una muy buena pregunta, en realidad. Uno de los asistentes pregunta: ¿me dirá esta herramienta si una tabla puede necesitar un índice para acelerar la consulta? Si es así, ¿puedes mostrar un ejemplo?
Bullett Manale: Sí, así que no sé si tengo uno para agregar un índice específicamente, pero puedes ver aquí, tenemos recomendaciones de fragmentación aquí. También creo que acabamos de tener y esto fue parte del Administrador de diagnóstico que ofrece la versión basada en la web, donde me dice que me falta un índice. Y podemos ver esas recomendaciones y nos dirá la ganancia potencial de eso al indexar esa información. La otra cosa que debo mencionar es que cuando hacemos las recomendaciones, para muchas de ellas, el script se creará para ello. Ese no es un buen ejemplo, pero podría ver, sí, las situaciones en las que un índice, ya sea un índice duplicado o la adición de un índice, mejoraría el rendimiento y, como dije antes, hacemos muchas eso a través del análisis de índice hipotético. Por lo tanto, realmente ayuda en términos de comprensión de la carga de trabajo, para poder aplicar eso a la recomendación.
Eric Kavanagh: Eso es excelente, y esto me dará una buena idea de los comentarios finales aquí. Robin, yo y Rick también, hemos escuchado durante muchos años, se habla de bases de datos de autoajuste. ¡Es una base de datos de autoajuste! Todo lo que puedo decirte es: no les creas.
Bullett Manale: No te creas la exageración.
Eric Kavanagh: Puede haber algunas pequeñas cosas que se hacen dinámicamente, pero incluso eso, es posible que desee verificarlo y asegurarse de que no esté haciendo algo que no desea que haga. Entonces, durante bastante tiempo, necesitaremos herramientas como esta para comprender lo que está sucediendo a nivel de base de datos y, como dijo Robin, los lagos de datos son conceptos fascinantes, pero probablemente haya tantas posibilidades de que se hagan cargo como existan. habiendo un monstruo del lago Ness en cualquier momento pronto. Entonces, solo diría nuevamente, el mundo real tiene mucha tecnología de base de datos, necesitamos personas, DBA, para ver estas cosas y sintetizarlas. Puedes decir que necesitas saber qué estás haciendo para que esto funcione. Pero necesita las herramientas para darle la información para saber lo que está haciendo. Entonces, la conclusión es que los DBA van a estar bien.
Y muchas gracias a Bullett Manale y nuestros amigos de IDERA. Y, por supuesto, Rick Sherman y Robin Bloor. Archivamos todos estos webcasts, así que ingrese en línea insideanalysis.com o visite nuestro sitio asociado www.techopedia.com para obtener más información sobre todo eso.
Y con eso, nos despediremos, amigos. Gracias de nuevo, hablaremos la próxima vez. Cuídate. Adiós.