Hogar Bases de datos Proteja su base de datos: alta disponibilidad para datos de alta demanda

Proteja su base de datos: alta disponibilidad para datos de alta demanda

Anonim

Por el personal de Techopedia, 7 de diciembre de 2016

Para llevar: El presentador Eric Kavanagh habla sobre la disponibilidad con Robin Bloor, Dez Blanchfield y Bert Scalzo de IDERA.

Actualmente no has iniciado sesión. Inicia sesión o regístrate para ver el video.

Eric Kavanagh: Damas y caballeros, hola y bienvenidos de nuevo. Son las cuatro en punto de la hora del este de un miércoles, y en estos días eso puede significar casi una cosa si estás en el mundo de los datos: ¡es hora una vez más para Hot Technologies! Si, de hecho.

Mi nombre es Eric Kavanagh, seré tu anfitrión para el show. Está diseñado para descubrir qué es lo que está de moda, qué está sucediendo allí, cuáles son las cosas geniales que se utilizan en la empresa y, por supuesto, la base de todo lo que hacemos en este campo es la base de datos. Así que vamos a hablar sobre la protección de su base de datos. El tema exacto es: "Proteja su base de datos: alta disponibilidad para datos de alta demanda". Entonces, hay una diapositiva sobre la suya. Y, suficiente sobre mí, contáctame en Twitter, @eric_kavanagh.

Primero, este año es caluroso, los datos son calurosos, los grandes datos son muy calurosos, pero en realidad todavía están al límite. Más de las empresas de vanguardia están aprovechando big data en estos días, la mayoría de las organizaciones de pan y mantequilla en el mundo, todavía están utilizando datos tradicionales, y si sus datos tienen una gran demanda, entonces quiere asegurarse de que estén disponibles porque cuando los sistemas se caen, cuando no se puede acceder a los datos, es cuando obtienes clientes insatisfechos, clientes potenciales insatisfechos, obtienes abandono de clientes, te infelices todo tipo de cosas, socios, etc. Así que no quieres eso.

Aprenderemos de algunos de los mejores hoy en el negocio: escucharemos a nuestro propio Dr. Robin Bloor, experto en bases de datos de unas tres décadas consecutivas. Dez Blanchfield, que ha estado haciendo esto durante casi tanto tiempo, pero comenzó cuando era muy joven, y Bert Scalzo de IDERA, que es realmente el cinturón negro de la base de datos. Entonces, no se detengan, amigos, hagan preguntas: la gran parte de este evento es valioso para ustedes cuando hacen buenas preguntas y obtienen buenas respuestas, así que envíenlas a través de la ventana de chat o el componente Q y A de su consola.

Y con eso voy a dárselo a Robin Bloor, llévatelo.

Dr. Robin Bloor: OK, déjenme hacer clic en esto y ver si se mueve, lo hace. No voy a hablar sobre la base de datos en particular. Pensé que, ya sabes, porque estoy haciendo la introducción, la primera presentación de presentación, así que hablaré sobre los niveles de servicio esperados y, por supuesto, la disponibilidad, que es el trato, que es el tema del programa de hoy.

Y la pregunta es: "¿En serio, qué es la disponibilidad? ¿Y qué papel juega en la forma en que las personas manejan los centros de datos hoy en día? ”. Una cosa que noté, noté esto en algún momento en los años 90, estaba trabajando en un sitio y los usuarios comenzaron a quejarse porque su correo electrónico no funcionaba. 15 minutos.

Y fue interesante porque el CTO o quien estaba a cargo de TI realmente tenía uno de los pocos lugares en los que en esos días habían determinado los niveles de servicio y el correo electrónico que estuvo inactivo durante 15 minutos no violaba el nivel de servicio de nadie . Creo que está permitido estar fuera por dos horas, de hecho. No era que el correo electrónico no podía usarse, solo era que no podía enviar y recibir porque el servidor estaba fuera. Y eso me alertó sobre el hecho de que he notado que avanzo desde entonces, que todo simplemente se acelera y también lo hacen las expectativas de los usuarios, y esto lo lleva a la situación en la que las personas pueden tener tres niveles de servicio, pero a menudo comenzará a quejarse cuando los niveles de servicio no se violen realmente.

Entonces, la definición de los niveles de servicio, solo para dar un … bueno, puede depender exactamente de lo que está hablando en términos de niveles de servicio. Hemos hablado sobre el sistema de TI o la aplicación de TI. Normalmente se define en términos de rendimiento, disponibilidad y metricación; en otras palabras, no se puede definir realmente un nivel de servicio a menos que se pueda medir, por lo que normalmente hay algún tipo de medición involucrada y normalmente se trata de tiempos de respuesta, transacciones particulares y el disponibilidad de los sistemas durante un período de tiempo particular, y antes de aproximadamente 1994–1995, era realmente raro que se requiriera que algún sistema estuviera disponible por más de las horas normales de trabajo. Entonces, digamos ocho de la mañana hasta las seis de la tarde, para dar un lapso normal, y la gente construyó sistemas y de esa manera y eso significaba, en mi mente, particularmente con la base de datos, que podía configurar la base de datos de una manera particular y como la ventana del lote comenzó a reducirse, la necesidad de pensar nuevamente comenzó a surgir en algunos sistemas y luego en otros sistemas, y luego tuvimos la llegada del servicio o la arquitectura, que comenzó a hacer dependencias entre sistemas que antes no dependían el uno al otro, empeorando todo aún más. Obtuvimos la restricción en términos de disponibilidad de los sistemas.

Lo que estaba diciendo era cuando hablamos de disponibilidad, incluye respaldo y recuperación e incluye: es como si no fuera solo disponibilidad en los términos normales de los que estamos hablando; Hay muchas formas diferentes en que una aplicación puede fallar. Usted sabe, puede obtener una falla de hardware o puede tener una falla en la base de datos, puede tener una falla en el software y hay muchas especies diferentes de esas cosas, y cuando ocurre, necesita poder recuperarse y, por lo tanto, también debe retroceder hasta los sistemas. Por lo tanto, debe existir algún esquema para hacer una copia de seguridad del sistema y usted también, en muchos sitios hoy en día, necesita la capacidad de recuperación ante desastres en caso de que un edificio completo explote. Y hay algo que vale la pena mencionar aquí, y voy a insistir en eso en un minuto, pero los procesos comerciales también tienen niveles de servicio y, de hecho, los niveles de servicio del proceso comercial que realmente son importantes para la empresa. TI solo tiene que hacer su parte y de acuerdo con cualquier acuerdo.

Los niveles de servicio de TI normalmente son subsidiarios de los niveles de servicio de procesos de negocio, pero como era realmente raro hace 15 años que una organización tuviera niveles de servicio bien definidos, todavía es bastante raro que las organizaciones tengan niveles de servicio bien definidos para procesos de negocio. . Eso es algo que está sucediendo ahora; No es algo que ha estado sucediendo durante mucho tiempo.

Estas son las barreras de aceleración y tiempo, solo vale la pena mencionar las barreras de tiempo. Nos movemos gradualmente a un mundo de procesamiento de eventos y por eso nos movemos gradualmente a un mundo en tiempo real, y debido a eso gradualmente pasamos a disponibilidad para ser requerido 24 por 7, y eso es realmente difícil para muchos sistemas: es Difícil de lograr. O es muy costoso o, en algunos casos, es posible que deba cambiar los sistemas, incluso pasar a una base de datos diferente, una versión diferente del software de base de datos que estamos utilizando.

También estas barreras de tiempo, y siempre me gusta mencionarlas cada vez que tengo la oportunidad, son barreras de tiempo con las que se encuentran nuestras aplicaciones; las aplicaciones pueden querer ser lo más rápidas posible, es cuando el software habla con el software. Realmente no hay ninguna licencia aceptable en algunas situaciones, desea ser lo más rápido posible, y esas situaciones en términos comerciales como situaciones de mercado, donde la persona que viene con la orden de compra en segundo lugar obtiene un precio peor que alguien quién viene primero y, por lo tanto, la velocidad del software realmente importa.

Pero ya sabes, a continuación, cuando estás tratando, interactuando con seres humanos, el mejor tiempo de respuesta que realmente se te puede exigir es una décima de segundo, porque se trata del tiempo de respuesta de un ser humano. No necesita ir más rápido que eso porque un ser humano no se dará cuenta de todos modos. Entre 1.1 y cuatro segundos es un tiempo de espera que los seres humanos normalmente tolerarán, pero tan pronto como pasen unos cuatro segundos, dejarán de hacer otra cosa y, por lo tanto, estarán realmente en una actividad por lotes.

Por lo tanto, puede ver que ciertos marcos de tiempo y días, semanas y meses para aquellas cosas en las que un comportamiento de lote tiene sentido y, por lo tanto, no se encuentra en un mundo de procesamiento de eventos, y por lo tanto, la disponibilidad puede ser bastante diferente en términos de lo que necesita para poder proporcionar. Pero tan pronto como esté en el mundo de los eventos, tendrá disponibilidad las 24 horas, los 7 días de la semana, y el cambio tecnológico es un factor a medida que la tecnología avanza cada vez más rápido, entonces la disponibilidad podría no aumentar; simplemente se mantiene como está.

Estas son capas de complejidad y no quiero profundizar en esto, es solo, ya sabes, hay tres cosas a considerar aquí. Existe un nivel de servicio de infraestructura, este es el eje vertical, y luego hay un nivel de servicio de cualquier aplicación dada y luego hay un nivel de servicio empresarial, y estos dependen unos de otros y deberán tenerse en cuenta si realmente está buscando crear un entorno receptivo donde se cumplan los niveles de servicio, básicamente.

Luego tiene, aquí abajo, que solo se representan las bases de datos, pero puede hacer cualquier cosa dentro del sistema, sabe que tiene la configuración ininterrumpida, lo que significa lo que dice: nunca se detendrá. Tienes la situación de espera activa, donde de una forma u otra, hay diferentes maneras de lograrlo, pero de una forma u otra, si una base de datos falla, se cambia a una espera activa y hay muy poco retraso en términos de tiempo, hasta el punto en que los usuarios probablemente lo notarían, pero no notarían mucho.

El modo de espera cálido es más parecido al cambio de 20 minutos en el que todos llaman a la mesa de ayuda y se quejan en la mesa de ayuda mientras la base de datos se cambia a modo de espera. Luego hay una situación de reinicio en la que puede llevar mucho tiempo. Vale la pena señalar que cualquier aplicación o base de datos puede estar en cualquiera de las situaciones, dependiendo de lo que realmente esté sucediendo y del nivel de servicio requerido de la aplicación.

A partir de eso, solo quiero hacer un punto sobre la curva de complejidad. La complejidad deriva de nodos y conexiones, las dependencias. En el mundo en el que vivimos, el número de nodos y conexiones involucrados en cualquier cosa sigue creciendo, por lo que está corriendo hacia este tipo de curva conveniente. Si puede observar la forma en que aumenta la complejidad y la forma en que se reducen las dimensiones del tiempo, entonces sabe los niveles de disponibilidad, ¿hay objetivos de tiempo, es probable que se reduzcan?

Y la evolución natural, por lo tanto, es hacia una operación sin parar, que es, por supuesto, la más cara, al menos en mi experiencia, son las configuraciones más caras que puede crear. De una forma u otra, cualquier organización que esté pensando en esto, realmente necesita pensar no solo en lo que está sucediendo ahora, sino en lo que sucederá en el futuro.

Quizás el último punto que quiero destacar es que la gestión de los niveles de servicio es una actividad continua; no es algo que sepa que tiene un proyecto, lo hace y se acabó. No lo es, porque las cosas siguen cambiando. Dicho esto, le pasaré el balón a Dez.

Dez Blanchfield: Gracias Robin. Me encanta tu diapositiva de apertura. Acabamos de repetir, creo que es "Finding Nemo 2", la película. Tenías a Nemo buscando disponibilidad en forma de nueves, lo que me pareció bastante lindo. Siempre es un acto difícil de seguir. Cuando pienso en el tiempo de actividad, la disponibilidad y el alto rendimiento, la primera imagen que me viene a la mente, porque crecí en las Islas Salomón cerca de los volcanes y el ecuador, es un volcán en erupción en mi centro de datos; Existe esta imagen que siempre tengo en mi mente de que eso es lo que podría suceder si algo explota. Esta es una foto del hermoso monte. Etna, que es la esquina noreste de Sicilia, que está justo al lado de Catania.

Mi enfoque para esto es tener una conversación con usted y darle un par de cosas para llevar al mismo nivel que lo hago en una sala de juntas de forma regular desde C-suites y los jefes de negocios con el fin de mantener una conversación. sobre lo que puede afectar a su organización desde un sentido comercial o técnico y los tipos de ingeniería.

Tenemos que pensar y cómo: qué nos quitamos de eso, y cómo vamos a abordar algunos de los desafíos de los que hablamos cuando hablamos de alta disponibilidad y tiempo de actividad, particularmente en torno a la automatización y las plataformas.

Entonces, la pregunta que planteamos inicialmente es, ¿qué queremos decir realmente cuando hablamos de sistemas de bases de datos y disponibilidad de plataformas de bases de datos? ¿Qué significa realmente hablar sobre el desafío real de hacer que algo esté disponible a un nivel como Robin habló en el mapeo instalado de acuerdo de nivel de servicio de lo que realmente necesitamos y queremos?

Entonces, la realidad de hoy es que, y de hecho aquí hay un par de realidades máximas en mi mente, hoy todo está efectivamente basado en bases de datos. Hay muy pocos sistemas que se construyen hoy y se construyen de tal manera que las cosas simplemente se almacenan en archivos o son algún tipo de registro de archivo plano; invariablemente todo es impulsado por la base de datos. Como resultado de esto, tenemos la necesidad de dejar de pensar en la disponibilidad de esas bases de datos, en los diferentes sistemas, aplicaciones y herramientas que dependen de ellas y dependen de ellas para brindar los servicios que buscamos ofrecer, vender o consumir. . Y toda la infraestructura a su alrededor.

De hecho, tanto, cuando piensas en las grandes interrupciones de datos de los últimos tiempos, en particular, los nativos digitales o los nativos de la nube, algunas de las compañías que han aparecido como Uber y Airbnb y demás, y los PayPals un poco más antiguos y los eBay del mundo: la escala y el tamaño de esas organizaciones solo es posible gracias a la moderna tecnología de bases de datos y la moderna infraestructura de la nube. Sin eso, sin la capacidad adicional proporcionada, ciertamente no existirían. Imagine un escenario en el que solo podría llegar a eBay entre las 9:05 y las 9:25 porque no estaba disponible por el resto del día porque estaba tratando de hacer un iCloud o una copia de seguridad o algo así, simplemente no habría trabajó.

Entonces, y hay otras áreas clave cuando piensa en nuestra vida cotidiana, ya sabe, como el comercio minorista y la banca y las finanzas y las aerolíneas, etc. Los grandes grupos de la industria como la logística de la aviación, el transporte marítimo, el gobierno en su conjunto, la seguridad nacional y la policía, etc. Todas estas industrias, todos estos segmentos de mercado, todos estos organismos, grupos dependen de que sus entornos estén en funcionamiento.

Entonces, con eso en mente, también tenemos la otra advertencia en la que tenemos que pensar, la otra conclusión sobre la que quiero dejarlo pensando, y es que nuestro mundo es ahora lo que yo llamo "siempre encendido". Estamos permanentemente conectados y este es un tema que escuchará de forma regular y voy a repetirlo y reiterarlo. Ahora tenemos teléfonos inteligentes en nuestras manos todo el día, todos los días. No los apagamos, los ponemos al lado de la cama, los usamos invariablemente como despertadores, los usamos como cámaras y tomamos fotos, empujan esas fotos hacia la nube.

Siempre están activos, mentalidad permanentemente conectada. De hecho, hay una moneda de frase que me gusta usar, y es que ahora estamos viviendo la generación de Fitbit, que es donde medimos todo, monitoreamos todo, y debe registrarse y eso va a ir a alguna parte.

Y también hay otra frase con la que te dejaré, y es que son las nueve en algún lugar, todo el tiempo. Es un mundo 24/7/365 en el que vivimos. La Tierra gira constantemente alrededor del Sol y en algún momento, en cualquier momento, cada hora del día son las nueve en punto. Y eso significa que la gente se levanta de la cama y trata de hacer cosas, comprar cosas, instalar cosas, etc.

Entonces, ¿qué queremos decir cuando hablamos de alta disponibilidad? Bueno, suena muy obvio hasta que comienzas a sumergirte en los detalles. Entonces, cuando pensamos en "OK, ¿qué significa alta disponibilidad?" Bueno, la realidad es que no hay una bala de plata. Es un concepto bastante complejo, ya que Robin se relacionó con algunos de los temas que mencionó, como medir la disponibilidad y los acuerdos de nivel de servicio. Lo asignamos a cosas como, tengo estas preguntas, ¿es tiempo de actividad? ¿Nos preocupamos de cosas como lo que llamamos cinco nueves, en lo que entraré en un minuto? ¿Nos consideramos con lo que hay en nuestros acuerdos de nivel de servicio? Por ejemplo, en los acuerdos de nivel de servicio, quiero decir que hay retrasos, el acrónimo de tres letras para los acuerdos de nivel de servicio se ha vuelto cada vez más crítico en estos días.

A medida que atraviesa todo este proceso de instalaciones locales y autohospedadas a centros de datos externos y servicios gestionados externos, y ahora vamos a la nube. Y la realidad es que cuando hablas de la nube, solo son las computadoras de otras personas. Y eso significa que no está ejecutando la infraestructura, no está ejecutando los sistemas e invariablemente no está ejecutando la nube. Está haciendo la infraestructura configurada como plataforma, por lo que es aún más importante en el servicio de la fuerza de ventas. Ahora imagine las ventas, por ejemplo, sabe que no toca ninguna de esas infraestructuras, simplemente inicia sesión en una interfaz web.

Por lo tanto, el único mecanismo que tiene en ese mundo de infraestructura en la nube y subcontratada de cualquier forma para controlarlo son los acuerdos de nivel de servicio, ese es el único mecanismo que tiene, y si las personas no cumplen con su instalación, entonces aguantan multas y una reducción en la cantidad de dinero que les paga o simplemente no los paga.

Entonces, esto me recuerda todo este desafío de, ya sabes, ¿cómo gestionamos la alta disponibilidad? ¿Cómo gestionamos el tiempo de disponibilidad de disponibilidad si no es su infraestructura? Se trata de SLA, por ejemplo. Si es su infraestructura o incluso si es la infraestructura de otra persona como punto de vista de diseño. Hablamos sobre el equilibrio de carga para modelar la ciencia, ¿es una patente de diseño de tolerancia a fallas?

¿Ejecutas activo activo o activo en espera en tus arquitecturas? ¿Tiene múltiples servidores, múltiples plataformas de almacenamiento? ¿Cómo funcionan esas plataformas de almacenamiento? ¿Se replican entre sí, se reflejan? ¿Estás ejecutando RAID? ¿Qué tipo de RAID está ejecutando para almacenamiento redundante? ¿Está ejecutando RAID a nivel de disco? ¿Está ejecutando una plataforma de almacenamiento de objetos que se replica en unidades modelo y sistemas modelo y unidades? ¿Es N más uno por cada pequeña pieza de infraestructura que tienes? ¿Agrega otro y está en el mismo centro de datos u otro centro de datos? ¿Ha creado una patente de diseño que no representa un punto de venta único, por ejemplo?

Todas estas cosas fundamentales, ahora suenan como conceptos simples, pero cuando entras en cada una de estas cosas, son cosas muy, muy detalladas. Cuando hablamos de disponibilidad, siempre terminamos hablando de nueves. ¿Y a qué nos referimos con nueves? Todos hemos escuchado sobre esto, pero pensemos en lo que significan por un minuto y por qué son importantes.

Entonces, hablamos de un nueve, que es solo el 90 por ciento de nuestra disponibilidad. Sé que eso suena muy alto. Entonces, cuando hablamos 24 por 7 por 365, si solo miramos un año, por ejemplo, cuando hablamos a las nueve, que es el 90 por ciento del tiempo, eso permite treinta y seis días y medio de tiempo de inactividad al año. Vamos a redondear eso a poco más de un mes.

Ahora piense en cualquier negocio con el que lidiemos todos los días, ya sea banca en línea, eBay, PayPal o plataformas de redes sociales como LinkedIn, Twitter o simplemente un minorista general, digamos que quería reservar un vuelo para venir a los Estados Unidos desde Sunny Australia, ¿sería feliz si quisiera venir a Estados Unidos dentro de una semana, si mi aerolínea favorita cayera durante treinta y seis días y medio porque su proveedor de servicios dijo: "Mira, estamos en el 90 por ciento del tiempo? "? Por supuesto que no lo haría.

A medida que avanza este modelo, dos nueves: 99 por ciento. Bueno, eso se convierte en 3, 65 días, aproximadamente tres días y medio de inactividad al año. ¿Es eso un gran problema? Bueno, es si está ejecutando Black Friday, y está ejecutando una oferta especial y la gente solo puede comprar durante esos dos días.

Tres nueves se convierten en tan solo 8, 7 horas al año, pero incluso 8, 7 horas al año, son ocho horas consecutivas sin parar de nuestro tiempo. Bueno, eso en banca y finanzas, en salud, si es un hospital, eso podría costar vidas. A medida que asciende, cuatro nueves son 52 minutos, cinco nueves son cinco minutos y seis nueves son básicamente 30 segundos. Seis nueves es extremadamente alto, y a medida que subes esta escalera, a medida que subes este árbol de Navidad de nueves, cuantos más nueves subas, más difícil será el diseño, el entorno y la plataforma. Cuanto más difícil sea entregar ese servicio, y si piensa en la reducción en la cantidad de tiempo que tiene para ejecutar cosas como copias de seguridad, administración, parches, ventanas de mantenimiento para cualquier forma de interrupción, todos desafíos no triviales - y todo se reduce a porcentajes de interrupciones, efectivamente.

La clave aquí que me gustaría transmitir es que no hay una bala de plata, como mencioné antes. Cuando se trata de disponibilidad, no existe una "talla única". Es posible que tenga un tipo particular de patente de diseño que se adapte a las industrias clave. Todos los bancos enfrentan los mismos desafíos. Algunos podrían ser bancos minoristas, otros podrían ser bancos premium. Algunos bancos podrían centrarse en el comercio y la inversión, la gestión del patrimonio. Algunos podrían ser puramente consumidores. Algunos pueden ser solo para colocar en Internet y ni siquiera tener cajeros y solo tratar con cajeros automáticos cuando dispensan efectivo. Entonces, en esos escenarios, incluso en la industria de servicios financieros y de administración de patrimonio y banca en general, para cada uno de ellos todavía tienen su propio sabor particular o lo que necesitan cuando se trata de disponibilidad.

Entonces, cuando pensamos en la disponibilidad en inglés simple, la combinación entre disponibilidad y alta disponibilidad, creemos que son lo mismo, pero en realidad son tiza y queso. La disponibilidad es, lo he puesto en inglés simple, una medida del tiempo que un servidor o proceso funciona normalmente o en general, vinculado a su uso. Eso solo significa cómo describimos si está disponible o no. Cuando hablamos de disponibilidad, a menudo caemos en esta trampa de pensamiento: "Lo estoy proporcionando en forma disponible", frente a la alta disponibilidad para proteger la seguridad de esa infraestructura.

La alta disponibilidad, en otro sentido en inglés simple, es el diseño en el que implementa o logra algún tipo de resultado y disponibilidad de datos en particular donde casi todo el tiempo, 24/7/365 días al año, esa disponibilidad llega a algunos de esos Nueve. Invariablemente no significa 100 por ciento. El cien por ciento técnicamente no es posible en un mundo real en cualquier entorno. Es muy difícil para un servidor en un sistema operativo con una base de datos en él, con una plataforma ejecutándose y en eso una aplicación que puede entregar y esperar que se ejecute al 100 por ciento. Entonces comenzamos a pensar en diseños. ¿Tenemos redundancias, tenemos múltiples diapositivas para replicar? Luego, cuando lo pones en inglés simple, es interesante cuán diferente se vuelve el tema de disponibilidad frente a alta disponibilidad.

Pensé que lo pondría en una forma gráfica realmente simple solo para darnos una idea de cómo se ve esto cuando comience a superar el desafío de aumentar la disponibilidad para proteger el tiempo de actividad de su servicio. En la esquina inferior izquierda tenemos un solo nueve. He presentado los cinco nueves de los que generalmente hablamos. Seis nueves es un poco escandaloso. Cuando hablamos de cinco nueves en la esquina inferior izquierda, aproximadamente 35 días después de la interrupción, es un entorno de bajo costo y baja complejidad el que está tratando de proporcionar porque tiene una serie de cosas que pueden fallar y puede aún cumple con sus acuerdos de nivel de servicio.

Pero a medida que avanza por la parte inferior de izquierda a derecha, y llega al punto donde hay más nueves en la imagen, obtiene los escenarios en los que comienza a pensar en la replicación de sistemas y plataformas. Debe pensar en la agrupación y virtualización de varias partes de la infraestructura. Debe pensar en la geolocalización de esos clústeres, múltiples sitios de centros de datos, y debe pensar en el tipo de industria y segmento de mercado al que apunta. Entonces, ¿qué tipo de nivel de servicio necesita cumplir? ¿Qué prestación de servicio está buscando? Áreas que son servicios basados ​​en tarjetas en tiempo real que hablan de comunicaciones. ¿Son los servicios militares? Entonces, este gráfico va de abajo a la izquierda a arriba a la derecha y a medida que avanza por esa curva, el costo y la complejidad aumentan. A medida que obtenga entornos más complejos y exigentes, necesitará más nueves.

Este gráfico, por ejemplo, hace algo muy similar: describe la historia entre el componente de costo y el componente de disponibilidad deseado. Entonces, en la esquina superior izquierda, mapeamos sistemas complejos altamente disponibles, y el costo incurrido si esa disponibilidad cae en comparación con el beneficio de tener disponibilidad en tiempo de inactividad cero. Entonces, por ejemplo, si tenemos un entorno en el lado izquierdo donde las cosas están mal, podemos incurrir en pérdidas financieras. Tenemos implicaciones legales que pueden ser implicaciones comerciales a nivel de estrategia comercial.

Supongo que hay todo tipo de problemas potencialmente morales en torno a los beneficios de un servicio. Si se trata de una industria de la salud y comienzan a pasar por el costo de una interrupción, un impacto en los clientes, una reducción en la satisfacción del cliente, la productividad del personal, la productividad del usuario, etc. Estas cosas se ven afectadas si pensamos en diseñar diseños altamente complejos y altamente dependientes, entorno altamente riesgoso donde existe un riesgo potencial de interrupción y, por lo tanto, pérdida.

En el lado derecho, intentamos apuntar a un escenario en el que si invertimos altos costos y planificación en diseño, invertimos en una implementación inteligente. Invertimos en proporcionar a las personas habilidades y recursos, y contamos con una red y un entorno operativo y hardware y software de gran prestigio. Tenemos alta disponibilidad pero tiene un alto costo. Entonces, el punto de péndulo mágico oscilante de la posición óptima en el medio donde se cruzan, donde tenemos un costo ligeramente reducido y una mayor disponibilidad que solo hace malabarismos entre los niveles de nueves y la alta disponibilidad que es la disponibilidad continua y esto es un un desafío constante para nosotros, como en cuánto dinero está dispuesto a invertir para obtener el nivel de servicio que está buscando?

También tenemos el tema en el que no voy a entrar en detalles, pero solo quiero que te lleves esto y lo pienses. La diferencia entre el tiempo medio entre fallas en su diseño y el tiempo medio para recuperarse. En otras palabras, ¿está invirtiendo en infraestructura de mejor calidad, mejor diseño de calidad, hardware y software de mejor calidad y personal y recursos calificados de mejor calidad para diseñar cosas y reducir el tiempo promedio entre fallas, el tiempo promedio que se tarda en encontrar el descanso en lugar de reducir la inversión en infraestructura, en recursos y diseño y patentes ciegas, la alta capacidad de recuperación? En otras palabras, si algo se rompe, tienes mucho que enchufar. Si alguien tiene una computadora portátil y se muere, tienes una de repuesto. Se lo das y en 30 segundos inician sesión. Estos son extremos muy diferentes del poste. El primero infiere que estás diseñando con un alto costo y una alta inversión para evitar fallas, y el inferior dice que "voy a aceptar que el fracaso va a venir, así que voy a diseñar eso y estar preparado para el fracaso". y recuperarse rápidamente ".

Como mencioné antes, donde podría decir: "Mi disponibilidad no es su disponibilidad". Entonces, cuando se trata de entornos de bases de datos y soporte de la infraestructura, ejecutar su base de datos y proteger eso y garantizar una alta disponibilidad, realmente no hay una ventanilla única . Cada uno tiene sus propias necesidades y deseos. Así que debes hacerte estas preguntas fundamentales con las que te dejaré, y es: ¿Qué puede permitirse tu organización? No solo estoy hablando de dólares y centavos. Me refiero a que, como organización, ¿qué puede aportar de recursos, tiempo y esfuerzo, etc., en la medida en que el nivel de disponibilidad puede proporcionar? Además, ¿qué puede apoyar su negocio? Entonces, las capacidades actuales, las habilidades actuales, la infraestructura actual, la financiación actual que puede recaudar. Entonces, hacer malabares entre lo que realmente puede pagar y lo que puede apoyar es un equilibrio interesante.

Además, debe hacerse las siguientes preguntas: ¿Qué habilidades y tecnología tiene internamente? ¿Puedes subcontratar algo de ese desafío? ¿Puedes mover cosas a la nube? Si tiene el servicio de infraestructura aparte del servicio de software, se queda sin esa pila a medida que avanza en la pila. Entonces, ¿debería invertir más en plataformas y servicios y no preocuparse por la pieza de infraestructura, o debería considerar el software como una oferta de servicio porque no tendría que preocuparse por la plataforma?

¿Qué tipo de mercado y consumidor o cliente atiende? Quiero decir, si usted es una empresa de telecomunicaciones y alguien tiene que levantar el teléfono y recibe un tono de marcado todo el tiempo, ese es un desafío muy diferente para abrir una pequeña tienda minorista entre el lunes y el viernes, de nueve a cinco y cerrar por un hora del almuerzo como un barbero de la tienda de la esquina. Por lo tanto, debe pensar detenidamente cómo funciona eso y qué significa eso para su organización, qué necesita para poder proporcionar.

Y luego el malabarismo entre lo que hay en las instalaciones, lo que está alojado externamente y, potencialmente, lo que hay en la nube. Como dije antes, eso también proviene de los desafíos del tiempo. Así que nos quedamos con la pregunta final que espero que nuestros amigos en IDERA nos digan cómo abordan estas mismas cosas, y esa es la combinación perfecta entre la disponibilidad deseada y la requerida con el rendimiento, y lo que su negocio necesita y qué Su mercado y sus consumidores necesitan.

Y la realidad es que no es poca cosa. Va a tomar tiempo, esfuerzo y dinero en general para pensar en estas cosas. E invariablemente es una inversión en personas y capacidades, y una inversión en software y herramientas para automatizar algunos de esos procesos y proporcionar a esas personas las herramientas y los sistemas correctos para mejorar sus vidas no solo, sino también porque es posible monitorear entornos de gran escala y protegerlos. y administrar esos entornos a gran escala a menudo está más allá de las capacidades humanas individuales.

Entonces, con eso en mente, espero haber preparado el escenario para una gran conversación para que nuestros amigos en IDERA hablen sobre su plataforma y herramientas, y espero poder hacer algunas buenas preguntas al final. Y pasaré de largo.

Dr. Robin Bloor: Muy bien. Bert, te acabo de dar las llaves, llévatelas.

Bert Scalzo: ¡ Gracias! Gracias Dez y Robin. Continuaré con el tema de alta disponibilidad para sus datos. Y en realidad voy a aprovechar mucho de lo que Dez acaba de hablar. Entonces, las elecciones, los nueves, las compensaciones, la asequibilidad. Voy a tratar de ponerlo más en términos del administrador de la base de datos o de alguien más cercano a las trincheras, ¿cómo lo verían? ¿Cómo lo diseñarían? Y qué significan esas elecciones.

Ahora, voy a tratar de ser independiente de la base de datos. No voy a dibujar, por ejemplo, una solución específica de Oracle o de SQL Server, pero voy a dibujar, digamos, una arquitectura genérica que ofrecen todos los proveedores de bases de datos, algo así. Todos lo llaman con diferentes nombres, pero ese es un tipo de opción que tiene en común, y quiero verlo desde la perspectiva comercial y tecnológica, y cómo se relaciona con los requisitos comerciales.

Y quiero comenzar por cuál es la solución de pseudoalta disponibilidad más básica a través de las opciones que tiene en soluciones de nivel de almacenamiento, soluciones de nivel de virtualización y soluciones de nivel de base de datos. Y luego quiero presentarle también el hecho de que todas las opciones están disponibles en la nube también.

Entonces, de nuevo, voy a tratar de mantener una base de datos bastante independiente. Ahora, la mayoría de las cosas de las que voy a hablar, sé que existen en Oracle, SQL Server, MySQL, PostgreSQL. También hay algunos proveedores externos, que crean herramientas que también le darían arquitecturas adicionales que podría considerar. Y, como Dez acaba de decir, ninguna solución es la mejor; todo depende. Pero hay un hecho universal en lo que vamos a ver, es que habrá más partes móviles, por lo que será más complejo y, por lo tanto, más costoso.

Entonces, todos sabemos que los datos son un activo importante. Y todos saben que el acceso rápido a los datos siempre es bueno. Pero, el acceso confiable a los datos es crítico. Y como estaba hablando con sus nueve ejemplos, ¿puede realmente permitirse tener 36½ días de tiempo de inactividad? Es fundamental que esos datos estén disponibles todo el tiempo. Por lo tanto, el tiempo de inactividad puede costar una fortuna, tanto en términos de pérdida de ingresos, pero aún más importante, en la pérdida de clientes o en la pérdida de buena voluntad de los clientes. Te daré un buen ejemplo; Si un sitio web en particular donde realizo compras es lento, puedo intentar encontrar un nuevo sitio web que venda artículos similares a un costo similar y que no tengan sitios web lentos. Y así, no es solo la pérdida del cliente, es la buena voluntad que el cliente tiene hacia usted.

Ahora, el hardware es mucho más barato en estos días, por lo que cada vez hay más demanda de alta disponibilidad. Y una vez más, nos vamos a llevar a la nube, cuando veamos eso. Y tenemos ofertas de varios niveles: los proveedores de almacenamiento, los proveedores de bases de datos, los proveedores de virtualización y ahora incluso los proveedores de la nube. Entonces, lo que es realmente interesante con la nube es que después de dibujar todas estas maravillosas imágenes de estas arquitecturas que puedes construir en la nube, muchas veces son solo algunas casillas de verificación que marcas. Y usted dice: "Quiero replicación en regiones geográficas". Casilla de verificación. "Quiero replicación de componentes clave de hardware". Casilla de verificación. Entonces, si entiendes las imágenes, a veces en la nube solo está marcando algunas casillas para construir la imagen que tienes en mente.

Ahora, la clave es, ¿cuáles son los requisitos comerciales para una alta disponibilidad? Por ejemplo, ¿solo tengo que preocuparme por la falla en un solo sitio, o debo tenerla en varios sitios? En otras palabras, ¿puedo tener un centro de cómputo y no me importa si ese centro se desconecta? No estoy exigiendo que se expanda en varios sitios. Es una pregunta de negocios. Y es importante saber cómo la empresa percibe las respuestas a esa pregunta, porque eso generalmente define su presupuesto.

Ahora, también desea mirar hacia abajo en el nivel de protección contra fallas. ¿Podría ser una falla de energía? ¿Podría ser una falla del componente? Al igual que una NIC o un HBA va mal, un adaptador de bus host. ¿Es un disco duro que falla? ¿Es una falla del gabinete de almacenamiento? ¿Es una falla de la computadora? O, en algunos casos, ¿es una falla del sitio? Eso es diferente a que, en algunos casos, puede haber una falla en el sitio, porque el sitio en sí está fuera de línea. En otro caso, puede ser que una parte sustancial del sitio esté fuera de línea, pero desde su perspectiva ese es todo el sitio.

Y luego, como Dez estaba hablando, ¿cuál es la expectativa del tiempo para reanudar las operaciones? Esa es una pregunta de negocios. Si la empresa dice que debe poder reanudar las operaciones dentro de dos minutos, entonces, obviamente, eso definirá algunas de estas imágenes que le mostraré que funcionarán, y algunas de ellas no serán opciones para usted. poder elegir.

Y otra pregunta que surge durante la alta disponibilidad, pero a menudo la gente se olvida de preguntar es: "Oye, negocios, si algo sucede mientras estoy procesando una transacción, ¿qué puedo perder al reanudar el sistema? " En otras palabras, si puedo recuperar el sistema en dos minutos y no puedo perder más de 10 segundos de, digamos, transacciones que estaban en vuelo, ¿es eso un negocio aceptable? Y de nuevo, eso definirá lo que la empresa está dispuesta a gastar para eso, y nuevamente, eso puede definir qué imágenes que voy a mostrar se aplican o no.

Entonces, comencemos con la solución de pseudo-alta disponibilidad más básica. Esto realmente no es alta disponibilidad, pero me gusta comenzar con esto, porque hace que la gente piense de la manera correcta. Si tengo un servidor y una matriz de almacenamiento, normalmente pondré varias NIC, tarjetas de interfaz de red, en ese servidor, y las vincularé para que si una NIC falla, todavía estoy activo. Y haré lo mismo con mis adaptadores de bus host, lo haré en múltiples rutas a través de diferentes conmutadores, para que tenga múltiples formas de llegar a mi almacenamiento. Y obtuve una fuente de alimentación universal, y tengo controladores repetitivos dentro de mi matriz de almacenamiento, y tal vez hice algo como RAID 10 con mis discos. En otras palabras, en esta imagen he evitado la falla de un solo componente en múltiples niveles. Por lo tanto, no estoy obligado por la NIC, o el HBA, o el controlador, o el interruptor.

Pero si observa, el servidor está en rojo y la matriz de almacenamiento está en rojo. Todavía tengo dos áreas en las que si fallan, si mi servidor se apaga, estoy muerto, si mi gabinete de almacenamiento se apaga, estoy muerto. Entonces, aunque esta no es una disponibilidad realmente alta, comienza a ver y mirar la imagen y a decir: "Quiero una imagen donde no haya rojo". Y ese es realmente el objetivo de estas imágenes, hacernos apuntar en la dirección correcta.

Entonces, lo primero que debe suceder es que, como DBA, es posible que siempre quiera poner la solución de alta disponibilidad como una implementación de base de datos, pero es posible que esté disponible para que se pueda hacer como una solución de almacenamiento, o podría ser que podría ser una replicación a nivel de almacenamiento. En el caso de la izquierda, tengo virtualización de almacenamiento. Lo que sucede es que tengo RAID 0 en dos gabinetes de almacenamiento diferentes para mis discos, pero tengo RAID 1 en los dos gabinetes de almacenamiento diferentes. En otras palabras, ahora puedo hacer que falle un gabinete de almacenamiento, y no estoy muerto. Por lo tanto, es mejor que la imagen anterior, porque en la imagen anterior, recuerde que teníamos rojo en el servidor y rojo en la matriz de almacenamiento, y ahora hicimos una pequeña mejora, ahora ya no tenemos rojo en el nivel de almacenamiento, nosotros he usado: la virtualización del almacenamiento resolvió ese problema.

Ahora, otra forma en que podría hacerlo, y no todos los proveedores proporcionan esto, es que puede hacer una replicación a nivel de almacenamiento. No estoy hablando de replicación de bases de datos, en realidad estoy hablando de replicar su bloque de E / S para su almacenamiento. Y eso se puede hacer a nivel de almacenamiento. Y de nuevo, ahora tengo en el lado derecho, otra imagen donde elimino el rojo de la parte inferior, porque estoy usando la replicación de almacenamiento.

Y así, esta es otra imagen que puede o no estar disponible. Y la persona que administraría esto puede ser su administrador de almacenamiento, en lugar de su administrador de base de datos. Me gusta mencionar esto, porque a veces la gente piensa: "¡Oh! Alta disponibilidad, debe ser el DBA el que aborde este problema". Eso no siempre es verdad; En este caso, podría ser el administrador de almacenamiento.

Ahora, a continuación, podemos hacer la virtualización del servidor como una posible solución. Ahora, si recuerdas, en la primera imagen tenía rojo en el servidor y rojo en la matriz de almacenamiento. Podría, en este caso, usar la virtualización, podría reubicarme, y en algunos casos esa reubicación es una reubicación cálida, y en algunos casos incluso puede ser una reubicación en caliente. Algunos virtualizadores o hipervisores proporcionan la capacidad de mover una máquina virtual en vuelo. Y algunas bases de datos aceptarán ese movimiento en vuelo fácilmente. Ahora, de nuevo, no todos los hipervisores proporcionan esto, pero este es un posible nivel de solución. Ahora, he hecho que los servidores principales ya no sean rojos, pero todavía tengo la matriz de almacenamiento compartida y adivina qué, esta solución puede ser un esfuerzo conjunto entre el administrador de la base de datos y el administrador de virtualización. O incluso podría ser solo el administrador de virtualización, según el nivel de reubicación admitido en ese hipervisor y esa base de datos.

Si se está preguntando: "Vaya, ¿qué quiere decir con esta reubicación? Dame un ejemplo específico ”. Por ejemplo, en VM donde puede usar VMotion para mover su máquina virtual de un host a otro y hacerlo sin tiempo de inactividad. Ahora, claramente esa imagen anterior todavía tenía algo de rojo. Todavía tenía el almacenamiento como un único punto de falla. Y así avanzamos a la siguiente solución que es, bueno, permítanme combinar el almacenamiento y la virtualización del servidor.

Ahora, en este caso, nuevamente, podría ser el administrador de almacenamiento y el administrador de virtualización quienes están creando esta solución y ahora miren: tengo una imagen sin rojo. Tengo alta disponibilidad porque puedo reubicar la máquina virtual o la aplicación o base de datos en ejecución de un servidor a otro y tengo virtualización en mi matriz de almacenamiento al hacer que realice RAID 1 en dos matrices de almacenamiento separadas. He modificado mis conmutadores y mis HBA.

Así que ahora he construido un sistema HA y lo he hecho principalmente no a nivel de base de datos. En otras palabras, he usado otras tecnologías para lograr lo mismo. Entonces, esta es una solución. Luego entramos en lo que se llama el clúster escalable de almacenamiento compartido. Realmente no es una solución de alta disponibilidad, pero nuevamente, me gusta mostrarla para la imagen.

Y lo que sucede aquí es que tenemos dos servidores que ejecutan una base de datos y se considera una base de datos. No son dos bases de datos separadas; No es como un amo y un esclavo, o un frío y un calor, o un activo y un modo de espera. Esto es, ambos nodos trabajan juntos para presentar una base de datos lógica. Entonces, lo que sucede es que, si un nodo en particular falla, todavía estás despierto. Por lo tanto, lo protege de fallas en el nivel del servidor y lo hace básicamente al dividir los recursos del nodo, si lo desea, pero aún tiene el único punto de falla en el fondo del disco. Entonces, este es un clúster escalable de almacenamiento compartido y Oracle llama a este Real Application Cluster o RAC.

Ahora, otra solución es utilizar un clúster de conmutación por error de almacenamiento compartido. Entonces, a la izquierda tengo un nodo activo, a la derecha tengo un nodo pasivo, tengo un latido en el medio. Tengo una matriz de almacenamiento compartida, y esto es crítico; Tienes que tener eso. Y básicamente, lo que sucede es que si el nodo activo encuentra problemas, el nodo pasivo puede hacerse cargo. Hay problemas de licencia para esto. Algunos proveedores de bases de datos le permiten tener el nodo pasivo con una licencia reducida por un tiempo fijo. En otros casos, debe tener una licencia duplicada completa. Todo depende de su proveedor de base de datos. Pero todos admiten este tipo de imagen que es, si un nodo se cae, el otro nodo puede hacerse cargo.

Y típicamente, este es uno de esos escenarios en los que es más o menos, cuando pasas del nodo activo al pasivo, probablemente, en la mayoría de las bases de datos, no en todas, vas a perder parte de la información transacciones de vuelo. Luego entramos en lo que realmente puede ver el administrador de la base de datos, que es la replicación de la base de datos, y hay dos formas diferentes de hacer la replicación de la base de datos.

Hay una replicación física, y lo que es importante es que, en el medio de esta imagen, se puede ver con la estrella verde, que la replicación está siendo realizada por la base de datos pero, al igual que la virtualización a nivel de almacenamiento, se está haciendo en el bloque nivel. Entonces, estamos repitiendo las E / S del bloque real desde el nodo activo al nodo de solo lectura o pasivo. Y esto se considera replicación física.

Ahora, déjenme pasar a la siguiente diapositiva porque es casi idéntica y es una replicación lógica y lo único que cambia en la imagen es que en el medio, en lugar de enviar el bloque de E / S, esencialmente enviamos el registro archivos con los comandos SQL en el mismo. En otras palabras, lo que estamos replicando no es la E / S física, sino los comandos que causan la E / S física.

Por lo tanto, esto a menudo se denomina envío de registros o replicación basada en registros. Algunos proveedores de bases de datos le ofrecen esto de forma nativa. Es posible que otros proveedores de bases de datos no ofrezcan esto, pero los proveedores externos lo ofrecen, por lo que esta es una solución de alta disponibilidad muy popular y se considera una solución completa. Pero esta solución es principalmente responsabilidad del DBA.

Entonces, no estoy usando la virtualización para lograr esto. Podría, pero no soy dependiente de eso. Y no estoy usando virtualización de almacenamiento. De nuevo, podría, pero no soy dependiente de ello. Pero estoy creando una solución con la base de datos como la característica principal de conducción. Entonces, esta es una replicación lógica.

Ahora, también es posible combinar bases de datos y virtualización de almacenamiento. Podría tener, en mi centro de datos, digamos, a la izquierda en azul, podría tener virtualización para el almacenamiento, de modo que no estoy obligado a que falle una matriz de almacenamiento en particular. Pero es posible que esté haciendo una replicación lógica o basada en registros a nivel de base de datos de un centro de datos a otro para que los comandos también se ejecuten en el centro de datos, lo que da como resultado E / S, pero no necesariamente la misma E / S, porque yo ' No envío el bloque de E / S, ni por la solución de almacenamiento ni por la base de datos, pero envío los registros y, por lo tanto, los comandos SQL.

Entonces, esta es una imagen muy común para organizaciones muy grandes. Y me gusta esta imagen aquí porque si tengo que configurar esto en las instalaciones utilizando una base de datos como Oracle, puedo hacerlo; Es una buena cantidad de trabajo, es bastante complejo, hay muchas partes móviles. Si hago esto en la nube, literalmente puedo decir, casilla de verificación, quiero dos regiones geográficas, quiero que las regiones estén separadas, ya sabes, en diferentes continentes, quiero virtualización a nivel de almacenamiento en una región geográfica particular. Incluso puedo decir que quiero la capacidad de hacer una asignación de tipo de virtualización o una definición de alta disponibilidad, y nuevamente, es otra casilla de verificación.

Y lo otro que me gusta de la nube es que a menudo hay otra casilla de verificación que dice: "No quiero lidiar con los parches, solo parchearlos", ya sabes, simplemente trabajar en el flujo de trabajo de todo lo demás que haces detrás de escenas, mantenme parcheado en todo momento. Y así, aunque algunas de estas imágenes se están volviendo muy complejas y pueden ser muy difíciles de hacer en las instalaciones, en realidad se están volviendo bastante fáciles de hacer en la nube.

Ahora, lo interesante es que es fácil marcar todas las casillas de verificación, pero adivina qué, eso cuesta más dinero mensualmente. Porque si está ejecutando dos centros de datos, ya sabe, tiene dos centros de datos en la nube que está utilizando, pagará más que si solo estuviera utilizando uno. Del mismo modo, si está haciendo el nivel de almacenamiento o la alta disponibilidad de virtualización como una capa adicional, nuevamente, puede haber costos adicionales.

Por lo tanto, es interesante que, si bien es difícil de hacer en el sitio y puede pensarlo demasiado, en la nube es tan fácil de hacer, puede pensarlo menos. Por lo tanto, siempre sepa cómo se ve la imagen y siempre sepa cuáles son las ramificaciones de costos para cualquier imagen que esté construyendo. Ahora, hay muchas más combinaciones de las que mostré aquí. Este no es un ejemplo completo o exhaustivo. Hay nuevas tecnologías que vienen a intervalos regulares, así que quién sabe, es posible que no haya mostrado una que acaba de aparecer en los últimos tres meses. Y la alta disponibilidad es mucho más común que hace diez años.

De hecho, no consideraría una exageración decir que para la mayoría de las organizaciones grandes es un requisito comercial obligatorio en estos días. Y me gusta volver a esta diapositiva porque acabo de decir que es un requisito comercial obligatorio. Y tengo estas dos mesas a la derecha. El superior está fuera de la documentación de SQL Server y el inferior está fuera de la documentación de Oracle. Y cuáles son estas, son tablas para ayudarlo a elegir, bueno, qué método de replicación debe usar.

Y observe que comienza con algunas preguntas muy simples. ¿Cuántos datos se me permite usar? Y si la respuesta es cero, sabe que solo puede, en ese gráfico superior, elegir la primera o la cuarta fila. Entonces haces otra pregunta. Bueno, ¿cuánto tiempo puedo tomar para la recuperación? Y si alguien dice, bueno, segundos o minutos, entonces eso toma decisiones por ti. Y luego, ¿la conmutación por error tiene que ser automática o requiere que alguien la haga manualmente? Y esa es otra pregunta de negocios. Pueden decir que lo quieren automático porque no quieren confiar, ya sabes, en un procedimiento de escalado y luego a alguien a quien se le asigna un boleto y luego resuelve el problema. Solo quieren que se arregle.

Estas son todas preguntas comerciales y son las mismas preguntas si bajo y hago lo mismo para Oracle. Y pregunto, OK, ¿qué tipo de falla permito, qué tipo de duración, qué puedo perder, cuál es el procedimiento de recuperación? Estas son todas opciones de negocios, por lo que si el negocio me dice las respuestas a tres o cuatro preguntas, mi trabajo es realmente fácil, solo vengo aquí, elijo el que coincida más y luego lo construyo. Y recuerde, en la nube, puede haber solo algunas casillas de verificación para implementarlas.

Y con eso, eso me lleva al final de mi material y al tiempo para abrirlo para preguntas.

Eric Kavanagh: Muy bien, Dez, ¿tal vez tú primero y luego Robin?

Dez Blanchfield: Absolutamente. De hecho, probablemente sea un poco injusto para aquellos que no están en Twitter, pero acabo de twittear una imagen de un gráfico que quiero visualizar en la mente de todos y luego quería enviar la pregunta a nuestro amigo experto en la llamada aquí. Cuando pienso en el código de propiedad versus el de código abierto en este espacio, que a menudo es de lo que hablamos, más o menos, de bases de datos de propiedad de Oracle y Microsoft, etc., en comparación con el código abierto, terminas con este desafío en el que el mundo de la propiedad el vendedor de software de internet o el desarrollador de software o la compañía invierte en los organismos para desarrollar esa complejidad. Y así, terminas con un escenario en el que compras el software y no necesitas invertir en muchas personas porque estás comprando la capacidad incorporada y en código abierto: no paga por el software o es de bajo costo, digamos, pero no paga por el software, pero debe invertir en los organismos.

Y estoy ansioso por tener su opinión sobre el malabarismo, particularmente ahora que nos estamos moviendo hacia modelos de nube donde puede obtener uno u otro. Puede ir a AWS o Azure y su Rackspace, lo que sea, y comprar como un servicio que proporciona su plataforma de base de datos, o puede hacerlo a través del código fuente abierto. Y de lo que acabamos de hablar, ¿cuál es el malabarismo entre el propietario y el código abierto y cómo los patrones de diseño de los que está hablando surten efecto y cuáles son sus pensamientos generales sobre este tema a medida que avanzamos, particularmente en cuanto a la disponibilidad?

Bert Scalzo: Uno de los grandes elementos con los que me encuentro cuando intento abordar esa pregunta, vuelvo al cliente y les pregunto sobre sus requisitos de rendimiento. Y la razón por la que hago eso es que he descubierto, al menos históricamente y en mi propia experiencia, que cuando se trata de clientes que necesitan un alto rendimiento en su replicación, casi siempre estoy mejor con la replicación que proporciona la base de datos proveedor, debido a la naturaleza de que está más intrínsecamente integrado y está en un nivel inferior, y a veces utiliza mecanismos que no están disponibles para el mundo exterior, incluso en una solución de código abierto.

Y te daré un buen ejemplo de un caso que tuve. Tenía una empresa basada en Internet que usaba MySQL como su base de datos y estaban en una versión anterior de MySQL, como la Versión 4.0, y la replicación entre sus nodos era el factor limitante de cuán grande podían escalar sus bases de datos. Y estaban buscando comprar una solución de terceros, luego estaban viendo, "Bueno, tal vez podamos usar una de las soluciones de código abierto". Y lo que realmente se redujo a esto fue que todo lo que tenían que hacer era actualizar su MySQL a la Versión, creo que fuimos 5.5, porque la diferencia entre esas dos versiones de la base de datos estaba en la Versión 4.0 de la replicación de MySQL. en la versión 5.0 era, y ese era realmente el mejor camino para ellos.

Ahora, miramos las otras opciones, pero el factor decisivo fue el rendimiento y permanecer con la solución del proveedor de la base de datos, y hacer la actualización de la base de datos en realidad terminó siendo nuestra mejor solución para obtener la mayor probabilidad de obtener el rendimiento que necesitaban. La mayor disponibilidad.

Dez Blanchfield: Sí, eso refleja mi propio pensamiento, para ser honesto. Solo para una divulgación completa, y no voy a entrar en marcas, pero he venido de un fondo propietario que trabaja para OEM y vendedores de software y COI en general, y esa ha sido definitivamente mi experiencia y al mismo tiempo soy muy profesional. -Open-source y soy un contribuidor de código para un montón de proyectos que no vamos a nombrar, pero estoy de acuerdo contigo en que si eres una gran organización, digamos que eres un banco, o lo que sea que puedas be - invariablemente no quieres ser una tienda de TI. Usted sabe, por ejemplo, si es un editor de periódicos o si es un minorista, no quiere ser una tienda de TI que publica periódicos, quiere ser una tienda de periódicos que en realidad solo aproveche las TI.

Y, por lo tanto, invertir en las capacidades patentadas donde los desarrolladores de software crean toda esa capacidad, el equilibrio de carga, etc., en la herramienta, tiene mucho más sentido en comparación con si eres, como, una startup de puntocom o algo así así que puede invertir en cuerpos humanos. ¿A dónde ves esto?

Probablemente mi última pregunta antes de entregarle al Dr. Robin Bloor, porque sé que nos estamos quedando sin tiempo. ¿Adónde ve esto desde el punto de vista de la tendencia? Entonces, estás ahí afuera todo el tiempo, estás al borde de las cosas, estás viendo que la gente se ha sentado y prestado atención y se ha dado cuenta de la necesidad de hacer de esto una parte comercial de su día a día. conversación de un día de vuelta a la sala de juntas? ¿O todavía lo ves como la granja geek, los técnicos y los sudaderas con capucha pensando en la disponibilidad porque les hace despertarse a las cuatro de la mañana cuando algo se desconecta?

¿Crees que la tendencia ahora está cambiando hacia organizaciones de todos los tamaños, no las obvias, como las aerolíneas y la banca y las finanzas, sino solo las empresas en general? ¿Crees que las personas realmente han perdido su propuesta de valor para proteger sus entornos de bases de datos y proporcionar alta disponibilidad e invertir en eso, o crees que todavía tenemos un camino por recorrer? ¿Cuál es el sentido general en el mercado por ahí?

Bert Scalzo: En este momento, creo que todavía hay una brecha, pero no es una brecha porque el negocio no lo pide, es una brecha en los niveles de comunicación entre los dos lados de la valla. En otras palabras, la gente de negocios dice muy claramente: "Estas aplicaciones requieren alta disponibilidad y tienen estos requisitos específicos cuando decimos alta disponibilidad".

Y de una forma u otra ese mensaje no se está transmitiendo claramente a la gente de tecnología. O la gente de tecnología volverá y dirá: "Oh, bueno, eso es complicado y le costará más dinero", y esto, lo otro. Creo que lo que sucederá es que finalmente se erosionará porque, honestamente, al estar, por ejemplo, en la nube, solo marcando algunas casillas aquí o allá para decir: "Construyeme esta estructura tecnológica realmente compleja", hay realmente no hay una buena razón para que la gente de tecnología regrese y diga a la gente de negocios: "Oh, es caro" o "Es difícil de hacer", o esto o aquello, y la gente de negocios está empezando a saber que ese es el hecho.

E incluso he visto en entornos donde, ya sabes, su propia gente de TI vendrá y dirá: “Oh, no puedes tener lo que quieres. Es demasiado costoso ". Y traerán una firma consultora externa que luego dirá:" No, eso no es correcto. Así es como puedes hacerlo. Esto es lo que le costará ”. Entonces, creo que todavía tenemos un poco de tiempo entre los niveles de comunicación entre las dos partes antes de que eso se vuelva automático.

Dez Blanchfield: Sí, eso definitivamente refleja lo que he visto aquí en Australia y alrededor de Asia Pacífico. Estoy seguro de que es algo global. Y es que muchos de los tomadores de decisiones clave desde la sala de juntas, todos los jefes de línea de negocios, son 'mucho más expertos técnicamente: están leyendo los blogs, están viendo seminarios web, están sintonizados en varios artículos y podcasts y van a eventos y foros y reuniones y ahora conocen sus opciones y saben que la nube es una opción.

También saben que pueden aportar esa capacidad interna, como dijiste, y creo que hay un desafío interesante ahora, esa conversación que tiene lugar, que es básicamente lo que hemos hecho hoy donde la gente, más o menos, comience a hacer cosas internamente y simplemente realice almuerzos de bolsos marrones y tenga una sesión informativa interna sobre cuál es nuestro estado actual, cuál es nuestro estado ideal, ¿a dónde debemos llegar? Y luego, más o menos, juntar eso.

Tenía un mensaje privado que voy a tocar rápidamente en este momento. Alguien hizo una pregunta: "¿Es realista que pueda obtener una disponibilidad del 100 por ciento?" Y es posible que pueda corregirme aquí, pero voy a decir que sí. He creado una plataforma para una transferencia electrónica de fondos, una puerta de enlace EFTPOS entre plataformas bancarias rápidas y los terminales EFTPOS. Construí esto a principios de la década de 2000. En realidad, ha estado en línea el 100 por ciento del tiempo durante 17 años. De hecho, se construyó antes de la década de 2000, pero su producción solo fue 2000/2001 aproximadamente.

Entonces, los 17 años han estado vigentes desde el desarrollo hasta las pruebas y luego entrar en producción. En esos 17 años, las PC comerciales de muy bajo costo, que ejecutan un sistema operativo de código abierto, pero una base de datos patentada, han estado haciendo un intercambio activo / pasivo cada 90 días, con diferentes patentes de diseño aplicadas, con replicación de discos en cada servidor, replicación de datos entre servidores modelo, replicación de múltiples centros de datos, y volteo desde el centro de datos A haciendo producción durante 90 días y luego volteando al centro de datos B y haciendo producción.

Y a medida que cambia, automáticamente parches y actualizaciones así que solo a la pregunta que acabo de recibir en privado, sí, es posible, pero con una gran inversión en ese proyecto desde el punto de vista del diseño. Entonces, la infraestructura en realidad no era tan costosa, pero el diseño, las pruebas y la implementación fueron muy costosas para conseguirlo. Entonces, no tuvimos que gastar mucho dinero en hardware e infraestructura, pero utilizamos herramientas muy inteligentes, en el día en que la nube ni siquiera era una moneda.

Entonces, la respuesta es sí, se puede hacer, aún más ahora con la nube, como acabamos de escuchar, con solo hacer clic en un botón puede habilitar esa capacidad. Voy a arrojarle eso a Robin porque estoy seguro de que él también tiene preguntas. Pero muchas gracias por responder mis preguntas y realmente me encantó escuchar su mensaje hoy. Completamente a bordo con todo eso porque refleja todo lo que he estado haciendo durante los últimos 30 años.

Dr. Robin Bloor: Bueno, está bien, lo recogeré. Una de las cosas que me fascinó acerca de su presentación fue la cantidad de opciones que están disponibles ahora que no estaban disponibles cuando solía tener problemas con estas cosas. ¿Estoy interesado en quién diseñará estas configuraciones o quién, hoy en día, diseña estas configuraciones? Lo que solía suceder, o el mundo al que estoy acostumbrado, es que habría un sistema transaccional bastante pesado y usted estaría interesado en un alto tiempo de actividad y una alta disponibilidad. Porque, ya sabes, el sistema transaccional, sería costoso si cayera de alguna manera. Y no tendrías todas las opciones que me acabas de presentar, pero de una forma u otra, podrías encontrar una manera, a través de la replicación en su mayoría, para crear un modo de espera activo que no haga clic inadvertidamente, pero Te daría un servicio degradado hasta que regreses.

Y estoy, más o menos, mirando lo que me mostrabas y pensando en ello, sin haber realizado ninguno de esos trabajos de diseño durante 15 años, ¿quién está haciendo ese trabajo ahora? ¿Es esto, como lo fue en mi día, algo que hiciste al inicio de un proyecto, ya sabes, poner en funcionamiento la infraestructura? ¿O es algo que es una actividad continua dentro de una organización? Porque hay nuevas opciones tecnológicas que aparecen.

Bert Scalzo: En las grandes empresas que son muy eficientes y efectivas en todas sus operaciones, incluida su TI, por lo general tendrán un grupo de arquitectura centralizado, o tendrán un nombre para él, lo he escuchado llamar "el grupo de arquitectura ”muchas veces. Y será su responsabilidad conocer todas estas diferentes imágenes y cuáles son los pros y los contras y cuáles son los costos. Y lo que sucederá es, cuando una aplicación en particular está buscando y dice: "Oye, tengo que cumplir con los requisitos comerciales X, Y y Z. Oye, equipo de arquitectura, ¿cuáles son mis opciones?"

Les darán la respuesta, como, aquí están los dos o tres que están disponibles, y luego, en ese punto, la decisión vuelve al nivel inferior al equipo de aplicación o al patrocinador comercial de la aplicación. Pero generalmente, hay un grupo centralizado que se mantiene al tanto de esto y que tiene esa información lista y preconstruida.

Ahora, son las empresas medianas donde no es tan formal. Lo que tenderá a suceder es que obtendrá uno o dos de sus administradores de sistemas o administradores de bases de datos de alto nivel y, de manera informal, citarán al "experto en dominios" para ese tipo de experiencia. Entonces, incluso en las empresas medianas sucede, simplemente sucede en una estructura no formalizada.

Dr. Robin Bloor: Eso es realmente interesante. En mi día, nunca estaríamos pensando en una alta disponibilidad, excepto en los sistemas transaccionales. Bueno, hoy en día, por supuesto, tienes sistemas de transmisión que están sujetos a demandas aún mayores en términos de disponibilidad. Pero, en el entorno basado en consultas, back-end, análisis, almacén de datos, tipo DI, ¿alguna vez ve requisitos para una alta disponibilidad allí?

Bert Scalzo: Sí, y me alegra que hayas hecho esa pregunta. Trabajé un poco para una empresa minorista y sus decisiones estratégicas para el negocio se basaron en gran parte en el análisis que harían desde el almacén de datos. Y, de hecho, fueron entrevistados por la revista Forbes y el CEO de la compañía dijo: "Hey, nuestro precio de las acciones creció un 250 por ciento en los últimos cinco años y una razón muy importante es que sabemos cómo aprovechar nuestros datos de manera efectiva en nuestro almacén de datos ”. Eran tan buenos en la toma de decisiones comerciales que, para ellos, el almacén de datos y la capacidad de hacer esos análisis, poder tomar decisiones diariamente con respecto a sus datos operativos, en realidad era para ellos, Un sistema de producción.

Y te daré un buen ejemplo de lo importante que es. Con este vendedor minorista en particular, el tipo que era responsable de las ventas de cerveza, era, como, el tercer ejecutivo más importante de la compañía, porque aportó, ya sabe, 60, 70 por ciento de los ingresos. Y así, tenía que poder, para mantenerse competitivo en ese mercado, tenía que poder saber todos los días, ya sabes, qué promociones debería llevar a cabo. Y eso podría basarse, no solo en la época del año, sino también en el clima, los patrones y otros datos críticos que pueden afectar la venta de algo como la cerveza.

Dr. Robin Bloor: Bueno, supongo que seguramente habrá cosas así. Estamos fuera de tiempo, creo que debería entregar a Eric en caso de que tenga algunas preguntas de la audiencia. Eric?

Eric Kavanagh: Sí, todo esto ha sido genial, Bert. Creo que abordó todas las preguntas que teníamos de la audiencia en su presentación. Pero es divertido de ver. Me alegro de que usted haya hablado sobre la virtualización del almacenamiento y el impacto que puede tener. Entonces, todo esto es bueno.

Bueno, amigos, archivamos todos estos webcasts para verlos más tarde. Entonces, vaya en línea a Techopedia.com para buscar la sección de transmisión web. Todos esos Hot Techs se enumerarán allí. Muchas gracias a nuestro amigo Bert por su experiencia. Y, por supuesto, a Dez y Robin. Y con eso vamos a despedirnos, amigos. Cuídate. Hablaremos la próxima vez. Adiós.

Proteja su base de datos: alta disponibilidad para datos de alta demanda