Hogar Audio Análisis de borde: la economía iot por fin

Análisis de borde: la economía iot por fin

Anonim

Por el personal de Techopedia, 22 de septiembre de 2016

Para llevar: la presentadora Rebecca Jozwiak habla sobre análisis de vanguardia con el Dr. Robin Bloor, Dez Blanchfield y Shawn Rogers de Dell Statistica.

Actualmente no has iniciado sesión. Inicia sesión o regístrate para ver el video.

Rebecca Jozwiak: Damas y caballeros, hola y bienvenidos a Hot Technologies de 2016. Hoy tenemos "Edge Analytics: The IoT Economy at Last". Mi nombre es Rebecca Jozwiak. Seré tu moderador para el webcast de hoy. Tuiteamos con un hashtag # HOTTECH16 si quieres unirte a la conversación de Twitter.

Entonces, el IoT, definitivamente un tema candente este año y el internet de las cosas, se trata realmente de los datos de la máquina, los datos del sensor, los datos de registro, los datos del dispositivo. Ninguno de los cuales es nuevo, hemos tenido ese tipo de datos para siempre, pero es que realmente no hemos podido usarlo y ahora estamos viendo solo un montón de nuevas formas de usar esos datos. Particularmente en la industria médica, los mercados financieros, con petróleo y gas, productos básicos, es solo una gran cantidad de información que previamente no se había aprovechado. Y no mucha gente realmente ha entendido bien cómo hacerlo bien. Estamos hablando de una gran cantidad de datos pequeños, pero son muchos datos y, ya sabes, hay problemas de red involucrados, hay hardware involucrado o necesita ser procesado, y ¿cómo lo hace sin obstruir su sistema? Bueno, eso es lo que vamos a aprender hoy.

Aquí está nuestra línea de expertos. Tenemos al Dr. Robin Bloor, nuestro analista jefe en The Bloor Group. También tenemos a Dez Blanchfield, nuestro científico de datos en The Bloor Group. Y estamos felices de tener a Shawn Rogers, director de marketing global y canales de Dell Statistica. Y con eso, voy a pasarle el balón a Robin.

Dr. Robin Bloor: Bien, gracias por eso. Pulsaré un botón y tiraré un tobogán. No tengo idea de por qué creé esta imagen apocalíptica para internet de las cosas. Posiblemente porque creo que al final será caótico. Seguiré adelante. Esto es normal para el curso en cualquier presentación de IoT. Tienes, de una forma u otra, decir algo escandaloso sobre a dónde va todo. Y en realidad, la mayor parte de esto es probablemente cierto. Si realmente observa la forma en que estas curvas se expanden gradualmente. Ya sabes, las computadoras personales, los teléfonos inteligentes y las tabletas probablemente seguirán aumentando. Los televisores inteligentes probablemente aumentarán. Wearables, probablemente están explotando en este momento, en comparación con lo que eran hace unos años. Automóviles conectados, inevitable que casi todos los automóviles se conecten completamente y transmitan datos todo el tiempo. Y todo lo demás. Y este gráfico particular de BI Intelligence indica que todo lo demás superará las cosas obvias muy, muy rápidamente.

Entonces, ¿qué decir sobre el IoT? Lo primero es solo un punto arquitectónico. Ya sabes, cuando tienes datos y tienes que procesarte, de una forma u otra, tendrás que juntar los dos. Y con los datos en los volúmenes que están ahora, y reunidos en varios lugares, los dos ya no están naturalmente juntos. Supongo que solían estar en los viejos tiempos del mainframe. Por lo tanto, puede pensar en términos de una capa de procesamiento, una capa de transporte y una capa de datos. Y de una forma u otra, la capa de transporte hoy en día va a mover el procesamiento o mover los datos a través de las redes. Aquí están las opciones: puede mover los datos al procesamiento, puede mover el procesamiento a los datos, puede mover el procesamiento y los datos a un punto de ejecución conveniente, o puede fragmentar el procesamiento y fragmentar los datos. Y con respecto al Internet de las cosas, los datos ya están fragmentados al nacer y lo más probable es que gran parte del procesamiento se fragmente para que las aplicaciones que se deben ejecutar puedan tener lugar.

Así que pinté un cuadro. Lo interesante para mí sobre el IoT, hablo de un dominio de agregación en este diagrama, y ​​señalo que hay subdominios. Entonces, puede imaginar que el dominio IoT 1 aquí es un automóvil de algún tipo, y el dominio 2 y el dominio 3 y el dominio 4 son automóviles de algún tipo, y agregará datos localmente, ejecutará aplicaciones locales en esos datos, y Pondrás varias cosas en acción. Pero para tener análisis sobre todos los autos, tendrá que transferir datos al centro, no necesariamente todos los datos, pero tendrá que agregarse en el centro. Y si piensa en esto, es posible que desee tener muchos, muchos dominios de agregación diferentes para el mismo conjunto de cosas de IoT. Y los dominios mismos podrían agregarse aún más. Entonces podrías tener esta jerarquía repetitiva. Y básicamente lo que tenemos allí es una red increíblemente compleja. Mucho más complejo que todo lo que teníamos que tener antes.

Tengo una nota al final aquí. Todos los nodos de red, incluidos los nodos hoja, pueden ser creadores de datos, almacenes de datos y puntos de procesamiento. Y eso le da la posibilidad de distribución, algo que no hemos visto antes. Dez hablará un poco más sobre eso, así que pasaré a este punto en particular. Una vez que estamos en Internet de las cosas y todos los datos se han convertido en eventos, el punto de esta diapositiva es solo para indicar que tendremos que estandarizar los eventos. Vamos a tener que, al menos, vamos a tener que tener esto. Tendremos la hora en que ocurrió el evento, la ubicación geográfica en la que ocurrió, la ubicación virtual o lógica del proceso que lo creó, el dispositivo fuente que lo creó, la identificación del dispositivo para que sepa exactamente qué dispositivo fuente lo creó, la propiedad de los datos y actores, aquellas personas que tienen derecho a usar los datos de una forma u otra, tendrán que llevar consigo sus permisos, lo que significa que realmente tendrá que llevar seguridad con ellos, y luego hay Los datos en sí. Y cuando miras esto, te das cuenta de que, sabes, incluso si tienes un sensor que no hace más que informar la temperatura de algo cada segundo más o menos, en realidad hay una gran cantidad de datos solo para identificar exactamente dónde están los datos originado y lo que realmente es. Por cierto, esta no es una lista exhaustiva.

Entonces, en términos del futuro panorama de TI, la forma en que lo veo es la siguiente: que no se trata solo de Internet de las cosas, también está el hecho de que estaremos en un mundo de actividades impulsadas por eventos, y por lo tanto tendrá que tener arquitecturas basadas en eventos, y esas arquitecturas tendrán que abarcar grandes redes. Y la otra cosa es todo en tiempo real, no es necesariamente el caso para que seamos en tiempo real, pero hay algo a lo que me refiero como tiempo de negocios, que es el tiempo dentro del cual los datos realmente deben ser entregados y listos a procesado. Eso podría no ser, ya sabes, un milisegundo después de que se haya creado. Pero siempre hay un momento para cada dato y una vez que tiene una arquitectura basada en eventos, comienza a ser más sensato pensar en términos de un enfoque en tiempo real de la forma en que funciona el mundo.

Entonces, reduciéndolo, porque de lo que realmente estamos hablando es de análisis en el IoT. A pesar de todo eso, todavía se trata de tiempo para la comprensión, y no es solo tiempo para la comprensión, la comprensión debe ser seguida por acciones. Entonces, el tiempo para la comprensión y el tiempo para la acción es a lo que lo resumiría. Dicho esto, le devolveré el balón a Dez.

Dez Blanchfield: Gracias Robin. Perspicaz como siempre. Me encanta el hecho de que es un acto difícil de seguir en cada caso, pero haré lo mejor que pueda.

Una de las cosas que estoy viendo, y a menudo me entretiene, para ser honesto, y no en una forma sesgada y negativa, pero hay mucha preocupación y pánico sobre el internet de las cosas que se apoderan del mundo y nos ubicará y comenzará a perder sus datos, por lo que quiero echar un vistazo a algunas de las cosas que hemos hecho antes en las últimas dos o tres décadas que fueron un facsímil cercano a Internet de cosas, pero tal vez no del todo a la misma escala. Y solo para demostrarnos que hemos estado aquí y hemos resuelto algunos de los problemas, no a este nivel de escala y no a esta velocidad. Porque significa que realmente podemos resolver el problema y que sabemos cuáles son algunas de las respuestas; solo tenemos que agacharnos y volver a aplicar algunos de los aprendizajes que tuvimos antes. Y sé que esta es toda la conversación que estamos a punto de tener y tengo toda una gama de cosas divertidas para conversar en la sección de preguntas y respuestas.

Pero cuando pensamos en Internet de las cosas en el círculo, hay una gran centralización actualmente en un nivel de diseño que se escribió en los primeros días. Los dispositivos Fitbit, por ejemplo, tienden a ir a un lugar central y es probable que estén alojados en una plataforma en la nube en algún lugar y todos los datos de todos esos dispositivos lleguen a la misma, digamos, front-end de una pila, incluyendo web y aplicación y servicios basados ​​en datos. Pero con el tiempo, esa escala requerirá una reingeniería para hacer frente a la cantidad de datos que les llega y la rediseñarán para que haya múltiples front-end y múltiples copias de la pila en múltiples ubicaciones y regiones. Y estamos viendo esto y hay una serie de ejemplos que les voy a dar que podemos discutir.

El punto clave de esto es que a pesar de que hemos visto algunas de estas soluciones que estoy a punto de cubrir, la escala y el volumen de los datos y el tráfico de red que generará Internet de las cosas requiere urgentemente un cambio desde el centro a arquitecturas distribuidas en mi opinión, y lo sabemos, pero no necesariamente hemos comprendido cuál es la solución. Cuando pensamos en el concepto de lo que es Internet de las cosas, es un modelo de red a gran escala. Son muchísimas cosas las que ahora están haciendo ruido. Cosas que no hacían ruido hasta hace poco. Y de hecho, creo que fue ayer, estaba hablando en broma sobre la pila, pero fui a comprar una nueva tostadora y venía con una opción que podía decirme varias cosas, incluso cuando necesitaba limpieza. Y un nuevo microondas con una función muy similar e incluso podría hacer ping a una aplicación en mi teléfono para decir que lo que estaba recalentando ya estaba hecho. Y soy muy de la opinión de que si hay un par de cosas que no quiero hablar conmigo es mi refrigerador, microondas y tostadoras. Me siento bastante cómodo con ellos como dispositivos tontos. Pero tengo un auto nuevo recientemente, un pequeño Audi, y me habla y estoy bastante satisfecho con eso, porque las cosas de las que habla son cosas de interés. Como actualizar mapas en tiempo real para decirme dónde hay una mejor ruta para llegar del punto A al punto B porque se detecta tráfico a través de varios mecanismos con datos que se envían.

Tengo esta diapositiva Ya hemos visto que los modelos de red de gran volumen requieren un cambio de captura central y distribuida y entrega de procesamiento de datos y modelos analíticos. Hemos visto cómo las cosas se mueven desde los tres pequeños diagramas gráficos en el borde derecho donde tenemos, el que está a la izquierda de los tres, hay un modelo centralizado con todos los pequeños dispositivos que llegan a la ubicación central y recopilan datos y la escala no es tan buena, se las arreglan muy bien allí. En el medio, tenemos un modelo y un centro un poco más descentralizados y hablamos, que es lo que creo que vamos a necesitar con Internet de las cosas en la próxima generación. Y luego, en el lado derecho, tenemos esta red totalmente distribuida y enredada, que es donde el Internet de las cosas y de máquina a máquina irá a muy corto plazo en el futuro, pero no estamos del todo allí por una variedad de razones. Y predominantemente porque estamos utilizando plataformas de Internet para la mayoría de las comunicaciones hasta el momento y no hemos construido una segunda red para transportar muchos de estos datos.

Ya existen segundas redes, como la red Batelco. Mucha gente no piensa en el hecho de que las redes de telecomunicaciones no son internet. Internet es una cosa muy separada en muchos sentidos. Enrutan datos desde teléfonos inteligentes a través de las redes telefónicas, y luego a través de las redes telefónicas y hacia Internet en general, donde en realidad los están colocando en capas en dos redes. Pero es completamente posible y probable que Internet de las cosas necesite otra red. Hablamos de Internet industrial como un tema general, que no vamos a entrar en detalles ahora, pero esencialmente estamos hablando de otra red que está específicamente diseñada para los tipos de transporte de datos o Internet de cosas y máquina a máquina. comunicación.

Pero algunos de los ejemplos que quería compartir en los que hemos visto que las redes de gran volumen y los datos distribuidos funcionan muy bien son cosas como Internet. Internet fue diseñado y diseñado específicamente desde el primer día para ser capaz de sobrevivir a una guerra nuclear. Si se explotan partes de los EE. UU., Internet se diseñó para que los datos puedan moverse por Internet sin pérdida de paquetes por razones por las que todavía estamos conectados. Y eso todavía existe hoy a escala global. Internet tiene múltiples capacidades de redundancia y paquetes de enrutamiento. Y, de hecho, Internet está controlado por una cosa llamada BGP, Border Gateway Protocol, y el Border Gateway Protocol, BGP, está específicamente diseñado para hacer frente a un enrutador, conmutador o servidor inactivo. Cuando envía o recibe un correo electrónico, si envía tres correos seguidos no hay garantía de que cada uno de esos correos electrónicos siga la misma ruta hacia el mismo destino final. Pueden moverse a través de diferentes partes de Internet por varias razones. Podría haber una interrupción, podría haber ventanas de mantenimiento donde las cosas están fuera de línea para actualizarse, podría haber congestión en la red, y vemos eso con redes de tráfico con automóviles y transporte público y barcos y aviones. Obtenemos contenido a nuestros dispositivos como nuestras computadoras portátiles y tabletas y computadoras a través de navegadores y demás todos los días a través de redes de entrega de contenido. Las redes de entrega de contenido consisten en tomar copias de contenido de su plataforma de servicio principal, como el servidor web, y mover copias de eso y el caché pequeñas cantidades al borde de la red y solo entregárselo desde la parte más cercana del borde.

Anti-spam y ciberseguridad: si se produce un evento de spam en Canadá y Microsoft lo detecta y ve que se envían muchas copias del mismo correo electrónico a un grupo de personas al azar, se toman las sumas de verificación, se firma una firma para ese mensaje creado y puesto en una red y distribuido inmediatamente. Y para que el correo electrónico nunca llegue a mi bandeja de entrada, o si lo hace, se etiqueta como spam inmediatamente porque se ha detectado en otro lugar en el borde de la red. Entonces, otras partes del borde de la red reciben información sobre esta firma de mensaje de spam y se coloca en el índice de una base de datos y si esos mensajes comienzan a aparecer en el otro lado del planeta, los detectamos y sabemos que son spam. Y lo mismo se aplica a la ciberseguridad. Un hack que se está llevando a cabo en un lado del planeta es detectado y registrado y mapeado y, de repente, en la otra parte de la red podemos combatirlo y archivar las reglas y políticas y cambiar para ver si podemos bloquearlo. Particularmente con el nuevo impacto de cosas como la denegación de servicio o la denegación de servicio distribuida, donde miles de máquinas se utilizan para atacar un sitio web central.

Bitcoin y blockchain son, por defecto, en su naturaleza un libro mayor distribuido, blockchain, y hace frente a cualquier interrupción o rotura en la red. Detección y prevención de fraude, servicios de energía y agua: estamos viendo, usted conoce la red eléctrica, si una parte de la red recibe un árbol y saca un poste y un cable, mi casa aún recibe energía. Ni siquiera lo sé, a menudo ni siquiera lo veo en las noticias. Y todos estamos acostumbrados a las redes de transporte donde originalmente había un modelo centralizado, "Todos los caminos conducían a Roma", como dicen, y finalmente tuvimos que ir al modelo descentralizado con centros y radios, y luego fuimos a una red de malla donde se puede llegar de un lado de la ciudad al otro a través de varias rutas de malla y diferentes intersecciones. Entonces, lo que vemos aquí es que este modelo centralizado de lo que estamos haciendo ahora con Internet de las cosas tendrá que llegar al límite de la red. Y esto se aplica a la analítica más que nunca, y es que necesitamos impulsar la analítica a la red. Y para hacer eso se requiere un enfoque completamente nuevo en cómo accedemos y procesamos esos datos y las corrientes de datos, en mi opinión. Estamos hablando de un escenario en el que creo que vemos una inteligencia limitada al límite de la red en dispositivos conectados a Internet, pero pronto veremos que esos dispositivos aumentan su inteligencia y aumentan el nivel de análisis que desean. que hacer. Y como resultado de eso, vamos a necesitar impulsar esos conocimientos cada vez más a través de la red.

Por ejemplo, aplicaciones inteligentes y redes sociales: si pensamos en las redes sociales y algunas de las aplicaciones inteligentes, siguen siendo muy centrales. Ya sabes, solo hay dos o tres centros de datos para los gustos de Facebook. Google se ha vuelto mucho más descentralizado, pero todavía hay un número limitado de centros de datos en todo el mundo. Luego, cuando pensamos en la personalización de contenido, debe pensar en un nivel muy local. Mucho de eso se está haciendo en su navegador o en una capa de red de entrega de contenido local. Y pensamos en los rastreadores de salud y estado físico: muchos de los datos que se recopilan de ellos se analizan localmente, por lo que las nuevas versiones de los dispositivos Garmin y Fitbit que coloca en su muñeca se están volviendo cada vez más inteligentes en el dispositivo . Ahora no envían todos los datos sobre su frecuencia cardíaca a un servidor centralizado para intentar realizar los análisis; Están construyendo esa inteligencia directamente en el dispositivo. Navegación en el automóvil, solía ser que el automóvil constantemente recibiría actualizaciones y mapas desde una ubicación central, ahora la inteligencia está en el automóvil y el automóvil toma decisiones por sí mismo y, finalmente, los automóviles se mezclarán. Los automóviles se hablarán entre sí a través de redes inalámbricas de alguna forma, que puede ser a través de una red inalámbrica 3G o 4G en la próxima generación, pero eventualmente será de dispositivo a dispositivo. Y la única forma en que vamos a hacer frente al volumen es haciendo que los dispositivos sean más inteligentes.

Ya tenemos sistemas de advertencia de emergencia que recopilarán información localmente y la enviarán centralmente o en una red de malla y tomarán decisiones sobre lo que sucede localmente. Por ejemplo, en Japón, hay aplicaciones que las personas ejecutan en sus teléfonos inteligentes con acelerómetros en el teléfono inteligente. Los acelerómetros en el teléfono inteligente detectarán las vibraciones y el movimiento y pueden determinar la diferencia entre el movimiento normal del día a día y los temblores y sacudidas de un terremoto. Y ese teléfono comenzará a alertarlo de inmediato, localmente. La aplicación real sabe que detecta terremotos. Pero también comparte esos datos a través de una red en un concentrador distribuido y un modelo de radio para que las personas cercanas a usted sean advertidas de inmediato o lo antes posible a medida que los datos fluyen a través de la red. Y finalmente, cuando llega a una ubicación central o una copia distribuida de la ubicación central, empuja a las personas que no están en el área inmediata, que no han detectado el movimiento del planeta, pero deben ser advertidos de ello porque tal vez viene un tsunami.

E infraestructura de ciudad inteligente: el concepto de infraestructura inteligente, ya estamos construyendo el intelecto en edificios inteligentes e infraestructura inteligente. De hecho, ayer estacioné mi auto en la ciudad en una nueva área donde parte de la ciudad está siendo restaurada y reconstruida. Y han vuelto a hacer todas las calles, y hay sensores en las calles, y el parquímetro real sabe que cuando he conducido con un automóvil, sabe que cuando vaya a refrescarme por el límite de dos horas que el auto no se ha movido, y en realidad no me permitió recargar y quedarme por otras dos horas. Tenía que subirme al auto, salir del espacio y luego regresar para engañarlo y permitirme permanecer allí durante otras dos horas. Pero lo interesante es que eventualmente iremos al punto en el que no solo se está detectando el automóvil que ingresa al área como un sensor localizado, sino cosas como características ópticas en las que se aplicará el reconocimiento con cámaras mirando mi placa de matrícula, y sabrá que en realidad solo saqué y volví a entrar y lo engañé, y simplemente no me deja renovar y seguiré adelante. Y luego distribuirá esos datos y se asegurará de que no pueda hacerlo en ningún otro lugar y también engañará a la red de manera continua. Debido a que, por naturaleza, tiene que ser más inteligente, de lo contrario todos continuaremos engañándolo.

Hay un ejemplo de esto en el que realmente he vivido personalmente, donde en tecnología de firewall, a finales de los 80 y principios de los 90, un producto llamado Check Point FireWall-1. Una tecnología de cortafuegos muy simple que utilizamos para crear reglas y crear políticas y reglas en torno a ciertas cosas para decir que los tipos de tráfico a través de ciertos puertos y direcciones IP y redes para ir y venir entre sí, el tráfico web de un lugar a otro, pasando del navegador y cliente final a nuestro servidor final. Resolvimos este problema eliminando la lógica de los firewalls y moviéndola al ASIC, el circuito integrado específico de la aplicación. Estaba controlando los puertos en los conmutadores Ethernet. Descubrimos que las computadoras del servidor, las computadoras que en realidad estábamos usando como servidores para tomar decisiones como firewalls, no eran lo suficientemente potentes como para manejar el volumen de tráfico que pasaba por ellas para cada inspección de paquetes. Resolvimos el problema moviendo la lógica requerida para hacer la inspección de paquetes y las detecciones de Internet a los conmutadores de red que se distribuyeron y pudieron manejar el volumen de datos que pasaba por el nivel de la red. No nos preocupamos a nivel centralizado con firewalls, lo trasladamos a los conmutadores.

Y entonces hicimos que los fabricantes construyeran la capacidad para que empujáramos rutas, reglas y políticas en el conmutador Ethernet para que en el nivel de puerto Ethernet real, y tal vez mucha gente en el grupo no esté familiarizada con esto porque estamos Todos vivían en un mundo inalámbrico ahora, pero había una vez que todo tenía que conectarse a través de Ethernet. Ahora, a nivel del puerto Ethernet, estábamos inspeccionando los paquetes para ver si incluso se permitía que los paquetes se movieran al conmutador y a la red. Algo de esto es lo que estamos resolviendo ahora en torno a este desafío de capturar datos en la red, específicamente de los dispositivos IRT, e inspeccionarlos, analizarlos y probablemente analizarlos en tiempo real para tomar decisiones al respecto. Y algo de esto es para obtener información sobre inteligencia empresarial e información sobre cómo los humanos toman mejores decisiones y otros análisis y rendimiento para el nivel de máquina a máquina donde los dispositivos están hablando con los dispositivos y tomando decisiones.

Y esta será una tendencia que tenemos que buscar resolver en el futuro inmediato porque si no lo hacemos, acabaremos con esta avalancha de ruido. Y hemos visto en el mundo de Big Data, hemos visto cosas como los lagos de datos convertidos en pantanos de datos que acabamos con un diluvio de ruido que no hemos descubierto cómo resolver los análisis de procesamiento en un sistema centralizado. Moda. Si no resolvemos este problema, en mi opinión, con el IoT de inmediato y obtenemos una solución de plataforma muy rápidamente, terminaremos en un lugar muy, muy malo.

Y con eso en mente, voy a concluir con mi punto, que es que creo que uno de los mayores cambios que tienen lugar en el espacio de Big Data y Analytics ahora está siendo impulsado por la necesidad inmediata de reaccionar ante el impacto de Internet. de cosas en análisis de alto volumen y en tiempo real, en el sentido de que necesitamos mover los análisis a la red y, finalmente, al borde de la red solo para hacer frente al gran volumen de la misma, solo para procesarla. Y finalmente, con suerte, colocamos la inteligencia en la red y en el borde de la red en un modelo de concentrador y radio que realmente podemos administrar y obtener información en tiempo real y obtener valor de ella. Y con eso voy a pasar a nuestro invitado y ver a dónde nos lleva esta conversación.

Shawn Rogers: Muchas gracias. Este es Shawn Rogers de Dell Statistica, y chico, para empezar, estoy totalmente de acuerdo con todos los temas principales que se han tocado aquí. Y Rebecca, comenzaste con una idea de, ya sabes, que estos datos no son nuevos, y es notable para mí cuánto tiempo y energía se gasta en discutir los datos, los datos, los datos del IoT. Y ciertamente es relevante, ya sabes, Robin hizo un buen punto, incluso si estás haciendo algo realmente simple y estás conectando un termostato una vez por segundo, sabes, lo haces las 24 horas del día y realmente tienes ya sabes, algunos desafíos de datos interesantes. Pero, al final, y creo que mucha gente en la industria está hablando de los datos de esta manera, que no es realmente tan interesante y, para el punto de Rebecca, ha existido por mucho tiempo, pero en el pasado no hemos podido hacer un gran uso de él. Y creo que la industria de análisis avanzado y la industria de BI en general están empezando a volverse realmente hacia IoT. Y Dez, hasta su punto final, esto es parte de uno de los puntos desafiantes del panorama de big data, creo que es muy cierto. Creo que todo el mundo está muy entusiasmado con lo que podemos hacer con este tipo de datos, pero al mismo tiempo, si no podemos descubrir cómo aplicar la información, tomar medidas y, ya sabes, obtener análisis donde están los datos, creo Vamos a tener desafíos que las personas no ven realmente en su camino.

Dicho esto, en el espacio de análisis avanzado somos grandes admiradores de lo que creemos que puede suceder con los datos de IoT, especialmente si le estamos aplicando análisis. Y hay una gran cantidad de información en esta diapositiva y dejaré que todo el mundo busque y picotee, pero si observa diferentes sectores como el comercio minorista en el extremo derecho, está viendo surgir su oportunidad de ser más innovadores o tener El ahorro de costos o la optimización o las mejoras del proceso son muy importantes y están viendo muchos casos de uso para eso. Si mira, ya sabe, de izquierda a derecha en la diapositiva, verá cómo cada una de estas industrias individuales reclama nuevas capacidades y nuevas oportunidades de diferenciación para sí mismos cuando aplican análisis a IoT. Y creo que la conclusión es, si vas a esforzarte por seguir ese camino, no solo debes preocuparte por los datos, como hemos estado discutiendo, y la arquitectura, sino que también debes buscar la mejor manera de aplicar la analítica a él y dónde deben realizarse las analíticas.

Para muchos de nosotros en la llamada de hoy, ya sabes, Robin y yo nos conocemos desde hace mucho tiempo y tuvimos innumerables conversaciones sobre arquitecturas tradicionales en el pasado, sobre bases de datos centralizadas o almacenes de datos empresariales, y así como nosotros " En la última década, hemos encontrado un buen trabajo al estirar las limitaciones de esas infraestructuras. Y no son tan firmes ni tan fuertes como nos gustaría que fueran hoy para respaldar todos los excelentes análisis que estamos aplicando a la información y, por supuesto, la información también está rompiendo la arquitectura, ya sabes, La velocidad de los datos, el volumen de datos, etc., definitivamente están estirando las limitaciones de algunos de nuestros enfoques y estrategias más tradicionales para este tipo de trabajo. Entonces, creo que comienza a exigir la necesidad de que las empresas adopten un punto de vista más ágil y tal vez más flexible, y esa es la parte, supongo, me gustaría hablar un poco sobre el lado de IoT.

Antes de hacerlo, me tomaré un momento para dejar que todos los que estén en la llamada, les brinden un poco de información sobre qué es Statistica y qué hacemos. Como puede ver en el título de esta diapositiva, Statistica es un análisis predictivo, big data y visualización para la plataforma IoT. El producto en sí tiene poco más de 30 años y competimos con los otros líderes del mercado con los que probablemente esté familiarizado en la línea de poder aplicar análisis predictivos, análisis avanzados a los datos. Vimos una oportunidad para expandir nuestro alcance de dónde estábamos poniendo nuestros análisis y comenzamos a trabajar en algunas tecnologías hace un tiempo que nos han posicionado bastante bien para aprovechar lo que tanto Dez como Robin han hablado hoy, que es este nuevo enfoque y dónde colocará los análisis y cómo los combinará con los datos. A lo largo de ese lado vienen otras cosas que debe poder abordar con la plataforma, y ​​como mencioné, Statistica ha estado en el mercado mucho tiempo. Somos muy buenos en el lado de la combinación de datos y creo que, ya sabes, no hemos hablado demasiado sobre el acceso a datos hoy en día, pero pudimos llegar a través de estas diversas redes y obtener los datos correctos en el El momento adecuado es cada vez más interesante e importante para los usuarios finales.

Por último, comentaré una pieza más aquí, porque Dez hizo un buen comentario sobre las redes en sí mismas, teniendo cierto nivel de control y seguridad sobre los modelos analíticos en todo su entorno y cómo se unen a los datos que se están volviendo muy importantes. Cuando ingresé a esta industria hace unos años, creo que casi 20 en este punto, cuando hablamos de análisis avanzado, fue de una manera muy curada. Solo un par de personas en la organización lo tenían en sus manos, lo desplegaron y le dieron a las personas la respuesta según sea necesario o proporcionaron ideas según sea necesario. Eso realmente está cambiando y lo que vemos es que muchas personas estaban trabajando con una o más formas diversas y más flexibles de llegar a los datos, aplicando seguridad y gobierno a los datos y luego pudiendo colaborar en ellos. Esas son algunas de las cosas importantes que analiza Dell Statistica.

Pero quiero profundizar en el tema que está un poco más cerca del título de hoy, que es cómo deberíamos abordar los datos que provienen de Internet de las cosas y lo que es posible que desee buscar cuando esté buscando diferentes soluciones. La diapositiva que tengo frente a ustedes ahora es una especie de vista tradicional y tanto Dez como Robin tocaron esto, ya sabes, esta idea de hablar con un sensor, ya sea un automóvil, una tostadora o una turbina eólica, o lo que sea, y luego mover esos datos desde la fuente de datos a su red de nuevo a una configuración centralizada, como Dez estaba mencionando. Y se conecta bastante bien y muchas empresas entran en el espacio de IoT originalmente están comenzando a hacerlo con ese modelo.

La otra cosa que surgió, si mira hacia el final de la diapositiva, es esta idea de tomar otras fuentes de datos tradicionales, aumentar sus datos de IoT y luego en este tipo de núcleo, ya sea que su núcleo sea un centro de datos o no. puede estar en la nube, en realidad no importa, tomaría un producto como Statistica y luego le aplicaría análisis en ese punto y luego proporcionaría esos conocimientos a los consumidores a la derecha. Y creo que esto es lo que está en juego en este momento. Esto es algo que debe poder hacer y debe tener una arquitectura lo suficientemente abierta para una plataforma analítica avanzada y hablar con todas estas fuentes de datos diversas, todos estos sensores y todos estos destinos diferentes donde Tienes los datos. Y creo que esto es algo que debe ser capaz de hacer y creo que encontrará que es cierto que muchos líderes en el mercado pueden hacer este tipo de cosas. Aquí en Statistica hablamos de esto como análisis central. Obtenga los datos, devuelva los datos al núcleo, trátelos, agregue más datos si es necesario o si es ventajoso, y haga sus análisis y luego comparta esa información para la acción o para obtener información.

Y, por lo tanto, creo que desde un punto de vista funcional, probablemente todos estaríamos de acuerdo en que, ya sabes, esta es la necesidad y todos deben estar haciendo esto. Cuando comienza a ponerse interesante es donde tienes grandes cantidades de datos, ya sabes, provenientes de diversas fuentes de datos, como sensores IoT, como mencioné, ya sea un automóvil o una cámara de seguridad o un proceso de fabricación, comienza a convertirse una ventaja de poder realizar el análisis donde se están produciendo los datos. Y creo que la ventaja para la mayoría de las personas cuando comenzamos a mover la analítica desde el núcleo al límite es esta capacidad de difundir algunos de los desafíos de datos que están sucediendo, y Dez y Robin probablemente comentarán sobre esto al final hoy, pero creo que debe ser capaz de monitorear y tomar medidas sobre los datos en el borde para que no siempre sea necesario mover todos esos datos a su red. Robin habló de esto en sus, más o menos, las imágenes de arquitectura que dibujó, donde tiene todas estas fuentes diferentes, pero generalmente hay algún punto de agregación. El punto de agregación que vemos con bastante frecuencia es a nivel de sensor, pero aún más a nivel de puerta de enlace. Y estas puertas de enlace existen como una especie de intermediario en el flujo de datos desde las fuentes de datos antes de volver al núcleo.

Una de las oportunidades que aprovechó Dell Statistica es nuestra capacidad para exportar un modelo desde nuestra plataforma centralizada de análisis avanzado para poder tomar un modelo y luego ejecutarlo en el borde en una plataforma diferente, como una puerta de enlace o dentro de una base de datos, o lo que tienes. Y creo que la flexibilidad que eso nos brinda es lo que realmente es el punto interesante de la conversación de hoy, ¿lo tienen hoy en su infraestructura? ¿Eres capaz de mover una analítica al lugar donde viven los datos en lugar de simplemente mover los datos a donde viven tus análisis? Y eso es algo en lo que Statistica se ha centrado durante bastante tiempo, y al mirar más de cerca las diapositivas, verá que hay otra tecnología de nuestra compañía hermana, Dell Boomi. Dell Boomi es una plataforma de integración de datos e integración de aplicaciones en la nube y, de hecho, utilizamos Dell Boomi como dispositivo de tráfico para mover nuestros modelos desde Dell Statistica, a través de Boomi y fuera de los dispositivos de borde. Y creemos que este es un enfoque ágil que las empresas van a exigir, por mucho que les guste la versión que les mostré hace un minuto, que es el tipo de idea central de mover datos desde los sensores hasta el centro, al mismo tiempo, las empresas van a querer poder hacerlo de la forma en que estoy esbozando aquí. Y las ventajas de hacer esto son algunos de los puntos que tanto Robin como Dez hicieron, es decir, ¿puede tomar una decisión y actuar a la velocidad de su negocio? ¿Puede mover los análisis de un lugar a otro y poder ahorrarse el tiempo, el dinero, la energía y la complejidad de mover constantemente los datos de borde al núcleo?

Ahora soy el primero en decir que algunos de los datos perimetrales siempre tendrán un mérito lo suficientemente alto donde tendría sentido almacenar esos datos y conservarlos y llevarlos de vuelta a su red, pero qué análisis perimetral le permitirá ¿Qué es la capacidad de tomar decisiones a la velocidad a la que están llegando los datos, verdad? Que puede aplicar la información y la acción a una velocidad en la que esté el valor más alto posible. Y creo que eso es algo que todos vamos a estar buscando cuando se trata de utilizar análisis avanzados y datos de IoT, es esta oportunidad para moverse a la velocidad del negocio o la velocidad que exige el cliente. Creo que nuestra posición es, creo que necesitas poder hacer ambas cosas. Y creo que muy pronto y muy rápidamente, a medida que más compañías busquen conjuntos de datos más diversos, especialmente aquellos del lado de IoT, comenzarán a mirar el espacio de los proveedores y exigirán lo que Statistica es capaz de hacer. Lo que es implementar un modelo en el núcleo, como lo hemos hecho tradicionalmente durante muchos años, o implementarlo en plataformas que tal vez no sean tradicionales, como una puerta de enlace de IoT, y poder calificar y aplicar análisis a los datos en el borde a medida que se producen los datos. Y creo que ahí es donde entra la parte emocionante de esta conversación. Porque al poder aplicar una analítica en el borde en el momento en que los datos salen de un sensor, nos permite tomar medidas tan rápido como sea necesario, pero también nos permite decidir, ¿deben estos datos volver al núcleo de inmediato? ¿Podemos agruparlo aquí y luego enviarlo de vuelta en pedazos y partes y realizar un análisis posterior? Y eso es lo que vemos que hacen muchos de nuestros principales clientes.

La forma en que Dell Statistica hace esto es que tenemos una capacidad de utilización, por ejemplo, digamos que construye una red neuronal dentro de Statistica y desea colocar la red neuronal en otro lugar de su panorama de datos. Tenemos la capacidad de generar esos modelos y todos los lenguajes que notó en la esquina derecha allí: Java, PPML, C y SQL, etc., también incluimos Python y también podemos exportar nuestros scripts. y a medida que lo saca de nuestra plataforma que está centralizada, puede implementar ese modelo o ese algoritmo donde lo necesite. Y como mencioné anteriormente, usamos Dell Boomi para ponerlo y estacionarlo donde necesitamos ejecutarlo y luego podemos recuperar los resultados, o podemos ayudar a recuperar los datos, o puntuar los datos y tomar medidas utilizando nuestro motor de reglas . Todas esas cosas se vuelven algo importantes cuando comenzamos a mirar este tipo de datos y pensamos nuevamente.

Esto es algo que la mayoría de ustedes en el teléfono tendrán que hacer porque será muy costoso y gravoso para su red, como Dez mencionó, mover datos desde la izquierda de estos diagramas a la derecha de estos diagramas. hora. No parece mucho, pero hemos visto clientes de fabricación con diez mil sensores en sus fábricas. Y si tiene diez mil sensores en su fábrica, incluso si solo está haciendo estos un segundo tipo de pruebas o señales, está hablando de ochenta y cuatro mil filas de datos de cada uno de esos sensores individuales por día. Y entonces los datos definitivamente se acumulan y Robin mencionó eso. Por adelantado, mencioné un par de industrias en las que estamos viendo personas que hacen cosas bastante interesantes utilizando nuestro software y datos de IoT: la automatización de edificios, la energía y los servicios públicos es un espacio realmente importante. Observamos que se está trabajando mucho en la optimización del sistema, incluso en el servicio al cliente y, por supuesto, en las operaciones y el mantenimiento en general, dentro de las instalaciones de energía y dentro del edificio para la automatización. Y estos son algunos casos de uso que vemos que son bastante poderosos.

Supongo que hemos estado haciendo análisis de bordes antes, el término fue acuñado. Como mencioné, tenemos raíces profundas en Statistica. La compañía se fundó hace casi 30 años, por lo que tenemos clientes que retroceden bastante tiempo y están integrando datos de IoT con sus análisis y lo han estado haciendo durante un tiempo. Y Alliant Energy es uno de nuestros casos de uso o clientes de referencia. Y usted puede imaginar el problema que tiene una compañía de energía con una planta física. Escalar más allá de las paredes de ladrillo de una planta física es difícil, por lo que las compañías de energía como Alliant están buscando formas de optimizar su producción de energía, básicamente mejorando su proceso de fabricación y optimizándolo al más alto nivel. Y usan Statistica para administrar los hornos dentro de sus plantas. Y para todos los que volvemos a nuestros primeros días en la clase de ciencias, todos sabemos que los hornos producen calor, el calor produce vapor, las turbinas giran, obtenemos electricidad. El problema para compañías como Alliant es realmente optimizar cómo se calientan y queman las cosas dentro de esos grandes hornos ciclónicos. Y optimizando la producción para evitar los costos adicionales de contaminación, desplazamiento de carbono, etc. Por lo tanto, debe poder monitorear el interior de uno de estos hornos de ciclón con todos estos dispositivos, sensores, y luego tomar todos los datos de ese sensor y realizar cambios en el proceso de energía de manera continua. Y eso es exactamente lo que Statistica ha estado haciendo para Alliant desde aproximadamente 2007, incluso antes de que el término IoT fuera súper popular.

Para el punto de Rebecca desde el principio, los datos ciertamente no son nuevos. La capacidad de procesarlo y usarlo correctamente es realmente donde están sucediendo las cosas emocionantes. Hemos hablado un poco sobre la atención médica en la pre-llamada de hoy y estamos viendo todo tipo de aplicaciones para que las personas hagan cosas como una mejor atención al paciente, mantenimiento preventivo, gestión de la cadena de suministro y eficiencias operativas en la atención médica. Y eso es bastante continuo y hay muchos casos de uso diferentes. Uno de los que estamos muy orgullosos aquí en Statistica es con nuestro cliente Shire Biopharmaceuticals. Y Shire fabrica medicamentos especializados para enfermedades realmente difíciles de tratar. Y cuando crean un lote de sus medicamentos para sus clientes, es un proceso extremadamente costoso y ese proceso extremadamente costoso también lleva tiempo. Cuando piensa en un proceso de fabricación cuando ve que los desafíos se están unificando en todos los datos, siendo lo suficientemente flexible en diferentes formas de poner datos en el sistema, validar la información y luego ser predictivo sobre cómo ayudamos a ese cliente. Y los procesos que extraían la mayor parte de la información de nuestros sistemas de fabricación y, por supuesto, los dispositivos y sensores que impulsan estos sistemas de fabricación. Y es un gran caso de uso de cómo las empresas evitan pérdidas y optimizan sus procesos de fabricación utilizando una combinación de datos de sensores, datos de IoT y datos regulares de sus procesos.

Así que ya sabes, un buen ejemplo de dónde la fabricación, y especialmente la fabricación de alta tecnología, están beneficiando a la industria del cuidado de la salud en torno a este tipo de trabajo y datos. Creo que tengo otros puntos que me gustaría comentar antes de concluir y devolvérselos a Dez y Robin. Pero sabes, creo que esta idea de poder llevar tu análisis a cualquier lugar dentro de tu entorno es algo que será extremadamente importante para la mayoría de las empresas. Estar atado al formato tradicional de datos ETL desde las fuentes hasta las ubicaciones centrales siempre tendrá un lugar en su estrategia, pero no debería ser su única estrategia. Tienes que adoptar un enfoque mucho más flexible para las cosas hoy. Para aplicar la seguridad que mencioné, evite los impuestos de su red, para poder administrar y filtrar los datos a medida que provienen del borde, y determinar qué datos vale la pena conservar a largo plazo, qué datos vale la pena trasladar a nuestra red, o qué datos solo deben analizarse en el momento en que se crean, para que podamos tomar las mejores decisiones posibles. Este enfoque analítico en todas partes es algo que tomamos muy en serio en Statistica y es algo en lo que somos muy competentes. Y se remonta a una de esas diapositivas que mencioné anteriormente, la capacidad de exportar sus modelos en una variedad de idiomas, para que puedan coincidir y alinearse con las plataformas donde se están creando los datos. Y luego, por supuesto, tener un dispositivo de distribución para esos modelos, que también es algo que traemos a la mesa y que estamos muy entusiasmados. Creo que la conversación de hoy es, si realmente vamos a tomarnos en serio esta información que ha estado en nuestros sistemas durante mucho tiempo y nos gustaría encontrar una ventaja competitiva y un ángulo innovador para utilizarla, debe aplicar alguna tecnología que le permite alejarse de algunos de esos modelos restrictivos que hemos usado en el pasado.

Una vez más, mi punto es que si va a hacer IoT, creo que debe poder hacerlo en el núcleo, y traer los datos y combinarlos con otros datos y hacer sus análisis. Pero también, igual de importante o quizás incluso más importante es, debe tener esta flexibilidad para poner el análisis con los datos y mover el análisis desde el lado central de su arquitectura al límite por las ventajas que he mencionado antes de. Eso es un poco acerca de quiénes somos y qué estamos haciendo en el mercado. Y estamos muy entusiasmados con IoT, creemos que definitivamente está llegando a la mayoría de edad y hay grandes oportunidades para que todos aquí influyan en sus análisis y procesos críticos con este tipo de datos.

Rebecca Jozwiak: Shawn, muchas gracias, fue una presentación realmente fantástica. Y sé que Dez probablemente se muere por hacerte algunas preguntas, así que Dez, te dejaré ir primero.

Dez Blanchfield: Tengo un millón de preguntas, pero me contendré porque sé que Robin también lo hará. Una de las cosas que estoy viendo a lo largo y ancho es una pregunta que surge y estoy realmente ansioso por obtener una idea de su experiencia en esto dado que usted está en el corazón de las cosas. Las organizaciones están luchando con el desafío, y mira, algunas de ellas acaban de leer artículos como "La Cuarta Revolución Industrial" de Klaus Schwab y luego sufrieron un ataque de pánico. Y aquellos que no están familiarizados con este libro, es esencialmente una idea de un caballero, de Klaus Schwab, quien creo que es un profesor, quien es el fundador y presidente ejecutivo del Foro Económico Mundial de memoria, y el libro es esencialmente sobre Toda esta ubicua explosión de Internet de las cosas y parte del impacto en el mundo en general. Las organizaciones con las que estoy hablando no están seguras de si deberían ir y adaptar el entorno actual o invertir todo en la construcción de todo el nuevo entorno, infraestructura y plataformas. También en Dell Statistica, ¿está viendo a personas adaptar los entornos actuales e implementar su plataforma en la infraestructura existente, o está viendo que cambian su enfoque para construir toda la infraestructura nueva y prepararse para este diluvio?

Shawn Rogers: Sabes, hemos tenido la oportunidad de atender a ambos tipos de clientes y estar en el mercado siempre que lo hagamos, tienes esas oportunidades para ampliarse. Tenemos clientes que han creado nuevas plantas fabulosas en los últimos años y las han equipado con datos de sensores, IoT, análisis desde el borde, de principio a fin durante todo el proceso. Pero debo decir que la mayoría de nuestros clientes son personas que han estado haciendo este tipo de trabajo durante un tiempo, pero se han visto obligados a ignorar esos datos. Sabes, Rebecca destacó desde el principio: estos no son datos nuevos, este tipo de información ha estado disponible en muchos formatos diferentes durante mucho tiempo, pero donde el problema había estado es conectarse a ellos, moviéndolo, llevándolo a un lugar donde podría hacer algo inteligente con él.

Y, entonces, diría que la mayoría de nuestros clientes están viendo lo que tienen hoy, y Dez, usted ya ha dicho esto antes, que esto es parte de esa revolución de big data y creo que de lo que se trata realmente es de todo revolución de datos, ¿verdad? Ya no tenemos que ignorar ciertos datos del sistema o datos de fabricación o datos de automatización de edificios, ahora tenemos los juguetes y herramientas adecuados para obtenerlos y luego hacer cosas inteligentes con ellos. Y creo que hay muchos impulsores en este espacio que están haciendo que eso suceda y algunos de ellos son tecnológicos. Sabes, las soluciones de infraestructura de big data como Hadoop y otras han hecho que sea un poco menos costoso y más fácil para algunos de nosotros pensar en crear un lago de datos con ese tipo de información. Y ahora estamos mirando alrededor de la empresa para decir: "Oye, tenemos análisis en nuestro proceso de fabricación, pero ¿se mejorarían si pudiéramos agregar una idea de estos procesos?" Y eso es, creo, lo que la mayoría de Nuestros clientes lo están haciendo. No se trata tanto de crear desde cero, sino de aumentar y optimizar el análisis que ya tienen con los datos que son nuevos para ellos.

Dez Blanchfield: Sí, hay algunas cosas emocionantes en algunas de las industrias más grandes que hemos visto, y usted mencionó, la energía y los servicios públicos. La aviación está atravesando este auge en el que uno de mis dispositivos favoritos de todos los tiempos de los que hablo regularmente, el Boeing 787 Dreamliner, y ciertamente el equivalente de Airbus, el A330 ha seguido la misma ruta. Había como seis mil sensores en el 787 cuando se lanzó por primera vez, y creo que ahora están hablando de quince mil sensores en la nueva versión del mismo. Y lo curioso de hablar con algunas de las personas que están en ese mundo es que la idea de poner sensores en las alas y demás, y lo sorprendente de 787 en una plataforma de diseño es que, ya sabes, reinventaron todo en el avión. Al igual que las alas, por ejemplo, cuando el avión despega, las alas se flexionan hasta doce metros y medio. Pero en los extremos, las alas pueden flexionarse en la punta hasta 25 metros. Esta cosa parece un aleteo de pájaro. Pero lo que no tuvieron tiempo de arreglar fue la ingeniería del análisis de todos estos datos, por lo que tienen sensores que hacen que los LED parpadeen en verde y rojo si sucede algo malo, pero en realidad no terminan con una visión profunda de tiempo real. Y tampoco resolvieron el problema de cómo mover el volumen de datos porque en el espacio aéreo doméstico en los EE. UU. Diariamente hay 87.400 vuelos. Cuando cada avión se pone al día con sus compras de un 787 Dreamliner, son 43 petabytes al día de datos, porque estos aviones actualmente crean aproximadamente medio terabyte de datos cada uno. Y cuando multiplica esos 87, 400 vuelos diarios en los Estados Unidos por cinco puntos o medio terabyte, termina con 43.5 petabytes de datos. Físicamente no podemos mover eso. Entonces, por diseño, tenemos que enviar los análisis al dispositivo.

Pero una de las cosas que es interesante cuando miro toda esta arquitectura, y estoy ansioso por ver lo que piensas sobre esto, es que nos hemos movido hacia la gestión de datos maestros, más o menos, los primeros principios de gestión de datos, tirando Todo en una ubicación central. Tenemos lagos de datos y, si lo desea, creamos pequeños estanques de datos, extractos de los que analizamos, pero al distribuir hasta el borde, una de las cosas que sigue surgiendo, particularmente de personas de bases de datos y administradores de datos o personas en el negocio de administrar información, ¿qué sucede cuando tengo muchos pequeños lagos de datos en miniatura distribuidos? ¿Qué tipo de cosas se han aplicado a este pensamiento con respecto a la analítica de borde en su solución, en que, tradicionalmente, todo vendría centralmente con el lago de datos, ahora terminamos con estos pequeños charcos de datos en todas partes, y aunque podemos realice análisis en ellos localmente para obtener una idea local, ¿cuáles son algunos de los desafíos que ha enfrentado y cómo lo ha resuelto, teniendo ese conjunto de datos distribuidos, y particularmente cuando obtiene los microcosmos de los lagos de datos y las áreas distribuidas?

Shawn Rogers: Bueno, creo que ese es uno de los desafíos, ¿verdad? A medida que nos alejamos, ya sabes, transportar todos los datos de regreso a la ubicación central o al ejemplo analítico central que di y luego hacemos la versión distribuida es que terminas con todos estos pequeños silos, ¿verdad? Tal como lo representaste, ¿verdad? Están haciendo un poco de trabajo, algunos análisis se están ejecutando, pero ¿cómo los vuelves a unir? Y creo que la clave será la orquestación de todo eso y creo que ustedes estarán de acuerdo conmigo, pero estoy feliz si no lo hacen, porque creo que hemos estado observando esta evolución durante bastante algún tiempo.

Volviendo a los días de nuestros amigos, el Sr. Inmon y el Sr. Kimball, que ayudaron a todos con la arquitectura de sus primeras inversiones en el almacén de datos, el punto es que nos hemos alejado de ese modelo centralizado durante mucho tiempo. Hemos adoptado esta nueva idea de permitir que los datos demuestren su gravedad sobre dónde debería residir mejor dentro de su ecosistema y alinear los datos con la mejor plataforma posible para el mejor resultado posible. Y creo que hemos empezado a gastar un enfoque más orquestado de nuestro ecosistema como una forma general de hacer las cosas, ya que es donde estamos tratando de alinear todas esas piezas a la vez. Qué tipo de análisis o trabajo voy a hacer con los datos, qué tipo de datos son, eso ayudará a dictar dónde deben vivir. ¿Dónde se produce y qué tipo de gravedad tienen los datos?

Ya sabes, vemos muchos de estos ejemplos de big data donde la gente habla de tener lagos de datos de 10 y 15 petabytes. Bueno, si tiene un lago de datos que es tan grande, es muy poco práctico que lo mueva y, por lo tanto, debe poder llevarle análisis. Pero cuando hace eso, en el centro de su pregunta, creo que plantea muchos desafíos nuevos para todos para orquestar el medio ambiente y aplicar la gobernanza y la seguridad, y comprender lo que se debe hacer con esos datos para curarlos y obtener el mayor valor de ello. Y para ser honesto con usted, me encantaría escuchar su opinión aquí, creo que estamos en los primeros días allí y creo que aún queda mucho trabajo por hacer. Creo que programas como Statistica se están enfocando en dar a más personas acceso a datos. Definitivamente estamos enfocados en estas nuevas personas, como los científicos de datos ciudadanos que desean llevar el análisis predictivo a lugares dentro de la organización que podrían no haber sido antes. Y creo que esos son algunos de los primeros días en torno a esto, pero creo que el arco de madurez tendrá que demostrar un alto nivel u orquestación y alineación entre estas plataformas, y una comprensión de lo que hay en ellas y por qué. Y ese es un problema antiguo para todos nosotros, personas de datos.

Dez Blanchfield: De hecho, lo estoy y estoy completamente de acuerdo con usted en eso, y creo que lo mejor que estamos escuchando hoy aquí es al menos la parte frontal del problema de capturar los datos en el nivel de puerta de enlace, supongo. de la red y la capacidad de hacer análisis en ese punto se resuelve esencialmente ahora. Y ahora nos libera para comenzar a pensar en el próximo desafío, que es distribuir lagos de datos. Muchas gracias por eso, fue una presentación fantástica. Realmente aprecio la oportunidad de conversar contigo al respecto.

Voy a pasarle a Robin ahora porque sé que lo ha hecho, y luego Rebecca también recibió una larga lista de grandes preguntas de la audiencia después de Robin. ¿Robin?

Dr. Robin Bloor: De acuerdo. Shawn, me gustaría que dijeras un poco más y no estoy tratando de darte la oportunidad de anunciarlo, pero en realidad es muy importante. Estoy interesado en saber en qué momento Statistica realmente generó la capacidad de exportación del modelo. Pero también, me gustaría que dijeras algo sobre Boomi porque todo lo que has dicho hasta ahora sobre Boomi es que es ETL, y de hecho es ETL. Pero en realidad es ETL bastante capaz y para el tipo de tiempos del que estamos hablando, y algunas de las situaciones que estamos discutiendo aquí, es algo muy importante. ¿Podrías hablarme de esas dos cosas?

Shawn Rogers: Claro, sí, absolutamente puedo. Sabes, nuestro movimiento en esta dirección fue ciertamente iterativo y fue una especie de proceso paso a paso. Nos estamos preparando la próxima semana para lanzar la versión 13.2 de Statistica. Y tiene las actualizaciones más recientes de todas las capacidades de las que estamos hablando hoy. Pero volviendo a la Versión 13, hace un año, en octubre, anunciamos nuestra capacidad para exportar modelos desde nuestra plataforma, y ​​la llamamos NDAA en ese momento. El acrónimo significaba Arquitectura de Análisis Distribuido Nativo. Lo que hicimos fue dedicar mucho tiempo, energía y enfoque a abrir nuestra plataforma con la oportunidad de usarla como centro de comando central para sus análisis avanzados, pero también para implementarla desde allí. Y los primeros lugares, Robin, que implementamos, hicieron una muy, muy buena adición a la plataforma en torno al aprendizaje automático. Y así, pudimos implementar desde Statistica a Azure Cloud de Microsoft para usar el poder de Azure para impulsar el aprendizaje automático, como saben, es muy intensivo y es una excelente manera de utilizar las tecnologías de la nube. Y eso fue lo primero.

Ahora aquí estábamos exportando nuestros modelos a Azure y usamos Azure para ejecutarlos y luego enviamos los datos o los resultados a la plataforma Statistica. Y luego pasamos a otros idiomas desde los que queríamos poder exportar, y, por supuesto, uno de ellos, Java, nos abre la puerta para que ahora comencemos a exportar nuestros modelos a otros lugares como Hadoop, por lo que dio nosotros una obra de teatro allí también.

Y, por último, nos centramos en poder enviar nuestros modelos con esa versión a las bases de datos. Y esa fue la primera iteración y, para ser sincero, el juego final fue IoT, pero aún no estábamos allí con la Versión 13 en octubre pasado. Desde entonces hemos llegado allí y eso tiene que ver con la capacidad de hacer todas las cosas que acabo de mencionar, pero luego tener algún tipo de dispositivo de transporte. Y volviendo a la pregunta de Dez, ¿sabes cuál es el desafío y cómo lo hacemos cuando tenemos todos estos análisis funcionando? Bueno, usamos Boomi como una especie de centro de distribución y, por lo tanto, porque está en la nube y porque es tan poderoso, como mencioné antes, es una plataforma de integración de datos, pero también es una plataforma de integración de aplicaciones, y utiliza JVM para permitirnos para estacionar y trabajar en cualquier lugar donde pueda aterrizar una máquina virtual Java. Eso es lo que realmente abrió la puerta para todas estas puertas de enlace y plataformas de computación de borde y servidores de borde, porque todos ellos tienen el cómputo y la plataforma que está disponible para ejecutar una JVM. Y porque podemos ejecutar la JVM en cualquier lugar, Boomi ha convertido resultó ser una distribución maravillosa y, usando mi palabra de antes, un dispositivo de orquestación.

Y esto se está volviendo realmente importante porque todos, ya sabes, creo que el escenario del avión hace un minuto fue genial, y mencioné, ya sabes, fabricantes como Shire que tienen diez mil sensores en una de sus fábricas, tú tiene que comenzar a abordar el tipo de enfoque central para el análisis avanzado en algún momento. Ser ad hoc al respecto ya no funciona. Solía ​​cuando el volumen de modelos y algoritmos que estábamos ejecutando era mínimo, pero ahora es máximo. Hay miles de ellos en una organización. Así que tenemos, parte de nuestra plataforma está basada en el servidor y cuando tiene nuestro software empresarial también tiene la capacidad de ajustar, calificar y administrar sus modelos en todo el entorno. Y eso también es parte de esa cosa de la orquestación. Necesitábamos tener una capa, Robin, en el lugar que no solo te permitiera obtener un modelo allí en primer lugar, sino que también te diera un conducto para ajustar los modelos y reemplazarlos de forma continua tan a menudo como lo necesitaras, porque Esto no es algo que pueda hacer manualmente. No puede caminar alrededor de una refinería con una unidad de disco USB tratando de cargar modelos a las puertas de enlace. Debe tener un sistema de transporte y gestión entre ellos, por lo que la combinación de Statistica y Boomi se lo da a nuestros clientes.

Dr. Robin Bloor: Sí. Bueno, seré muy breve pero, ya sabes, esta declaración que se hizo antes sobre el lago de datos y la idea de acumular petabytes en un lugar determinado, y el hecho de que tiene gravedad. Sabes, cuando comenzaste a hablar sobre la orquestación, empecé a hacerme pensar en el simple hecho de que, sabes, poner un lago de datos que es muy grande en un lugar probablemente significa que tienes que respaldarlo y probablemente significa que tienes que mover muchos datos de todos modos. Sabes, la arquitectura de datos reales es mucho más, en mi opinión de todos modos, mucho más en la dirección de la que estás hablando. Lo que diría es distribuirlo a lugares sensibles. Y parece que tienes una muy buena capacidad para hacer esto. Quiero decir, estoy bien informado sobre Boomi, por lo que es, de una forma u otra, casi injusto que pueda verlo y tal vez la audiencia no pueda. Pero Boomi es tan esencial, en mi opinión, en términos de lo que está haciendo porque tiene capacidades de aplicación. Y también porque la verdad del asunto es que no haces estos cálculos analíticos sin querer actuar en algún lugar por alguna razón u otra. Y Boomi juega un papel en eso, ¿verdad?

Shawn Rogers: Sí, absolutamente. Y, como saben por conversaciones anteriores, Statistica tiene un motor de reglas comerciales completo. Y creo que eso es realmente importante cuando nos concentramos en por qué hacemos esto. Sabes, bromeé al principio que realmente no hay ninguna razón para hacer IoT en absoluto a menos que vayas a analizar, utilizar los datos para tomar mejores decisiones o tomar medidas. Entonces, en lo que nos enfocamos no fue solo en poder presentar el modelo, sino también poder etiquetarlo, un conjunto de reglas. Y debido a que Boomi es tan robusto en sus capacidades para mover cosas de un lugar a otro, dentro de un átomo de Boomi también podemos incorporar la capacidad de disparar, alertar y tomar medidas.

Y así es donde comenzamos a obtener ese tipo de visión sofisticada de los datos de IoT donde decimos: "Vale, vale la pena escuchar estos datos". Pero realmente, ya sabes, sabiendo que "la luz está encendida, la luz está encendida, la luz está encendida, la luz está encendida "no es tan interesante como cuando se apaga la luz o cuando se apaga el detector de humo o cuando lo que sucede con nuestro proceso de fabricación no cumple las especificaciones. Cuando eso ocurra, queremos poder tomar medidas inmediatas. Y los datos se vuelven casi secundarios aquí en este punto. Debido a que no es tan importante que hayamos guardado todas esas señales, "está bien, está bien, está bien", lo importante es que notamos el "Hey, es malo" y tomamos medidas inmediatas. Ya sea enviando un correo electrónico a alguien o podemos involucrar a expertos en el dominio, o si activamos o no una serie de otros procesos para tomar medidas inmediatas, ya sea correctivo o en respuesta a la información. Y creo que es por eso que debes tener esta visión orquestada. No puedes concentrarte en manejar tus algoritmos por todas partes. Debe poder coordinarlos y orquestarlos. Debes poder ver cómo están funcionando. Y realmente, lo más importante, quiero decir, ¿por qué diablos harías esto si no puedes agregar la oportunidad de tomar alguna acción inmediata contra los datos?

Dr. Robin Bloor: Bien, Rebecca, ¿creo que tienes preguntas de la audiencia?

Rebecca Jozwiak: yo sí. Tengo un montón de preguntas de la audiencia. Shawn, sé que no querías esperar mucho más allá de la hora. ¿Qué piensas?

Shawn Rogers: estoy feliz. Adelante. Puedo responder algunas.

Rebecca Jozwiak: A ver. Sé que una de las cosas que mencionó fue que el IoT se encuentra en los primeros días y tiene un grado de madurez que tendrá que tener lugar y de alguna manera responde a esta pregunta que hizo uno de los asistentes. ¿Si el marco IPv6 va a ser lo suficientemente robusto como para acomodar el crecimiento de IoT en los próximos cinco o diez años?

Shawn Rogers: Oh, voy a dejar que Dez haga eco de mi respuesta porque creo que está más cerca de este tipo de información que yo. Pero siempre he pensado que estamos en un camino muy rápido para doblar y romper la mayoría de los marcos que tenemos en su lugar. Y aunque creo que la adición de ese nuevo tipo de especificaciones o la dirección en la que vamos con los marcos IPv6 es importante, y nos abre la puerta para que tengamos muchos más dispositivos y poder dar todo lo que Quiero dar una dirección. Creo que todo lo que estoy leyendo y viendo con mis clientes, y la cantidad de direcciones que se requieren, creo que en algún momento causará otro cambio en ese panorama. Pero no soy realmente un experto en redes, así que no puedo decir al cien por cien que lo vamos a romper en algún momento. Pero mi experiencia me dice que vamos a alterar ese modelo en algún momento.

Rebecca Jozwiak: No me sorprendería. Creo que los marcos se rompen bajo el peso de todo tipo de cosas. Y eso es lógico, ¿verdad? Quiero decir, no puedes enviar un correo electrónico con una máquina de escribir. Otro asistente pregunta: "¿Puedes usar un marco Hadoop?", Pero creo que podría cambiar eso para decir, ¿cómo usarías un marco Hadoop para análisis distribuido?

Shawn Rogers: Bueno, Robin me hizo el favor de hacerme una pregunta histórica y, por lo tanto, desde la Versión 13 hace aproximadamente un año para Statistica, hemos tenido la capacidad de sacar modelos de nuestro sistema y llevarlos a Hadoop. Y trabajamos muy de cerca con todos los grandes sabores de Hadoop. Tenemos historias de éxito realmente grandiosas sobre la capacidad de trabajar con Cloudera como una de las principales distribuciones de Hadoop con las que trabajamos. Pero debido a que podemos producir en Java, nos da la capacidad de ser abiertos y ubicar nuestros análisis en cualquier lugar. Colocarlos en un clúster de Hadoop es algo que hacemos de manera normal, regular y cotidiana para muchos de nuestros clientes. La respuesta corta es sí, absolutamente.

Rebecca Jozwiak: Excelente. Y solo voy a arrojarte uno más y dejarte seguir con tus vacaciones. Otro asistente pregunta, con análisis de IoT más aprendizaje automático, ¿cree que todos los datos deben almacenarse con fines históricos y cómo afectará eso a la arquitectura de la solución?

Shawn Rogers: Bueno, no creo que todos los datos tengan que almacenarse. Pero sí creo que es muy interesante tener la capacidad de entretener, escuchar cualquier fuente de datos que queramos dentro de nuestra organización, de donde sea que provenga. Y creo que los cambios que hemos visto en el mercado en los últimos años nos han permitido adoptar ese enfoque basado en todos los datos y parece que realmente está dando resultados. Pero será diferente para cada empresa y cada caso de uso. Sabes, cuando estamos analizando los datos de salud, ahora hay muchos problemas regulatorios, muchos problemas de cumplimiento de los que debemos preocuparnos, y eso nos hace guardar datos que otras compañías podrían no entender por qué es necesario guardarlos, correcto ? En los procesos de fabricación, para muchos de nuestros clientes de fabricación, existe una ventaja real de poder examinar históricamente sus procesos y poder mirar hacia atrás en grandes cantidades de estos datos para aprender de ellos y construir mejores modelos a partir de ellos.

Creo que será necesario mantener una gran cantidad de datos y creo que tenemos soluciones que lo hacen más económico y escalable hoy en día. Pero, al mismo tiempo, creo que todas las empresas encontrarán valor en los datos que no tienen que mantener a nivel atómico, pero querrán analizarlos en tiempo real y tomar decisiones sobre ellos para impulsar la innovación. Su compañía.

Rebecca Jozwiak: Bien, bien. No, audiencia, hoy no llegué a las preguntas de todos, pero se las enviaré a Shawn para que pueda comunicarse con usted directamente y responder esas preguntas. Pero gracias a todos por asistir. Muchas gracias a Shawn Rogers de Dell Statistica y de todos nuestros analistas, Dez Blanchfield y el Dr. Robin Bloor. Puede encontrar el archivo aquí en insideanalysis.com, SlideShare, hemos comenzado a poner nuestras cosas de nuevo allí, y estamos renovando nuestro YouTube, así que también busque eso allí. Muchas gracias amigos. Y con eso voy a despedirme y nos vemos la próxima vez.

Análisis de borde: la economía iot por fin