Supervisión de infraestructura: desafíos y mejores prácticas

Supervisión, Monitoreo de infraestructura: desafíos y mejores prácticas. Suena como tema de ciencia ficción pero no lo es. Se trata de un tema actual e importante. El monitoreo de infraestructura es el despliegue de herramientas de software para diagnosticar automáticamente problemas de rendimiento y disponibilidad en toda la pila de tecnología.

El monitoreo de la infraestructura cubre una variedad de usos y problemas, desde la optimización de la red hasta el diagnóstico y la detección de intrusos. El monitoreo de la infraestructura puede decirle si un enrutador está inactivo, un servidor se está ejecutando con una utilización inusual y, con la seguridad adecuada, también puede detectar a un intruso desviando datos de la compañía.

El monitoreo de la infraestructura permite la administración de la infraestructura, pero los dos son diferentes. La administración de la infraestructura son los pasos correctivos que usted toma en respuesta a los hallazgos de sus herramientas de monitoreo. Monitoreo de la infraestructura en la verificación constante de los diversos elementos de su plataforma de TI, desde su centro de datos interno hasta su nube privada y su nube pública .

Con las redes cada vez más complejas gracias a una creciente gama de dispositivos, así como a la llegada de la nube híbrida , la importancia de la integridad de la red crece con ella. Debe tener monitoreo de infraestructura incluso en una red básica dentro de una pequeña empresa, pero para sistemas complejos de grandes empresas, es un componente vital de la operación.

Comprender el monitoreo de infraestructura

En términos de operación diaria, el monitoreo de infraestructura es el despliegue de herramientas de software para diagnosticar automáticamente problemas de rendimiento y disponibilidad en toda la pila de tecnología para detectar problemas antes de que se vuelvan graves.
Por «toda la pila» entendemos el hardware, el sistema operativo, el entorno virtualizado, la red, el almacenamiento, la informática y las aplicaciones. Dado que la mayoría de las infraestructuras a gran escala abarcan múltiples ubicaciones y abarcan tanto la nube pública como la privada, eso plantea un gran desafío para que TI maneje todas las partes móviles, y la automatización se convierte en la clave.

Debido a la complejidad, la automatización es de vital importancia, por las siguientes razones:

  • La automatización puede responder mucho más rápido que un humano.
  • Puede manejar el problema más rápido que esperar la intervención humana.
  • Suponiendo que haya programado la respuesta correctamente, la automatización puede reducir los errores.
  • Funciona 24/7 y no necesita dormir, a diferencia de los humanos.

Con la automatización, puede establecer umbrales, como la utilización del servidor o el ancho de banda de la red, y las respuestas del programa si la red supera o supera los umbrales establecidos. Si un servidor se congela o deja de funcionar, también se puede reiniciar automáticamente.

El monitoreo de la infraestructura cubre la adición y eliminación de dispositivos a monitorear, el monitoreo del rendimiento y el estado, el monitoreo de la red y el movimiento de datos, los informes / registros y un sistema de alerta en caso de que surja un problema. Por lo general, son en tiempo real porque una alerta a un cuello de botella de la red no tiene sentido seis horas después de que se descubre.

El monitoreo de la infraestructura generalmente se realiza a través de un panel de control, que presenta toda su información en un solo lugar a través del diseño visual, como los medidores. Presentan una actualización en tiempo real en una sola pantalla y también pueden generar informes durante un período de tiempo.

Por qué necesita monitoreo de infraestructura

El monitoreo de la infraestructura le brinda al administrador los datos necesarios para comprender el estado de la infraestructura en tiempo real, así como la capacidad de medir el progreso hacia los objetivos de la organización. A través de la recopilación y revisión continua de datos sobre la infraestructura, el monitoreo permite medir tanto el estado actual como el progreso de la red.

Por-qué-necesita-monitoreo-de-infraestructuraPor ejemplo, si la administración ha establecido un objetivo de lograr un cierto nivel de respuesta de la red, las herramientas de monitoreo pueden mostrar dónde está la red en términos de capacidad de respuesta y dónde ha estado. Puede identificar picos en el retraso y quizás las causas también.

Asegurarse de que la red funcione con la máxima eficiencia requiere que sepa qué dispositivos componen la infraestructura de TI, pero también vigilar esos dispositivos en términos de estado de salud y rendimiento. El análisis proactivo de su sistema de TI significa que tiene una mejor oportunidad de detectar fallas inminentes antes de que causen una interrupción importante.

Hay muchos ejemplos de lo que puede salir mal sin una gestión adecuada de la infraestructura. El fenómeno del «servidor zombie», donde un servidor físico está inactivo y nadie lo está utilizando, es un ejemplo de ello. Un estudio de 2017 realizado por The Anthesis Group y un investigador de la Universidad de Stanford descubrió que hasta el 30% de los servidores en grandes centros de datos eran zombis. Correr, sacar poder, pero no hacer ningún trabajo. Esa es una falla de monitoreo adecuado porque un monitor de infraestructura notaría estos servidores que no generan ningún tráfico o que no usan ningún ciclo.

Otro ejemplo es la infiltración de malware. A lo largo de los años, ha habido historias e investigaciones sobre malware que ingresa a las redes corporativas y utiliza la red corporativa para entregar cargas maliciosas, disparar correo no deseado, lanzar ataques de denegación de servicio distribuido (DDoS) o rastrear el tráfico de red para obtener información útil. Nuevamente, aquí es donde el monitoreo ayuda porque notaría que una aplicación desconocida envía miles de correos electrónicos o habla con un servidor en Rusia.

Mejores prácticas de monitoreo de infraestructura

Aquí hay varios consejos para aprovechar al máximo sus herramientas de monitoreo de infraestructura:

  1. Priorizar : determine con anticipación cuáles son las notificaciones más importantes en orden descendente, ya que esto podría costarle su trabajo por algunos problemas, y aquí llegan los correos electrónicos por un problema menor.
  2. Crear un proceso para la resolución de alertas : debe haber un proceso para la mejor y más rápida resolución para cada tipo de alerta. Una vez más, se trata de prioridad, ya que debemos informar al CEO para obtener un interno que lo maneje.
  3. Compre, no construya : es un debate antiguo en TI, compilación vs. compra. ¿Lanzas tu propio sitio o te arriesgas a un proveedor? En este caso, debido a la creciente complejidad de los sistemas de TI, es mejor que compre herramientas de monitoreo. La buena noticia es que hay mucho para elegir.
  4. Pruebe su sistema de monitoreo y alerta , porque la primera vez que vea su sistema de alerta en acción no debería ser cuando hay una emergencia real, ya que podría requerir un poco de ajuste del sistema. Las ejecuciones en seco ayudan a garantizar que pueda ajustar el sistema a sus necesidades.
  5. Configure alertas detalladas e integrales : ¿no fue frustrante cuando se encendió la luz «Verificar motor» en su automóvil y no tenía idea de cuál era el problema? Bueno, lo mismo se aplica aquí. Una buena alerta debe ser completa, detallada y procesable.
  6. Monitoree desde múltiples ubicaciones : si tiene varios centros de datos, monitoree todos desde cada uno. Si tiene tres, supervise los centros de datos B y C desde A, supervise A y C desde B, etc. La redundancia nunca hace daño a nadie.
  7. Obtenga ayuda : los proveedores de herramientas de monitoreo tienen personal de soporte y consultores para ayudarlo. Usalos, usalos a ellos.
  8. Mezcle sus herramientas de monitoreo : existen herramientas tanto locales como basadas en la nube. Úselos ambos, especialmente si tiene un entorno de nube híbrida.
  9. Todo tranquilo no siempre es una buena señal : los sistemas fallan. Eso es inevitable Se ahogan con el ancho de banda o sufren una intrusión. A veces el monitor pierde cosas. No asumas que no hay alertas durante semanas no significa nada malo. El problema podría estar con el monitor en sí.
  10. Revise las métricas periódicamente : las métricas de rendimiento no se activan ni se olvidan. Puede configurar umbrales de CPU demasiado altos o alertas de ancho de banda demasiado tacaños. Las métricas deben someterse a una revisión periódica.

Herramientas de monitoreo de infraestructura

Existen dos tipos de herramientas de monitoreo: existen herramientas de software de monitoreo instaladas localmente y locales, y hay herramientas de monitoreo del servidor SaaS que operan desde fuera de su red. Su decisión debe basarse en las necesidades de su negocio, pero en este punto, quedan muy pocas herramientas locales. Casi todos se han mudado a la nube .

-CloudRadar: esto coloca todos sus servidores, hosts y servicios en una aplicación unificada, y cuando surgen problemas, como interrupciones y / o problemas de capacidad o rendimiento, el software notifica a los usuarios por correo electrónico, SMS, Slack, Whatsapp, Telegram, Pushover o Webhooks .

-Tecnologías de CA: CA ofrece una variedad de soluciones de gestión y monitoreo de nivel completo de nivel empresarial para las instalaciones y la nube, incluyendo DX Application Performance Management, DX App Experience Analytics, DX Infrastructure Manager y Network Operations and Analytics, por nombrar un pocos.

-VMware vRealize Hyperic: recopila datos de rendimiento de hasta 50,000 métricas en más de 70 tecnologías de aplicaciones para monitorear cualquier componente en su hardware, sistema operativo, aplicación y pila de middleware.

-New Relic: Dos aplicaciones, APM e Infraestructura, cuando se combinan para cubrir el rendimiento del sistema y la aplicación, tanto en las instalaciones como en la nube.

-BMC Digital Enterprise Management: DEM es un conjunto de seis soluciones para el monitoreo completo de la pila, desde la operación de TI, el monitoreo de la actividad de TI no autorizada, el mantenimiento de mainframe, el monitoreo de aplicaciones y el uso no autorizado.

-Dynatrace: la compañía está totalmente dedicada a crear herramientas de monitoreo para la gestión del rendimiento, IA para operaciones, monitoreo de infraestructura en la nube y gestión de experiencia digital.

-Opsview: su producto Monitor emblemático ofrece una vista única de todos los activos y sistemas de TI, así como los servicios basados ​​en la nube.

-SolarWinds: su herramienta emblemática Server and Application Monitor (SAM) le permite controlar el estado, la disponibilidad y el rendimiento de sus aplicaciones y la infraestructura del servidor, tanto en las instalaciones como en la nube. SAM admite más de 1200 plantillas de aplicaciones y sistemas o extiende fácilmente el monitoreo a cualquier aplicación personalizada o local.

Leer también: Cómo las herramientas de gestión remota ayuda a los clientes de Colocación  ; Pruebas de recuperación ante desastres: garantizar que su plan de recuperación ante desastres funcioneRefrigeración de racks de servidores: flujo de aire, ventiladores y métodos