¿Porqué se cae un servidor web o una página web? Apuntes usados para nuestro webinar transmitido por youtube, con el mismo título. A raíz del colapso parcial de Cloudflare en estos días, donde se dice que cerca de la mitad de internet estuvo fuera de línea, muchas personas nos preguntaban porqué los sitios web quedaban offline, cuáles eran los motivos. Este tipo de preguntas recurrentes dieron pié a que nos decidiéramos rápidamente a hacer este webinar al respecto, muy sencillo y directo.
Los sitios web caen. Es un hecho digital de la vida debido a la madre naturaleza, los problemas de hardware u otras cosas, principalmente fuera del control de un proveedor web. De cualquier manera, no hay duda de cuál debería ser su próxima acción: llame a su desarrollador, contacte luego a su proveedor de alojamiento web en segunda instancia para saber qué está pasando.
Principales razones
Limitación de recursos físicos como memoria o procesador.
Problemas del data center donde se alojan nuestro servidores.
Inconvenientes de conectividad de nuestra red.
Resolución de DNS defectuosa.
Daño físico en nuestros servers, red, centro de datos o en nodos país.
Ataques de denegación de servicio.
Mantenimiento del servidor
Por lo general, alertamos a nuestros clientes con anticipación cuando tenemos programado el mantenimiento del servidor. El mantenimiento del servidor es necesario para las actualizaciones de hardware o las actualizaciones de seguridad / software. Los usuarios son notificados con anticipación y la mayor parte del mantenimiento se realiza cuando hay muy poco tráfico a un sitio. Para la mayoría de las empresas, la medianoche suele ser un buen momento para comenzar.
Error del proveedor de servicios
Este error es uno de los más frustrantes porque no se puede hacer nada al respecto.
Un proveedor de servicios de alojamiento web es lo que hace que su sitio web aparezca en internet. No puede tener un sitio web a menos que un proveedor de servicios lo guarde, o de la forma más sencilla de almacenarlo.
Desafortunadamente, incluso los sitios web de proveedores de servicios pueden caerse, lo que significa que su sitio web también se vendrá al suelo. Podría ser por cualquier número de razones, incluido el mantenimiento o cualquiera de las mismas cosas que podrían suceder en su sitio web.
Los proveedores de servicios siempre hacen que sus servidores vuelvan a funcionar, generalmente también con bastante rapidez, pero hasta que lo solucionen, solo hay que esperar pacientemente.
Error de alojamiento
Esto encaja perfectamente con el último error, pero a veces su sitio web puede caerse porque no tiene un plan de alojamiento lo suficientemente grande.
Tal vez se olvidó de su plan y no lo ha actualizado desde que inició su sitio web, o tal vez su sitio web tuvo un crecimiento repentino.
De cualquier manera, a medida que su sitio web continúa desarrollándose y obteniendo más tráfico, su plan de alojamiento debería crecer con él. Si su plan de alojamiento es demasiado pequeño y mucha gente intenta ingresar a su sitio web, se cerrará.
Afortunadamente, este error es una solución simple. Simplemente póngase en contacto con sus proveedores de alojamiento y seleccione un plan más grande.
Errores de codificación
La codificación es un trabajo muy cerebral y cuando el cerebro está lleno, un desarrollador puede olvidar cerrar la línea de código o comentar algo que haga que su sitio funcione. Por lo general, es una solución fácil una vez que el desarrollador estudia bien lo que ha hecho previamente y luego lee las líneas de código asociadas con la funcionalidad del sitio. A veces, su sitio web falla porque usted, o alguien más que tiene acceso a su sitio web, rompió accidentalmente el código web.
Esto suele suceder porque alguien desordena algo mientras realiza el mantenimiento o actualiza el sitio web. Si experimenta un bloqueo del sitio web después de saber que alguien estaba trabajando en él, es probable que se bloquee debido a un error de código. Versiones caducas.
Los servidores defectuosos, fallos de hardware
Son máquinas y, a veces, los ventiladores revientan, los circuitos se fríen o simplemente causan problemas en general. Reemplazar la parte ofensiva es generalmente una solución fácil; a menos que sea necesario pedirlo, entonces depende del servicio de mensajería y sus leales corceles.
Errores de extensión / plugin
Un complemento o una extensión son piezas de software que se agregan a su sitio web y le dan características adicionales. En otras palabras, permiten que su sitio web muestre contenido y funciones que originalmente no formaban parte de su sitio.
Piénselo de esta manera, usted compra un teléfono nuevo, pero no tiene ninguna forma de almacenar o reproducir música. Entonces descarga una aplicación de música y ahora su teléfono puede reproducir música, algo que antes no podía hacer.
El problema con los complementos y extensiones es que están hechos por otras personas que no conoces. Algunos de esos creadores pueden hacer uno que no sea muy estable y otros pueden hacer un gran complemento pero no pueden actualizarlo.
Ya sea que el complemento o la extensión no se haya hecho muy bien o no se haya actualizado, a veces se pueden revelar. Cuando eso sucede, todo tu sitio web puede fallar.
Cambios de DNS o caducidad
Los nombres de dominio son típicamente un asunto de terceros. A veces, la dirección de la página web de la compañía de terceros se compra a través de cambios en su dirección IP y no se comunica con nuestros servidores. Otras veces, el nombre de dominio caduca y nadie lo renueva. Ambos resultan en un caos donde la información de los sitios se queman.
Error de dominio
Su dominio puede ser unas pocas palabras pequeñas, pero es una de las partes más grandes de su sitio web.
Su nombre de dominio es la dirección de su sitio web. Si invitaste a alguien a tu casa pero no les dieras la dirección, no podrían encontrar la casa. Lo mismo sucede con un nombre de dominio. Si las personas no pueden encontrar su dominio, no pueden encontrar su sitio web.
Y los dominios caducan
Si su dominio expira, su sitio web ya no aparecerá en línea.
Haga un hábito de verificar la fecha de vencimiento de su dominio para asegurarse de que nunca caduque.
Sobrecarga del servidor
Si ha publicado algo controvertido o está regalando autos gratuitos a través de su sitio web, espere un tsunami de tráfico. Si está bien planificado, puede tener servidores de respaldo para ayudar a mantener los servicios mientras se realizan millones de llamadas a su URL. Si no, el tsunami consumirá y destruirá a su paso, lo que encuentre.
Error de tráfico
Esto solo significa que muchas personas intentaron visitar su sitio web a la vez.
¿Sabes el Viernes Negro cuando tanta gente se apresura en una tienda a la vez que las cosas terminan por romperse y la gente se lastima? Cuando demasiadas personas visitan su sitio web a la vez, se convierte en su propio Black Friday.
Asegúrese de que su servidor pueda manejar una repentina ráfaga de tráfico para que eso no le suceda.
Problemas con los centros de datos
Los servidores suelen ser grandes y están en ubicaciones especializadas fuera de las instalaciones de nuestras oficinas centrales. Estas ubicaciones externas son grandes instalaciones de almacenamiento diseñadas específicamente para mantener el entorno de rendimiento óptimo. Cuando esos centros de datos se ven afectados por un corte de energía o un mal funcionamiento del hardware, afecta a todos los sitios que viven allí.
Hackear
Ahora, a menos que seas un perfil alto, es poco probable que te hackeen (es mentira, todos estamos expuestos a ser hackeados, no por lo importantes sino porque “estamos dando papaya”, es decir, siendo vulnerables y expuestos). Sin embargo, estas cosas ocurren especialmente para los programas maliciosos de malware que se abren camino en la computadora que usa para mantener su sitio. Para evitar esto, asegúrese de que su contraseña sea segura y no esté haciendo clic a la topa tolondra en cada anuncio de banner que vea.
Como se mencionó anteriormente, los sitios web caen. El mejor consejo que podemos dar es ser paciente, estar disponible y proporcionar toda la información que pueda. Le ayudaremos lo más rápido posible para llegar a la raíz del problema.
Códigos de error HTTP
A menudo, cuando intenta ver un sitio web, en lugar de ver una página en blanco, puede recibir un mensaje de error más detallado, como un código de error HTTP. Debido a que la World Wide Web es tan dependiente de HTTP, puede ser útil ver algunos códigos de error comunes, como los que se enumeran a continuación, que le brindarán más información sobre el error. En el caso de recibir un error, al menos puede estar seguro de haber llegado al servidor web, descartando un problema de red. En este caso, el servidor en sí (o el equilibrador de carga, etc.) probablemente experimente el problema:
400 Bad Request (Solicitud incorrecta): la solicitud HTTP contiene una sintaxis no válida. 401 no autorizado: el usuario no tiene autorización para acceder al contenido de esta página web. 403 Prohibido: el usuario tiene prohibido acceder al sitio debido a los permisos de archivos o algún otro motivo. 404 No encontrado: el archivo o recurso no se puede encontrar. (Esto se debe a menudo a un error tipográfico en la URL por parte del usuario). 500 Error interno del servidor: esto puede deberse a una mala configuración del servidor. 502 Bad Gateway: este es un problema del servidor proxy. 503 Servicio no disponible: este podría ser un problema temporal debido a un servidor sobrecargado. 504 Tiempo de espera de la puerta de enlace: es probable que se trate de un problema de red entre un servidor de puerta de enlace y servidores back-end.
El World Wide Web Consortium (W3C), liderado por Berners-Lee, proporciona una lista completa de códigos de error HTTP . Estos se extraen de RFC 2616, el estándar que rige HTTP.
Guía básica sobre qué hacer si sospecha que su sitio web o servidor está caído
Confirme que su sitio está fuera de servicio
Visite su sitio web para verificar que está abajo. Cuando revise su sitio, asegúrese de borrar la memoria caché en su navegador.
Póngase en contacto con un amigo para preguntar si pueden ver su sitio. ¿Se está mostrando el sitio? ¡Genial!
Si no, revisa el sitio con un navegador alternativo . Si usas regularmente Chrome, prueba Firefox. O Internet Explorer (Edge) o Safari.
Si el sitio aún no se muestra, revise su sitio web con una conexión alternativa . Si su sitio se muestra para una conexión, y no para la otra, puede asumir que hay un problema con su proveedor de servicios de Internet (ISP) o su proveedor de servicios inalámbricos.
Póngase en contacto con su proveedor de alojamiento web
A pesar de que todos los servicios de alojamiento web plantean un uptime del 99,9%todos, los servidores web pueden caerse. Es posible que haya un problema con el servidor en el que trabaja su proveedor de alojamiento web. Un pequeño ejercicio matemático: un año 365 días (100%), eso significa 364,635 días de tiempo al aire, o sea 0,365 días caído el servicio (8,76 horas). Eso significa un poco más de 40 minutos al mes offline (o lo que es lo mismo 1.5 minutos al día sin servicio)
Póngase en contacto con el servicio de atención al cliente de su proveedor de alojamiento web si su sitio está inactivo. Hágales saber la hora en que recibió su mensaje de alerta y pregunte si hubo algún problema con el servidor .
Pídale a su proveedor de alojamiento web que revise sus registros para detectar cualquier cosa que parezca sospechosa. Ellos pueden decirle si notan algo inusual y ofrecerle sugerencias sobre los próximos pasos a seguir.
Esto podría significar que necesita contactar a su desarrollador / diseñador acerca de su sitio.
Si el proveedor de alojamiento web confirma que todo se ve bien al final, continúe con el paso 3.
Confirme que su registro de dominio está pagado
La razón más común por la que los sitios de mis clientes disminuyen: olvidarse de pagar su registro de nombre de dominio .
Si su registro de nombre de dominio no se ha pagado, pague en línea y su sitio se realizará una copia de seguridad rápidamente.
Los nombres de dominio a menudo se pagan anualmente, pero puede configurar la renovación automática o pagar con varios años de anticipación.
Una cosa a tener en cuenta: use una dirección de correo electrónico actual para su registrador de nombres de dominio. Muchos de mis clientes registran su nombre de dominio por varios años.
Si su dirección de correo electrónico cambia durante ese tiempo, es posible que no se les reenvíe el mensaje a su nueva dirección de correo electrónico.
Sugerencia: programe un mensaje de notificación que se enviará a usted mismo al final de cada año para confirmar su dirección de correo electrónico para su registrador de nombres de dominio.
Preguntas y respuestas
1. ¿Por qué un servidor web se cae por sobrecarga de tráfico?
Respuesta: Un servidor web puede colapsar ante picos de tráfico inesperados (ej., eventos virales, campañas publicitarias masivas) que superan su capacidad de procesamiento. Cada servidor tiene límites en CPU, RAM y conexiones simultáneas: si miles de usuarios acceden al mismo tiempo, los recursos se agotan, generando lentitud o errores como HTTP 503 Service Unavailable.
Plataformas como Apache o Nginx tienen configuraciones predeterminadas (ej., MaxClients) que limitan las solicitudes concurrentes. Para mitigar esto, se usan balanceadores de carga (HAProxy), CDNs (Cloudflare) o escalamiento horizontal (añadir más servidores). Sin embargo, si no se anticipa el tráfico, incluso estas soluciones pueden verse sobrepasadas temporalmente.
2. ¿Cómo provocan las fallas de hardware la caída de un servidor?
Respuesta: Los componentes físicos del servidor (discos duros, fuentes de poder, ventiladores) pueden fallar por desgaste, sobrecalentamiento o defectos de fabricación. Por ejemplo, un disco HDD sin RAID puede corromper datos críticos al fallar, inutilizando el sistema. Servidores sin redundancia de energía (UPS o generadores) también son vulnerables a apagones.
En centros de datos, la falta de mantenimiento preventivo (ej., reemplazar discos con alto tiempo de uso) aumenta el riesgo. Soluciones como RAID 10, clusters de servidores y monitoreo de SMART (para discos) ayudan a prevenir caídas, pero requieren inversión en infraestructura y protocolos de respuesta rápida.
3. ¿Qué errores de software pueden derribar un servidor web?
Respuesta: Bugs en el código de la aplicación, conflictos entre librerías, o actualizaciones mal implementadas pueden causar caídas. Por ejemplo, un error en un script PHP puede consumir el 100% de la CPU, bloqueando el servidor.
Servidores como Apache pueden colapsar si un módulo (ej., mod_php) tiene fugas de memoria. Bases de datos mal optimizadas (consultas SQL lentas) también generan cuellos de botella. Además, sistemas operativos desactualizados son vulnerables a exploits que comprometen la estabilidad. Para evitarlo, se recomienda testing riguroso en entornos de staging, uso de contenedores (Docker) para aislar servicios, y monitoreo con herramientas como New Relic o Prometheus.
4. ¿Por qué un error de DNS puede dejar una página web inaccesible?
Respuesta: El DNS (Domain Name System) traduce nombres de dominio (ej., tudominio.com) a direcciones IP. Si los servidores DNS fallan (por ataques DDoS, malas configuraciones o problemas del proveedor), los usuarios no podrán resolver la dirección, viendo errores como DNS_PROBE_FINISHED_NXDOMAIN. Por ejemplo, en 2016, un ataque a Dyn DNS dejó inaccesibles a Twitter y Netflix.
También, cambios incorrectos en registros (ej., apuntar a una IP errónea) o la expiración del dominio provocan caídas. Para reducir riesgos, se usan DNS de alta disponibilidad (AWS Route 53), TTL (Time to Live) bajos para cambios rápidos, y verificaciones periódicas de las zonas DNS.
5. ¿Cómo los ataques DDoS afectan la disponibilidad de un sitio web?
Respuesta: Un ataque DDoS (Denegación de Servicio Distribuido) satura el servidor con tráfico malicioso (ej., solicitudes HTTP falsas o paquetes SYN flood), consumiendo ancho de banda y recursos hasta colapsarlo. Por ejemplo, en 2020, AWS mitigó un ataque de 2.3 Tbps.
Los sitios sin protección ven lentitud extrema o caídas totales, mostrando errores como Connection timed out. Herramientas como Cloudflare o Akamai filtran tráfico malicioso usando técnicas como rate limiting, CAPTCHAs y análisis de patrones. Sin embargo, ataques complejos (ej., amplificación DNS) pueden evadir filtros básicos, requiriendo soluciones especializadas y planes de respuesta ante incidentes.
6. ¿Qué impacto tienen las vulnerabilidades de seguridad en la caída de un sitio?
Respuesta: Exploits como inyecciones SQL, XSS o vulnerabilidades en plugins (ej., WordPress) permiten a atacantes tomar control del servidor, borrar datos o instalar malware. Por ejemplo, el ransomware web cifra archivos y exige pagos para restaurarlos, dejando el sitio inoperativo.
Fallos en sistemas de autenticación (ej., contraseñas débiles) facilitan accesos no autorizados. Además, ataques de defacement modifican la página principal para mostrar mensajes de hackers. Para prevenirlo, se deben aplicar parches de seguridad, usar firewalls (WAF), y realizar auditorías periódicas. Herramientas como OWASP ZAP ayudan a identificar vulnerabilidades antes de que sean explotadas.
7. ¿Por qué los errores de configuración derriban servidores web?
Respuesta: Cambios incorrectos en archivos de configuración (ej., .htaccess en Apache o nginx.conf) pueden invalidar el servicio. Por ejemplo, una regla de redirección mal escrita o un certificado SSL mal referenciado provocan errores 500 Internal Server Error. Actualizaciones de software sin pruebas (ej., migrar de PHP 7 a 8) también rompen compatibilidad con aplicaciones.
Además, configuraciones de firewall demasiado restrictivas bloquean tráfico legítimo. Para minimizar riesgos, se recomienda usar control de versiones (Git), implementar cambios en horarios de bajo tráfico, y tener backups de configuraciones anteriores. Herramientas como Ansible o Puppet automatizan despliegues consistentes.
8. ¿Cómo la expiración de un certificado SSL afecta a un sitio web?
Respuesta: Los certificados SSL/TLS (ej., Let’s Encrypt) tienen fechas de caducidad. Si no se renuevan, los navegadores muestran advertencias como «Su conexión no es privada», bloqueando el acceso al sitio. Esto afecta la reputación y el SEO, ya que Google penaliza sitios sin HTTPS.
La renovación automática (via cron jobs o herramientas como Certbot) es clave, pero fallos en el proceso (ej., problemas de validación DNS) pueden impedirla. Además, errores en la instalación del certificado (rutas incorrectas o permisos) generan errores. Monitorear fechas de expiración con herramientas como SSL Labs evita estos problemas.
9. ¿Por qué las bases de datos pueden causar caídas en un sitio web?
Respuesta: Las bases de datos (MySQL, PostgreSQL) son críticas para sitios dinámicos. Si una consulta SQL es ineficiente (ej., falta de índices), puede saturar la CPU o bloquear tablas, generando timeouts. Conexiones excesivas (más que el límite de max_connections) también derriban el servicio.
Fallos en réplicas o backups corruptos impiden recuperación rápida. Además, ataques como inyecciones SQL pueden corromper o borrar datos. Soluciones incluyen optimizar consultas, usar caché (Redis), y configurar clusters de bases de datos. Herramientas como Percona Monitoring and Management ayudan a diagnosticar problemas en tiempo real.
10. ¿Qué problemas de red provocan la inaccesibilidad de un sitio?
Respuesta: Fallos en la infraestructura de red (ruteadores, switches, ISPs) interrumpen la conectividad entre usuarios y el servidor. Por ejemplo, un BGP misconfiguration en un proveedor de internet puede desviar tráfico a rutas incorrectas, como ocurrió con Facebook en 2021.
Ataques a la capa de red (ej., ICMP floods) también saturan enlaces. Localmente, cables dañados o configuraciones incorrectas de VLANs aislan al servidor. Para mitigar, se usan múltiples proveedores de internet (multi-homing), monitoreo de latencia (pingdom), y protocolos redundantes como BGP Anycast. Herramientas como traceroute o MTR ayudan a diagnosticar dónde ocurre la falla.
11. ¿Cómo afectan las dependencias de terceros a la disponibilidad web?
Respuesta: Muchos sitios dependen de APIs externas (ej., pasarelas de pago, servicios de autenticación) o CDNs. Si un proveedor externo falla (ej., la caída de AWS US-East-1 en 2017), funciones críticas del sitio pueden dejar de trabajar. Por ejemplo, un error en la API de Google Maps puede romper un sitio de reservas.
Además, scripts de terceros (ej., anuncios o trackers) mal codificados ralentizan la carga o generan errores en cascada. Soluciones incluyen implementar circuit breakers (patrón de diseño para aislar fallos), cargar recursos de forma asíncrona, y tener alternativas locales para servicios esenciales.
12. ¿Por qué el agotamiento de recursos del servidor derriba un sitio?
Respuesta: Servidores con recursos limitados (RAM, CPU, almacenamiento) pueden colapsar si una aplicación consume más de lo asignado. Por ejemplo, un script mal optimizado que genera procesos infinitos agota la memoria, provocando que el kernel mate procesos prioritarios (OOM Killer).
Discos llenos (por logs no rotados o uploads masivos) impiden escrituras, bloqueando bases de datos o aplicaciones. Soluciones incluyen monitoreo con Nagios/Zabbix, límites de recursos (cgroups en Linux), y automatizar limpieza de archivos temporales. En entornos cloud, escalar verticalmente (aumentar RAM/CPU) o horizontalmente (añadir instancias) mitiga estos problemas, pero requiere ajustes dinámicos según la demanda.
13. ¿Cómo las actualizaciones fallidas provocan caídas en un sitio web?
Respuesta: Actualizar sistemas operativos, frameworks o plugins sin pruebas puede introducir incompatibilidades. Por ejemplo, una actualización de WordPress que rompe la compatibilidad con un tema personalizado genera errores PHP. En servidores, actualizar paquetes críticos (ej., OpenSSL) sin reiniciar servicios puede dejar puertos bloqueados. Además, parches de seguridad mal aplicados (ej., reglas de firewall) pueden aislar al servidor.
Para evitar esto, se usan entornos de staging idénticos a producción, despliegues canarios (liberar cambios gradualmente) y herramientas de rollback automático (ej., Snapshots en VMware). La comunicación entre equipos de desarrollo y operaciones (DevOps) es clave.
Respuesta: Errores manuales como eliminar archivos esenciales (ej., index.php), configurar mal permisos (chmod 777 en directorios), o desplegar código sin pruebas son causas frecuentes. En 2017, un error humano en AWS S3 (comando mal escrito) dejó caer sitios como Slack y Trello.
Otros casos incluyen: apagar servidores por equivocación, editar tablas de bases de datos en vivo, o bloquear IPs legítimas en firewalls. Mitigar esto requiere automatización (Infraestructura como Código), permisos basados en roles (RBAC), y flujos de aprobación para cambios críticos. Herramientas como Terraform o Kubernetes reducen la intervención manual.
15. ¿Por qué problemas legales o administrativos pueden caer un sitio web?
Respuesta: La expiración del dominio (no renovarlo a tiempo) o disputas de propiedad pueden dejar el sitio inaccesible. En 2018, el dominio de Google Argentina fue suspendido por un error administrativo. También, bloqueos gubernamentales (ej., censura por regulaciones) o demandas por infracción de derechos de autor (DMCA) pueden derribar sitios. Además, proveedores de hosting pueden suspender servicios por violación de TOS (ej., spam o contenido ilegal).
Para prevenirlo, se deben registrar dominios con auto-renewal, usar servicios de privacidad WHOIS, y cumplir normativas locales (GDPR, COPPA). Contratos claros con proveedores y asesoría legal son esenciales.
Consultor en Posicionamiento web y marketing digital, Colaborador en los Foros de Google, empeñado en transmitirle a los lectores la pasión por los temas que tienen que ver con las páginas web. Redactor del blog de HostDime desde el año 2017 y asesor de marketing en la compañía.