Ampliando equipos en el laboratorio de prácticas libres (L04)

El objetivo del laboratorio de prácticas libres es permitir a los alumnos de la Escuela Politécnica Superior realizar trabajos y prácticas de laboratorio con el mismo software y la misma instalación que disponen para las prácticas de sus asignaturas. Para cumplirlo, hemos ampliado dicho laboratorio con dos equipos idénticos a los del laboratorio L03 (Aula MAC).

Continue reading “Ampliando equipos en el laboratorio de prácticas libres (L04)”

Tu red bajo control: monitorización con Nagios

¿No te ha ocurrido nunca que en el peor momento se llena el disco duro? ¿O que se pare esa aplicación por red que tienes encendido 24 horas al día y tardes una semana en enterarte? Sí, podrías realizar unos programas que comprobasen constantemente que todo está funcionando en tus equipos, y te avisara cuando algo falla. Pero, ¿para qué hacerlo, si existe una herramienta profesional (y gratuita) que ya lo hace por ti? Nagios.

Si dispones de una vieja máquina con Linux, puedes instalar Nagios, y monitorizar todas tus máquinas y sus servicios de red en tiempo casi real, mostrando cualquier error vía web (ya que Nagios utiliza apache para mostrar los resultados) o mediante correo. Incluso podemos integrarlo en la barra del Firefox.

 


Nagios te avisará inmediatamente de cualquier problema que vea en los equipos de tu red, mediante unos plugins configurables. Sin embargo, su mayor eficacia la consigue en colaboración con NRPE.

NRPE (Nagios Remote Plugin Ejecutor) es un software disponible para Linux y Windows (en Windows se llama Nsclient++) que se instala en cada uno de los equipos a monitorizar, y que contacta con Nagios para informarle de cualquier anomalía que ocurra en su interior. Por supuesto es fácilmente programable y podemos ajustarlo al control que nos interese (NRPE incluye varios plugins por defecto para las tareas más comunes):


Y lo mejor de todo es que, no sólo nos informa del problema, sino que además es capaz de solucionarlo. Para ello simplemente programaremos NRPE para que ejecute una serie de comandos ante una alarma.

Nagios es una herramienta imprescindible para administradores, pero también muy recomendable para cualquier usuario que quiera estar seguro que sus equipos están funcionando correctamente, sea una máquina o cien.

Es muy sencillo encontrar información en Internet sobre la instalación y configuración de Nagios y NRPE. La página oficial es: http://www.nagios.org

Almacenamiento profesional, económico y en casa.

¡No sólo los grandes centros de datos pueden disponer de un servicio de almacenamiento profesional! Con Openfiler, prácticamente cualquiera, también puede.

Openfiler es una distribución Linux basada en rPatch con licencia GPL, que nos permite utilizar una máquina como servidor de ficheros por red. Soporta multitud de protocolos: HTTP/WEBDAV, NFS, SMB/CIFS, FTP…, pero uno de los más interesantes es iSCSI. Gracias a ello podemos convertir nuestro servidor en una SAN (Storage Area Network) sin necesidad del desembolso económico que suele ser necesario.

Continue reading “Almacenamiento profesional, económico y en casa.”

Alta disponibilidad con Heartbeat

En la entrada sobre DRBD explicábamos cómo crear RAID1 sobre dos servidores conectados por red.

Imaginemos que hemos instalado un servidor web en el servidor maestro, con lo que tendremos replicada la información en el servidor secundario en tiempo real gracias al DRBD. Esta configuración de los servidores nos permite recuperar el servicio sin pérdida de información en muy poco tiempo. Sin embargo, necesitamos la intervención del administrador para levantar el servicio tras caída del servidor primario: cambiar el estado del DRBD de secundario a primario, configurar la red y levantar el servicio Web.

Para conseguir alta disponibilidad necesitamos que el propio sistema realice todos estos pasos de manera automática, dando al usuario la sensación de que el servicio no ha sufrido ninguna interrupción (el tiempo sin servicio sería muy pequeño).

Continue reading “Alta disponibilidad con Heartbeat”

RAID1 por TCP/IP (DRBD)

Cuando se maneja información valiosa siempre es necesario tenerla replicada para poder disponer de ella en el menor tiempo posible (inmediatamente de manera óptima), y por supuesto, sin ninguna pérdida de datos.

Hace ya mucho tiempo que se usa RAID1 (y el resto de opciones RAID) en los discos de los servidores para tener una réplica exacta de los datos en ambos discos. De esta manera, en caso de fallo en uno de los discos, los datos siguen intactos en el otro, con lo que el servicio ofrecido seguirá disponible mientras solucionamos el problema del disco afectado.

Evidentemente, RAID1 no podrá mantener la disponibilidad del servicio si lo que falla es cualquier otra parte del servidor: controladora, alimentación, red, etc. Para poder hacerlo deberíamos tener duplicadas cada una de las partes que se pueden ver afectadas…pero siempre se puede estropear la placa base.

Continue reading “RAID1 por TCP/IP (DRBD)”

Copias de seguridad en caliente

Uno de los principales puntos a tener en cuenta por parte de un administrador de sistemas son las copias de seguridad de los datos que residen en sistemas en producción. Una buena gestión de copias de seguridad es básica para poder solventar posibles problemas en datos que, además, son críticos.

Hoy en día cualquier sistema informático en producción tiene como criterio de calidad la disponibilidad 24×7, por lo que el realizar copias de seguridad de datos que pueden estar actualizándose constantemente no es una tarea ni simple ni obvia.

En la EPS hemos implementado nuestros sistemas en producción con LVM, sí ese gestor de volúmenes de disco de software libre tan usado en Linux y sobradamente conocido por su propiedad de aumento de tamaño “en caliente”. LVM dispone de una opción muy interesante para solventar el problema de las copias: los “snapshots”.

¿Qué es y qué hace un “snapshots” en un gestor de volúmenes lógico?

Un volumen “snapshot” de LVM es un tipo especial de volumen  que permite mostrar, de cara al usuario, datos de otro volumen (normalmente uno en producción) tal cual se encontraban en el momento en que se creo el ‘snapshot’ y al que no le afectan las nuevas modificaciones que se realizan en el sistema original en producción. Al montar dicho volumen lógico (el del snapshot) accederemos a los directorios, ficheros e información existente en el volumen en producción en el momento en el que se realiza el snapshot.

¿Cómo lo consigue mientras el volumen de producción sigue actualizándose?

Lo que en realidad se almacena en el volumen del snapshot es  información referente a los cambios que se realizan en la partición original desde que se creó el snapshot (como metadatos, y por tanto, no accesible directamente), con el objetivo de saber en todo momento cómo estaba la partición original cuando se hizo el snapshot (al comparar dichos cambios y los datos actuales de la partición original). Por lo tanto, el tamaño del volumen del snapshot no necesita ser el mismo que el del volumen en producción, pues no van a copiarse los datos del sistema original.

El único problema que nos puede ocurrir sucede cuando el tamaño de los metadatos que debemos almacenar en el volumen “snapshot” como consecuencia de las modificaciones en el volumen origen (el de producción) es mayor que el tamaño que le hemos asignado al volumen del snapshot; en este caso no se garantiza la coherencia de los datos.

Cómo se puede hacer esto:

  • Debemos tener espacio suficiente para guardar los cambios producidos en el volumen original tras el snapshot.
  • Creamos el volumen en el que se copiará la “foto”:

lvcreate –LXXXG –s –n nombreVolumen nombreVolumenOriginal
nombreVolumen’ es el nombre que le daremos al ‘snapshot’
nombreVolumenOriginal’ es el nombre de volumen del que queremos realizar el ‘snapshot’

  • Montar el volumen
  • Realizar la copia
  • Una vez terminada la copia, se borra el snapshot igual que se borra cualquier otro volumen:

lvremove nombreVolumen