[eside-ghost] [solucion] oom-killer , ¿quien es este?

AngelD angeld en froga.net
Mar Feb 28 12:01:48 CET 2006


Hace ya unos cuantos días, planteé un problema aleatorio cuyo protagonista
era "oom-killer", o "el abrazo de la muetee". Aquí van algunas cosas que
he probado, y la solución encontrada.

El "maravilloso" oom-killer se produce cuando una máquina se queda sin
memoria, "matando" este los procesos "que sobran" para que la máquina siga
funcionando, aun a costa de fulminar todo lo que pudiera interesar que
funcione. Cuando esto se produce, un aumento de la swap puede solucionar
el problema, a costa de rendimiento.

El problema empieza cuando se tiene muchísima memoria y swap, y el
oom-killer aparece de forma aleatoria. El ampliar la swap parece no
arreglar el problema, y los logs sólo dicen que los procesos se "mueren"
gracias a nuestro amigo.


## El problema REAL y la solución ##

Estos problemas me ocurrian con una 'Red Hat Enterprise Server 4' (RHES4).
Esta distro trae por defecto activado el 'SElinux', unas políticas de
seguridad implantadas a nivel de kernel para intentar evitar ciertos
ataques  por problemas en las aplicaciones.
Al parecer estas políticas no son del todo compatibles con algunas
aplicaciones y situaciones (en mi caso 'oracle' realizando copias via
'rman' por NFS), y, por ahora, la solución pasa por desactivar estas
políticas.

Resumientdo, al cargarme el 'SElinux' (y reiniciar) todo ha vuelto a
funcionar, y sin errores aleatorios.

Conclusión: Hay que mirar NO sólo los errores, sino lo que dice el log
inmediatamente antes de los mismos. :-)

Si alguien puede iluminarnos con algunos apuntes sobre SElinux, se
agradecerá, mientras tanto aquí queda el problema y la solución.

Saludos --- Angel



-- 
¡007 se lleva todas las mujeres!
¡Batman tiene a Robin!


Más información sobre la lista de distribución eside-ghost