Uso de memoria virtual de Java en Linux, se utiliza demasiada memoria
Tengo un problema con una aplicación Java que se ejecuta en Linux.
Cuando inicio la aplicación, usando el tamaño de almacenamiento dinámico máximo predeterminado (64 MB), veo que al usar la aplicación superior se asignan 240 MB de memoria virtual a la aplicación. Esto crea algunos problemas con algún otro software en la computadora, que tiene recursos relativamente limitados.
La memoria virtual reservada no se utilizará de todos modos, hasta donde tengo entendido, porque una vez que alcanzamos el límite del montón, OutOfMemoryError
se lanza un an. Ejecuté la misma aplicación en Windows y veo que el tamaño de la memoria virtual y el tamaño del montón son similares.
¿Existe alguna forma de configurar la memoria virtual en uso para un proceso Java en Linux?
Edición 1 : el problema no es el montón. El problema es que si configuro un montón de 128 MB, por ejemplo, Linux aún asigna 210 MB de memoria virtual, que nunca es necesaria.**
Edición 2 : El uso ulimit -v
permite limitar la cantidad de memoria virtual. Si el tamaño establecido es inferior a 204 MB, la aplicación no se ejecutará aunque no necesite 204 MB, solo 64 MB. Entonces quiero entender por qué Java requiere tanta memoria virtual. ¿Se puede cambiar esto?
Edición 3 : hay varias otras aplicaciones ejecutándose en el sistema, que está integrado. Y el sistema sí tiene un límite de memoria virtual (según comentarios, detalle importante).
Esta ha sido una queja de larga data con Java, pero en gran medida no tiene sentido y, por lo general, se basa en observar información incorrecta. La frase habitual es algo así como "¡Hola mundo en Java ocupa 10 megabytes! ¿Por qué necesita eso?" Bueno, aquí hay una manera de hacer que Hello World en una JVM de 64 bits afirme ocupar más de 4 gigabytes... al menos según una forma de medición.
java -Xms1024m -Xmx4096m com.ejemplo.Hola
Diferentes formas de medir la memoria
En Linux, el comando top le proporciona varios números diferentes de memoria. Esto es lo que dice sobre el ejemplo de Hola Mundo:
PID USUARIO PR NI VIRT RES SHR S %CPU %MEM TIME+ COMANDO 2120 kggregory 20 0 4373m 15m 7152 S 0 0.2 0:00.10 java
- VIRT es el espacio de memoria virtual: la suma de todo lo que hay en el mapa de memoria virtual (ver más abajo). En gran medida no tiene sentido, excepto cuando no lo es (ver más abajo).
- RES es el tamaño del conjunto residente: el número de páginas que residen actualmente en la RAM. En casi todos los casos, este es el único número que debes usar cuando dices "demasiado grande". Pero todavía no es un número muy bueno, especialmente cuando se habla de Java.
- SHR es la cantidad de memoria residente que se comparte con otros procesos. Para un proceso Java, esto normalmente se limita a bibliotecas compartidas y archivos JAR asignados en memoria. En este ejemplo, solo tenía un proceso Java ejecutándose, por lo que sospecho que 7k es el resultado de las bibliotecas utilizadas por el sistema operativo.
- SWAP no está activado de forma predeterminada y no se muestra aquí. Indica la cantidad de memoria virtual que reside actualmente en el disco, ya sea que esté o no en el espacio de intercambio . El sistema operativo es muy bueno para mantener páginas activas en la RAM, y las únicas soluciones para el intercambio son (1) comprar más memoria o (2) reducir la cantidad de procesos, por lo que es mejor ignorar este número.
La situación del Administrador de tareas de Windows es un poco más complicada. En Windows XP, hay columnas "Uso de memoria" y "Tamaño de memoria virtual", pero la documentación oficial no dice nada sobre lo que significan. Windows Vista y Windows 7 agregan más columnas y, de hecho, están documentadas . De éstas, la medición del "Conjunto de Trabajo" es la más útil; corresponde aproximadamente a la suma de RES y SHR en Linux.
Comprender el mapa de memoria virtual
La memoria virtual consumida por un proceso es el total de todo lo que está en el mapa de memoria del proceso. Esto incluye datos (por ejemplo, el montón de Java), pero también todas las bibliotecas compartidas y archivos mapeados en memoria utilizados por el programa. En Linux, puede usar el comando pmap para ver todas las cosas asignadas al espacio de proceso (de aquí en adelante solo me referiré a Linux, porque es lo que uso; estoy seguro de que existen herramientas equivalentes para Ventanas). Aquí hay un extracto del mapa de memoria del programa "Hello World"; todo el mapa de memoria tiene más de 100 líneas y no es inusual tener una lista de mil líneas.
0000000040000000 36K rx-- /usr/local/java/jdk-1.6-x64/bin/java 0000000040108000 8K rwx-- /usr/local/java/jdk-1.6-x64/bin/java 0000000040eba000 676K rwx-- [anónimo] 00000006fae00000 21248K rwx-- [anónimo] 00000006fc2c0000 62720K rwx-- [anónimo] 0000000700000000 699072K rwx-- [anónimo] 000000072aab0000 2097152K rwx-- [anónimo] 00000007aaab0000 349504K rwx-- [anónimo] 00000007c0000000 1048576K rwx-- [anónimo] ... 00007fa1ed00d000 1652K r-xs- /usr/local/java/jdk-1.6-x64/jre/lib/rt.jar ... 00007fa1ed1d3000 1024K rwx-- [anónimo] 00007fa1ed2d3000 4K ----- [anónimo] 00007fa1ed2d4000 1024K rwx-- [anónimo] 00007fa1ed3d4000 4K ----- [anónimo] ... 00007fa1f20d3000 164K rx-- /usr/local/java/jdk-1.6-x64/jre/lib/amd64/libjava.so 00007fa1f20fc000 1020K ----- /usr/local/java/jdk-1.6-x64/jre/lib/amd64/libjava.so 00007fa1f21fb000 28K rwx-- /usr/local/java/jdk-1.6-x64/jre/lib/amd64/libjava.so ... 00007fa1f34aa000 1576K rx-- /lib/x86_64-linux-gnu/libc-2.13.so 00007fa1f3634000 2044K ----- /lib/x86_64-linux-gnu/libc-2.13.so 00007fa1f3833000 16K rx-- /lib/x86_64-linux-gnu/libc-2.13.so 00007fa1f3837000 4K rwx-- /lib/x86_64-linux-gnu/libc-2.13.so ...
Una explicación rápida del formato: cada fila comienza con la dirección de memoria virtual del segmento. A esto le sigue el tamaño del segmento, los permisos y el origen del segmento. Este último elemento es un archivo o "anon", que indica un bloque de memoria asignado mediante mmap .
Empezando desde arriba, tenemos
- El cargador JVM (es decir, el programa que se ejecuta cuando escribe
java
). Esto es muy pequeño; todo lo que hace es cargar en las bibliotecas compartidas donde se almacena el código JVM real. - Un montón de bloques anónimos que contienen el montón de Java y los datos internos. Se trata de una JVM de Sun, por lo que el montón se divide en varias generaciones, cada una de las cuales es su propio bloque de memoria. Tenga en cuenta que la JVM asigna espacio de memoria virtual según el
-Xmx
valor; esto le permite tener un montón contiguo. El-Xms
valor se usa internamente para indicar qué parte del montón está "en uso" cuando se inicia el programa y para activar la recolección de basura a medida que se acerca a ese límite. - Un archivo JAR asignado en memoria, en este caso el archivo que contiene las "clases JDK". Cuando mapea en memoria un JAR, puede acceder a los archivos que contiene de manera muy eficiente (en lugar de leerlo desde el principio cada vez). Sun JVM asignará en memoria todos los JAR en el classpath; Si el código de su aplicación necesita acceder a un JAR, también puede asignarlo en memoria.
- Datos por subproceso para dos subprocesos. El bloque de 1M es la pila de subprocesos. No tenía una buena explicación para el bloque 4k, pero @ericsoe lo identificó como un "bloque de guardia": no tiene permisos de lectura/escritura, por lo que causará una falla de segmento si se accede, y la JVM lo detecta y lo traduce. a un
StackOverFlowError
. Para una aplicación real, verá docenas, si no cientos, de estas entradas repetidas en el mapa de memoria. - Una de las bibliotecas compartidas que contiene el código JVM real. Hay varios de estos.
- La biblioteca compartida para la biblioteca estándar C. Esta es sólo una de las muchas cosas que carga la JVM y que no son estrictamente parte de Java.
Las bibliotecas compartidas son particularmente interesantes: cada biblioteca compartida tiene al menos dos segmentos: un segmento de solo lectura que contiene el código de la biblioteca y un segmento de lectura y escritura que contiene datos globales por proceso para la biblioteca (no sé cuál es el segmento sin permisos es; sólo lo he visto en Linux x64). La parte de solo lectura de la biblioteca se puede compartir entre todos los procesos que utilizan la biblioteca; por ejemplo, libc
tiene 1,5 M de espacio de memoria virtual que se puede compartir.
¿Cuándo es importante el tamaño de la memoria virtual?
El mapa de memoria virtual contiene muchas cosas. Parte es de sólo lectura, parte se comparte y parte se asigna pero nunca se toca (por ejemplo, casi todos los 4 Gb del montón en este ejemplo). Pero el sistema operativo es lo suficientemente inteligente como para cargar sólo lo que necesita, por lo que el tamaño de la memoria virtual es en gran medida irrelevante.
Donde el tamaño de la memoria virtual es importante es si está ejecutando un sistema operativo de 32 bits, donde solo puede asignar 2 Gb (o, en algunos casos, 3 Gb) de espacio de direcciones de proceso. En ese caso, se trata de un recurso escaso y es posible que tenga que hacer concesiones, como reducir el tamaño del montón para mapear en memoria un archivo grande o crear muchos subprocesos.
Pero, dado que las máquinas de 64 bits son omnipresentes, no creo que pase mucho tiempo antes de que el tamaño de la memoria virtual sea una estadística completamente irrelevante.
¿Cuándo es importante el tamaño del conjunto de residentes?
El tamaño del conjunto residente es la porción del espacio de memoria virtual que realmente se encuentra en la RAM. Si su RSS crece hasta convertirse en una parte importante de su memoria física total, puede que sea hora de empezar a preocuparse. Si su RSS crece hasta ocupar toda su memoria física y su sistema comienza a intercambiar, ya es hora de comenzar a preocuparse.
Pero RSS también es engañoso, especialmente en una máquina con poca carga. El sistema operativo no dedica mucho esfuerzo a recuperar las páginas utilizadas por un proceso. Se obtendrán pocos beneficios al hacerlo y existe la posibilidad de que se produzca un costoso error en la página si el proceso afecta a la página en el futuro. Como resultado, la estadística RSS puede incluir muchas páginas que no están en uso activo.
Línea de fondo
A menos que esté intercambiando, no se preocupe demasiado por lo que le dicen las distintas estadísticas de memoria. Con la advertencia de que un RSS en constante crecimiento puede indicar algún tipo de pérdida de memoria.
Con un programa Java, es mucho más importante prestar atención a lo que sucede en el montón. La cantidad total de espacio consumido es importante y existen algunas medidas que puede seguir para reducirla. Más importante es la cantidad de tiempo que dedica a la recolección de basura y qué partes del montón se recolectan.
Acceder al disco (es decir, a una base de datos) es caro y la memoria es barata. Si puedes cambiar uno por el otro, hazlo.
Existe un problema conocido con Java y glibc >= 2.10 (incluye Ubuntu >= 10.04, RHEL >= 6).
La cura es establecer este env. variable:
export MALLOC_ARENA_MAX=4
Si está ejecutando Tomcat, puede agregar esto al TOMCAT_HOME/bin/setenv.sh
archivo.
Para Docker, agregue esto a Dockerfile
ENV MALLOC_ARENA_MAX=4
Hay un artículo de IBM sobre cómo configurar MALLOC_ARENA_MAX https://www.ibm.com/developerworks/community/blogs/kevgrig/entry/linux_glibc_2_10_rhel_6_malloc_may_show_excessive_virtual_memory_usage?lang=en
Esta publicación de blog dice
Se sabe que la memoria residente se arrastra de una manera similar a una pérdida o fragmentación de memoria.
También hay un error JDK abierto JDK-8193521 "glibc desperdicia memoria con la configuración predeterminada"
busque MALLOC_ARENA_MAX en Google o SO para obtener más referencias.
Es posible que desees ajustar también otras opciones de malloc para optimizar una baja fragmentación de la memoria asignada:
# tune glibc memory allocation, optimize for low fragmentation
# limit the number of arenas
export MALLOC_ARENA_MAX=2
# disable dynamic mmap threshold, see M_MMAP_THRESHOLD in "man mallopt"
export MALLOC_MMAP_THRESHOLD_=131072
export MALLOC_TRIM_THRESHOLD_=131072
export MALLOC_TOP_PAD_=131072
export MALLOC_MMAP_MAX_=65536
La cantidad de memoria asignada para el proceso Java está bastante a la par de lo que esperaría. He tenido problemas similares al ejecutar Java en sistemas integrados/con memoria limitada. La ejecución de cualquier aplicación con límites arbitrarios de VM o en sistemas que no tienen cantidades adecuadas de swap tiende a fallar. Parece ser la naturaleza de muchas aplicaciones modernas que no están diseñadas para su uso en sistemas con recursos limitados.
Tiene algunas opciones más que puede probar y limitar la huella de memoria de su JVM. Esto podría reducir la huella de memoria virtual:
-XX:ReservedCodeCacheSize=32m Tamaño de caché de código reservado (en bytes): tamaño máximo de caché de código. [Solaris de 64 bits, AMD64 y servidor x86: 48 m; en 1.5.0_06 y anteriores, Solaris de 64 bits y and64: 1024m.]
-XX:MaxPermSize=64m Tamaño de la Generación Permanente. [5.0 y versiones más recientes: las máquinas virtuales de 64 bits se escalan un 30 % más; 1,4 AMD64: 96 m; 1.3.1 -cliente: 32m.]
Además, también debe configurar su -Xmx (tamaño máximo de almacenamiento dinámico) en un valor lo más cercano posible al uso máximo de memoria real de su aplicación. Creo que el comportamiento predeterminado de la JVM sigue siendo duplicar el tamaño del montón cada vez que lo expande hasta el máximo. Si comienza con un montón de 32 millones y su aplicación alcanzó un máximo de 65 millones, entonces el montón terminaría creciendo 32 millones -> 64 millones -> 128 millones.
También puedes intentar esto para que la VM sea menos agresiva a la hora de hacer crecer el montón:
-XX:MinHeapFreeRatio=40 Porcentaje mínimo de montón libre después de GC para evitar la expansión.
Además, por lo que recuerdo de haber experimentado con esto hace unos años, la cantidad de bibliotecas nativas cargadas tuvo un gran impacto en el espacio mínimo. La carga de java.net.Socket agregó más de 15 M si no recuerdo mal (y probablemente no).
Sun JVM requiere mucha memoria para HotSpot y se asigna en las bibliotecas de tiempo de ejecución en la memoria compartida.
Si la memoria es un problema, considere usar otra JVM adecuada para incrustar. IBM tiene j9 y existe el "jamvm" de código abierto que utiliza bibliotecas de rutas de clases GNU. Además, Sun tiene Squeak JVM ejecutándose en SunSPOTS, por lo que existen alternativas.