Una trampa del ciclo de vida del hilo del kernel de Linux: el caso del proceso Chromium que muere aleatoriamente
Al optimizar la latencia de inicio de Output Media de Recall.ai, un ingeniero encontró un error desconcertante: el proceso Chromium terminaba aleatoriamente después del inicio. La causa raíz se rastreó hasta la bandera `--die-with-parent` de Bubblewrap y el manejo de PR_SET_PDEATHSIG por parte del kernel de Linux. Esta bandera hace que los procesos secundarios reciban una señal SIGKILL cuando el hilo principal, no el proceso principal, termina. La gestión de hilos de Tokio interactuó con este comportamiento, llevando a la terminación inesperada de Chromium cuando el hilo principal era recolectado. Eliminar la bandera solucionó el problema, pero reveló un peculiar comportamiento poco conocido del kernel de Linux, subrayando la necesidad de precaución al manejar la interacción entre los ciclos de vida de los hilos y el aislamiento de procesos.
Leer más