Apache Hudi: Upserts, eliminaciones y procesamiento incremental para Big Data

2025-01-23
Apache Hudi: Upserts, eliminaciones y procesamiento incremental para Big Data

Apache Hudi es una plataforma de data lakehouse de código abierto, construida sobre un formato de tabla abierta de alto rendimiento para ingerir, indexar, almacenar, servir, transformar y gestionar datos en múltiples entornos de datos en la nube. Admite varios formatos de datos y fuentes, ofrece confirmaciones atómicas con soporte de rollback/restauración, y cuenta con capacidades rápidas de upsert/delete. Un subsistema de indexación escalable acelera las consultas, mientras que el soporte para consultas de instantánea, incrementales y de viaje en el tiempo ofrece flexibilidad. También se incluye la integración con almacenes de metadatos como Apache Hive Metastore.

Leer más

Archivado Web Hazlo Tú Mismo: Preservando la Web, Zine por Zine

2025-01-23

Este zine a color de 22 páginas, "Archivado Web Hazlo Tú Mismo", faculta a todos a participar en la preservación del contenido en línea que valoran. Creado por cinco autores, proporciona una guía práctica para el archivado web, sin requerir ninguna experiencia especial. Basado en un taller de noviembre de 2024, el zine explica por qué el archivado web es crucial y cómo hacerlo. Un PDF a color y una versión en póster están disponibles ahora, con una versión en blanco y negro e instrucciones de impresión próximamente.

Leer más

Compresión sin pérdidas de IDs de vectores mejora la búsqueda aproximada de vecinos más cercanos

2025-01-23
Compresión sin pérdidas de IDs de vectores mejora la búsqueda aproximada de vecinos más cercanos

Los investigadores presentan un esquema de compresión sin pérdidas para los IDs de vectores para abordar el alto costo de almacenamiento de los índices en la búsqueda aproximada de vecinos más cercanos. Aprovechando el hecho de que el orden de los IDs es irrelevante en muchas estructuras de índice y utilizando sistemas numéricos asimétricos o árboles wavelet, el método logra hasta 7 veces de compresión de los IDs de vectores sin afectar la precisión ni el tiempo de ejecución de la búsqueda. Esto se traduce en una reducción del 30% en el tamaño del índice para conjuntos de datos a escala de miles de millones. Además, el enfoque también puede comprimir sin pérdidas los códigos de vectores cuantizados, explotando las suboptimalidades en el algoritmo de cuantización original.

Leer más

Google Fiber comienza la construcción en Las Vegas

2025-01-22
Google Fiber comienza la construcción en Las Vegas

Google Fiber ha anunciado oficialmente el inicio de la construcción de su red en Las Vegas. La construcción ha comenzado en el lado oeste de la ciudad, con planes de expansión a otras partes del Condado de Clark en los próximos meses. Este proyecto es el resultado de acuerdos alcanzados en 2024 con la ciudad de Las Vegas y el Condado de Clark. Google Fiber se compromete a minimizar las interrupciones durante la construcción y planea ofrecer servicio en partes del área metropolitana a finales de este año. Los residentes y empresas de Nevada tendrán acceso a los planes de Google Fiber, con velocidades de hasta 8 gigabits y precios sin cambios desde 2012.

Leer más
Tecnología Construcción de Red

Juego de disparos multijugador en Lisp: La odisea de un desarrollador en solitario

2025-01-22
Juego de disparos multijugador en Lisp: La odisea de un desarrollador en solitario

Un desarrollador solitario creó un juego de disparos en tercera persona multijugador basado en la web, Wizard Masters, utilizando Clojure, un dialecto de Lisp. Aprovechando el REPL de Clojure para una iteración rápida y Babylon.js para los gráficos, el artículo detalla el sistema de reglas del juego, la arquitectura de red y los cálculos de daño en el área de efecto. Los desafíos encontrados incluyen la gestión del estado, la falta de una comunidad sólida de desarrollo de juegos Clojure y las limitaciones de la plataforma web. El autor concluye sopesando los pros y los contras del desarrollo de juegos web y enfatiza el papel crucial de las herramientas, insinuando un posible cambio a un motor principal como Unity o Unreal en el futuro.

Leer más
Juegos

Dieta alta en grasas de un hombre de Florida provoca una crisis de colesterol

2025-01-22
Dieta alta en grasas de un hombre de Florida provoca una crisis de colesterol

La dieta carnívora alta en grasas de un hombre de Florida, que consistía en kilos de queso, mantequilla y hamburguesas, provocó un nivel de colesterol superior a 1000 mg/dL, muy por encima del rango saludable. Esto provocó que los lípidos se filtraran de sus vasos sanguíneos, formando nódulos amarillos visibles en su piel, una afección llamada xantelasma. Su caso, publicado en JAMA Cardiology, destaca los peligros de las dietas extremadamente ricas en grasas y la importancia de controlar la hipercolesterolemia para prevenir complicaciones graves de salud.

Leer más
Salud

Reestructurando la Competencia de Investigación Estudiantil de la ACM: Enfoque en la Retroalimentación

2025-01-22
Reestructurando la Competencia de Investigación Estudiantil de la ACM: Enfoque en la Retroalimentación

Si bien la comunidad de lenguajes de programación cuenta con iniciativas de mentoría como PLMW, SIGPLAN-M y PLTea, falta una pieza crucial: la orientación en la presentación de investigaciones. Los autores argumentan que la Competencia de Investigación Estudiantil de la ACM (SRC), si bien intenta ayudar, adolece de un enfoque centrado en la competencia que eclipsa sus mecanismos de retroalimentación. Esto deja a los investigadores jóvenes sin las habilidades cruciales para presentar su trabajo de manera eficaz. La solución propuesta consiste en reorientar la SRC para que proporcione retroalimentación de alta calidad por parte de expertos, incluyendo un mayor número de revisores expertos, retroalimentación detallada y el archivo de resúmenes ampliados. Esto tiene como objetivo mejorar las habilidades de presentación de los estudiantes y aumentar la visibilidad de sus investigaciones.

Leer más

Tribunal Federal declara inconstitucionales las búsquedas encubiertas de datos del artículo 702

2025-01-22
Tribunal Federal declara inconstitucionales las búsquedas encubiertas de datos del artículo 702

Un tribunal de distrito federal ha dictaminado que las búsquedas encubiertas de bases de datos que contienen comunicaciones privadas de estadounidenses, recopiladas en virtud del artículo 702, normalmente requieren una orden judicial. Este fallo histórico, tras más de una década de litigios, rechaza la afirmación del gobierno de que dichas búsquedas pueden llevarse a cabo sin orden judicial. Organizaciones como la EFF han argumentado durante mucho tiempo que esta práctica es inconstitucional, y la decisión del tribunal es una victoria significativa para los derechos de privacidad. El fallo exige una reforma del Congreso del artículo 702 para prevenir futuros abusos.

Leer más

Construyendo un Portátil de Código Abierto desde Cero: El Proyecto anyon_e

2025-01-22
Construyendo un Portátil de Código Abierto desde Cero: El Proyecto anyon_e

Bryan se embarcó en una ambiciosa tarea para construir un portátil de código abierto altamente integrado, el anyon_e, desde cero. La máquina resultante cuenta con una pantalla AMOLED 4K, un teclado mecánico Cherry MX y un rendimiento impresionante ejecutando juegos como Minecraft y LLMs de 7B parámetros, todo ello manteniendo aproximadamente 7 horas de duración de la batería. El proyecto incluyó el diseño de una placa base personalizada en torno a un SoC RK3588, un controlador de energía dedicado (ESP32-S3) y la creación de un teclado mecánico y un trackpad. Este esfuerzo interdisciplinario, que abarca el diseño de hardware, el desarrollo de software y la ingeniería mecánica, muestra el poder de la colaboración de código abierto y el impulso para superar los límites.

Leer más
Hardware

Dominando el 'No' del Gerente de Producto: Reuniones Eficientes y Priorización

2025-01-22
Dominando el 'No' del Gerente de Producto: Reuniones Eficientes y Priorización

Esta publicación o indicación explora cómo los gerentes de producto pueden decir 'no' eficazmente a las solicitudes innecesarias, manteniendo las reuniones ágiles y las prioridades en orden. Se enfatiza la comunicación clara y la toma de decisiones eficiente para evitar que los proyectos se desvíen por demandas irrelevantes, aumentando así la productividad.

Leer más

Trellis: Automatización de flujo de trabajo PDF con IA

2025-01-22
Trellis: Automatización de flujo de trabajo PDF con IA

Trellis es una plataforma impulsada por IA que automatiza los flujos de trabajo de PDF. Su motor transforma documentos y llamadas complejas en datos utilizables para los equipos de operaciones e ingeniería en segundos, no en semanas. Ofrece acciones personalizables, validación de datos y sincronización en tiempo real con las fuentes de datos. Trellis prioriza la seguridad con el cumplimiento de SOC II Tipo 2, el cifrado de datos y las opciones de implementación en la nube privada. Aplicable en finanzas, salud e inmobiliaria, Trellis ayuda a las organizaciones a mejorar la eficiencia y garantizar el cumplimiento normativo.

Leer más

Desterrar la fatiga ocular en el teletrabajo: Optimizando la iluminación de tu oficina en casa

2025-01-22
Desterrar la fatiga ocular en el teletrabajo: Optimizando la iluminación de tu oficina en casa

¿El teletrabajo te causa fatiga ocular? El bloguero Russell Baylis comparte su experiencia para lograr una iluminación óptima, destacando la luz uniforme y difusa como clave para reducir la fatiga ocular. Transformó su espacio de trabajo con lámparas de pie y luces regulables, eliminando sombras duras y altos contrastes. La luz natural se suaviza con cortinas filtrantes, y se prioriza la iluminación de alta calidad y sin parpadeo. También se enfatiza la regla 20-20-20 y los descansos regulares para la salud ocular.

Leer más

El Satélite Espía Secreto que Ayudó a Ganar la Guerra Fría

2025-01-22
El Satélite Espía Secreto que Ayudó a Ganar la Guerra Fría

En la década de 1970, el auge de la Armada Soviética representaba una amenaza significativa para los EE. UU. Para contrarrestar la aparición de poderosos buques de guerra soviéticos, se lanzó el programa de satélites ultrasecreto Parcae. Desarrollado por el Laboratorio de Investigación Naval de EE. UU., Parcae proporcionaba datos de ubicación en tiempo real de buques soviéticos, reduciendo drásticamente el tiempo entre la interceptación de señales y la generación de informes de inteligencia a tan solo minutos. Esta inteligencia casi instantánea fue crucial para la toma de decisiones militares. Empleando múltiples satélites trabajando en conjunto y sistemas informáticos avanzados para procesar grandes cantidades de datos, Parcae ayudó a mantener el equilibrio estratégico durante la Guerra Fría. Su tecnología continúa influenciando los sistemas modernos de inteligencia de señales satelitales.

Leer más

Sistemas de Archivos: ¿La Hipermedia Original?

2025-01-22
Sistemas de Archivos: ¿La Hipermedia Original?

Este artículo explora la intrigante idea de los sistemas de archivos como precursores de la hipermedia. Se argumenta que la estructura de enlaces entre directorios y archivos, junto con el soporte para diversos tipos de datos, proporcionó una forma de acceso y organización de información flexible y variada, haciendo eco de los principios centrales de la hipermedia. Aunque carece de la interactividad y el dinamismo de la hipermedia moderna, el artículo destaca el papel pionero de los sistemas de archivos en la gestión de la información, preparando el terreno para las tecnologías de hipermedia posteriores.

Leer más

Pesadilla de seguridad de subprocesos: Un fallo misterioso en ARM64, incluso con Rust seguro

2025-01-22
Pesadilla de seguridad de subprocesos: Un fallo misterioso en ARM64, incluso con Rust seguro

Durante la portabilidad del código de E/S de red de Python a Rust en EdgeDB, surgió un fallo misterioso en plataformas ARM64. Inicialmente se sospechó que era un bloqueo, pero la causa raíz resultó ser un comportamiento inseguro de subprocesos en las funciones `setenv` y `getenv`. En ARM64, la biblioteca `openssl-probe` usa `setenv` para establecer variables de entorno, mientras que otro subproceso llama concurrentemente a `getenv`. Esto reubica la matriz `environ`, lo que provoca un fallo. La solución consistió en cambiar el backend TLS de reqwest de rust-native-tls a rustls. Esto destaca cómo incluso en Rust seguro para la memoria, las interacciones con la biblioteca estándar de C todavía pueden introducir problemas de seguridad de subprocesos.

Leer más

Resolviendo Problemas de Ciencia Computacional con IA: Redes Neuronales Informadas por la Física (PINNs)

2025-01-22

Este artículo explora el uso de Redes Neuronales Informadas por la Física (PINNs) para resolver problemas desafiantes en ciencia computacional, particularmente ecuaciones diferenciales parciales (EDPs). Las PINNs superan las limitaciones de los métodos numéricos tradicionales al incorporar leyes físicas directamente en la función de pérdida de la red neuronal. Esto aborda problemas como datos insuficientes, alto costo computacional y generalización deficiente. El artículo explica EDPs, derivadas parciales y demuestra la implementación de PINNs usando la ecuación de calor 2D, cubriendo la arquitectura de la red, la definición de la función de pérdida y el entrenamiento. Los resultados muestran que las PINNs modelan con precisión y eficiencia la difusión de calor, ofreciendo una herramienta poderosa para varios desafíos científicos y de ingeniería.

Leer más
IA

El lobby de IA de OpenAI se multiplica por siete: una nueva estrategia política

2025-01-22
El lobby de IA de OpenAI se multiplica por siete: una nueva estrategia política

El gasto de OpenAI en cabildeo gubernamental se disparó a 1,76 millones de dólares en 2024, un aumento de casi siete veces respecto al año anterior. Esto marca la entrada significativa de OpenAI en la arena política, con el objetivo de dar forma a las políticas de IA. Sus esfuerzos de cabildeo se centraron en la legislación relacionada con los centros de investigación de IA y las pruebas de referencia. La empresa contrató a varios lobistas experimentados, incluidos antiguos empleados del senador Lindsey Graham. Aunque todavía es menor que el de sus principales competidores tecnológicos, la creciente influencia de OpenAI es evidente, mientras presionan por políticas energéticas favorables, contratos de seguridad nacional y regulaciones más flexibles.

Leer más
Tecnología

Orígenes de los Comandos Comunes de Unix

2025-01-22

Este artículo explora los orígenes de los comandos clave en la jerarquía de comandos de Unix/Linux. Desde utilidades Unix fundamentales como `cat`, `ls` y `grep` hasta contribuciones de BSD, GNU y otros proyectos, el autor rastrea meticulosamente el linaje de numerosas herramientas. Esto proporciona una perspectiva histórica fascinante sobre la evolución de estos sistemas esenciales y será de interés para entusiastas de la línea de comandos y desarrolladores de sistemas.

Leer más

Stratoshark: Extendiendo el legado de Wireshark a la nube

2025-01-22

Stratoshark es una herramienta de código abierto que lleva el poder del análisis de red de Wireshark a entornos de nube. Captura llamadas del sistema y actividad de registro, ofreciendo funciones avanzadas para la resolución de problemas y el análisis. Comparte el motor de disección y gran parte de la interfaz de usuario con Wireshark, y admite el mismo formato de archivo que Falco y Sysdig CLI, lo que permite un flujo de trabajo fluido entre herramientas. Disponible para Windows, macOS y a través del código fuente, proporciona una visión sin precedentes de la actividad de la aplicación en la nube.

Leer más
Tecnología análisis de red

TabBoo: Extensión de Chrome para romper malos hábitos de sitios web

2025-01-22
TabBoo: Extensión de Chrome para romper malos hábitos de sitios web

¿Cansado de visitar repetidamente sitios web que te distraen? La extensión de Chrome TabBoo puede ayudar. Muestra sustos aleatorios cuando intentas acceder a sitios web específicos, utilizando el condicionamiento aversivo para ayudarte a romper los malos hábitos online. Dile adiós a los bucles infinitos y recupera el control de tu tiempo de navegación.

Leer más

Ejecuta LLMs locales en tu navegador: Presentamos BrowserAI

2025-01-22
Ejecuta LLMs locales en tu navegador: Presentamos BrowserAI

BrowserAI es un proyecto de código abierto que te permite ejecutar modelos de lenguaje grandes (LLMs) localmente en tu navegador. Priorizando la privacidad, todo el procesamiento ocurre en tu dispositivo, eliminando los costos de servidor y la infraestructura compleja. Admite varios modelos, incluidos los de MLC y Transformers, aprovechando WebGPU para una inferencia ultrarrápida. Una API simple permite a los desarrolladores integrar fácilmente la generación de texto, el reconocimiento de voz y la conversión de texto a voz. Muchos modelos ya son compatibles, con una hoja de ruta que describe mejoras futuras, como capacidades avanzadas de RAG y funciones empresariales.

Leer más
IA

Lógica para Programadores: Una Introducción Suave al Cálculo de Secuencias

2025-01-22

Esta publicación, la primera de una serie sobre lógica, introduce el cálculo de secuencias como un sistema poderoso para el razonamiento. Usando la notación de Gentzen, el autor explica cómo representar inferencias lógicas simbólicamente, cubriendo reglas de inferencia, árboles de derivación y metavariables. El artículo compara el cálculo de secuencias, la deducción natural de secuencias y la deducción natural, y aborda el cálculo de secuencias unilateral y la lógica intuicionista. Finalmente, presenta brevemente los términos de prueba en la lógica intuicionista y su conexión con el cálculo lambda simplemente tipado.

Leer más

Conquistando la Oscuridad: Una Guía para la Fotografía de Minerales Fluorescentes

2025-01-22
Conquistando la Oscuridad: Una Guía para la Fotografía de Minerales Fluorescentes

Esta guía completa se adentra en el arte de la fotografía de minerales fluorescentes, ofreciendo un enfoque paso a paso desde la configuración de la cámara hasta las técnicas de iluminación y el postprocesamiento. El desafío radica en capturar colores fluorescentes vibrantes en condiciones de poca luz, lo que requiere ajustes meticulosos del tiempo de exposición, ISO, apertura y más. El artículo enfatiza la importancia de la selección del fondo, la colocación de la luz y el software de postprocesamiento, proporcionando soluciones para fotografiar especímenes complejos con múltiples minerales fluorescentes. El objetivo final es lograr imágenes nítidas y con colores precisos de estas maravillas brillantes.

Leer más

¡Computador casero retro DIY: 4 veces la potencia de un C64!

2025-01-22
¡Computador casero retro DIY: 4 veces la potencia de un C64!

Un desarrollador construyó un ordenador casero retro usando solo 61 chips lógicos 74HCxx, 2 chips SRAM 6C1008 y 4 chips FLASH 39SF0x0, ¡con 4 veces la potencia de procesamiento de un Commodore C64! El Minimal 64x4 cuenta con 64 KB de RAM, un SSD FLASH de 512 KB, salida VGA y un puerto PS/2. Tiene 256 instrucciones y una cadena de herramientas completa, incluyendo un sistema operativo, editor de texto, ensamblador e intérprete similar a Python. El proyecto de código abierto incluye juegos clásicos como Tetris y Space Invaders.

Leer más
Hardware

Error de DNS de Mastercard pasa desapercibido durante años

2025-01-22

Un investigador de seguridad, Philippe Caturegli, descubrió un error de casi cinco años en la configuración del servidor de nombres de dominio de Mastercard. Esta configuración incorrecta podría haber permitido a cualquiera interceptar o desviar el tráfico de internet de la empresa registrando un nombre de dominio no utilizado. Caturegli gastó 300 dólares en registrar el dominio 'akam.ne' para evitar su explotación por ciberdelincuentes. Mastercard reconoció el error, pero afirmó que no hubo ningún riesgo real para la seguridad. El incidente destaca el potencial de vulnerabilidades significativas incluso en las configuraciones de DNS de grandes organizaciones.

Leer más
Tecnología error DNS

Hoja de ruta de Plex para 2025: Experiencia de usuario renovada y nuevas funciones

2025-01-22
Hoja de ruta de Plex para 2025: Experiencia de usuario renovada y nuevas funciones

Plex comenzó 2025 con fuerza, anunciando actualizaciones centradas en mejorar la experiencia del usuario e introduciendo nuevas funciones interesantes. Estas incluyen un sistema de revisión e interacción renovado que permite a los usuarios escribir y comentar reseñas, opciones mejoradas de visibilidad y uso compartido de perfiles en watch.plex.tv para una mayor interacción de la comunidad, una vista previa de una aplicación Apple TV rediseñada y el lanzamiento oficial de la codificación de hardware HEVC para los suscriptores de Plex Pass, lo que aumenta la calidad del video y reduce el consumo de ancho de banda. En general, Plex busca crear una plataforma de transmisión más robusta y una comunidad más vibrante.

Leer más
Tecnología

La tiranía de la falta de estructura: Dinámicas de poder en el movimiento de liberación de la mujer

2025-01-22

Este artículo examina los inconvenientes de las formas organizativas 'sin estructura' en el movimiento de liberación de la mujer. Jo Freeman argumenta que los grupos aparentemente sin estructura desarrollan inevitablemente estructuras de poder informales, lo que lleva al elitismo y a la exclusión. La falta de estructuras formales resulta en procesos de toma de decisiones opacos, con el poder concentrado en manos de unos pocos, dejando a la mayoría confundida. La autora aboga por estructuras organizativas formales y democráticas para garantizar una distribución equitativa del poder y la rendición de cuentas, proponiendo principios para la estructuración democrática, como la delegación de autoridad, la responsabilidad, el poder distribuido y el intercambio de información para fomentar el desarrollo saludable del movimiento de liberación de la mujer.

Leer más

La procesadora de pagos en criptomonedas canadiense Cryptomus presuntamente ayuda a Rusia a evadir sanciones

2025-01-22

Cryptomus, una empresa financiera registrada en Canadá, ha sido identificada como la procesadora de pagos para docenas de casas de cambio de criptomonedas rusas y sitios web que ofrecen servicios de ciberdelincuencia a clientes de habla rusa. Las investigaciones revelan que la dirección registrada de Cryptomus es una dirección virtual compartida con numerosas otras entidades financieras, lo que genera preocupaciones sobre el lavado de dinero a gran escala y la evasión de sanciones. Los investigadores descubrieron que Cryptomus procesó transacciones para al menos 122 servicios de ciberdelincuencia, incluidos aquellos que venden cuentas robadas, servicios de anonimato e infraestructura de ataque. Estas transacciones finalmente se vincularon a cuentas en grandes bancos rusos, actualmente sancionados por los EE. UU. y otras naciones occidentales. Las operaciones reales de Cryptomus y la legitimidad de su dirección registrada son altamente cuestionables, lo que destaca el potencial de las criptomonedas para facilitar la evasión de sanciones.

Leer más

Tablas Hash Rápidas y Arreglos Dinámicos en C

2025-01-22

Este artículo muestra cómo implementar rápidamente en C equivalentes a `std::unordered_map` y `std::vector` de C++. Utilizando un asignador personalizado, cadenas contadas y una función hash eficiente, el autor presenta implementaciones de tablas hash planas y jerárquicas, junto con un arreglo dinámico. El artículo también cubre la concatenación de cadenas, la manipulación de variables de entorno y la seguridad mejorada de las tablas hash, utilizando Address Space Layout Randomization (ASLR) para mejorar la resistencia a colisiones.

Leer más
1 2 501 502 503 505 507 508 509 595 596