Webtagr - Resumen de noticias de tecnología

Fivetran adquiere Census: automatizando todo el recorrido de los datos

2025-05-01

La adquisición de la empresa de ETL inverso Census por parte de Fivetran representa un avance significativo en la integración de datos. El motor de ETL inverso confiable de Census permite el movimiento fluido y confiable de datos gobernados desde almacenes de datos hasta aplicaciones operativas como Salesforce y HubSpot, cerrando el ciclo entre el análisis y la acción. Esto expande la plataforma Fivetran más allá de la ingestión y la transformación, permitiendo a los clientes impulsar decisiones en tiempo real, IA y operaciones comerciales con automatización y capacidad de observación, sin código personalizado ni mantenimiento continuo. Clientes como Canva ya han logrado resultados impresionantes utilizando Fivetran y Census, incluyendo un aumento en las tasas de apertura de correos electrónicos, el compromiso con la plataforma y un ahorro significativo de tiempo de ingeniería.

(www.fivetran.com)

Desarrollo ETL inverso

Inicios lentos de aplicaciones Mac: ¿escaneo de malware o fallo en la caché de hash?

2025-05-01

El blogger Jeff Johnson descubrió el año pasado que los lentos inicios de las aplicaciones Mac se deben al escaneo de malware realizado por el proceso syspolicyd. Sin embargo, el blogger Howard Oakley no está de acuerdo. Johnson utiliza spindumps para refutar a Oakley, mostrando que el escaneo de malware se produce durante dlopen al cargar bibliotecas dinámicas. Oakley afirma que los inicios lentos se deben a fallos en la caché de hash SHA-256 para archivos en la carpeta Frameworks. Johnson argumenta que la teoría de Oakley carece de evidencia e ignora el hecho de que los binarios universales contienen dos arquitecturas, lo que hace que las estimaciones de tiempo de cálculo de hash de Oakley sean imprecisas. El núcleo de este debate reside en diferentes interpretaciones de los registros del sistema y las instantáneas de procesos, y en diferentes comprensiones de los mecanismos de caché.

(lapcatsoftware.com)

Desarrollo aplicaciones Mac

Redis vuelve a la licencia de código abierto AGPLv3

2025-05-01

El desarrollador principal de Redis, antirez, recuerda el proceso de regreso de Redis a la licencia de código abierto AGPLv3. Él personalmente abogó fuertemente por AGPL, creyendo que el SSPL no logró obtener una aceptación generalizada por parte de la comunidad. Redis 8, ahora oficialmente lanzado, utiliza la licencia AGPLv3, para gran satisfacción de antirez. Promete mejoras continuas a Redis, particularmente el nuevo tipo de datos Vector Sets.

(antirez.com)

Desarrollo Licencia de Código Abierto

Gestor de marcadores de código abierto y autoalojable: tu privacidad, tu elección

2025-05-01

Este gestor de marcadores de código abierto y autoalojable prioriza tu privacidad. Cuenta con un diseño adaptable a todos los tamaños de pantalla, potentes funciones de búsqueda para facilitar la recuperación de contenido, una extensión de navegador para guardar páginas web sin problemas, y admite acciones masivas, importación/exportación y alternancia entre modo oscuro/claro. Lo más importante es que promete nunca vender tus datos a terceros y ofrece una integración de API segura para crear soluciones personalizadas. ¡Experimenta este gestor de marcadores centrado en la privacidad y potente hoy mismo!

(linkwarden.app)

Desarrollo gestor de marcadores

Acelera la copia de bases de datos SQLite: el truco del volcado de texto

2025-05-01

El autor encontró un cuello de botella de velocidad al copiar bases de datos SQLite grandes debido al gran tamaño de los archivos de índice. Descubrió que volcar la base de datos como un archivo de texto (usando el comando `.dump`) y luego comprimirlo con gzip reduce significativamente el tamaño del archivo, acelerando así el proceso de copia. En comparación con copiar directamente una base de datos de 3,4 GB, este método comprimió el archivo a 240 MB, lo que resultó en una mejora de velocidad de 14 veces. Además, este método evita problemas de corrupción de la base de datos que pueden surgir de las actualizaciones durante el proceso de copia, mejorando la confiabilidad.

(alexwlchan.net)

Desarrollo copia de base de datos

El error de inicio de 30 segundos de Windows 7: ¿Un simple error de codificación?

2025-05-01

¿Recuerdas Windows 7? Aunque fue un triunfo para Microsoft, un peculiar error afectó a algunos usuarios: un retraso de inicio de 30 segundos al usar un fondo de pantalla monocromático. Una publicación reciente en un blog revela al culpable: un simple error de codificación. El sistema esperaba un mensaje que confirmaba que la imagen de fondo estaba lista, un mensaje que solo se enviaba si se usaba un mapa de bits complejo, no un solo color. Para empeorar las cosas, una configuración de política de grupo para ocultar los iconos del escritorio agravó el problema debido a su ubicación en el código. La corrección, implementada meses después, destaca las formas sorprendentes en que los errores de programación aparentemente menores pueden causar grandes dolores de cabeza.

(www.pcworld.com)

Desarrollo error de codificación inicio del sistema

Suite Completa de Conversión CSV: Transforma tus Datos con Facilidad

2025-05-01

Este potente conversor CSV online te permite procesar fácilmente varios formatos de datos directamente en tu navegador. Admite la importación de archivos CSV, TSV, XLSX, XLS y TXT con detección automática de formato y codificación. Renombra encabezados, activa/desactiva campos, arrastra y suelta para reordenar columnas, divide o fusiona columnas, utiliza expresiones regulares para la sustitución de texto y convierte datos a formatos JSON o XML. Una vista de pantalla completa facilita la inspección de conjuntos de datos grandes, mientras que las funciones de búsqueda, filtro y ordenación están integradas. Compara las diferencias entre conjuntos de datos para un análisis mejorado. Sin descargas ni instalaciones necesarias: ¡experimenta el procesamiento de datos simplificado!

(csvforge.com)

Desarrollo conversión CSV

Hackathon FinArva IA 2025: Solucionando los desafíos de distribución financiera de la India con IA

2025-05-01

GroMo presenta el Hackathon FinArva IA 2025, impulsado por AWS, una competencia de alto nivel para abordar los problemas más difíciles de distribución financiera en la India utilizando IA e innovación de productos. Los participantes diseñarán soluciones inteligentes para los próximos mil millones de usuarios de la India, recibirán tutoría exclusiva, presentarán sus ideas a los principales líderes de fintech y competirán por premios que superan los ₹10,00,000. Abierto a estudiantes, profesionales y entusiastas de la IA, se alientan los equipos de 3 a 5 miembros. Los criterios de victoria incluyen la comprensión del problema, la innovación, el impacto comercial, la integración eficaz de la IA y la facilidad de uso.

(www.ycombinator.com)

Desarrollo

Explotación de una Use-After-Free en el motor de navegador Ladybird de SerenityOS

2025-05-01

Se ha descubierto una vulnerabilidad Use-After-Free (UAF) en el motor JavaScript LibJS de Ladybird, un motor de navegador del proyecto SerenityOS. Esta vulnerabilidad se debe a una gestión incorrecta del búfer de argumentos del intérprete, lo que permite a los atacantes activarla con un objeto de función proxy malicioso y un controlador `[[Get]]`. La explotación de este UAF concede primitivas de lectura/escritura arbitrarias, culminando en la ejecución de código, demostrada mediante la ejecución de `/calc`. La vulnerabilidad se encontró utilizando el fuzzer Fuzzilli y se explotó mediante una serie de pasos que incluyen la fuga de memoria y la falsificación de objetos.

(jessie.cafe)

Desarrollo

Las trampas del límite de longitud de cadena

2025-04-30

Esta publicación profundiza en las complejidades de la limitación de la longitud de la cadena. Las diferentes codificaciones de caracteres (UTF-8, UTF-16, puntos de código Unicode, grupos de grafemas) dan lugar a diferentes métodos de cálculo de la longitud, lo que provoca fácilmente inconsistencias entre el front-end, el back-end y las capas de la base de datos, dando como resultado errores. El autor sugiere utilizar el recuento de puntos de código Unicode con normalización NFC, aunque no es perfecto, como el mejor enfoque. El artículo también explora las ventajas y desventajas del recuento de grupos de grafemas, el recuento de bytes UTF-8 y el recuento de unidades de código UTF-16, y proporciona un ejemplo de código para un método de recuento híbrido.

(adam-p.ca)

Desarrollo longitud de cadena

El Laboratorio de Código Abierto (OSL) se enfrenta al cierre a menos que se aseguren 250.000 dólares

2025-04-30

El Laboratorio de Código Abierto (OSL) de la Universidad Estatal de Oregón se enfrenta a una grave escasez de fondos. Debido a la disminución de las donaciones corporativas y a los recortes presupuestarios de la universidad, el OSL necesita recaudar 250.000 dólares antes del 14 de mayo de 2025 para evitar el cierre. Esta financiación cubrirá los salarios de los empleados y estudiantes, y los gastos operativos. El OSL alberga más de 500 proyectos de código abierto gratuitos en todo el mundo y ha asesorado a más de 130 estudiantes en sus 22 años de historia. El laboratorio también se enfrenta al desafío de que su centro de datos se vaya a desmantelar, siendo la búsqueda de una nueva ubicación extremadamente difícil.

(osuosl.org)

Desarrollo universidad

JetBrains elimina reseñas negativas de su asistente de IA, generando controversia

2025-04-30

El plugin Asistente de IA de JetBrains, descargado más de 22 millones de veces, tiene una mediocre calificación de 2,3 estrellas. Recientemente, los usuarios notaron la eliminación de reseñas negativas, lo que llevó a JetBrains a explicar que estas reseñas abordaban problemas ya resueltos o violaban las políticas. Sin embargo, esta acción generó una reacción negativa, con usuarios acusando a JetBrains de intentar ocultar varios problemas que afectan al Asistente de IA, incluyendo soporte limitado a modelos de terceros, latencia frecuente, dependencia de servicios en la nube para funciones principales, experiencia de usuario inconsistente entre los tipos de proyectos y documentación escasa. La instalación automática no autorizada del Asistente de IA es otro punto importante de controversia. Si bien JetBrains introdujo el nuevo agente de IA Junie y un nivel gratuito, el alto costo y la falta de un negocio de nube separado, a diferencia de sus competidores, representan desafíos continuos.

(devclass.com)

Desarrollo Reseñas negativas

CVE-2025-21756: Explotación de una vulnerabilidad del kernel de Linux a través de vsock

2025-04-30

Un investigador descubrió una vulnerabilidad simple en el kernel de Linux, CVE-2025-21756, en una presentación de KernelCTF, que permite la escalada de privilegios a través de vsock. La explotación se centra en un problema de Use After Free (UAF), solucionado con solo unas pocas líneas de código. El investigador analizó el parche, identificó la vulnerabilidad e intentó un ataque de caché cruzado. Sin embargo, AppArmor impidió la explotación directa. Inteligentemente, usó vsock_diag_dump como un canal lateral para evitar kASLR y filtrar direcciones del kernel. Finalmente, se usó una cadena ROP cuidadosamente elaborada para llamar a la función `commit_creds` y obtener privilegios de root. El proceso fue desafiante, proporcionando un valioso conocimiento sobre seguridad del kernel.

(hoefler.dev)

Desarrollo

NotebookLM ahora ofrece resúmenes de audio multilingües

2025-04-30

NotebookLM ha actualizado su función de resumen de audio, permitiendo a los usuarios seleccionar su idioma de salida preferido. Ya sea que subas un documental en portugués, un artículo de investigación en español o un informe de estudio en inglés, el sistema puede generar un resumen de audio en el idioma que elijas, facilitando la creación de contenido multilingüe o materiales de aprendizaje. Por ejemplo, un profesor puede compartir recursos sobre la selva amazónica en varios idiomas, y los alumnos pueden subirlos y generar resúmenes de audio en su idioma nativo, rompiendo las barreras del idioma y haciendo la información más accesible.

(blog.google)

Desarrollo resumen de audio

ART: Mejora del rendimiento de LLM con cambios mínimos de código mediante RL

2025-04-30

Agent Reinforcement Trainer (ART) es una biblioteca de aprendizaje por refuerzo de código abierto diseñada para aumentar el rendimiento de los modelos de lenguaje grandes (LLM) en flujos de trabajo de agentes. Utilizando el potente algoritmo GRPO, ART entrena modelos a partir de sus propias experiencias. A diferencia de la mayoría de las bibliotecas de RL, ART se integra perfectamente en las bases de código existentes, descargando la complejidad del bucle de entrenamiento de RL a su backend. ART consta de un cliente (para interactuar con su código) y un servidor (que maneja la inferencia y el entrenamiento). El bucle de entrenamiento implica inferencia (recopilación de datos y asignación de recompensas) y entrenamiento (utilizando GRPO para entrenar el modelo y actualizar LoRAs). ART admite la mayoría de los modelos de lenguaje causal compatibles con vLLM/HuggingFace Transformers. Actualmente en fase alfa, ART acepta contribuciones.

(github.com)

Desarrollo

BSSG: Un generador de sitios estáticos en Bash lanzado después de una década de desarrollo

2025-04-30

El autor, con un sitio web personal desde finales de la década de 1990, pasó por varias etapas de creación de sitios web: desde la codificación manual de HTML hasta editores WYSIWYG y CMS dinámicos como WordPress. Frustrado con las constantes actualizaciones de seguridad y el mantenimiento de los CMS dinámicos, adoptó generadores de sitios estáticos. Después de experimentar con bashblog, Pelican y Nikola (para el cual incluso creó un contenedor Docker), desarrolló su propio Generador de Sitios Estáticos en Bash (BSSG) en 2015. Con el tiempo, BSSG evolucionó, incorporando características como temas, archivado y etiquetas. Sus puntos fuertes radican en su naturaleza ligera, portabilidad, alto rendimiento, excelentes puntuaciones de accesibilidad, soporte para Markdown y una variedad de temas. A pesar de reconocer imperfecciones en el código, el autor lanza BSSG de código abierto, esperando que beneficie a quienes buscan una alternativa de bajo mantenimiento a los CMS dinámicos.

(it-notes.dragas.net)

Desarrollo

Raven: El nuevo ecosistema de aprendizaje automático de OCaml

2025-04-30

Raven es un ecosistema completo que lleva el aprendizaje automático y la ciencia de datos a OCaml. Ofrece bibliotecas que reflejan las herramientas populares de Python, como NumPy (con Ndarray), Jupyter (con Quill) y JAX (con Rune), buscando la facilidad de uso de Python, al tiempo que aprovecha la seguridad de tipos y el rendimiento de OCaml. Actualmente en pre-alfa, Raven cuenta con un conjunto creciente de herramientas para computación numérica, visualización (Hugin) y más, prometiendo una alternativa convincente para los científicos de datos que buscan un lenguaje más seguro y rápido.

(github.com)

Desarrollo

El Arte de Decir No: Una API Ligera para Rechazos Elegante

2025-04-30

¿Cansado de luchar para rechazar educadamente las solicitudes? Esta API ligera, "No como Servicio", ofrece miles de razones creativas y divertidas para el rechazo en cualquier situación. Fácil de integrar en aplicaciones, bots, páginas de destino y mucho más, incluso ayuda a crear cartas de rechazo ingeniosas. El código abierto es fácil de ejecutar, lo que lo convierte en una herramienta divertida y eficiente para decir "no" con estilo.

(github.com)

Desarrollo Razones de Rechazo Ligera

arXivLabs: Colaboraciones de la Comunidad en Nuevas Funciones de arXiv

2025-04-30

arXivLabs es un marco experimental que permite a los colaboradores desarrollar y compartir nuevas funciones de arXiv directamente en el sitio web. Los participantes adoptan los valores de arXiv de apertura, comunidad, excelencia y privacidad de datos de usuario. ¿Tienes una idea para mejorar la comunidad de arXiv? ¡Aprende más sobre arXivLabs!

(arxiv.org)

Desarrollo

Talanoa: Una Visión de una Década, Finalmente Realizada

2025-04-30

John Martin, un ingeniero web, concibió la idea de Talanoa, una aplicación de correo electrónico diseñada como una conversación, en 2014. Revisando la idea anualmente, finalmente la lanzó después de darse cuenta de que no existía un producto similar en el mercado. Esta historia destaca la dedicación y la persistencia necesarias para dar vida a una visión y llenar un vacío en el mercado.

(talanoa.email)

Desarrollo

dataframely: Una biblioteca de validación de DataFrames nativa de Polars

2025-04-30

El esfuerzo de QuantCo para modernizar una base de código heredada reveló un fallo crítico en el procesamiento de sus DataFrames: la falta de validación. La migración de pandas a Polars, buscando ganancias de rendimiento, puso de manifiesto este problema. Bibliotecas existentes como pandera y patito resultaron insuficientes. Para solucionarlo, desarrollaron dataframely, una biblioteca nativa de Polars que permite la validación declarativa de DataFrames. dataframely define esquemas, valida el contenido del DataFrame, admite la validación entre DataFrames y ofrece validación suave, mejorando significativamente la robustez y la legibilidad de los pipelines. Ya se utiliza en varios equipos y proyectos.

(tech.quantco.com)

Desarrollo validación de datos

HP webOS 'Eel': Un Sistema Operativo Innovador Que Nunca Fue

2025-04-30

Si bien la mayoría de los planes de tabletas y teléfonos de HP fueron decepcionantes, su equipo de software estaba desarrollando diseños verdaderamente innovadores. Con el nombre en clave 'Eel', la próxima versión principal de webOS tenía como objetivo expandir la metáfora de 'tarjeta' introducida con el Palm Pre original. Combinaba 'pilas de tarjetas' y 'paneles responsivos', permitiendo a los usuarios abrir enlaces en nuevas tarjetas separadas a la izquierda, deslizarlas o 'cortarlas' en pilas diferentes. Esto ofrecía un tamaño y agrupación de ventanas flexibles, administrando bien tanto en teléfonos como en tabletas. Representó un intento innovador de aumentar la productividad, pero finalmente, el proyecto nunca llegó a su máximo potencial.

(www.theverge.com)

Desarrollo

Misión Imposible: Gestionando Agentes de IA en el Mundo Real

2025-04-30

Este artículo aborda los desafíos y estrategias para controlar eficazmente agentes de IA en varios campos, especialmente el desarrollo de software. El autor comparte lecciones aprendidas con dificultad, enfatizando la planificación meticulosa y la restricción del contexto de lo que los agentes de IA pueden hacer. Se profundiza en la elección de herramientas, la planificación de tareas, la creación y revisión de planes, las pruebas de esos planes y la identificación de problemas arquitectónicos mayores. Aspectos clave como las reglas, el retorno del rendimiento, la selección de modelos y el control de costos también se abordan. El autor detalla su experiencia usando herramientas como Cursor para crear planes reutilizables, refinándolos y probándolos iterativamente para mejorar la fiabilidad, llevando en última instancia a un desarrollo de software eficiente.

(medium.com)

Desarrollo gestión de planes

Analizando el conjunto de datos completo de Hacker News con DuckDB

2025-04-30

El autor descargó el conjunto de datos completo de Hacker News, un archivo JSON de 20 GB que contiene todo lo que se ha publicado en el sitio, y lo analizó usando la base de datos DuckDB. La publicación detalla el proceso de descarga y utiliza consultas SQL para calcular promedios móviles de 12 semanas de la frecuencia de menciones para lenguajes de programación específicos (Python, JavaScript, Java, Ruby, Rust). El autor elogia la facilidad de uso y la velocidad de DuckDB, sugiriendo de forma humorística posibilidades futuras como el entrenamiento de modelos LLM en el conjunto de datos.

(www.jasonthorsness.com)

Desarrollo

Ejecutando Linux en Excel: Un truco divertido

2025-04-30

Un desarrollador logró ejecutar un sistema Linux dentro de Microsoft Excel. Usando un emulador ligero llamado mini-rv32ima, compilado como un DLL y llamado mediante macros VBA, el desarrollador consiguió mostrar la salida de Linux directamente en las celdas de Excel. Aunque el proyecto tiene errores y el autor admite haber usado un DLL externo en lugar de reescribir el emulador en VBA o fórmulas de Excel, es un experimento creativo y divertido que demuestra ingenio y habilidad de programación.

(github.com)

Desarrollo

Diferenciación Esparsa Automática: Domando Hessianas de Alta Dimensión

2025-04-30

Calcular matrices hessianas de alta dimensión es un gran cuello de botella en el aprendizaje automático. Esta publicación presenta la Diferenciación Esparsa Automática (ASD), una técnica que aprovecha la escasez de la matriz para acelerar los cálculos de hessianas y jacobianas. La ASD utiliza la detección de patrones de escasez y la coloración de matrices para combinar varias columnas (o filas) ortogonalmente estructuradas en un solo vector para el cálculo, reduciendo así el costo computacional y los requisitos de memoria. El artículo detalla el funcionamiento de la ASD, cubriendo la diferenciación automática de modo directo e inverso, las representaciones de matrices dispersas, los algoritmos de coloración y mucho más. Un ejemplo de código Julia demuestra su aplicación y beneficios de rendimiento, concluyendo que la ASD ofrece ventajas significativas en aplicaciones que requieren cálculos de jacobianas o hessianas dispersas, como el método de Newton y otros algoritmos de optimización.

(iclr-blogposts.github.io)

Desarrollo matriz dispersa

PATH de Linux: El Secreto del Shell

2025-04-29

¿Alguna vez te has preguntado cómo Linux encuentra los comandos que ejecutas? La respuesta: ¡depende del shell, no del kernel! Este artículo profundiza en la mecánica de la variable de entorno PATH, revelando cómo los shells (como dash) utilizan funciones como `padvance` para buscar ejecutables dentro de PATH, mientras que la llamada al sistema `execve` del kernel en realidad recibe la ruta completa. Los lenguajes de programación como Python, Go y Rust también implementan su propia búsqueda en PATH en sus bibliotecas de subprocesos, en última instancia, dependiendo de funciones subyacentes como `execvp`. El artículo también explica por qué los shebang requieren rutas absolutas y el papel inteligente de `/usr/bin/env`.

(blog.danielh.cc)

Desarrollo

Los clústeres Multi-AZ de Amazon RDS para PostgreSQL fallan en el aislamiento de instantáneas

2025-04-29

Las pruebas de Jepsen revelan que los clústeres Multi-AZ de Amazon RDS para PostgreSQL no garantizan completamente el aislamiento de instantáneas. Se observaron anomalías como ciclos G-no adyacentes, que violan las reglas de aislamiento de instantáneas. Estas incluían Long Fork, lo que sugiere que RDS para PostgreSQL podría ofrecer el aislamiento de instantáneas paralelo, un modelo ligeramente más débil. Esto significa que las transacciones de lectura pueden discrepar sobre el orden de ejecución en alta concurrencia. Los usuarios deben tener en cuenta las estructuras de transacción, evitar Long Fork o usar solo el punto final del escritor para recuperar el aislamiento de instantáneas.

(jepsen.io)

Desarrollo aislamiento de instantáneas

Convirtiendo un viejo Kindle en un panel familiar

2025-04-29

Un padre, frustrado por los retrasos de su hija para ir a la escuela, reutilizó un viejo Kindle para crear un panel de información familiar. Hizo el jailbreak del Kindle y luego escribió scripts y construyó una API de back-end para mostrar información en tiempo real sobre el clima, el transporte público y el horario escolar de su hija. El back-end usa Cloudflare Workers, Hono JS y resuelve de manera inteligente los desafíos de conversión de formato de imagen. El resultado: una pantalla de información funcional y personalizada.

(samkhawase.com)

Desarrollo Jailbreak de Kindle

Combatiendo Bots Maliciosos con Bombas Zip

2025-04-29

¿Enfrentando ataques implacables de bots maliciosos? Un propietario de sitio web comparte su ingeniosa solución: bombas zip. Estos pequeños archivos comprimidos se expanden en archivos enormes, sobrecargando los recursos del atacante. Al detectar solicitudes maliciosas, el autor sirve una bomba zip comprimida, repeliendo eficazmente varios ataques y protegiendo su sitio web. Aunque no es infalible, es una defensa sorprendentemente eficaz contra botnets poco sofisticadas.

(idiallo.com)

Desarrollo

Category: Desarrollo