GAO critica a agencias federales por fallas en ciberseguridad

2025-08-06
GAO critica a agencias federales por fallas en ciberseguridad

La Oficina de Responsabilidad Gubernamental (GAO) publicó informes severos criticando a tres agencias federales: la Administración de Servicios Generales (GSA), la Agencia de Protección Ambiental (EPA) y el Departamento de Seguridad Nacional (DHS), por la falla de sus CIO en implementar recomendaciones de ciberseguridad. El DHS tiene 43 recomendaciones pendientes, siete priorizadas por el GAO; la EPA tiene 11; y la GSA tiene 4. Las fallas comunes incluyen un registro inadecuado de eventos de ciberseguridad y revisiones de cartera de TI. La EPA enfrenta problemas adicionales con la gestión de software en la nube, falta de documentación y acuerdos de nivel de servicio. El programa de Tecnología Avanzada de Reconocimiento de la Patria (HART) del DHS sigue plagado de problemas, con las nueve recomendaciones sin implementar. El GAO espera que los CIO recién nombrados solucionen estas deficiencias y ha puesto en conocimiento del Congreso estas cuestiones.

Leer más

SeedLM: Un Nuevo Método de Compresión de Pesos LLM usando Generadores de Números Pseudoaleatorios

2025-04-06
SeedLM: Un Nuevo Método de Compresión de Pesos LLM usando Generadores de Números Pseudoaleatorios

Los grandes modelos de lenguaje (LLM) se ven obstaculizados por altos costos de tiempo de ejecución, lo que limita su implementación generalizada. Investigadores de Meta presentan SeedLM, un nuevo método de compresión posterior al entrenamiento que utiliza semillas de un generador de números pseudoaleatorios para codificar y comprimir pesos de modelos. Durante la inferencia, SeedLM utiliza un registro de desplazamiento de retroalimentación lineal (LFSR) para generar eficientemente una matriz aleatoria, combinada linealmente con coeficientes comprimidos para reconstruir bloques de pesos. Esto reduce el acceso a la memoria y aprovecha los ciclos de cómputo inactivos, acelerando las tareas limitadas por memoria al intercambiar cómputo por menos accesos a la memoria. A diferencia de los métodos de vanguardia que requieren datos de calibración, SeedLM no necesita datos y se generaliza bien en diversas tareas. Los experimentos en el desafiante Llama 3 70B muestran una precisión de cero-shot en la compresión de 4 y 3 bits que iguala o supera a los métodos de vanguardia, manteniendo un rendimiento comparable a los benchmarks FP16. Las pruebas de FPGA demuestran que SeedLM de 4 bits se acerca a una aceleración de 4x con respecto a un benchmark FP16 Llama 2/3 a medida que aumenta el tamaño del modelo.

Leer más
IA

Vlang: Un Vistazo a un Lenguaje Multifacético

2025-08-30

Este fragmento de código demuestra la versatilidad de Vlang, desde bucles simples que saludan a desarrolladores en diversos campos (juegos, web, etc.) hasta el manejo de archivos de registro, solicitudes de red, análisis y manipulación de datos JSON y la eliminación de duplicados en matrices. Abarca operaciones de E/S, manipulación de cadenas, programación de red, manejo de JSON y manipulación de matrices, mostrando la sintaxis concisa y elegante de Vlang y su potente biblioteca estándar.

Leer más

Ton Roosendaal deja el cargo de CEO de Blender

2025-09-18

Ton Roosendaal, fundador y CEO del software 3D de código abierto Blender, anunció que dejará su cargo el 1 de enero de 2026. Pasará a formar parte del recién creado consejo de supervisión de la Blender Foundation. El actual COO, Francesco Siddi, asumirá como CEO, junto con nuevos miembros del consejo: Sergey Sharybin (Jefe de Desarrollo), Dalai Felinto (Jefe de Producto) y Fiona Cohen (Jefa de Operaciones). Roosendaal afirmó que se han estado preparando para esto desde 2019 y confía en el equipo para liderar Blender en la próxima década.

Leer más
Desarrollo Transición de CEO

El Regreso de Trump y la Amenaza a la Soberanía Digital Europea

2025-04-08
El Regreso de Trump y la Amenaza a la Soberanía Digital Europea

El regreso de Trump al poder genera preocupaciones significativas sobre la seguridad de datos a nivel global. La Ley CLOUD permite a las autoridades de EE. UU. acceder a datos almacenados por empresas estadounidenses, incluso cuando se encuentran en Europa, exponiendo los datos europeos al escrutinio legal y la presión política de EE. UU. El artículo insta a Europa a invertir en soluciones de código abierto, construir infraestructuras de nube independientes e imponer estándares abiertos para liberarse de la dependencia de las grandes empresas tecnológicas de EE. UU., proteger la soberanía digital y evitar que los datos se conviertan en una pieza clave de la geopolítica.

Leer más
Tecnología

ams OSRAM lanza módulos de sensor de tiempo de vuelo directo compactos

2025-09-21
ams OSRAM lanza módulos de sensor de tiempo de vuelo directo compactos

ams OSRAM ha presentado nuevos módulos de sensor de tiempo de vuelo (ToF) directos, compactos y de bajo consumo. Estos módulos integran un láser VCSEL de 940 nm, una matriz de píxeles SPAD, convertidores tiempo-digital (TDCs) y todo el procesamiento de señal necesario para una lectura directa de la distancia a través de I2C. Disponibles en configuraciones de zona única y multizona (hasta 8x8), vienen en paquetes de tan solo 2,2x3,6x1,0 mm, con rangos de operación y campos de visión de hasta 5 m y 63 grados, respectivamente. Las aplicaciones incluyen enfoque automático para cámaras y proyectores, detección de obstáculos para robótica y drones, activación de bajo consumo para sistemas de cámara, controles sin contacto y detección de gestos.

Leer más
Hardware

Google DeepMind crea un equipo de IA para 'modelado del mundo' con enfoque en AGI

2025-01-07
Google DeepMind crea un equipo de IA para 'modelado del mundo' con enfoque en AGI

Google DeepMind está formando un nuevo equipo de investigación de IA enfocado en el desarrollo de "modelos del mundo" capaces de simular entornos físicos. Liderado por Tim Brooks, ex-co-líder del proyecto Sora de OpenAI, el equipo tiene como objetivo aprovechar el pre-entrenamiento masivo de datos de video y multimodales para avanzar en el desarrollo de AGI. Esta iniciativa impulsará aplicaciones en juegos, entrenamiento de robots y más, incluyendo razonamiento visual y simulación, planificación para agentes encarnados y entretenimiento interactivo en tiempo real. Esto demuestra el esfuerzo intensificado de Google en la carrera por la AGI, compitiendo con rivales como OpenAI.

Leer más

Bug persistente en la Utilidad de Discos APFS de macOS: Una solución alternativa

2025-09-21
Bug persistente en la Utilidad de Discos APFS de macOS: Una solución alternativa

La Utilidad de Discos de macOS Monterey 12.0.1 sigue sufriendo un error persistente: la incapacidad de desmontar volúmenes o contenedores al reparar discos APFS. Este artículo proporciona soluciones alternativas, incluyendo el uso de la Utilidad de Discos en modo de recuperación o el uso directo de la herramienta de línea de comandos `fsck_apfs` para verificar y reparar volúmenes y contenedores APFS. El artículo detalla el uso de `fsck_apfs`, incluyendo las opciones de verificación y reparación, y el manejo de volúmenes encriptados.

Leer más

C++26: Un salto gigante para constexpr

2025-04-23

C++26 está listo para revolucionar constexpr. Las características futuras incluyen conversiones constexpr desde void*, permitiendo una manipulación de memoria más flexible en tiempo de compilación; constexpr placement new, permitiendo la colocación de objetos dentro de expresiones constantes; y enlaces estructurados constexpr, trayendo enlaces estructurados en tiempo de compilación. Estas mejoras expanden drásticamente el alcance de constexpr y empoderan a la biblioteca estándar con capacidades mejoradas en tiempo de compilación.

Leer más

Appwrite Sites: Implementación y alojamiento de sitios web en un solo lugar

2025-05-21
Appwrite Sites: Implementación y alojamiento de sitios web en un solo lugar

Appwrite lanza Sites, un nuevo producto que te permite implementar y alojar sitios web y aplicaciones web directamente dentro de Appwrite. Olvídate de alternar entre múltiples plataformas y configuraciones complejas; simplemente construye, implementa y lanza. Sites admite sitios estáticos y aplicaciones SSR, integrando Git, una CDN global, protección DDoS y se integra perfectamente con los servicios de bases de datos, funciones, almacenamiento y autenticación de Appwrite. Hay varias plantillas implementables con un solo clic, con soporte para autohospedaje. Appwrite Sites es gratuito hasta el 1 de julio de 2025.

Leer más

Ataque masivo a la cadena de suministro de paquetes NPM: millones de descargas comprometidas

2025-09-09
Ataque masivo a la cadena de suministro de paquetes NPM: millones de descargas comprometidas

Un importante ataque a la cadena de suministro se dirigió al ecosistema npm, comprometiendo múltiples paquetes con más de 2.600 millones de descargas semanales. Los atacantes utilizaron correos electrónicos de phishing para obtener acceso a la cuenta de un mantenedor, inyectando posteriormente malware en varios paquetes ampliamente utilizados. Este malware intercepta transacciones de criptomonedas en el navegador, redirigiendo fondos a billeteras controladas por los atacantes. Si bien la equipo de NPM ha eliminado algunas versiones maliciosas, el incidente destaca las vulnerabilidades de las cadenas de suministro de software y la creciente amenaza del phishing y los ataques basados ​​en navegador. El impacto se mitigó en cierta medida, ya que solo afectó a los usuarios con instalaciones nuevas en un período de tiempo limitado.

Leer más
Desarrollo

En la Era de la IA, las Herramientas Adaptables Triunfarán

2025-08-27
En la Era de la IA, las Herramientas Adaptables Triunfarán

En la era de la IA, el éxito no depende de adaptarse a las herramientas, sino de que las herramientas se adapten a ti. El artículo contrasta Linear, una herramienta rígida, con Fibery, una herramienta flexible, ilustrando sus destinos divergentes. La inflexibilidad de Linear limita la integración de IA, mientras que Fibery utiliza LLMs para transformar configuraciones complejas en prompts simples. Los LLMs cambian el enfoque del diseño de soluciones a la definición de problemas; los usuarios describen las necesidades en lenguaje natural, y la IA se encarga de la implementación. Esto destaca el poder del software maleable, donde la configuración se vuelve rápida y fácil, permitiendo a los usuarios adaptarse a las necesidades cambiantes, mientras que las herramientas rígidas se quedan atrás. El artículo predice que el software maleable reemplazará gradualmente a sus contrapartes rígidas en los próximos años, convirtiéndose en el paradigma dominante.

Leer más
Desarrollo Software Maleable

arXivLabs: Proyectos experimentales con colaboradores de la comunidad

2025-04-09
arXivLabs: Proyectos experimentales con colaboradores de la comunidad

arXivLabs es un marco que permite a los colaboradores desarrollar y compartir nuevas funciones de arXiv directamente en nuestro sitio web. Tanto las personas como las organizaciones que trabajan con arXivLabs han adoptado y aceptado nuestros valores de apertura, comunidad, excelencia y privacidad de los datos de los usuarios. arXiv está comprometido con estos valores y solo trabaja con socios que se adhieran a ellos. ¿Tienes una idea para un proyecto que agregue valor a la comunidad de arXiv? Obtén más información sobre arXivLabs.

Leer más
Desarrollo

De la Atención Multi-Cabeza a la Atención Latente: La Evolución de los Mecanismos de Atención

2025-08-30
De la Atención Multi-Cabeza a la Atención Latente: La Evolución de los Mecanismos de Atención

Este artículo explora la evolución de los mecanismos de atención en el procesamiento del lenguaje natural, desde el mecanismo de Atención Multi-Cabeza (MHA) inicial hasta variantes más avanzadas como la Atención Multi-Cabeza Latente (MHLA). El MHA pondera palabras importantes en el contexto calculando vectores de consulta, clave y valor; sin embargo, su complejidad computacional y de memoria crece cuadráticamente con la longitud de la secuencia. Para abordar esto, surgieron enfoques más nuevos como el MHLA, mejorando la velocidad computacional y la escalabilidad sin sacrificar el rendimiento, por ejemplo, utilizando el almacenamiento en caché KV para reducir cálculos redundantes. El artículo explica claramente los conceptos principales, ventajas y limitaciones de estos mecanismos y sus aplicaciones en modelos como BERT, RoBERTa y Deepseek.

Leer más
IA

Google refuerza la verificación de desarrolladores de Android: la carga lateral sin conexión podría estar restringida

2025-09-19
Google refuerza la verificación de desarrolladores de Android: la carga lateral sin conexión podría estar restringida

Google está reforzando su sistema de verificación de desarrolladores de Android, exigiendo que los desarrolladores registren sus identidades e impidiendo la instalación de aplicaciones no verificadas. Si bien existen soluciones alternativas, como ADB, un código reciente del SDK de Android sugiere que incluso las aplicaciones verificadas podrían no ser instalables sin conexión. Esto significa que incluso las aplicaciones seguras podrían bloquearse de la instalación sin una conexión de red, lo que podría causar inconvenientes a algunos usuarios. La política se implementará en un año, dejando tiempo para refinar los detalles y encontrar soluciones.

Leer más
Desarrollo Carga Lateral

Documentos internos revelan que Meta entrenó Llama 3 con datos pirateados

2025-01-19
Documentos internos revelan que Meta entrenó Llama 3 con datos pirateados

Documentos internos de Meta recientemente revelados muestran que su modelo de lenguaje grande Llama 3 fue entrenado utilizando material con derechos de autor de la biblioteca pirata Library Genesis (LibGen). A pesar de las preocupaciones internas, el CEO Mark Zuckerberg aprobó el uso de estos datos. Esta decisión expone a Meta a posibles demandas por infracción de derechos de autor y publicidad negativa, lo que destaca las preocupaciones más amplias sobre el abastecimiento ético de datos en el desarrollo de IA.

Leer más
IA

TrueNAS en un Raspberry Pi 5: Un viaje entre hackers, pero educativo

2025-08-28

El autor intenta ejecutar TrueNAS, un sistema de almacenamiento en red que normalmente se utiliza en hardware más potente, en un Raspberry Pi 5. Debido a la falta de soporte UEFI oficial en el Raspberry Pi, se utiliza un proyecto de la comunidad, rpi5-uefi. Si bien se instala TrueNAS con éxito, las limitaciones en el modo UEFI —incluida la falta de soporte para ventilador, GPIO y Ethernet integrada, además de restricciones en varios dispositivos PCIe— impiden que algunos equipos sean reconocidos. El autor concluye que, si bien es una experiencia de aprendizaje desafiante, se recomienda hardware Arm de gama alta para necesidades de alto rendimiento.

Leer más
Hardware

Microsoft Teams se transforma con la llegada masiva de agentes de IA Copilot

2025-09-19
Microsoft Teams se transforma con la llegada masiva de agentes de IA Copilot

Microsoft está añadiendo una gran cantidad de agentes de IA a Teams, prometiendo asistentes Copilot para cada canal, reunión y comunidad. Estos nuevos agentes también funcionarán en SharePoint y Viva Engage, y se están implementando para los usuarios de Microsoft 365 Copilot. Entre las nuevas funciones destacan: agentes facilitadores de reuniones que crean agendas, toman notas y responden preguntas; agentes de canal que responden preguntas basadas en conversaciones y reuniones anteriores; agentes de comunidad en Viva Engage que ayudan a los administradores; y agentes de conocimiento en SharePoint que organizan y resumen archivos. Los agentes facilitadores de reuniones ya están disponibles, pero la creación de documentos y tareas, junto con otros agentes, se encuentra en vista previa pública, junto con una herramienta Workflows rediseñada para la automatización de tareas con IA y un generador de resúmenes de audio.

Leer más
Tecnología

Tuta Mail lanza TutaCrypt: El primer proveedor de correo electrónico resistente a la computación cuántica del mundo

2025-02-25
Tuta Mail lanza TutaCrypt: El primer proveedor de correo electrónico resistente a la computación cuántica del mundo

Celebrando su décimo aniversario, Tuta Mail lanzó una importante actualización de seguridad, TutaCrypt, convirtiéndose en el primer proveedor de correo electrónico del mundo con cifrado post-cuántico. TutaCrypt combina algoritmos de vanguardia seguros para computadoras cuánticas con algoritmos tradicionales (AES/ECC), protegiendo los correos electrónicos de los ataques de las computadoras cuánticas. Todas las cuentas nuevas ahora usan de forma predeterminada este cifrado seguro para computadoras cuánticas, con un lanzamiento gradual para los usuarios existentes. Tuta Mail continúa su trabajo pionero en comunicación segura, preparando su servicio para el futuro.

Leer más

Meta Ingresa al Mercado de Comercio Mayorista de Energía

2025-09-20
Meta Ingresa al Mercado de Comercio Mayorista de Energía

Meta Platforms Inc. está entrando en el mercado de comercio mayorista de energía para gestionar mejor las enormes necesidades de electricidad de sus centros de datos. Esta medida es una respuesta estratégica al aumento de los costos y la demanda de energía, alineada con los objetivos de energía limpia de Meta. La demanda de energía de los centros de datos para IA se prevé que se cuadruplique en diez años, lo que eleva los precios y obliga a algunas empresas de tecnología a reconsiderar sus fuentes de energía, incluso recurriendo al gas natural. La entrada de Meta en el mercado le permite comprar y vender electricidad, beneficiándose de los picos de precios y optimizando la gestión de energía.

Leer más
Tecnología Comercio de Energía

Cuello de botella de PostgreSQL LISTEN/NOTIFY: Lecciones del procesamiento de millones de horas de reuniones

2025-07-11
Cuello de botella de PostgreSQL LISTEN/NOTIFY: Lecciones del procesamiento de millones de horas de reuniones

Recall.ai procesa millones de horas de datos de reuniones cada mes. Su base de datos PostgreSQL sufrió caídas debido a escrituras de alta concurrencia. La investigación reveló que la función LISTEN/NOTIFY adquiere un bloqueo global de la base de datos durante el commit de la transacción, serializando todos los commits y creando un cuello de botella. La migración de esta lógica a la capa de aplicación resolvió el problema.

Leer más
Desarrollo

La autopsia de Tract: Por qué fracasó una startup británica de proptech

2025-04-16
La autopsia de Tract: Por qué fracasó una startup británica de proptech

Tract, una startup británica de proptech, tenía como objetivo abordar la crisis de vivienda en Gran Bretaña simplificando los permisos de planificación. Después de recaudar 744.000 libras esterlinas en financiación pre-semilla, iteraron a través de varios modelos de negocio, incluyendo herramientas de búsqueda de sitios para desarrolladores, evaluaciones gratuitas de terrenos para propietarios, actuando como un promotor de terrenos habilitado por tecnología y, finalmente, una plataforma de documentos de planificación impulsada por IA. A pesar de construir productos técnicamente impresionantes, Tract finalmente no pudo asegurar un modelo de negocio viable a escala de inversión. El conservadurismo del mercado inmobiliario británico, la baja disposición a pagar por software y las complejidades operacionales de la promoción de terrenos resultaron insuperables. Después de casi dos años sin ingresos, devolvieron el capital a los inversores y compartieron su autopsia, ofreciendo valiosas lecciones para futuros fundadores sobre la selección del mercado, la validación del modelo de negocio y la importancia de priorizar la tracción comercial sobre el desarrollo de tecnología.

Leer más
Startup

Grupos financiados por combustibles fósiles acosan a científicos para bloquear la energía eólica marina

2025-08-27
Grupos financiados por combustibles fósiles acosan a científicos para bloquear la energía eólica marina

Un informe de la Universidad Brown expone cómo grupos financiados por combustibles fósiles y sus abogados utilizan batallas legales y desinformación para impedir el desarrollo de energía eólica marina limpia y asequible en la costa este de EE. UU. Estos grupos emplean afirmaciones ambientales engañosas, como la protección de la ballena franca del Atlántico Norte, para retrasar o cancelar proyectos eólicos, protegiendo así los intereses de la industria de los combustibles fósseis. Un bufete de abogados incluso amenazó a la Universidad Brown para suprimir los hallazgos de la investigación. El informe destaca las conexiones entre las empresas de combustibles fósiles, el ala derecha política y las redes de desinformación, y su obstrucción a la acción climática. Este incidente pone de manifiesto los desafíos de la transición energética y las presiones que enfrenta la investigación académica.

Leer más

DuckDuckGo no escapa completamente del rastreo de Google: Estudio

2025-07-14
DuckDuckGo no escapa completamente del rastreo de Google: Estudio

Un nuevo estudio revela que incluso usando motores de búsqueda centrados en la privacidad como DuckDuckGo, los usuarios no están totalmente protegidos del rastreo extensivo de Google en la web. Google Analytics, AdSense e incrustaciones de YouTube permiten a Google recopilar datos incluso cuando se usa DuckDuckGo. El estudio, que compara EE. UU., Reino Unido, Suecia y Suiza, encontró que más del 40% de los sitios web estadounidenses todavía enviaban datos a Google, a pesar de usar DuckDuckGo. Las leyes de privacidad más estrictas en Suecia y Suiza dieron como resultado tasas de rastreo más bajas. Los hallazgos destacan la necesidad de reducir la dependencia de los servicios de Google y elegir alternativas independientes que prioricen la privacidad en todas las capas de internet, no solo en la navegación.

Leer más
Tecnología rastreo de Google

El Hobbit en Cinco Lenguas Celtas: Un Hito Editorial

2025-06-27
El Hobbit en Cinco Lenguas Celtas: Un Hito Editorial

La editorial galesa Melin Bapur ha reunido todas las ediciones actuales en lengua celta del clásico de J.R.R. Tolkien, *El Hobbit*, incluyendo la traducción en gaélico escocés recientemente publicada, *A' Hobat*. Esto representa un logro significativo en la difusión de la historia a un público celta más amplio, faltando solo la versión en gaélico manés. La traducción galesa, *Yr Hobyd*, lanzada en 2024, utiliza exclusivamente las runas galesas del siglo XVIII, Coelbren y Beirdd, en lugar de las runas anglosajonas, añadiendo un toque distintivamente galés. La editorial destaca el valor de la traducción de libros conocidos para fomentar una lectura más amplia y proporcionar recursos inestimables para los estudiantes de idiomas.

Leer más

DeskHog: Consola Miniatura, Gran Potencial

2025-06-11
DeskHog: Consola Miniatura, Gran Potencial

DeskHog es una consola de videojuegos en miniatura impulsada por un ESP32-S3 Reverse TFT Feather. Con una pantalla TFT a color de 240x135, una duración de batería de 10 horas, WiFi y un lindo LED, ejecuta Pong y Flappy Bird, con soporte para Doom en desarrollo. Más allá de los juegos, funciona como un terminal de escritorio para datos PostHog e incluye un puerto de expansión I²C para mayor funcionalidad. Es un dispositivo portátil sorprendentemente versátil.

Leer más

Legado de la Guerra Fría: Una misión secreta de 17 años para asegurar el plutonio en Kazajistán

2025-06-03
Legado de la Guerra Fría: Una misión secreta de 17 años para asegurar el plutonio en Kazajistán

En la estepa desolada del este de Kazajistán, la Unión Soviética realizó 456 pruebas nucleares durante la Guerra Fría. Tras el colapso soviético, se abandonaron cantidades significativas de residuos que contenían plutonio, lo que supuso una grave amenaza para la seguridad nuclear. Científicos de EE. UU., Rusia y Kazajistán superaron numerosos obstáculos en una operación secreta de 17 años y 150 millones de dólares para sellar con éxito estos residuos con hormigón especial, eliminando un gran riesgo para la seguridad nuclear. Esta operación demuestra el potencial de la cooperación internacional en materia de seguridad nuclear, al tiempo que destaca las incertidumbres a largo plazo derivadas de la falta de transparencia.

Leer más

Arch Linux bajo ataque DDoS durante una semana

2025-08-24
Arch Linux bajo ataque DDoS durante una semana

La popular distribución Arch Linux está sufriendo un ataque distribuido de denegación de servicio (DDoS) que lleva una semana, afectando a su sitio web principal, AUR y foros. Se desconoce el motivo del atacante. El equipo de Arch está trabajando activamente con su proveedor de alojamiento para mitigar el ataque y está evaluando opciones de protección DDoS. Si bien Arch es conocido por su dificultad técnica, el ataque causa inconvenientes a la comunidad. Los usuarios pueden obtener paquetes a través del paquete pacman-mirrorlist o GitHub para solucionar las interrupciones del servicio.

Leer más
Tecnología

arXivLabs: Proyectos Experimentales con Colaboradores de la Comunidad

2025-09-21
arXivLabs: Proyectos Experimentales con Colaboradores de la Comunidad

arXivLabs es un marco que permite a los colaboradores desarrollar y compartir nuevas funciones de arXiv directamente en el sitio web. Las personas y organizaciones que trabajan con arXivLabs han adoptado nuestros valores de apertura, comunidad, excelencia y privacidad de los datos de los usuarios. arXiv está comprometido con estos valores y solo trabaja con socios que los respalden. ¿Tiene una idea para un proyecto que agregue valor a la comunidad de arXiv? Obtenga más información sobre arXivLabs.

Leer más
Desarrollo

LLaMA-Factory: Un marco unificado para el ajuste fino eficiente de más de 100 LLM

2025-09-19
LLaMA-Factory: Un marco unificado para el ajuste fino eficiente de más de 100 LLM

LLaMA-Factory es un framework de código abierto que permite el ajuste fino eficiente de más de 100 modelos de lenguaje grandes (LLM), incluyendo LLaMA, LLaVA y Mistral. Integra varios métodos de ajuste fino (como LoRA, QLoRA y OFT), ofrece recursos escalables y algoritmos avanzados, y cubre una amplia gama de tareas como el diálogo de varias vueltas y la comprensión de imágenes. LLaMA-Factory también admite varias técnicas de aceleración de inferencia y proporciona una interfaz y API fáciles de usar. Constantemente actualizado con soporte para los modelos y técnicas más recientes, LLaMA-Factory tiene como objetivo proporcionar a los desarrolladores una herramienta conveniente y eficiente para el ajuste fino de LLM.

Leer más
1 2 52 53 54 56 58 59 60 595 596