¿IA escribe código, IA revisa? ¿Es una tontería?

2025-05-01
¿IA escribe código, IA revisa? ¿Es una tontería?

Daksh, cofundador de Greptile, descubrió que una herramienta de generación de código de IA, Devin, estaba enviando más solicitudes pull que cualquier ingeniero humano. Esto plantea la intrigante pregunta: ¿debería el código generado por IA ser revisado por la propia IA? Si bien los LLMs son sin estado, cada llamada es independiente, esto no significa que la IA revise perfectamente su propio código. El código generado por IA, si bien aumenta la eficiencia, puede introducir errores que los humanos tienen dificultades para encontrar. Las investigaciones muestran que la IA es más eficaz que los humanos para encontrar ciertos tipos de errores, aunque su precisión aún necesita mejoras. En última instancia, el artículo argumenta que, si bien no es perfecta, la revisión de código de IA es más eficaz que los humanos para encontrar tipos específicos de errores introducidos por la propia IA.

Leer más

Generar memes graciosos con LLMs: Sorprendentemente difícil

2025-01-06
Generar memes graciosos con LLMs: Sorprendentemente difícil

Un pasante de la Universidad de Waterloo intentó construir una aplicación usando LLMs y la API Greptile para generar memes que “tuestean” repositorios de GitHub. El proceso resultó inesperadamente desafiante. Pedir directamente al LLM que generara bromas produjo resultados genéricos. La solución implicó separar la tarea en análisis de código (usando Greptile para identificar problemas específicos) y generación de bromas (usando el LLM para crear humor dirigido). La generación de imágenes resultó difícil debido a limitaciones en el manejo de texto, lo que llevó al uso de plantillas de memes preconstruidas y node-canvas para la inserción de texto. A pesar de los obstáculos, el proyecto culminó en reporoast.com, un sitio web capaz de generar memes personalizados que “tuestean” código.

Leer más

Cómo un Bot de Revisión de Código de IA Aprendió a Callarse

2024-12-21
Cómo un Bot de Revisión de Código de IA Aprendió a Callarse

El bot de revisión de código de IA de Greptile inicialmente recibió críticas por generar demasiados comentarios. Para solucionar esto, experimentaron con la ingeniería de prompts e hicieron que el LLM evaluara sus propios comentarios, pero estos métodos resultaron ineficaces. Su avance provino de la vectorización de comentarios anteriores, agrupándolos en una base de datos vectorial y filtrando nuevos comentarios similares a los que habían sido rechazados anteriormente. Este enfoque aumentó la tasa de atención del desarrollador de 19% a más del 55%, reduciendo significativamente el ruido del LLM.

Leer más