LLMs e humanos exibem viés: um experimento de classificação de atratividade de voz TTS

2025-03-10

No ano passado, o autor usou LLMs para classificar usuários do Hacker News e descobriu um viés em que os modelos sempre favoreciam o primeiro usuário mencionado no prompt. Este ano, um novo experimento classificando a atratividade de voz TTS revelou um viés semelhante em participantes humanos, que favoreciam vozes apresentadas do lado direito da tela. Isso reforça as descobertas anteriores do autor e destaca a importância do tamanho da amostra e da aleatoriedade ao usar julgamentos de IA e humanos para mitigar vieses.

Leia mais

Perdemos o Respeito pela Complexidade?

2025-01-21

Este artigo de blogue explora a perda moderna na sociedade da compreensão e respeito pela complexidade. Com a automação e a era da informação, o contacto directo com sistemas complexos diminuiu, levando a uma falta de apreço pelas complexidades de áreas como a agricultura e a manufactura. Esta falta de respeito manifesta-se em abordagens simplificadas a problemas complexos na vida quotidiana e afecta os sistemas educativos e as perspectivas futuras. O autor argumenta que admitir 'Não sei' é uma característica valiosa, e o respeito pela complexidade é verdadeiramente admirável.

Leia mais

Reescrita de Código: Varinha Mágica vs. Melhoria Iterativa

2025-01-03

Este artigo explora os prós e contras da reescrita de código. Usando a falha da Netscape como exemplo, o autor argumenta que reescrever não é sempre a melhor abordagem. Em vez de reescritas em larga escala, mantenha o idealismo, imagine uma solução perfeita (uma varinha mágica) e, em seguida, melhore iterativamente o código existente. Ao distinguir entre complexidade necessária e acidental, identifique as direções de melhoria e reflita continuamente sobre "Se eu pudesse acenar com uma varinha mágica, o que eu gostaria que fosse?", atingindo, finalmente, o estado ideal.

Leia mais