Benchmark open-source pour l'OCR et l'extraction de données des LLM

2025-04-01
Benchmark open-source pour l'OCR et l'extraction de données des LLM

Omni est un outil de benchmark open-source qui compare les capacités d'OCR et d'extraction de données de différents grands modèles multimodaux tels que gpt-4o, en évaluant la précision de l'extraction de texte et de JSON. Ce benchmark fournit une évaluation complète de la précision de l'OCR auprès des fournisseurs d'OCR traditionnels et des LLM. L'ensemble de données et les méthodologies sont open-source, encourageant les contributions et l'expansion. Le benchmark se concentre sur l'extraction de JSON, en mesurant la précision de l'ensemble du pipeline : Document ⇒ OCR ⇒ Extraction. Il utilise un json-diff modifié pour la précision du JSON et la distance de Levenshtein pour la similarité du texte. L'outil prend en charge plusieurs modèles, notamment OpenAI, Google Gemini et Anthropic, avec une interface simple en ligne de commande et une sortie JSON.

Lire plus
Développement

TopoSort : Une bibliothèque Zig hautement efficace pour le tri topologique

2025-04-01
TopoSort : Une bibliothèque Zig hautement efficace pour le tri topologique

TopoSort est une bibliothèque Zig très efficace pour effectuer un tri topologique sur un graphe de dépendances. Elle offre des fonctionnalités telles que la construction de graphes de dépendances, le tri topologique, la génération de sous-ensembles sans dépendances pour le traitement parallèle, la détection et le signalement des cycles, et la prise en charge de différents types de nœuds. Un outil d'interface en ligne de commande, `toposort-cli`, simplifie son utilisation. Les performances sont optimisées en définissant le paramètre `max_range`, ce qui peut accélérer la construction de l'arbre de dépendances de 3 à 4 fois. TopoSort est sous licence MIT.

Lire plus
Développement Tri Topologique

RubyUI : Bibliothèque de composants d'interface utilisateur Rails ultrarapide

2025-04-01
RubyUI : Bibliothèque de composants d'interface utilisateur Rails ultrarapide

RubyUI (anciennement PhlexUI) est une bibliothèque de composants d'interface utilisateur Rails construite sur Phlex, offrant des vitesses jusqu'à 12 fois supérieures à celles des modèles ERB traditionnels. Elle propose une collection de composants réutilisables et personnalisables que vous pouvez copier-coller directement dans vos applications. RubyUI met l'accent sur un design épuré, des composants bien organisés et des options de personnalisation étendues, avec une documentation et des exemples complets. Elle utilise des contrôleurs Stimulus.js personnalisés, minimisant les dépendances, permettant la création facile d'interfaces d'applications Rails efficaces et esthétiques.

Lire plus

Contrôlez votre téléphone Android avec l'IA : codez vos commandes

2025-04-01
Contrôlez votre téléphone Android avec l'IA : codez vos commandes

Le projet open source `mobile-use` vous permet de contrôler votre téléphone Android à l'aide de l'IA. Il suffit d'écrire des commandes telles que "Ouvrir Instagram et envoyer un message", et le projet les exécute à l'aide de vos outils SDK Android installés localement (adb). Il prend en charge les modèles LLM personnalisés et propose des méthodes de saisie par ligne de commande et par fichier, vous permettant d'envoyer facilement des instructions à partir du terminal ou d'un fichier. Le projet est sous licence MIT.

Lire plus
Développement

Une librairie PubSub minimaliste de 149 octets

2025-04-01
Une librairie PubSub minimaliste de 149 octets

Cet article présente une librairie PubSub minimaliste de seulement 149 octets, avec pratiquement aucune dépendance. Elle est comparée à des concurrentes telles que nano-pubsub (194 octets) et tiny-pubsub (401 octets), soulignant sa taille extrêmement réduite. Construite à l'aide d'EventTarget, le code est clair et concis, et inclut des définitions de type TypeScript. L'auteur encourage les contributions pour réduire encore plus la taille de la librairie.

Lire plus
Développement librairie légère

KOReader : Une liseuse multiplateforme performante

2025-04-01
KOReader : Une liseuse multiplateforme performante

KOReader est un visualiseur de documents principalement destiné aux liseuses à encre électronique, prenant en charge de nombreux formats (PDF, EPUB, MOBI, etc.) et appareils (Kindle, Kobo, etc.). Il dispose d'une vue de lecture hautement personnalisable, d'un support multilingue, d'une intégration avec des outils tels que Calibre et d'optimisations pour l'encre électronique pour un retournement de page rapide. Extensible via des plugins, KOReader est développé et maintenu par une communauté mondiale de bénévoles.

Lire plus
Développement liseuse

Boostez vos pipelines Airflow avec les LLMs : le SDK Apache Airflow AI

2025-03-31
Boostez vos pipelines Airflow avec les LLMs : le SDK Apache Airflow AI

Ce SDK Apache Airflow AI, basé sur Pydantic AI, vous permet d'intégrer en toute transparence les grands modèles de langage (LLMs) dans vos workflows Airflow. Utilisant des tâches basées sur des décorateurs (@task.llm, @task.llm_branch, @task.agent), il simplifie les appels LLM et l'orchestration des agents. La prise en charge de plusieurs modèles (OpenAI, Anthropic, etc.), l'analyse automatique des sorties et les capacités de branchement de DAG rendent vos pipelines de données plus intelligents et plus efficaces.

Lire plus
Développement

guMCP : Une collection de serveurs de protocole de contexte de modèle unifié open source de Gumloop

2025-03-31
guMCP : Une collection de serveurs de protocole de contexte de modèle unifié open source de Gumloop

Gumloop a publié guMCP, une collection open source de serveurs de protocole de contexte de modèle (MCP) qui peuvent fonctionner localement et à distance. L'objectif est de créer la plus grande collection de serveurs MCP unifiés, favorisant une communauté autour des intégrations IA et de l'avenir de l'AGI. Prenant en charge les transports stdio et SSE, guMCP inclut des serveurs pour les systèmes de fichiers, les bases de données, les outils de développement, l'automatisation web et plus encore, encourageant les contributions de la communauté. Sous licence GPL-3.0, la sécurité est la priorité absolue, avec la conformité à SOC 2 Type II, GDPR et HIPAA.

Lire plus
Développement

Contrôlez WhatsApp avec Claude : Un serveur WhatsApp MCP

2025-03-31
Contrôlez WhatsApp avec Claude : Un serveur WhatsApp MCP

Ce projet intègre WhatsApp avec le grand modèle linguistique (LLM) Claude. Un pont Go se connecte à l'API multi-appareils web de WhatsApp, stockant les messages localement dans une base de données SQLite. Un serveur Python implémente le protocole de contexte du modèle (MCP), permettant à Claude de rechercher des messages, des contacts et d'envoyer des messages via un ensemble d'outils. Tout le traitement est local, privilégiant la confidentialité de l'utilisateur.

Lire plus
Développement

Installation ultra-rapide de Windows 9x : 90 secondes ou moins !

2025-03-31
Installation ultra-rapide de Windows 9x : 90 secondes ou moins !

Fatigué des installations lentes de Windows 98 ? Windows 9x QuickInstall est là ! Ce projet utilise Linux et un programme d’installation personnalisé pour empaqueter un système Windows 98 déjà installé dans une image ISO optimisée, permettant une installation en environ 60 à 90 secondes. Il prend en charge Windows 98, Windows 98 SE et Windows ME, et permet l’ajout flexible de pilotes et d’outils. Bien que la création de l’ISO soit plus complexe que l’utilisation de nLite, la personnalisation accrue la rend parfaite pour les utilisateurs qui privilégient la vitesse et les installations hautement personnalisées.

Lire plus

Ambermoon Advanced : Une extension RPG massive publiée par épisodes

2025-03-31
Ambermoon Advanced : Une extension RPG massive publiée par épisodes

Le développeur indépendant Pyrdacor publie Ambermoon Advanced, une extension non officielle du RPG Ambermoon, par épisodes. Cinq épisodes sont prévus, dont les trois premiers sont déjà disponibles, avec du contenu comme « Mystères de la mer » et « Créatures élémentaires ». Le jeu fonctionne sur Amiga et les systèmes modernes, bien que la version Amiga soit encore en développement. Le développeur précise que le jeu est en cours de développement et peut contenir des bogues et des déséquilibres. Un manuel physique est également prévu, contenant des informations sur le jeu et l’histoire d’Ambermoon.

Lire plus

Blue95 : Une expérience nostalgique des années 90 sur votre bureau

2025-03-30
Blue95 : Une expérience nostalgique des années 90 sur votre bureau

Blue95 propose une expérience bureautique légère rappelant les années 1990, basée sur Fedora Atomic Xfce avec le thème Chicago95. Bien que l'installeur inclus soit encore en version alpha, la méthode d'installation recommandée consiste à rebaser à partir d'un autre bureau Fedora Atomic, tel que winblues/vauxite. Blue95 privilégie la convivialité et l'accessibilité plutôt que la réplication exacte des anciens systèmes d'exploitation, intégrant des améliorations de Universal Blue (codecs, mises à jour automatiques, etc.) pour une meilleure expérience prête à l'emploi. Une ISO live est également disponible pour un test sans installation.

Lire plus
Développement Bureau rétro

Le débogueur rr reçoit une mise à jour majeure : mode Compteurs logiciels

2025-03-30
Le débogueur rr reçoit une mise à jour majeure : mode Compteurs logiciels

Le débogueur rr dispose désormais d’un mode Compteurs logiciels, lui permettant de s’exécuter sans accès aux compteurs de performances matériels du processeur, ce qui surmonte les limitations des machines virtuelles cloud et des conteneurs. Ce mode utilise une instrumentation dynamique et statique légère pour assurer la fonctionnalité d’enregistrement et de lecture, simplifiant ainsi les workflows de débogage. L’article de blog de l’auteur détaille les principes de la technologie d’enregistrement et de lecture, souligne les avantages du débogueur rr et partage son parcours de développement.

Lire plus
Développement compteurs logiciels

PG-MCP : Serveur amélioré du protocole de contexte de modèle pour PostgreSQL

2025-03-30
PG-MCP : Serveur amélioré du protocole de contexte de modèle pour PostgreSQL

PG-MCP est un serveur de protocole de contexte de modèle (MCP) pour les bases de données PostgreSQL, offrant des capacités améliorées pour les agents d'IA. Il s'appuie sur l'implémentation de référence de Postgres MCP, en ajoutant la prise en charge de plusieurs bases de données, des métadonnées riches incluant les extensions PostGIS et pgvector, des outils d'analyse des plans de requête et une gestion robuste des connexions. Déployable via Docker ou un environnement virtuel, les développeurs peuvent interagir avec PG-MCP en utilisant le client Python fourni, et même exploiter des grands modèles de langage comme Claude pour la conversion de langage naturel en SQL.

Lire plus
Développement

msgpack23 : Une bibliothèque C++ moderne pour MessagePack

2025-03-30
msgpack23 : Une bibliothèque C++ moderne pour MessagePack

msgpack23 est une bibliothèque C++ légère et uniquement en en-tête pour la sérialisation et la désérialisation de données au format MessagePack. Tirant parti des fonctionnalités modernes de C++ (C++20 et au-delà), elle offre une solution flexible et sans dépendance, prenant en charge divers types de données, notamment les conteneurs STL, les objets de point temporel et les types personnalisés. Son API simple, son accent sur les performances et son extensibilité en font un outil puissant pour la gestion efficace des données.

Lire plus
Développement

xan : Un outil CLI ultra-rapide pour le traitement de fichiers CSV

2025-03-29
xan : Un outil CLI ultra-rapide pour le traitement de fichiers CSV

xan est un outil en ligne de commande écrit en Rust pour le traitement ultra-rapide de fichiers CSV volumineux (gigaoctets !). Tirant parti du multithreading pour le parallélisme, il gère facilement des tâches telles que la prévisualisation, le filtrage, le découpage, l’agrégation, le tri et la jointure de données CSV. xan possède un puissant langage d’expressions qui surpasse la vitesse de Python, Lua ou JavaScript pour les opérations complexes. Initialement une fourchette de xsv, mais entièrement réécrit, xan répond aux besoins d’analyse de données des sciences sociales, incluant la lexicométrie, la théorie des graphes et même le web scraping. L’installation est simple via cargo, Homebrew, pacman, Nix ou des binaires pré-compilés.

Lire plus
Développement traitement CSV

JobHuntr : automatisez vos candidatures LinkedIn grâce à l’IA

2025-03-29
JobHuntr : automatisez vos candidatures LinkedIn grâce à l’IA

JobHuntr.fyi est une application de bureau macOS utilisant l’IA Ollama pour postuler automatiquement à des offres d’emploi sur LinkedIn, 24h/24 et 7j/7, sans clé API OpenAI. Elle cible les offres avec l’option « Candidature facile » (environ 70 %), jusqu’à 25 candidatures par jour. L’IA remplit intelligemment les formulaires en fonction de votre CV et de votre FAQ, en vérifiant soigneusement les informations. Les questions incertaines sont enregistrées dans votre FAQ et les candidatures sont ignorées. Conçue pour imiter le comportement humain et utilisant votre adresse IP, elle minimise le risque de détection d’automatisation par LinkedIn.

Lire plus
Développement Candidatures

LVGL : Une bibliothèque graphique embarquée légère et polyvalente

2025-03-29
LVGL : Une bibliothèque graphique embarquée légère et polyvalente

LVGL est une bibliothèque graphique embarquée open-source populaire pour créer de belles interfaces utilisateur pour tout MCU, MPU et type d'affichage. Elle dispose de plus de 30 widgets intégrés, d'un système de style puissant, de gestionnaires de mise en page inspirés du Web et prend en charge plusieurs langues. Nécessitant des ressources minimales (32 Ko de RAM et 128 Ko de Flash), LVGL simplifie le développement de l'interface utilisateur. L'équipe LVGL propose également des services de conception, d'implémentation et de conseil pour aider les développeurs à créer des interfaces utilisateur graphiques de haute qualité.

Lire plus

RTABench : Un nouveau benchmark pour les applications d’analyse en temps réel

2025-03-29
RTABench : Un nouveau benchmark pour les applications d’analyse en temps réel

Les benchmarks d’analyse traditionnels négligent souvent les besoins des applications en temps réel, telles que la génération d’informations rapides et ciblées pour des utilisateurs, des appareils ou des transactions spécifiques. RTABench comble cette lacune en fournissant un benchmark qui reflète avec précision l’analyse en temps réel au sein des applications, en utilisant un schéma normalisé, des tailles de jeux de données réalistes et des requêtes qui correspondent aux modèles d’utilisation du monde réel. Il inclut 33 requêtes couvrant les requêtes d’événements bruts, le filtrage sélectif, les jointures de plusieurs tables et les requêtes pré-agrégées pour évaluer les performances de la base de données sur les schémas normalisés, le filtrage sélectif et les vues matérialisées incrémentales. RTABench prend en charge plusieurs bases de données et encourage les contributions de la communauté pour étendre la prise en charge de ses bases de données et les optimisations.

Lire plus

vramfs : transformez la VRAM de votre GPU en système de fichiers

2025-03-29
vramfs : transformez la VRAM de votre GPU en système de fichiers

vramfs est un utilitaire utilisant la bibliothèque FUSE pour créer un système de fichiers dans la VRAM de votre GPU. Similaire à un ramdisk, mais utilisant la RAM vidéo, il n'est pas destiné à une utilisation intensive, mais fonctionne étonnamment bien sur les GPU grand public avec 4 Go de VRAM ou plus. Le développeur a atteint des vitesses de lecture d'environ 2,4 Go/s et d'écriture de 2,0 Go/s, soit environ 1/3 d'un ramdisk. Il utilise OpenCL pour la gestion de la mémoire et FUSE pour un développement simplifié. Les améliorations futures visent à atteindre les limites de bande passante PCI-e.

Lire plus
Développement Système de fichiers

Apprenez la grammaire japonaise avec TypeScript : Présentation de Typed Japanese

2025-03-29
Apprenez la grammaire japonaise avec TypeScript : Présentation de Typed Japanese

Typed Japanese est une bibliothèque TypeScript de niveau type qui permet d'exprimer des phrases complètes en japonais à l'aide du système de types. Elle crée un langage spécifique à un domaine (DSL) basé sur les règles grammaticales japonaises, permettant d'écrire et de vérifier un langage naturel grammaticalement correct à l'aide du compilateur TypeScript. Le projet explore également un format intermédiaire pour l'IA dans l'apprentissage des langues, remplaçant potentiellement JSON par une représentation vérifiée par type pour une meilleure précision. Il prend en charge diverses conjugaisons de verbes et d'adjectifs, la construction de phrases et d'expressions, dans le but de créer un système de types pour apprendre et vérifier la grammaire japonaise. Bien qu'il en soit encore aux premiers stades et qu'il dépende de règles générées par LLM, il offre une approche unique de l'apprentissage des langues et de la vérification grammaticale.

Lire plus
Développement

Échecs en Temps Réel : Un Échiquier Physique qui Supprime les Tours

2025-03-29
Échecs en Temps Réel : Un Échiquier Physique qui Supprime les Tours

Fatigué des longues attentes dans les échecs au tour par tour ? Un développeur a créé un échiquier physique en temps réel qui élimine complètement les tours. Chaque pièce a un temps de recharge individuel, imposé par l’électronique et les électroaimants, ce qui empêche la tricherie. Les conceptions de circuits imprimés et le micrologiciel du projet sont open source, mais l’auteur note des problèmes tels qu’une distribution d’énergie inadéquate et des tolérances serrées.

Lire plus
Matériel

bknd : Un backend léger et complet pour simplifier le développement d'applications

2025-03-29
bknd : Un backend léger et complet pour simplifier le développement d'applications

bknd simplifie le développement d'applications en fournissant un backend entièrement fonctionnel pour la gestion de bases de données, l'authentification, les médias et les workflows. Construit sur des standards web, il est léger et déployable presque partout, y compris dans votre framework de choix. Plus besoin de déployer plusieurs services séparés ! Il offre une API REST, un SDK React et des éléments React pour les composants d'authentification et de médias, ainsi qu'une interface utilisateur d'administration facile à utiliser. Bien qu'il soit encore en développement actif (avant la v1.0.0), la compatibilité descendante totale n'est pas encore garantie.

Lire plus
Développement

Minuteur Pomodoro basé sur ESP32 : Un projet DIY de matériel et de logiciel

2025-03-29
Minuteur Pomodoro basé sur ESP32 : Un projet DIY de matériel et de logiciel

Un ingénieur logiciel, poussé par la recherche d’une meilleure productivité et le désir d’aider un ami, a conçu un minuteur Pomodoro basé sur ESP32. Ce minuteur utilise un écran à encre électronique et un encodeur rotatif, privilégiant un appareil physique, le plaisir et une utilisation intuitive. Le projet englobe le choix du matériel (ESP32, écran à encre électronique, encodeur rotatif, LED, etc.), le développement logiciel (C++, framework Arduino, bibliothèque GxEPD2) et la conception d’un boîtier imprimé en 3D. L’auteur partage les leçons tirées du processus de conception, telles que le choix de l’écran, la conception de la méthode de saisie, la mise en œuvre de l’indicateur LED et la gestion du code logiciel. Le produit final allie praticité et amusement, intégrant des œufs de Pâques.

Lire plus

Point final PCIe sur FPGA série 7 Xilinx : Implémentation open source

2025-03-29
Point final PCIe sur FPGA série 7 Xilinx : Implémentation open source

Ce projet implémente un point final PCIe sur les FPGA série 7 de Xilinx à l'aide du bloc dur PCIE_2_1 et des transceivers GTP. Il évite les cœurs IP propriétaires Vivado et est compatible avec openXC7. La conception comprend la génération d'horloge, les transceivers GTP et le bloc dur PCIE_2_1, prenant en charge PCIe Gen1 x1 et Gen2 x1. Il a été testé sur Alinx AC7100B SoM et Wavelet uSDR. Des scripts de build et d'exécution Docker sont fournis, ainsi que la prise en charge des interruptions MSI et des pilotes de noyau. Ce projet est financé par NGI0 Entrust.

Lire plus
Matériel

Serveur de Langage Postgres : Une Suite d'Outils SQL Puissante pour les Développeurs

2025-03-29
Serveur de Langage Postgres : Une Suite d'Outils SQL Puissante pour les Développeurs

Ce projet propose une suite d'outils complète pour le développement Postgres, construite sur l'analyseur propre à Postgres (libpg_query) pour une compatibilité syntaxique garantie à 100 %. Utilisant une architecture client-serveur avec une conception indépendante du transport, il fournit un accès via LSP, CLI, API HTTP et WebAssembly. Les fonctionnalités actuelles incluent la complétion automatique, la mise en évidence de la syntaxe, la vérification de type (à l'aide des informations EXPLAIN) et un linter. Le développement futur se concentre sur l'amélioration de ces fonctionnalités principales et la construction d'une infrastructure robuste. Les contributions sont les bienvenues !

Lire plus
Développement Outils pour Développeurs

Auto-héberger un serveur TURN open source presque gratuit sur le cloud Oracle

2025-03-28
Auto-héberger un serveur TURN open source presque gratuit sur le cloud Oracle

Ce guide détaille la configuration d'un serveur TURN open source quasiment gratuit sur la couche gratuite d'Oracle Cloud, offrant une alternative aux implémentations WebRTC reposant sur des services tiers. Il explique la création de sous-réseaux, de listes de sécurité, de configurations d'instances, l'installation de Nginx, Certbot, d'un serveur PeerJS et d'un serveur Coturn. Le guide couvre la configuration des règles iptables et l'utilisation de coturn-credential-api pour l'authentification, offrant un contrôle total sur la communication WebRTC et améliorant la confidentialité et la sécurité en évitant la dépendance à des grands fournisseurs comme Google.

Lire plus
Développement serveur TURN cloud Oracle

Hexi : Une bibliothèque C++23 légère pour la gestion sécurisée des données binaires

2025-03-28
Hexi : Une bibliothèque C++23 légère pour la gestion sécurisée des données binaires

Hexi est une bibliothèque C++23 légère, uniquement en en-tête, pour la gestion sécurisée des données binaires provenant de sources arbitraires (principalement des données réseau). Elle se situe entre la copie manuelle des octets à partir des tampons réseau et les bibliothèques de sérialisation complètes. Conçue pour la facilité d'utilisation, la sécurité lors du traitement des données non fiables, la flexibilité et une surcharge minimale, Hexi prend en charge les conteneurs personnalisés (y compris les conteneurs non contigus), la gestion des exceptions et la vérification des limites. Des fonctionnalités supplémentaires incluent des types de tampons pour les fichiers binaires, des tampons statiques/dynamiques et un allocateur de blocs de thread local.

Lire plus

Un Forth minuscule pour le 6502 : moins de 600 octets

2025-03-28
Un Forth minuscule pour le 6502 : moins de 600 octets

Cet article détaille une implémentation Forth extrêmement minimisée pour le processeur 8 bits 6502, atteignant une taille inférieure à 600 octets. L’auteur compare deux modèles d’interpréteur : le code threadé direct (DTC) et le code threadé minimal (MTC), optant pour le DTC pour sa taille réduite. Le projet privilégie la taille aux performances, visant à vérifier le DTC standard par rapport aux variations du MTC. Le Forth résultant inclut des primitives essentielles et est testé avec `my_hello_world.FORTH`, démontrant sa fonctionnalité.

Lire plus
Développement
1 2 27 28 29 31 33 34 35 50 51