Au-delà des modèles autorégressifs : la prochaine frontière de l’IA

2025-03-07

La plupart des modèles d’IA générative actuels sont autorégressifs, ce qui signifie qu’ils prédisent le jeton suivant, l’architecture Transformer étant l’implémentation dominante en raison de son efficacité computationnelle. Cependant, les modèles autorégressifs présentent des limitations inhérentes, telles que le manque de capacités de planification et de raisonnement, une mémoire à long terme limitée et une tendance à « halluciner ». L’auteur soutient que la pensée humaine n’est pas purement autorégressive, englobant la pensée non séquentielle et la planification. Pour parvenir à une IA plus proche de la cognition humaine, les chercheurs explorent des paradigmes alternatifs tels que JEPA et les modèles de diffusion, qui génèrent du contenu par raffinement itératif ou débruitage à partir du bruit, reflétant plus fidèlement les processus de pensée humains.

Lire plus

Intérieur d'une étoile à neutrons révélé : la QCD sur réseau franchit la barrière de la vitesse du son

2025-03-07
Intérieur d'une étoile à neutrons révélé : la QCD sur réseau franchit la barrière de la vitesse du son

Pour la première fois, des chercheurs ont utilisé la chromodynamique quantique sur réseau (LQCD) pour étudier l'intérieur des étoiles à neutrons, obtenant une nouvelle limite supérieure pour la vitesse du son à l'intérieur de l'étoile et une meilleure compréhension de la relation entre la pression, la température et d'autres propriétés. Cette recherche a surmonté les défis liés à la résolution des équations de la chromodynamique quantique sous des interactions fortes. En introduisant l'isospin pour simplifier les calculs, l'équipe a conclu que la vitesse du son dans les étoiles à neutrons pourrait dépasser c/√3, ouvrant de nouvelles voies pour de futures recherches sur les propriétés des étoiles à neutrons.

Lire plus

L'USCIS étend la surveillance des médias sociaux aux non-citoyens déjà présents aux États-Unis

2025-03-07
L'USCIS étend la surveillance des médias sociaux aux non-citoyens déjà présents aux États-Unis

Le Service américain de la citoyenneté et de l'immigration (USCIS) propose d'étendre son programme de surveillance des médias sociaux aux non-citoyens déjà présents aux États-Unis et qui demandent des avantages en matière d'immigration. Cette extension, découlant d'un décret de 2020, vise à améliorer les processus de vérification. La règle proposée exigerait que les candidats à la résidence permanente, à la citoyenneté ou au statut de réfugié/asile soumettent leurs informations sur les médias sociaux pour examen, ce qui pourrait ajouter des centaines de milliers d'heures de travail par an. La proposition est ouverte aux commentaires du public pendant 60 jours.

Lire plus

Gboard Android adopte des touches plus rondes en version bêta

2025-03-07
Gboard Android adopte des touches plus rondes en version bêta

Google déploie un nouveau design pour certains testeurs bêta de Gboard sur Android, avec des touches circulaires et en forme de pilule. Ce n'est pas qu'un simple ajustement ; les formes des touches ont été considérablement redessinées, passant de rectangles arrondis à des cercles et des pilules pour les lettres, la barre d'espace et les autres touches adoptant une forme de pilule. Bien que les cibles tactiles restent inchangées, l'impact visuel est important, donnant à Gboard une apparence plus moderne. Cependant, les utilisateurs ayant activé l'option "Appuyer longuement pour les symboles" pourraient trouver la disposition encombrée. Ce changement est actuellement limité à certains utilisateurs bêta de Gboard (version 15.1) et Google n'a pas encore confirmé un déploiement plus large.

Lire plus
Développement

InstantStyle : Framework de transfert de style en un clic pour une génération d'images IA sans effort

2025-03-07
InstantStyle : Framework de transfert de style en un clic pour une génération d'images IA sans effort

InstantStyle est un framework simple mais puissant pour le transfert de style d'image, permettant un contrôle précis du style en séparant intelligemment les informations de contenu et de style de l'image. Il utilise les caractéristiques globales de CLIP et se concentre sur des couches d'attention spécifiques (up_blocks.0.attentions.1 et down_blocks.2.attentions.1) pour manipuler le style et la disposition. InstantStyle est intégré à des outils populaires comme diffusers, prend en charge des modèles tels que SDXL et SD1.5, et offre des démonstrations en ligne et des capacités de génération haute résolution, simplifiant ainsi considérablement le flux de travail et offrant aux utilisateurs une expérience pratique pour la génération d'images stylisées.

Lire plus

Automates Cellulaires Logiques Différentiables : Du Jeu de la Vie à la Génération de Motifs avec des Circuits Récurrents Apprenants

2025-03-07

Cet article présente DiffLogic CA, une nouvelle architecture d'automates cellulaires neuronaux (ACN) utilisant un état cellulaire entièrement discret, mis à jour via un circuit binaire récurrent appris. En remplaçant les composants de réseau neuronal par des réseaux de portes logiques différentiables profonds, cela permet un apprentissage différentiable des portes logiques discrètes. Le succès de l'application des portes logiques différentiables aux automates cellulaires est démontré par la réplication du Jeu de la Vie de Conway et la génération de motifs par des dynamiques discrètes apprises. Ceci souligne le potentiel d'intégration de la logique discrète dans les ACN et prouve que les réseaux de portes logiques différentiables peuvent être efficacement appris dans les architectures récurrentes. Bien que prometteur, l'entraînement pour des formes complexes reste un défi, suggérant des travaux futurs sur les architectures hiérarchiques et les portes spécialisées pour une meilleure gestion de l'état.

Lire plus

La Chambre cite Google pour une prétendue ingérence de l'administration Biden dans la modération de contenu

2025-03-06
La Chambre cite Google pour une prétendue ingérence de l'administration Biden dans la modération de contenu

La commission judiciaire de la Chambre des représentants des États-Unis a assigné à comparaître Alphabet (société mère de Google) pour enquêter sur les communications avec l'administration Biden concernant les politiques de modération de contenu. Le président Jim Jordan a également demandé des communications similaires avec des groupes externes. La citation vise les restrictions de contenu sur des sujets tels que Donald Trump, Elon Musk, COVID-19 et d'autres points de vue conservateurs. Alors que Meta avait précédemment admis avoir subi des pressions de la part de l'administration Biden, Google nie des actions similaires, affirmant que ses politiques sont appliquées de manière indépendante et qu'elle s'engage en faveur de la liberté d'expression.

Lire plus
Technologie

30 Euros de Punition : Une Astuce de Productivité

2025-03-06
30 Euros de Punition : Une Astuce de Productivité

Frustré par le manque de régularité de ses publications de blog, l'auteur adopte une technique de productivité inhabituelle : une pénalité auto-imposée de 30 euros s'il ne publie pas un article chaque mois. Inspiré par l'idée qu'une production constante et moins stressante est préférable à des publications peu fréquentes et très stressantes, cet engagement le motive à écrire régulièrement. Il étend ce système à la peinture de figurines, avec pour objectif 52 articles et 60 figurines peintes d'ici la fin de l'année. L'auteur prévoit de faire un compte-rendu des résultats et d'étendre cette méthode à d'autres projets.

Lire plus

LLM de diffusion : un changement de paradigme dans la modélisation du langage

2025-03-06

Inception Labs a dévoilé un modèle linguistique large de diffusion (dLLM) révolutionnaire qui remet en question l'approche autorégressive traditionnelle. Contrairement aux modèles autorégressifs qui prédisent les jetons séquentiellement, les dLLM génèrent des segments de texte simultanément, en les affinant itérativement. Cette méthode, couronnée de succès dans les modèles d'image et de vidéo, surpasse désormais les LLM de taille similaire dans la génération de code, affichant une amélioration de 5 à 10 fois de la vitesse et de l'efficacité. L'avantage principal ? Réduction des hallucinations. Les dLLM génèrent et valident des parties cruciales avant de poursuivre, ce qui est crucial pour les applications exigeant de la précision, telles que les chatbots et les agents intelligents. Cette approche promet des flux de travail d'agents multi-étapes améliorés, en prévenant les boucles et en améliorant la planification, le raisonnement et l'autocorrection.

Lire plus
IA

Modèle de détection de tour de parole open source : Smart Turn

2025-03-06
Modèle de détection de tour de parole open source : Smart Turn

L'équipe Pipecat a publié Smart Turn, un modèle de détection de tour de parole open source conçu pour améliorer les systèmes d'IA vocale existants basés sur la détection d'activité vocale (VAD). Utilisant le Wav2Vec2-BERT de Meta AI comme base, avec une tête de classification simple à deux couches, le modèle prend actuellement en charge l'anglais et en est à un stade initial de preuve de concept. Cependant, l'équipe est convaincue que les performances peuvent être rapidement améliorées. Elle invite la communauté à contribuer à l'amélioration du modèle et à l'élargissement de sa prise en charge linguistique et de ses fonctionnalités.

Lire plus
IA

Nouvelle fonctionnalité de 1Password basée sur la localisation : Éléments à proximité

2025-03-06
Nouvelle fonctionnalité de 1Password basée sur la localisation : Éléments à proximité

1Password a lancé une fonctionnalité basée sur la localisation permettant aux utilisateurs de marquer les mots de passe avec des emplacements physiques. Lorsqu'ils se trouvent à proximité d'un emplacement marqué, les informations d'identification pertinentes apparaissent automatiquement dans l'application mobile 1Password. Cette fonctionnalité « Éléments à proximité » simplifie l'accès aux informations, éliminant le besoin de rechercher ou de se souvenir des noms de compte spécifiques. Les données de localisation peuvent être ajoutées à toute entrée de mot de passe existante ou nouvelle, et une vue cartographique facilite la configuration et l'affichage de la localisation. 1Password garantit aux utilisateurs que les données de localisation restent locales et ne quittent jamais l'appareil. La fonctionnalité est disponible pour tous les clients 1Password dès aujourd'hui.

Lire plus

ChatGPT pour macOS édite désormais le code directement

2025-03-06
ChatGPT pour macOS édite désormais le code directement

OpenAI a annoncé que son application ChatGPT pour macOS dispose désormais de fonctionnalités d'édition de code direct, prenant en charge des outils de développement tels que Xcode, VS Code et JetBrains. La fonctionnalité est disponible pour les utilisateurs payants dès maintenant, et sera déployée pour les utilisateurs gratuits la semaine prochaine. Cela s'appuie sur la fonctionnalité « travailler avec les applications » lancée en novembre 2024, minimisant le besoin de copier-coller du code. Cela place ChatGPT en concurrence plus directe avec des outils de codage IA tels que Cursor et GitHub Copilot, et OpenAI prévoit de lancer un produit dédié à l'ingénierie logicielle. Bien que les outils d'assistance de codage IA gagnent en popularité, des préoccupations subsistent concernant les risques de sécurité, de droits d'auteur et de fiabilité, notamment l'augmentation du temps de débogage pour le code généré par l'IA.

Lire plus
Développement Édition de code

Amélioration de la sécurité du Web PKI : comment SCTNotAfter prévient les erreurs généralisées de certificats

2025-03-06
Amélioration de la sécurité du Web PKI : comment SCTNotAfter prévient les erreurs généralisées de certificats

Historiquement, les événements de méfiance envers les autorités de certification (AC) ont causé des perturbations importantes en raison d’erreurs généralisées de certificats. Cependant, avec les journaux de transparence des certificats (CT) et des durées de vie de certificats plus courtes, la situation s’est améliorée. Le nouveau mécanisme SCTNotAfter fournit une assurance cryptographique concernant la date « NotBefore » du certificat, permettant d’appliquer la méfiance aux certificats émis après une date future, donnant ainsi aux utilisateurs le temps de faire la transition. Cette approche, utilisée avec succès par Chrome pour la gestion de GLOBALTRUST et Entrust, minimise les interruptions pour l’utilisateur tout en améliorant la sécurité du Web PKI et l’expérience utilisateur.

Lire plus

Résolution de l'énigme des gobelins du labyrinthe avec l'algèbre booléenne

2025-03-06

Cet article montre comment résoudre l'énigme de logique classique des Chevaliers et des Valets du film *Labyrinthe* à l'aide de l'algèbre booléenne. L'auteur modélise le problème, en utilisant A pour la réponse, Q pour la réponse correcte à la question et G pour savoir si le gobelin ment, dérivant A = G⊕Q. En posant une question astucieuse pour intégrer le statut de mensonge de l'autre gobelin, l'équation se simplifie, révélant la solution. L'auteur soutient que l'approche formalisée clarifie les étapes et souligne l'utilité des systèmes formels comme outils de raisonnement.

Lire plus

Le changement neutre en technologie du BEAD suscite la controverse : Starlink pourrait recevoir des milliards

2025-03-06
Le changement neutre en technologie du BEAD suscite la controverse : Starlink pourrait recevoir des milliards

Le passage à une approche technologiquement neutre du programme d’équité, d’accès et de déploiement de la large bande (BEAD) suscite la controverse. Les critiques affirment que ce changement, qui abandonne la préférence initiale pour la fibre optique, laissera des millions de personnes avec un accès large bande plus lent, moins fiable et plus cher. Ce changement pourrait acheminer des milliards de dollars de subventions vers les fournisseurs d’internet par satellite comme Starlink, potentiellement au détriment du développement des infrastructures à fibre optique. Les républicains font également pression pour des modifications législatives afin de supprimer ce qu’ils considèrent comme des réglementations onéreuses imposées par l’administration Biden. En fin de compte, les gouvernements des États distribueront les fonds aux FAI, bien que l’allocation exacte reste incertaine.

Lire plus

Koko : une organisation à but non lucratif de santé mentale basée sur l'IA recherche un responsable technique

2025-03-06
Koko : une organisation à but non lucratif de santé mentale basée sur l'IA recherche un responsable technique

Koko, une organisation à but non lucratif spécialisée dans la technologie de la santé mentale, fondée par d'anciens ingénieurs du MIT et d'Airbnb, recherche un responsable technique. Ils construisent des systèmes d'IA évolutifs pour fournir un soutien immédiat en santé mentale en ligne aux jeunes, en intégrant leurs interventions sur des plateformes telles que TikTok et Discord. Ayant déjà aidé plus de 4 millions de jeunes dans 199 pays, Koko met l'accent sur les décisions de produit basées sur les données, les tests A/B et des normes de sécurité rigoureuses. Il s'agit d'une occasion de produire un impact significatif en utilisant l'IA pour le bien.

Lire plus

Bibliothèque d'algèbre linéaire Rust : lin-alg

2025-03-06
Bibliothèque d'algèbre linéaire Rust : lin-alg

lin-alg est une bibliothèque d'algèbre linéaire en Rust qui fournit des structures de données et des opérations pour les vecteurs, les matrices et les quaternions, prenant en charge les types f32 et f64. Elle convient à la création de graphismes informatiques, à la biomécanique, à la robotique et plus encore. La bibliothèque prend en charge les environnements no_std et offre des fonctionnalités de graphismes informatiques et de codage/décodage bincode. Remarque : n'utilisez pas `cargo fmt` sur cette base de code.

Lire plus
Développement Algèbre linéaire

Des modèles de raisonnement économiques surpassent les géants : Conquérir les casse-têtes logiques avec l’apprentissage par renforcement

2025-03-06
Des modèles de raisonnement économiques surpassent les géants : Conquérir les casse-têtes logiques avec l’apprentissage par renforcement

Des chercheurs ont utilisé l’apprentissage par renforcement pour entraîner des modèles de langage open source plus petits et moins coûteux qui ont surpassé DeepSeek R1, OpenAI o1 et o3-mini, et ont presque égalé Anthropic Sonnet 3.7 dans un jeu de raisonnement complexe appelé « Indice temporel », tout en étant plus de 100 fois moins chers au moment de l’inférence. Ils y sont parvenus grâce à une conception minutieuse des tâches, au réglage des hyperparamètres et à l’utilisation de l’algorithme d’optimisation de politique relative de groupe (GRPO) et de la bibliothèque torchtune. Cette recherche démontre le potentiel de l’apprentissage par renforcement pour entraîner efficacement des modèles ouverts pour des tâches de déduction complexes, même avec des données limitées, obtenant des gains de performance significatifs avec seulement 16 exemples d’entraînement.

Lire plus
IA

Molécules clés : Les architectes silencieux des écosystèmes

2025-03-06
Molécules clés : Les architectes silencieux des écosystèmes

Une étude publiée dans Science Advances apporte des preuves convaincantes du concept de « molécules clés ». Ces molécules rares, analogues aux espèces clés en écologie, exercent des effets disproportionnés sur la structure de l’écosystème et les interactions entre les espèces, malgré leur faible abondance. Les chercheurs se sont concentrés sur les limaces de mer Alderia, isolant de nouvelles molécules appelées aldérènes à partir de leur mucus. L’introduction de ces aldérènes dans l’écosystème de vasière a radicalement modifié le comportement d’autres espèces et l’habitat général. Cette recherche souligne le rôle souvent négligé des interactions chimiques dans les réseaux trophiques et ouvre de nouvelles voies pour explorer l’influence de la signalisation chimique dans les écosystèmes.

Lire plus

Réduction de la latence de 83% grâce à des indicateurs de processus Linux ésotériques

2025-03-06
Réduction de la latence de 83% grâce à des indicateurs de processus Linux ésotériques

Un ingénieur optimisant la fonctionnalité Output Media de Recall.ai a rencontré un problème déroutant : la terminaison aléatoire du processus Chromium dans un environnement bac à sable. Un débogage approfondi a révélé la cause racine : la fonction prctl(PR_SET_PDEATHSIG, SIGKILL) du noyau Linux, qui suit les threads parents, et non les processus. L’interaction inattendue avec la gestion des threads de Tokio a provoqué la récupération des threads parents et déclenché le signal SIGKILL, terminant le processus enfant. La suppression de l’indicateur --die-with-parent de Bubblewrap a résolu le problème, entraînant une réduction de la latence de 83 %.

Lire plus

Fiches index : un héritage des Lumières et son côté obscur

2025-03-06
Fiches index : un héritage des Lumières et son côté obscur

Cet article retrace les origines des fiches index, révélant qu'il s'agit de plus qu'un simple matériel de bureau. Étroitement lié à la figure des Lumières Carl Linnaeus, la fiche index a été inventée pour gérer la surcharge d'informations de son travail botanique, impactant significativement la taxonomie moderne et la gestion de l'information. Cependant, l'application de la fiche index était loin d'être neutre ; elle a joué un rôle dans le racisme et la persécution politique. Le FBI et le régime nazi ont utilisé des fiches index pour créer des bases de données catégorisant et surveillant des populations spécifiques. L'article explore l'objectivité de l'organisation de l'information et la relation entre pouvoir et technologie.

Lire plus

Shelgon : Un framework Rust robuste pour les applications REPL interactives

2025-03-06
Shelgon : Un framework Rust robuste pour les applications REPL interactives

Shelgon est un framework Rust robuste pour construire des applications REPL (Read-Eval-Print Loop) interactives et des shells personnalisés. Il fournit une base flexible et type-safe avec des capacités d'interface utilisateur de terminal intégrées utilisant ratatui. Les fonctionnalités incluent l'exécution de commandes type-safe, l'intégration d'un runtime asynchrone (tokio), une belle interface TUI, une gestion d'entrée riche (historique des commandes, déplacement du curseur, complétion par tabulation, gestion de Ctrl+C/Ctrl+D), un support de contexte personnalisé et un support STDIN. Le projet inclut une documentation complète et des exemples pour aider les développeurs à construire rapidement leurs propres shells.

Lire plus

Campagne de phishing usurpant l'identité de l'EFF cible les joueurs d'Albion Online

2025-03-06
Campagne de phishing usurpant l'identité de l'EFF cible les joueurs d'Albion Online

Un acteur menaçant s'est fait passer pour l'Electronic Frontier Foundation (EFF) pour cibler les joueurs d'Albion Online à l'aide de documents leurres et de logiciels malveillants. Un répertoire ouvert contenait des logiciels malveillants (Steal et Pyramid C2) ainsi que de faux rapports de l'EFF. L'analyse a lié l'opération à un développeur russophone et à 11 serveurs partageant des clés SSH. Les messages d'hameçonnage affirmaient que l'EFF enquêtait sur le vol de comptes, attirant les joueurs vers des liens malveillants. L'incident souligne le danger que représentent les acteurs de menaces qui tirent parti de la confiance associée aux organisations connues.

Lire plus
Technologie

Rayhunter : Captureur de Captureurs IMSI Open Source pour Hotspot Orbic

2025-03-06
Rayhunter : Captureur de Captureurs IMSI Open Source pour Hotspot Orbic

Rayhunter est un captureur de captureurs IMSI open source conçu pour le hotspot mobile Orbic (RC400L). Des scripts d'installation sont fournis pour Linux et macOS, avec des instructions manuelles détaillées incluant le support pour Windows. Une interface web accessible via Wi-Fi ou USB permet de contrôler l'enregistrement, de télécharger les captures et d'effectuer une analyse heuristique. Le projet est explicitement étiqueté comme preuve de concept, inapproprié pour les situations à haut risque, et inclut un avertissement concernant les responsabilités légales.

Lire plus
Développement captureur IMSI

bcvi : Édition locale de fichiers distants via un canal SSH inversé

2025-03-06

bcvi est un outil en ligne de commande qui utilise SSH pour créer un 'canal inverse' d'un serveur vers votre poste de travail, vous permettant d'éditer des fichiers sur un serveur distant localement sans avoir besoin du transfert X. L'utilisatrice Sally peut éditer des fichiers sur un serveur en utilisant son éditeur gvim local via bcvi, profitant de tous les avantages d'un éditeur local, tels que les raccourcis clavier personnalisés, les plugins et une meilleure réactivité. bcvi prend également en charge le transfert de fichiers et les notifications de bureau après l'exécution de commandes à distance. L'installation de bcvi nécessite l'installation des composants client et serveur à la fois sur le serveur et sur le poste de travail, ainsi que la configuration du transfert de port SSH et des alias shell.

Lire plus
Développement édition à distance

Questions-réponses avec William J. Rapaport, expert en IA : L’avenir de l’IA et le test de Turing

2025-03-06
Questions-réponses avec William J. Rapaport, expert en IA : L’avenir de l’IA et le test de Turing

Le 27 mars, nous organiserons une séance de questions-réponses avec le professeur William J. Rapaport, expert renommé en IA de l’Université de Buffalo, titulaire de postes en informatique, ingénierie, philosophie et linguistique. L’auteur du livre fondamental « Philosophie de l’informatique » et de plusieurs articles importants, dont des travaux récents sur le succès de l’IA et les grands modèles de langage en lien avec le test de Turing, répondra à vos questions. Soumettez vos questions via ce formulaire ! Il s’agit d’une occasion rare d’échanger directement avec un chercheur de premier plan en IA.

Lire plus

Révolutionner Unix : le système de fichiers rapide 4.3BSD

2025-03-06
Révolutionner Unix : le système de fichiers rapide 4.3BSD

Cet article explore les améliorations révolutionnaires du système de fichiers rapide (FFS) introduit dans le système d’exploitation Unix 4.3BSD de 1984. En s’attaquant aux limitations du système de fichiers Unix traditionnel en termes de taille de fichier, de vitesse d’E/S et de nombre de fichiers, le FFS a considérablement amélioré les performances et la stabilité grâce à une disposition de fichiers optimisée, une taille de bloc augmentée, l’exploitation des caractéristiques physiques du disque et l’introduction de nouveaux types de fichiers et d’appels système. Les principes de conception du FFS, tels que la colocalisation des métadonnées et des données, et l’optimisation des E/S en fonction de la vitesse de rotation du disque, ont profondément influencé les conceptions ultérieures de systèmes de fichiers et jeté les bases de systèmes d’exploitation modernes performants.

Lire plus
Développement

Atlassian intègre Opsgenie dans Jira Service Management et Compass

2025-03-06
Atlassian intègre Opsgenie dans Jira Service Management et Compass

Atlassian a annoncé l'intégration complète des fonctionnalités d'Opsgenie dans sa plateforme afin de mieux répondre aux besoins de ses clients. Les fonctionnalités d'alerte et de gestion des astreintes d'Opsgenie seront intégrées à Jira Service Management et Compass. Jira Service Management deviendra une solution complète de gestion des incidents, tandis que Compass offrira des alertes et une gestion des astreintes riches en contexte. Opsgenie ne sera plus commercialisé à partir du 4 juin 2025 et son support prendra fin le 5 avril 2027. Les clients pourront choisir de migrer vers Jira Service Management ou Compass, Atlassian fournissant des outils et un support de migration personnalisés.

Lire plus
Développement

Mistral OCR : Une API OCR révolutionnaire qui libère la puissance de l'information numérisée

2025-03-06
Mistral OCR : Une API OCR révolutionnaire qui libère la puissance de l'information numérisée

Mistral OCR, une nouvelle API de Reconnaissance Optique de Caractères (OCR), établit une nouvelle norme en matière de compréhension de documents. Contrairement aux autres, elle comprend les médias, le texte, les tableaux et les équations avec une précision et une cognition sans précédent. Prenant des images et des PDF en entrée, elle extrait le contenu sous forme de texte et d'images entrelacés. Avec des performances de pointe sur les documents complexes, une prise en charge multilingue et des benchmarks de premier ordre, Mistral OCR est le modèle par défaut pour des millions d'utilisateurs sur Le Chat. Elle offre une fonctionnalité de document comme invite et une sortie structurée (JSON), avec une option d'auto-hébergement sélective pour les données sensibles. L'API est disponible sur la Plateforme, au prix de 1000 pages par dollar (avec une inférence par lots offrant une valeur encore meilleure).

Lire plus
IA

Le modem 56k : comment il a dépassé la limite de Shannon

2025-03-06
Le modem 56k : comment il a dépassé la limite de Shannon

À l'ère du RTC, 33,6 kbps était considéré comme la limite de vitesse pour les modems sur les lignes téléphoniques standard. Cependant, le modem 56k est arrivé, brisant cette limite. Il ne s'agissait pas d'une violation de la loi de Shannon, mais d'une exploitation intelligente de la transformation numérique du réseau téléphonique. À l'époque, le cœur du réseau téléphonique était numérique, seule la « dernière mille » restait analogique. Le modem 56k a atteint des vitesses plus élevées en permettant aux FAI d'envoyer des signaux numériques directement sur le réseau téléphonique, en contournant les conversions analogiques. Bien que les vitesses réelles aient été affectées par la qualité de la ligne et d'autres facteurs, le modem 56k a rendu Internet beaucoup plus utilisable avant la prolifération du haut débit.

Lire plus
← Previous 1 3 4 5 6 7 8 9 195 196