Le cauchemar de l'AGI d'OpenAI : Un pari à 500 milliards de dollars et la bulle IA qui menace

2025-03-25
Le cauchemar de l'AGI d'OpenAI : Un pari à 500 milliards de dollars et la bulle IA qui menace

L'ambitieux "Projet Stargate" d'OpenAI, une initiative de 500 milliards de dollars visant à construire une IAG, est confrontée à une menace majeure de DeepSeek R1, un modèle open source d'un fonds spéculatif chinois. DeepSeek R1 égale les performances du modèle phare d'OpenAI pour une fraction du coût, soulevant des inquiétudes concernant une bulle IA. Des investissements massifs affluent vers l'IA, mais OpenAI est en train de perdre beaucoup d'argent, comptant sur une avance technologique que DeepSeek R1 a effectivement effacée. Le surinvestissement, la dépendance à des GPU et à de l'énergie coûteuses, et les gains de productivité discutables des outils IA augmentent le risque d'un éclatement de la bulle, pouvant provoquer un choc économique significatif.

Lire plus
Technologie bulle IA

Bruin : Construisez des pipelines de données avec SQL et Python

2024-12-17
Bruin : Construisez des pipelines de données avec SQL et Python

Bruin est un outil puissant de pipeline de données qui combine l'ingestion de données, la transformation de données avec SQL et Python, et les contrôles de qualité des données en un seul framework. Il fonctionne avec les principales plates-formes de données et s'exécute sur votre machine locale, une instance EC2 ou GitHub Actions. Les fonctionnalités clés incluent l'ingestion de données, les transformations SQL et Python, les contrôles de qualité des données, les modèles Jinja, la validation de bout en bout et la prise en charge de plusieurs environnements. Les pipelines sont facilement définis à l'aide d'un simple fichier pipeline.yml.

Lire plus
Développement pipeline de données

Un YouTuber gagne une bataille DMCA contre un faux avocat de Nintendo

2024-12-30
Un YouTuber gagne une bataille DMCA contre un faux avocat de Nintendo

Le YouTuber allemand Domtendo a été confronté à des demandes de retrait DMCA d'un faux avocat de Nintendo, menaçant son canal de 17 ans. En remarquant l'utilisation par l'avocat d'une adresse e-mail ProtonMail et en contactant directement Nintendo, Domtendo a exposé la fraude. Nintendo a confirmé l'illégalité de l'e-mail, ce qui a conduit au retrait des revendications. Cet incident met en évidence les lacunes du système DMCA de YouTube et la prévalence des abus de droits d'auteur, entraînant des appels à la réforme des politiques.

Lire plus

L'œuf d'Enron : Un réacteur nucléaire domestique ?

2025-01-07
L'œuf d'Enron : Un réacteur nucléaire domestique ?

Enron a dévoilé "L'œuf", un réacteur nucléaire compact pour usage domestique, promettant une énergie sûre, efficace et abordable. Utilisant des barres de combustible d'hydrure d'uranium-zirconium, il génère de la chaleur par fission nucléaire, la convertissant en électricité grâce à un échangeur de chaleur Inconel imprimé en 3D. De multiples dispositifs de sécurité sont mis en avant, notamment un arrêt automatique en cas de surchauffe et un blindage anti-radiations avancé. Enron affirme que "L'œuf" est significativement moins cher que les systèmes traditionnels, offrant une énergie fiable et constante. Cependant, la sécurité et la viabilité des réacteurs nucléaires domestiques restent débattues, nécessitant un examen plus approfondi des affirmations d'Enron.

Lire plus

Au-delà du codage par vibes : une approche responsable du développement assisté par IA

2025-05-30
Au-delà du codage par vibes : une approche responsable du développement assisté par IA

L'attrait du « codage par vibes », utilisant l'IA pour générer rapidement du code sans comprendre les fondamentaux, est prévalent. Cependant, cette approche, illustrée par un incident récent ayant exposé une clé API en raison de la négligence des principes de base de la sécurité, est profondément défectueuse. L'auteur soutient que, si les outils d'IA accélèrent le développement, ils ne doivent pas remplacer les connaissances fondamentales en programmation, la planification et les tests. Le véritable développement assisté par IA implique une conception intentionnelle, une compréhension complète de la fonction du code et des tests rigoureux pour éviter les vulnérabilités de sécurité et garantir un logiciel fiable. Il s'agit d'utiliser l'IA pour améliorer, et non pour remplacer, les bonnes pratiques de développement.

Lire plus

L'analogie hydraulique : un obstacle à l'apprentissage de l'électronique

2024-12-30
L'analogie hydraulique : un obstacle à l'apprentissage de l'électronique

De nombreux manuels d'introduction à l'électronique utilisent l'analogie hydraulique pour expliquer les circuits, en comparant le courant électrique au flux d'eau et les batteries à des pompes. Cependant, l'auteur soutient que cette analogie est profondément erronée, notamment lorsqu'il s'agit d'expliquer les composants semi-conducteurs tels que les JFET et les MOSFET. L'analogie ne parvient pas à représenter avec précision leurs courbes caractéristiques, ce qui entrave l'apprentissage. L'auteur préconise d'abandonner cette analogie imprécise et d'apprendre l'électronique à partir de principes plus fondamentaux.

Lire plus

Western Digital mise sur la technologie HAMR pour des disques durs de 100 To d'ici 2030

2025-02-14
Western Digital mise sur la technologie HAMR pour des disques durs de 100 To d'ici 2030

Western Digital a annoncé son plan d'adoption de la technologie d'enregistrement magnétique assisté par la chaleur (HAMR) pour ses disques durs, à partir de fin 2026, avec pour objectif des disques de 80 To à 100 To d'ici 2030. Cela marque un changement par rapport à la technologie MAMR, précédemment soutenue par l'entreprise. Les premiers disques durs HAMR, d'une capacité de 36 To (CMR) et de 44 To (UltraSMR), seront lancés en 2026, avec une production de masse prévue pour le premier semestre 2027. Deux fournisseurs d'hyperscale testent déjà ces disques. Cette innovation promet de plus que doubler la capacité de stockage des disques durs dans les années à venir.

Lire plus

Licencié deux fois en un an : le récit d’un ingénieur logiciel

2025-01-07

Un ingénieur logiciel raconte son expérience de deux licenciements en un an, une fois une semaine après le début de son congé paternité et une autre juste avant Noël. L’article détaille les montagnes russes émotionnelles, les mesures pratiques prises pour trouver un nouvel emploi (mises à jour du CV, allocations chômage, stratégies de recherche d’emploi) et les réflexions sur l’état actuel de l’industrie technologique et l’estime de soi. Il donne des conseils pour gérer les licenciements, en soulignant l’importance de la résilience, du réseautage et de l’apprentissage continu.

Lire plus
Développement recherche d’emploi

L'Odyssée de 20 Ans d'arXiv : Le Règne Réticent d'un Programmeur

2025-03-27
L'Odyssée de 20 Ans d'arXiv : Le Règne Réticent d'un Programmeur

Le serveur de prépublications arXiv de Paul Ginsparg, pierre angulaire de la communication scientifique, a subi une transformation spectaculaire en vingt ans. Initialement un projet solo, sa croissance a engendré des défis de gestion, des cauchemars de maintenance de code et des frictions avec le personnel de la bibliothèque. Malgré ses tentatives d'abandonner le contrôle, Ginsparg est resté profondément impliqué jusqu'à ce que le financement de la Fondation Simons permette une restructuration et une modernisation indispensables. Cet article détaille l'histoire du parcours opiniâtre mais doux-amer d'un brillant programmeur, et l'évolution laborieuse d'une plateforme open-source.

Lire plus
Développement

Moteur d'échecs en 84 688 expressions régulières

2025-01-07

Nicholas Carlini a créé un moteur d'échecs minimax à 2 plis utilisant un nombre impressionnant de 84 688 expressions régulières comme projet de vacances. Il a conçu une machine virtuelle basée sur les expressions régulières avec un jeu d'instructions sans branchement, à exécution conditionnelle et SIMD. Un compilateur d'exécution symbolique traduit le code Python en séquences d'expressions régulières, permettant le calcul parallèle. Le moteur exploite le SIMD pour calculer les mouvements de plusieurs pièces simultanément, avec des optimisations intelligentes des expressions régulières pour la vitesse. Bien que limité en profondeur, il montre la puissance de calcul surprenante des expressions régulières.

Lire plus

Les Secrets Étonnants de la Droite Numérique

2025-02-19
Les Secrets Étonnants de la Droite Numérique

Cet article explore les complexités surprenantes cachées dans la droite numérique apparemment simple. L'auteur soutient que même les entiers méritent une considération plus approfondie concernant leur existence et leur distinction. Plus choquant encore, la grande majorité des nombres sur la droite numérique sont non calculables, ce qui signifie qu'ils ne peuvent être exprimés ou calculés avec précision, dépassant les limites de la compréhension humaine. Cela remet en question notre compréhension des nombres et révèle les mystères infinis du monde mathématique.

Lire plus

Autorisation centralisée : la prochaine plateforme partagée ?

2025-03-22
Autorisation centralisée : la prochaine plateforme partagée ?

Cet article explore les avantages et les défis des systèmes d’autorisation centralisés. Traditionnellement, l’autorisation est décentralisée sur plusieurs applications, ce qui entraîne des inefficacités et des difficultés de gestion. Un système centralisé offre une standardisation, une réduction des coûts et une meilleure conformité, mais nécessite de relever les défis liés à l’expressivité, aux performances, à l’isolation et à l’intégration. L’article examine comment les plateformes open source (Topaz) et commerciales (Aserto) surmontent ces obstacles, permettant une autorisation au niveau de l’entreprise efficace, sécurisée et gérable.

Lire plus
Développement autorisation centralisée

Introduction en douceur aux réseaux neuronaux de graphe : révéler la puissance des données de graphe

2024-12-20
Introduction en douceur aux réseaux neuronaux de graphe : révéler la puissance des données de graphe

Cet article fournit une introduction accessible aux réseaux neuronaux de graphe (GNN). Il commence par expliquer les données de graphe et leurs applications dans le monde réel, telles que les réseaux sociaux, les structures moléculaires et le texte. L’article approfondit ensuite les composants essentiels des GNN, notamment le passage de messages, les opérations de regroupement et les différents types de données de graphe. En construisant un modèle GNN moderne étape par étape, il clarifie le rôle et la motivation derrière la conception de chaque composant. Enfin, il propose un espace de jeu interactif GNN, permettant aux lecteurs de vivre en première main le processus de construction et de prédiction d’un modèle GNN, approfondissant ainsi leur compréhension.

Lire plus

Acouphènes après un concert : récit édifiant

2025-05-22

J'ai développé des acouphènes permanents après avoir assisté à un concert de musique électronique en novembre dernier. Au début, j'étais négligent quant à la protection auditive, pensant que toute gêne serait temporaire. Cette fois-ci, ce ne fut pas le cas. Maintenant, les sons forts me font physiquement mal, et je me surprends à agir comme un parent inquiet, rappelant à mes amis de porter des casques et des gilets réfléchissants. Cette expérience a mis en lumière le risque souvent négligé de dommages auditifs et l'importance de l'autoprotection.

Lire plus

L'inconfortable vérité sur le déficit commercial américain

2025-05-04
L'inconfortable vérité sur le déficit commercial américain

Cet article explore la relation complexe entre le déficit commercial persistant des États-Unis et le statut du dollar comme monnaie de réserve mondiale. L'auteur soutient que la position privilégiée du dollar conduit à sa surévaluation, nuisant à la compétitivité du secteur manufacturier américain et alimentant le populisme politique interne. L'article dissèque la mécanique de la demande mondiale de dollars, le cycle d'endettement qui en résulte et les risques financiers inhérents. Plusieurs stratégies gouvernementales pour gérer le déficit sont analysées et remises en question pour leur incapacité à s'attaquer à la cause profonde. Les implications pour les investissements sont explorées, suggérant de se concentrer sur les bons du Trésor à court terme, les actifs protégés contre l'inflation et les actions internationales pour naviguer dans la volatilité économique potentielle.

Lire plus

Onyx : Plateforme IA open source pour la recherche d'entreprise

2025-03-04
Onyx : Plateforme IA open source pour la recherche d'entreprise

Onyx (anciennement Danswer) est une plateforme IA open source qui connecte les documents, applications et personnes de votre entreprise. Elle offre une interface de chat riche en fonctionnalités et prend en charge plusieurs LLM. Intégration transparente avec plus de 40 connecteurs, dont Google Drive, Slack et Salesforce, en maintenant la synchronisation des connaissances et des contrôles d'accès. Créez des agents IA personnalisés avec des invites, des bases de connaissances et des actions uniques. Déployez Onyx en toute sécurité à n'importe quelle échelle : ordinateur portable, sur site ou dans le cloud. Une édition communautaire est disponible gratuitement sous licence MIT, tandis qu'une édition Entreprise offre des fonctionnalités améliorées pour les grandes organisations.

Lire plus
Développement Recherche d'entreprise

xan : Un outil CLI ultra-rapide pour le traitement de fichiers CSV

2025-03-29
xan : Un outil CLI ultra-rapide pour le traitement de fichiers CSV

xan est un outil en ligne de commande écrit en Rust pour le traitement ultra-rapide de fichiers CSV volumineux (gigaoctets !). Tirant parti du multithreading pour le parallélisme, il gère facilement des tâches telles que la prévisualisation, le filtrage, le découpage, l’agrégation, le tri et la jointure de données CSV. xan possède un puissant langage d’expressions qui surpasse la vitesse de Python, Lua ou JavaScript pour les opérations complexes. Initialement une fourchette de xsv, mais entièrement réécrit, xan répond aux besoins d’analyse de données des sciences sociales, incluant la lexicométrie, la théorie des graphes et même le web scraping. L’installation est simple via cargo, Homebrew, pacman, Nix ou des binaires pré-compilés.

Lire plus
Développement traitement CSV

La « photographie de rue » par IA n'est pas de la photographie : ce que nous perdons en simulant l'expérience

2024-12-21
La « photographie de rue » par IA n'est pas de la photographie : ce que nous perdons en simulant l'expérience

Cet article soutient que la « photographie de rue » générée par l'IA n'est pas de la vraie photographie. Bien que l'IA puisse créer des images ressemblant à des photos de rue, elle manque des éléments essentiels de la photographie réelle : la capture de la lumière et des moments réels, l'interaction avec des étrangers et les risques et les récompenses inhérents à l'interaction avec le monde réel. L'auteur oppose les images générées par l'IA à sa propre expérience dans Chinatown à Brooklyn, soulignant la valeur de la connexion humaine, des échanges culturels et du malaise et du courage nécessaires à la vraie photographie de rue. L'article met finalement en garde contre l'effondrement du sens lorsque les expériences simulées remplacent l'engagement authentique avec la réalité.

Lire plus

BYOJS : Adoptez JavaScript natif pour le développement web

2024-12-17

Le projet BYOJS préconise la construction d'applications web avec le JavaScript core, plutôt que de dépendre de frameworks lourds. Bien que les frameworks et les langages comme TypeScript soient populaires, BYOJS soutient que la construction d'applications web efficaces en utilisant le langage JS core est un art perdu. Il encourage l'utilisation de bibliothèques faiblement couplées au lieu de frameworks fortement couplés, prônant le choix de l'outil le moins puissant qui permette de réaliser la tâche et privilégiant un code concis. Le projet fournit des utilitaires utiles tels qu'une API simple de stockage clé-valeur, un émetteur d'événements asynchrones, un wrapper modal, et plus encore. Tout le code est sous licence MIT.

Lire plus

Lenovo dévoile la console portable Legion Go S avec SteamOS

2025-01-07

Lors du CES 2025, Lenovo a officiellement lancé sa nouvelle console portable de jeu, la Legion Go S, officiellement licenciée par Valve et dotée de SteamOS. Cette annonce a suscité des discussions sur sa concurrence avec la Steam Deck et les mesures de contrôle qualité de Valve pour les appareils SteamOS tiers. Certains commentateurs suggèrent que la Legion Go S pourrait surpasser la Steam Deck en termes de performances, mais des inquiétudes subsistent concernant la prise en charge des pilotes et les problèmes de compatibilité avec le matériel tiers.

Lire plus
Matériel console portable

La mise à jour de la mémoire d'OpenAI : un bond en avant transformateur pour l'IA

2025-04-17
La mise à jour de la mémoire d'OpenAI : un bond en avant transformateur pour l'IA

Les mises à jour de la mémoire d'OpenAI marquent le début de ce qui pourrait être le changement le plus transformateur depuis les débuts de GPT-3. Auparavant, l'IA ressemblait à un ami brillant mais oublieux. Maintenant, la mémoire change tout. L'IA se souviendra de vos habitudes, de vos schémas de pensée et de vos préférences, devenant un compagnon et un assistant à vie. Cela entraînera des gains de productivité massifs et remettra en question l'idée reçue selon laquelle l'IA manque de défensabilité. OpenAI pourrait lancer un produit "Se connecter avec OpenAI", permettant aux développeurs tiers d'accéder directement à sa couche de mémoire pour construire des applications plus puissantes. La compétition se concentrera sur la mémoire : celui qui la capture le plus rapidement gagne.

Lire plus

Le Contrôleur d'Œufs : La quête d'un fils pour comprendre l'héritage de son père

2025-04-26

L'auteur hérite du 'Contrôleur d'Œufs' de son père décédé, un dispositif permettant de contrôler précisément la température du barbecue. Initialement déroutant, l'appareil s'avère être un engin d'ingénierie sophistiqué utilisant un contrôle PID. Le parcours de dépannage de l'auteur, de la confusion initiale à la découverte d'un interrupteur caché, aboutit à l'utilisation réussie du contrôleur, accomplissant le travail inachevé de son père et servant d'hommage poignant.

Lire plus
Divers Hommage

L'étrange cas du hash(-1) == hash(-2) en Python

2025-01-10

Une question sur Reddit concernant la raison pour laquelle `hash(-1) == hash(-2)` en Python a déclenché une enquête. En plongeant dans le code source de CPython, l'auteur a découvert que -1 est utilisé comme indicateur d'erreur dans la fonction `PyObject_Hash`. Ainsi, lorsque le hachage calculé est -1, il est converti en -2. Ce n'est pas un easter egg de Python, mais une particularité de la façon dont le code C de CPython gère les erreurs.

Lire plus

L'UE investit 70 milliards d'euros dans la technologie pour combler le fossé avec les États-Unis

2025-05-19
L'UE investit 70 milliards d'euros dans la technologie pour combler le fossé avec les États-Unis

La Banque européenne d'investissement (BEI) prévoit d'investir 70 milliards d'euros dans le secteur technologique européen d'ici 2027, afin de réduire l'écart d'innovation avec les États-Unis. Cette initiative, baptisée TechEU, vise à renforcer la position de l'Europe dans les technologies émergentes telles que l'intelligence artificielle et les drones militaires, à attirer des investissements privés (potentiellement 250 milliards d'euros) et à simplifier les processus de financement. La présidente de la BEI, Nadia Calviño, souligne la volonté de la banque de prendre plus de risques, en accélérant le financement en capital-risque, ce qui pourrait être déterminant pour les startups dans un marché rapide. Un hub centralisé pour les demandes de financement sera créé.

Lire plus

Site Web Dover : JavaScript requis

2025-01-13

Une visite sur un site web nommé Dover affiche une invite demandant d'activer JavaScript pour exécuter l'application. Cela suggère fortement que le site dépend fortement de JavaScript pour le rendu front-end ou les fonctionnalités interactives. Il utilise probablement du contenu dynamique, des animations ou une interface interactive complexe nécessitant JavaScript pour un fonctionnement correct. Cela soulève des questions sur les choix de conception du site web et le degré de dépendance à JavaScript.

Lire plus
Développement

Mixbox : Révolutionner le mélange des couleurs en peinture numérique

2024-12-29
Mixbox : Révolutionner le mélange des couleurs en peinture numérique

Mixbox est une bibliothèque révolutionnaire de mélange des couleurs qui résout le problème du mélange de couleurs peu naturel en peinture numérique en simulant la façon dont les pigments réels se mélangent. Basée sur la théorie de Kubelka-Munk, elle traite les couleurs comme des pigments, offrant une interface simple d'entrée/sortie RVB et prenant en charge plusieurs langages, notamment C++, Python et GLSL. Mixbox permet des dégradés de couleurs plus réalistes, des effets de mélange plus riches et un mélange de coups de pinceau plus naturel, rapprochant la peinture numérique de la sensation de la peinture traditionnelle. Elle est déjà intégrée à Rebelle et à l'extension Flip Fluids de Blender et offre des options de licence flexibles pour les développeurs.

Lire plus

Optimisation non intuitive : accélération des unions de chemins dans Skia

2025-01-01
Optimisation non intuitive : accélération des unions de chemins dans Skia

L'auteur a rencontré des goulots d'étranglement de performances lors de l'exécution d'opérations d'union de chemins sur un grand nombre de chemins de graphiques vectoriels à l'aide de Skia. L'approche initiale naïve consistant à unir les chemins de manière itérative était lente, et bien que le générateur de chemins de Skia offrait une optimisation, il n'était pas suffisamment rapide. En approfondissant les détails internes des opérations de chemins de Skia, il a été découvert que le nombre de courbes dans chaque chemin affectait considérablement les performances. En divisant l'union des chemins en intervalles plus petits et en appliquant de manière récursive une stratégie de diviser pour régner, l'auteur a obtenu une accélération significative, surpassant finalement la méthode par défaut de Skia. Étonnamment, l'augmentation du nombre d'opérations d'union via cette méthode a entraîné un traitement plus rapide.

Lire plus

Archivage de 16 To de données publiques fédérales américaines publié

2025-02-07
Archivage de 16 To de données publiques fédérales américaines publié

Des chercheurs de la Harvard Law School ont publié une archive de 16 To contenant plus de 311 000 ensembles de données, une archive complète de data.gov de 2024 et 2025. Ce projet vise à préserver l'intégrité et l'authenticité des données en conservant des métadonnées détaillées et des signatures numériques, facilitant ainsi la citation et l'accès à ces informations pour les chercheurs et le public au fil du temps. Un logiciel et une documentation open source sont également publiés pour permettre à d'autres de reproduire le travail et de créer des référentiels similaires. Le projet est soutenu par la Filecoin Foundation et le Rockefeller Brothers Fund.

Lire plus

Améliorer la qualité de la base de connaissances pour les systèmes RAG : meilleures pratiques pour l’IA et les humains

2025-06-18
Améliorer la qualité de la base de connaissances pour les systèmes RAG : meilleures pratiques pour l’IA et les humains

Ce guide décrit les meilleures pratiques pour créer une documentation qui serve efficacement à la fois les lecteurs humains et les IA/LLM dans les systèmes de génération augmentée par la récupération (RAG). Une documentation de haute qualité améliore les réponses de l’IA et l’expérience utilisateur, créant une boucle de rétroaction positive. L’article détaille la manière dont les systèmes d’IA traitent la documentation (récupération, base de données vectorielles, génération), soulignant l’importance d’un contenu clair, concis et contextuellement complet. Les recommandations incluent l’utilisation de HTML sémantique, l’évitement des PDF, la création d’un contenu adapté aux robots d’indexation, la garantie de la clarté sémantique, la fourniture d’équivalents textuels pour les éléments visuels et le maintien de mises en page simples. Le guide aborde également les défis courants de conception de contenu, tels que les dépendances contextuelles, les lacunes de découvrabilité sémantique, les hypothèses de connaissances implicites et les dépendances d’informations visuelles. Il préconise une architecture d’information hiérarchique, des sections autonomes et la fourniture d’un contexte d’erreur avec des solutions. En fin de compte, l’objectif est une documentation à la fois lisible pour les humains et conviviale pour l’IA.

Lire plus
Développement documentation IA

Plongeon en profondeur dans la sélection de niveau de mipmap du GPU

2025-05-14

Cet article explore en détail le mécanisme de sélection du niveau de mipmap lors de l'échantillonnage des textures sur le GPU. En commençant par le problème de l'aliasing des textures, l'auteur explique la technique du mipmapping et le rôle des dérivées de pixels (ddx()/ddy()). En analysant les spécifications GLES3.0 et DirectX 11.3, ainsi que les résultats expérimentaux, l'auteur révèle la complexité de la relation entre la sélection du niveau de mipmap et les dérivées de pixels, ainsi que les différences d'implémentation entre les différents fabricants de GPU. L'article explore également l'impact des transformations elliptiques et du filtrage anisotrope sur la sélection du niveau de mipmap, en fournissant des implémentations logicielles correspondantes et en les comparant aux implémentations matérielles.

Lire plus
Développement
1 2 511 512 513 515 517 518 519 595 596