Vulnérabilité de dépassement de capacité de la mémoire heap dans Atop 2.11 : CVE-2025-31160

2025-03-29

Une vulnérabilité de dépassement de capacité de la mémoire heap (CVE-2025-31160) a été découverte dans Atop 2.11. Cette vulnérabilité provient du fait qu'Atop tente de se connecter au port TCP du démon atopgpud lors de l'initialisation. Si un autre programme écoute sur ce port, Atop peut s'y connecter et recevoir des chaînes de caractères malveillantes, ce qui entraîne des erreurs d'analyse, des dépassements de capacité de la mémoire heap et des erreurs de segmentation. Cette vulnérabilité est présente depuis l'introduction d'atopgpud dans Atop 2.4.0. La solution consiste à : ne pas se connecter au port TCP par défaut, tenter de se connecter uniquement lorsque l'indicateur '-k' est utilisé ; améliorer l'analyse des chaînes de caractères pour éviter les dépassements de capacité de la mémoire heap ; et ne pas rechercher netatop ou netatop-bpf par défaut, uniquement lorsque l'indicateur '-K' est utilisé.

Lire plus

Terence Tao sur la résolution des systèmes dynamiques

2025-01-29

Le mathématicien renommé Terence Tao a partagé ses idées sur la résolution de problèmes dans les systèmes dynamiques sur Mathstodon. Il a souligné la nécessité de considérer la complexité et l'évolution de ces systèmes, nécessitant une approche multiforme utilisant divers outils mathématiques et le contexte du monde réel. Son message a suscité des discussions parmi les passionnés de mathématiques, montrant l'exploration et l'innovation continues dans le domaine.

Lire plus

Toyota IMV 0 à 10 000 $: un pick-up sans fioritures que les États-Unis ne peuvent pas avoir

2025-03-28
Toyota IMV 0 à 10 000 $: un pick-up sans fioritures que les États-Unis ne peuvent pas avoir

Sur un marché américain où les pick-up neufs coûtent en moyenne 59 000 $, la Toyota IMV 0 à 10 000 $ change la donne. Ce pick-up compact, basé sur la plateforme Hilux, manque de fonctionnalités modernes comme les écrans tactiles et les dispositifs de sécurité, mais il offre une praticité et une robustesse surprenantes. Il offre une benne et une cabine étonnamment spacieuses, et sa boîte manuelle et sa traction arrière procurent une expérience de conduite pure. Bien qu'il ne soit actuellement disponible que sur les marchés en développement comme la Thaïlande et indisponible aux États-Unis, il présente un argument convaincant pour un pick-up plus simple et plus abordable. Il suggère un changement potentiel de la demande du marché vers des véhicules plus petits, moins chers et plus utilitaires.

Lire plus

Régression d'optimisation de Clang : l'intégration des fonctions nuit aux performances dans un benchmark C++

2025-02-19

Un benchmark C++ a révélé une régression de performance dans l'optimisation des fonctions intégrées de Clang. Lorsque la fonction `increment` a été intégrée, les échecs de prédiction de branche ont entraîné une baisse des performances d'environ 5 fois par rapport à la version non intégrée. `perf stat` a confirmé que les prédictions de branche incorrectes étaient les coupables. Curieusement, la compilation avec la chaîne d'outils Zig a considérablement amélioré les performances, suggérant une régression potentielle dans Clang 19. Le problème a été signalé sur le dépôt Clang/LLVM, l'enquête initiale indiquant un compromis entre les passes d'optimisation SROA et SimplifyCFG.

Lire plus
Développement

Demodesk : façonner l'avenir des ventes, recrutement mondial

2025-01-23
Demodesk : façonner l'avenir des ventes, recrutement mondial

Demodesk, une entreprise technologique proposant un coaching de vente basé sur l'IA, l'automatisation de la planification et des plateformes de visioconférence, recrute à l'échelle mondiale. Elle promeut un environnement de travail amical pour le télétravail, offrant des conditions de travail flexibles et une rémunération attractive incluant des options sur actions, une couverture santé et des avantages de transport, en mettant l'accent sur le développement et l'épanouissement des employés. Rejoignez Demodesk et participez à façonner l'avenir des ventes !

Lire plus
Startup IA ventes

Svader : une bibliothèque Svelte pour les composants rendus par GPU

2024-12-14
Svader : une bibliothèque Svelte pour les composants rendus par GPU

Svader est une bibliothèque permettant de créer des composants Svelte rendus par GPU à l'aide de shaders de fragments WebGL et WebGPU. Les développeurs peuvent écrire des programmes dans les shaders de fragments pour personnaliser les couleurs des pixels et contrôler les effets de rendu via le passage de paramètres. Prenant en charge Svelte 4 et 5, elle offre des modes de rendu WebGL et WebGPU avec des paramètres intégrés tels que la résolution, l'échelle et le temps. Svader simplifie le rendu GPU grâce à des composants faciles à utiliser et fournit un rendu de secours dans les environnements ne prenant pas en charge WebGL ou WebGPU.

Lire plus
Développement

Benchmark : Comparaison de six serveurs de tuiles vectorielles PostGIS open source

2025-04-06
Benchmark : Comparaison de six serveurs de tuiles vectorielles PostGIS open source

Le mémoire de master de Fabian Rechsteiner compare six serveurs de tuiles vectorielles PostGIS open source (BBOX, ldproxy, Martin, pg_tileserv, Tegola, TiPg) en termes de vitesse. Les résultats sont présentés via une comparaison interactive de cartes sur vectormap.ch et un référentiel GitHub avec un code reproductible. Bien que la vitesse ne soit pas le seul facteur, ce benchmark fournit des informations précieuses pour le choix d'un serveur de tuiles vectorielles.

Lire plus
Développement tuiles vectorielles

Suivi des trains et de la météo avec écran e-ink et Raspberry Pi : combler le manque d'autonomie

2025-03-29
Suivi des trains et de la météo avec écran e-ink et Raspberry Pi : combler le manque d'autonomie

L'auteur a construit un écran e-ink alimenté par un Raspberry Pi qui affiche les heures d'arrivée du métro en temps réel et les prévisions météo, résolvant ainsi un problème quotidien de trajet matinal. L'appareil affiche la date, l'heure, les prochaines arrivées des trains F et G pour les 30 prochaines minutes et une prévision météo sur 12 heures. Les détails du projet couvrent la conception matérielle et logicielle, y compris l'acquisition de données de l'API MTA, le moteur d'affichage et les stratégies de mise à jour pour minimiser le scintillement et les images fantômes sur l'écran. Le produit fini est esthétique et fonctionnel, apprécié par la femme de l'auteur, comblant ainsi avec succès le 'manque d'autonomie'.

Lire plus
Matériel

Con Kolivas, développeur de noyau Linux de renom, démissionne : Aperçu des défis du Linux de bureau

2025-02-15

Con Kolivas, développeur de noyau Linux renommé et anesthésiste, a récemment annoncé son départ du développement du noyau. Connu pour ses contributions à l'amélioration des performances du bureau, ses ensembles de correctifs ont eu un impact significatif sur le noyau Linux. Cette interview explore les raisons de son départ, en examinant les complexités du marché du matériel et des logiciels, les obstacles auxquels Linux est confronté sur le bureau et sa vision de l'avenir. Ses idées offrent des perspectives précieuses aux utilisateurs de Linux et de Windows, soulignant les défis continus dans l'évolution de l'expérience Linux de bureau.

Lire plus
Développement Développement de noyau

Repenser SQLite : étonnamment puissant à l’hyper-échelle

2025-03-03
Repenser SQLite : étonnamment puissant à l’hyper-échelle

Contrairement à l’opinion répandue, SQLite ne se limite pas aux petites applications. Cet article soutient que des services comme Cloudflare Durable Objects et Turso libèrent le potentiel de SQLite à l’hyper-échelle. Ces plateformes attribuent des bases de données SQLite par entité, remplaçant la complexité des bases de données partitionnées. Cette approche résout des problèmes tels que les schémas rigides, les modifications de schéma difficiles et les opérations complexes entre partitions. Bien que des défis persistent — manque de solution open source auto-hébergée et de protocoles standardisés —, la conformité ACID de SQLite, les E/S efficaces et les riches extensions SQL en font une alternative convaincante aux bases de données partitionnées traditionnelles.

Lire plus
Développement

La renaissance des jeux de rôle sur table : comment Donjons et Dragons lutte contre la solitude

2025-03-27
La renaissance des jeux de rôle sur table : comment Donjons et Dragons lutte contre la solitude

En commençant dans un café de jeux de société à New York, un groupe de jeunes d’une vingtaine d’années a transformé son hobby de Donjons et Dragons en une chaîne Twitch florissante, "The Bards of New York", comptant des milliers d’abonnés. Ce succès reflète la popularité croissante des jeux de rôle sur table (JDR), en particulier Donjons et Dragons. Autrefois un loisir de niche, Donjons et Dragons compte désormais des dizaines de millions de joueurs, donnant naissance à des films, des séries télévisées et des carrières lucratives de streaming. L’article souligne que les JDR ne se contentent pas de divertir, mais qu’ils favorisent également des communautés fortes, luttant contre la solitude et améliorant la créativité et les capacités de résolution de problèmes — un aspect particulièrement précieux dans un monde post-pandémique.

Lire plus

Exécuter ArchiveTeam Warrior sur Kubernetes

2025-02-05

L'auteur a initialement exécuté le projet ArchiveTeam Warrior sur une machine virtuelle Proxmox, mais pour améliorer l'efficacité et tirer parti de son cluster Kubernetes, il l'a migré vers un environnement conteneurisé. L'article détaille comment l'auteur a écrit des manifestes Kubernetes, configurés à l'aide de variables d'environnement, et a utilisé un emptyDir en mémoire pour résoudre les problèmes d'espace disque. De plus, l'auteur a développé un script Python pour surveiller l'état de Warrior. Une mise à jour ultérieure mentionne le passage aux images `*-grab` plus légères après avoir discuté avec d'autres développeurs et prévoit de construire une interface utilisateur d'administration.

Lire plus
Développement Conteneurisation

Doctor Droid : Assistant intelligent pour la résolution des incidents de production

2025-02-14
Doctor Droid : Assistant intelligent pour la résolution des incidents de production

Doctor Droid développe un assistant intelligent pour aider les équipes d'ingénierie à accélérer l'investigation lors d'incidents de production. Cette plateforme open source, utilisée dans le monde entier, vise à réduire les temps d'arrêt et à augmenter la productivité des développeurs. Sa vision est de permettre à n'importe quel membre de l'équipe de déboguer les problèmes de production courants sans avoir besoin d'ingénieurs seniors. Soutenu par Accel et diplômé du batch hiver 2023 de Y Combinator, Doctor Droid recherche des développeurs passionnés pour rejoindre son équipe.

Lire plus
Développement Résolution d'incidents

Simulateur de la théorie du constructeur en Python : Gravité quantique et électromagnétisme en code

2025-05-18
Simulateur de la théorie du constructeur en Python : Gravité quantique et électromagnétisme en code

Une implémentation Python du framework de la théorie du constructeur de David Deutsch, présentant les concepts clés — des tâches simples et des substrats ramifiés à la gravité quantique et à l'électromagnétisme — entièrement en code. Il inclut un « constructeur universel » capable de s'auto-amorcer à partir d'une liste de tâches, démontrant l'auto-réplication et la puissance de la théorie du constructeur. Les fonctionnalités incluent les tâches irréversibles et quantiques, les minuteries et les horloges, la fongibilité, la dynamique continue et les tâches de couplage telles que le corps gravitationnel à deux corps, le couplage de Coulomb et la force de Lorentz.

Lire plus
Développement Théorie du constructeur

S'attaquer à la crise du logement à New York : une approche axée sur la mobilité

2025-05-14
S'attaquer à la crise du logement à New York : une approche axée sur la mobilité

La crise du logement à New York exige une action immédiate, mais la construction de nouveaux logements prend des années. Cet article propose une solution plus rapide : améliorer la mobilité. En optimisant les voies réservées aux bus, en ajustant les prix du stationnement, en construisant des pistes cyclables protégées et en améliorant les systèmes d’information du métro, la ville peut indirectement augmenter l’offre de logements abordables et créer des opportunités pour les résidents. L’auteur cite des exemples réussis à Londres et à San Francisco pour démontrer l’efficacité et la faisabilité de ces stratégies, en soulignant leur mise en œuvre rapide et leur fort effet de levier.

Lire plus

L'essor et le déclin (et la possible renaissance ?) de l'industrie américaine de la machine-outil

2025-04-08
L'essor et le déclin (et la possible renaissance ?) de l'industrie américaine de la machine-outil

L'industrie américaine de la machine-outil, autrefois leader mondial, a connu un déclin spectaculaire au début des années 1980 en raison d'une conjonction de facteurs : une chute vertigineuse de la demande intérieure, une réponse lente à la volatilité du marché, la domination japonaise en matière de technologie CNC et de processus de fabrication, et la force du dollar. L'incapacité de l'industrie à rebondir découlait de problèmes plus profonds : un manque d'entreprises de grande taille, des difficultés à obtenir des capitaux, un manque de compétences et une faible capacité de transfert de technologie. Une étude du RAND suggère une approche gouvernementale à trois volets — favoriser les réseaux de coopération, investir dans les infrastructures de fabrication et simplifier les procédures d'exportation — pour relancer potentiellement le secteur.

Lire plus

L'effet de refroidissement évaporatif sur les réseaux sociaux : pourquoi les contributeurs de haute valeur partent

2025-01-07

Cet article de blog explore « l'effet de refroidissement évaporatif », où les contributeurs de haute valeur quittent une communauté en raison d'un manque d'avantages, ce qui entraîne une baisse de la qualité de la communauté. Il analyse comment des facteurs tels que l'ouverture, les mécanismes d'accès à la communauté (par exemple, l'adhésion payante ou les barrières de connaissances), les styles de communication interne et la récompense des contributeurs de haute valeur affectent cet effet. L'auteur soutient que « le refroidissement évaporatif » est inévitable dans la croissance d'une communauté, et la clé est de le ralentir. L'article suggère de combiner les structures de communauté « place » (facilement extensible) et « terrier » (plus stable) pour équilibrer l'évolutivité et la stabilité.

Lire plus

Faille de sécurité dans un terminal de paiement suisse : micrologiciel non crypté et shell root accessible

2025-06-01

Un chercheur en sécurité a procédé à l’ingénierie inverse d’un terminal de paiement Worldline Yomani XR largement utilisé en Suisse, découvrant un micrologiciel non crypté et un shell root accessible publiquement. Malgré les protections physiques anti-manipulation, le port de débogage est accessible de l’extérieur, permettant aux attaquants d’obtenir un accès root et de déployer des logiciels malveillants en 30 secondes. Cependant, une analyse plus approfondie a révélé que le système Linux ne gère pas les données sensibles (comme les informations sur les cartes) ; un processeur séparé, crypté et signé, gère les fonctions de sécurité. Bien qu’il s’agisse d’un important oubli d’ingénierie logicielle, le risque direct semble moins important que craint initialement.

Lire plus

Sources d'ondes gravitationnelles : du moment quadrupolaire aux objets compacts

2025-04-06

Cet article explore les sources d'ondes gravitationnelles. Selon la relativité générale, la génération d'ondes gravitationnelles est liée à la variation temporelle du moment quadrupolaire de la distribution de matière dans l'espace-temps. Contrairement aux ondes électromagnétiques, le terme source d'ordre le plus bas pour les ondes gravitationnelles est le moment quadrupolaire, ce qui signifie que seuls les objets non sphériques et accélérés peuvent produire des ondes gravitationnelles significatives. Les objets compacts tels que les naines blanches, les étoiles à neutrons et les trous noirs, et leurs systèmes binaires sont les principales sources d'ondes gravitationnelles. Leurs formes non sphériques et le mouvement orbital provoquent des changements dans le moment quadrupolaire, générant des ondes gravitationnelles détectables.

Lire plus

La courbe de Gatsby académique : dans quelle mesure le succès académique est-il hérité ?

2024-12-21
La courbe de Gatsby académique : dans quelle mesure le succès académique est-il hérité ?

Une nouvelle étude révèle que le succès académique reflète l'héritage de la richesse et du statut social. En analysant les données de plus de 245 000 paires mentor-mentoré, les chercheurs ont découvert que plus la distribution des citations est inégale au sein d'une discipline, plus le classement des citations d'un mentoré est susceptible de refléter celui de son mentor. Cela suggère que le succès académique est façonné par des forces structurelles similaires à celles qui régissent la mobilité sociale, où l'avantage d'avoir un mentor de haut niveau crée un cycle de succès auto-renforçant. Tout en reconnaissant les avantages du mentorat de haut niveau, l'étude met en garde contre la dépendance exclusive aux mesures de citations, plaidant pour une plus grande équité académique et l'égalité des chances.

Lire plus

CVS vous permet de déverrouiller les étagères verrouillées avec votre téléphone

2025-01-29
CVS vous permet de déverrouiller les étagères verrouillées avec votre téléphone

CVS teste une nouvelle fonctionnalité qui permet aux clients de déverrouiller les casiers verrouillés en magasin à l'aide de leur téléphone, éliminant ainsi le besoin de demander de l'aide à un employé. L'essai est actuellement mené dans quelques magasins, avec des plans de déploiement national en cas de succès. La fonctionnalité nécessite que les utilisateurs soient connectés à l'application CVS, connectés au Wi-Fi du magasin et que le Bluetooth soit activé. L'adhésion au programme de fidélité CVS est également nécessaire. L'application propose également une recherche optimisée par l'IA et un chatbot IA conversationnel pour vérifier les renouvellements de médicaments et le statut des commandes, simplifiant ainsi le processus de retrait des ordonnances.

Lire plus

Conception de logiciels d'information : le triomphe du graphisme, l'échec de l'interaction ?

2025-06-03

Dans son article, Bret Victor remet en question les principes traditionnels de la conception de logiciels, en faisant valoir que la plupart des logiciels (logiciels d'information) mettent l'accent sur la présentation de l'information plutôt que sur l'interaction. Il plaide pour une conception de logiciels d'information fondée sur le graphisme, réduisant l'interaction de l'utilisateur grâce à des visualisations intelligentes et à la prise de conscience du contexte. L'article prend des exemples tels que les horaires de trains, les librairies en ligne et les listes de films pour comparer les conceptions interactives traditionnelles aux approches guidées par le graphisme. Il propose des méthodes d'inférence de contexte utilisant la détection environnementale et les données historiques. Victor lance un appel à l'industrie de la conception de logiciels pour qu'elle privilégie la communication visuelle, en révolutionnant la conception des logiciels d'information afin d'obtenir des expériences utilisateur plus intuitives et efficaces.

Lire plus
Développement Graphisme

Hoarder : Archivage Web Auto-Hébergé avec Fonctions IA

2025-03-16
Hoarder : Archivage Web Auto-Hébergé avec Fonctions IA

Hoarder est un outil d'archivage web open source et auto-hébergé qui permet de rechercher, filtrer et taguer du contenu web, en stockant des copies complètes localement pour un accès hors ligne. Il utilise une instance headless de Chrome pour le téléchargement et intègre en option des fonctionnalités d'IA (OpenAI ou LiteLLM) pour l'étiquetage et la création de résumés automatiques. Hoarder propose une application web et une application Android, prenant en charge la recherche en texte intégral, le filtrage par tag et les abonnements RSS. L'auteur détaille la configuration de Docker et de Caddy, l'intégration de SingleFile et la migration depuis Linkding. Les améliorations futures comprennent une meilleure prise en charge des annotations, la lecture mobile dans l'application, l'exportation de livres électroniques et un avenir social décentralisé.

Lire plus
Développement

Plongeon au cœur du cache Caffeine : Décryptage de Window TinyLFU et implémentations efficaces

2025-02-02

Cet article explore en profondeur les mécanismes internes de la bibliothèque de cache haute performance Caffeine, en se concentrant sur sa politique d'évictions unique Window TinyLFU. Il explique comment Window TinyLFU combine les informations de fréquence et de fraîcheur d'accès, utilisant une structure de données CountMinSketch pour une estimation efficace de la fréquence. De plus, l'article analyse les mécanismes d'expiration de Caffeine basés sur des files d'attente ordonnées et une roue de temporisation hiérarchique, et comment sa politique de cache adaptative ajuste dynamiquement la configuration du cache en utilisant un algorithme de montée de gradient pour atteindre une gestion de cache haute performance.

Lire plus
Développement

Penn réduit les admissions en études supérieures suite à des coupes dans les financements fédéraux pour la recherche

2025-02-23
Penn réduit les admissions en études supérieures suite à des coupes dans les financements fédéraux pour la recherche

L'Université de Pennsylvanie a considérablement réduit les admissions en études supérieures au sein de sa School of Arts and Sciences en raison de coupes budgétaires fédérales affectant la recherche, provoquant l'indignation des professeurs. Les départements ont reçu pour instruction de réduire drastiquement les admissions, allant même jusqu'à révoquer des offres faites à des étudiants déjà acceptés. Les professeurs ont critiqué le manque de transparence et ont mis en garde contre les graves conséquences sur la recherche et l'enseignement. Ces coupes sont liées à une proposition de réduction de 240 millions de dollars du National Institutes of Health (NIH), mais des spéculations évoquent également des liens possibles avec les efforts de syndicalisation des étudiants diplômés ou une diminution du soutien aux humanités. La situation met en lumière la situation financière précaire des établissements d'enseignement supérieur.

Lire plus

Hyperview : Des applications mobiles natives aussi faciles à créer qu'un site web

2025-01-08
Hyperview : Des applications mobiles natives aussi faciles à créer qu'un site web

Hyperview est un nouveau format hypermédia et un client React Native pour développer des applications mobiles pilotées par serveur avec la simplicité de la création d'un site web. Il affiche les écrans en récupérant le contenu Hyperview XML (HXML) d'un serveur, supportant diverses technologies back-end comme Django, Rails ou Node. Les mises à jour sont instantanées grâce aux modifications du back-end, éliminant les longs délais d'examen sur l'app store. Hyperview excelle pour les applications basées sur le réseau (réseaux sociaux, places de marché, navigation multimédia), mais n'est pas idéal pour les applications fortement dépendantes des données hors ligne ou du calcul local.

Lire plus

L'Amérique en pleine forme ? Un mystère!

2024-12-19
L'Amérique en pleine forme ? Un mystère!

Des données récentes révèlent une amélioration inattendue de la santé aux États-Unis, avec une baisse du nombre de décès par overdose de drogue, d'accidents de la route, de taux d'obésité et de taux d'homicides. Cela contraste fortement avec l'image de longue date des États-Unis comme un « piège mortel riche ». Si certains attribuent cela à des politiques efficaces, telles que l'amélioration de l'accès aux traitements contre la toxicomanie et la disponibilité accrue de Narcan, les experts suggèrent que l'impact de ces politiques pourrait être surestimé. D'autres facteurs, tels que la baisse naturelle du nombre de décès par overdose après la pandémie et les changements dans l'application des lois, ont probablement joué un rôle. Les causes précises de cette amélioration restent obscures, soulignant la complexité de la réalité, souvent occultée par des explications simplistes.

Lire plus

Projet Open Source Hokusai : Mise à jour majeure ajoutant la prise en charge de Windows !

2025-05-09
Projet Open Source Hokusai : Mise à jour majeure ajoutant la prise en charge de Windows !

Le projet open source Hokusai a bénéficié d'une mise à jour majeure, ajoutant la prise en charge de Windows ! Cette mise à jour inclut également une documentation améliorée, des scripts de build corrigés et le déplacement de la logique de blocage et de texte vers le C. L'historique des commits montre un projet actif et réactif aux commentaires des utilisateurs, améliorant continuellement l'expérience utilisateur.

Lire plus
Développement support windows

La dépendance à la pornographie démystifiée : la morale, et non la consommation de pornographie, est à l’origine des problèmes

2025-04-04
La dépendance à la pornographie démystifiée : la morale, et non la consommation de pornographie, est à l’origine des problèmes

Une méta-analyse d’études sur la consommation de pornographie remet en question la notion de longue date de « dépendance à la pornographie ». La recherche révèle que l’incongruence morale, fortement influencée par la religiosité, est un prédicteur bien plus fort des problèmes liés à la pornographie que la quantité de pornographie consommée. La culpabilité et la honte associées à la consommation de pornographie proviennent souvent de ce conflit entre les valeurs personnelles et le comportement, plutôt que d’un processus de dépendance. L’étude suggère que les cliniciens devraient se concentrer sur le traitement des conflits moraux et des croyances religieuses pour aider les individus à concilier leurs valeurs et leurs comportements, plutôt que de cibler uniquement la consommation de pornographie.

Lire plus

Au-delà de BPE : l’avenir de la tokenisation dans les grands modèles de langage

2025-05-30
Au-delà de BPE : l’avenir de la tokenisation dans les grands modèles de langage

Cet article explore les améliorations apportées aux méthodes de tokenisation dans les grands modèles de langage pré-entraînés. L’auteur remet en question la méthode couramment utilisée de codage par paires de bytes (BPE), en soulignant ses lacunes dans le traitement des sous-mots au début et à l’intérieur des mots. Des alternatives sont suggérées, telles que l’ajout d’un masque de nouveau mot. En outre, l’auteur plaide contre l’utilisation d’algorithmes de compression pour le prétraitement des entrées, préconisant la modélisation du langage au niveau des caractères, en établissant des parallèles avec les réseaux neuronaux récurrents (RNN) et les modèles d’auto-attention plus profonds. Cependant, la complexité quadratique du mécanisme d’attention représente un défi. L’auteur propose une approche basée sur la structure arborescente, utilisant des sous-séquences fenêtrées et une attention hiérarchique pour réduire la complexité de calcul tout en capturant mieux la structure du langage.

Lire plus
1 2 467 468 469 471 473 474 475 595 596