VLM Run Hub: Vordefinierte Pydantic-Schemata zur vereinfachten Extraktion visueller Daten

2025-02-20
VLM Run Hub: Vordefinierte Pydantic-Schemata zur vereinfachten Extraktion visueller Daten

VLM Run Hub ist ein umfassendes Repository vordefinierter Pydantic-Schemata zum Extrahieren strukturierter Daten aus unstrukturierten visuellen Bereichen wie Bildern, Videos und Dokumenten. Es wurde für visuelle Sprachmodelle (VLMs) entwickelt und für reale Anwendungsfälle optimiert, wodurch die Integration von visuellem ETL in Ihre Workflows vereinfacht wird. Es bietet verschiedene vordefinierte Schemata, z. B. ein Rechnungsschema zum Extrahieren von Rechnung Metadaten, und unterstützt mehrere VLMs, darunter OpenAIs GPT-4o und Anthropics Claude Vision. Die Verwendung von Pydantic-Schemata gewährleistet eine genaue und zuverlässige Datenextraktion und vereinfacht nachgelagerte Workflows.

Mehr lesen

Postgres Sprachserver: Eine leistungsstarke Toolchain für die SQL-Entwicklung

2025-02-19
Postgres Sprachserver: Eine leistungsstarke Toolchain für die SQL-Entwicklung

Eine Sammlung von Sprachwerkzeugen und eine Implementierung des Language Server Protocol (LSP) für Postgres, die die Entwicklererfahrung und zuverlässige SQL-Tools priorisiert. Basierend auf Postgres' eigenem Parser (libpg_query) für 100% Syntaxkompatibilität, verwendet es eine Server-Client-Architektur mit transportunabhängigem Design und bietet Zugriff über LSP, CLI, HTTP-APIs oder WebAssembly. Derzeit mit Autovervollständigung, Syntaxhervorhebung, Typprüfung (über EXPLAIN) und einem von Squawk inspirierten Linter ausgestattet, konzentriert sich das Projekt auf die Verfeinerung dieser Kernfunktionen und den Aufbau einer robusten Infrastruktur. Beiträge sind willkommen!

Mehr lesen
Entwicklung SQL-Tools

BloodFlowTrixi.jl: Hochleistungs-Blutflussmodelle in Julia

2025-02-19
BloodFlowTrixi.jl: Hochleistungs-Blutflussmodelle in Julia

BloodFlowTrixi.jl ist ein Julia-Paket, das 1D- und 2D-Blutflussmodelle für die arterielle Zirkulation implementiert, abgeleitet von den Navier-Stokes-Gleichungen. Entwickelt für die Doktorarbeit zu kardiovaskulären Pathologien, nutzt es das Trixi.jl-Framework für effiziente Discontinuous Galerkin (DG)-Simulationen. Das Paket unterstützt krummlinige Geometrien und nachgiebige Wanddynamik. Zukünftige Entwicklungen umfassen 3D-Fluid-Struktur-Interaktion und Simulationen von Gefäßnetzwerken.

Mehr lesen

Mastra: Ein TypeScript-Framework für die schnelle Entwicklung von KI-Anwendungen

2025-02-19
Mastra: Ein TypeScript-Framework für die schnelle Entwicklung von KI-Anwendungen

Mastra ist ein opinioniertes TypeScript-Framework zum schnellen Erstellen von KI-Anwendungen und -Funktionen. Es bietet wichtige Primitives: Workflows, Agents, RAG, Integrationen und Evaluierungen. Führe Mastra lokal aus oder deploye es in eine serverlose Cloud. Zu den Hauptfunktionen gehören die Integration von LLM-Modellen (Unterstützung von OpenAI, Anthropic, Google Gemini über das Vercel AI SDK), Agentensysteme, die es LLMs ermöglichen, Tools zu verwenden und auf Daten zuzugreifen, typisierte Tool-Funktionen, dauerhafte, graphbasierte Workflows, RAG-Wissensdatenbankerstellung, vorgefertigte Drittanbieter-API-Clients und automatisierte Evaluierungen. Beginne mit `create-mastra` und öffne den Playground mit `mastra dev`. Beiträge sind willkommen!

Mehr lesen
Entwicklung KI-Framework

Subtrace: Wireshark für Ihre Docker-Container

2025-02-19
Subtrace: Wireshark für Ihre Docker-Container

Subtrace ist wie Wireshark, aber für Docker-Container. Es ermöglicht Entwicklern, alle Netzwerk-Anfragen in und aus ihren Backend-Servern zu sehen, um Probleme in der Produktion schneller zu lösen. Es funktioniert sofort ohne Codeänderungen, unterstützt alle Sprachen, zeigt vollständige Nutzdaten, Header, Statuscodes und Latenz an und bietet einen Performance-Overhead von weniger als 100 µs. Basierend auf ClickHouse und Open Source (derzeit werden jedoch aufgrund von Ressourcenbeschränkungen keine Pull Requests akzeptiert), begrüßt Subtrace Feature-Requests und Bug-Reports.

Mehr lesen
Entwicklung Leistungsanalyse

go-msquic: Ein Go-Wrapper für Microsofts QUIC-Bibliothek

2025-02-19
go-msquic: Ein Go-Wrapper für Microsofts QUIC-Bibliothek

go-msquic ist ein Go-Wrapper für Microsofts QUIC-Bibliothek und bietet Go-Entwicklern eine einfache Schnittstelle für die Arbeit mit QUIC-basierten Protokollen wie HTTP/3. Die API ist von quic-go inspiriert und kann als direkter Ersatz verwendet werden. Sofern Sie nicht mit C-Bibliotheken arbeiten möchten, empfehlen wir eigentlich quic-go statt go-msquic. Zur Installation muss zuerst die lokale MsQuic C-Bibliothek erstellt werden, danach installieren Sie mit `go get github.com/noboruma/go-msquic`. Beispielcode befindet sich im Verzeichnis sample/.

Mehr lesen
Entwicklung

OpenArc: Ein leichtgewichtiges Inferenz-API-Backend zur Beschleunigung von LLMs auf Intel-Hardware

2025-02-19
OpenArc: Ein leichtgewichtiges Inferenz-API-Backend zur Beschleunigung von LLMs auf Intel-Hardware

OpenArc ist ein leichtgewichtiges Inferenz-API-Backend, das die OpenVINO-Laufzeit und OpenCL-Treiber nutzt, um die Inferenz von Transformer-Modellen auf Intel-CPUs, -GPUs und -NPUs zu beschleunigen. Es wurde für agentenbasierte Anwendungsfälle entwickelt und bietet eine stark typisierte FastAPI-Implementierung mit Endpunkten für das Laden und Entladen von Modellen, die Textgenerierung und Statusabfragen. OpenArc vereinfacht die Entkopplung von Machine-Learning-Code von der Anwendungslogik und bietet einen ähnlichen Workflow wie Ollama, LM-Studio und OpenRouter. Es unterstützt benutzerdefinierte Modelle und Rollen und wird um Funktionen wie einen OpenAI-Proxy, Unterstützung für visuelle Modelle usw. erweitert.

Mehr lesen

Augment: KI-gestützte Code-Vervollständigung und Chat für Vim/Neovim

2025-02-19
Augment: KI-gestützte Code-Vervollständigung und Chat für Vim/Neovim

Das Augment-Plugin für Vim/Neovim bietet Inline-Code-Vervollständigungen und mehrstufige Chat-Konversationen, die auf Ihre Codebasis zugeschnitten sind. Nach der Installation (Node.js 22.0.0+ und kompatible Vim/Neovim-Versionen erforderlich) fügen Sie Arbeitsbereich-Ordner hinzu und melden sich beim Augment-Dienst an. Kontextbezogene Code-Vervollständigungen erscheinen während der Eingabe; verwenden Sie den Befehl `:Augment chat` für KI-gestützte Code-Diskussionen. Das Plugin bietet Befehle zum Verwalten des Status, Anmelden/Abmelden, Aktivieren/Deaktivieren von Vorschlägen, Anzeigen von Protokollen und Starten neuer Chat-Konversationen. `.augmentignore` hilft bei der Verwaltung großer Projekte. Tastaturkürzel zum Akzeptieren von Vorschlägen lassen sich einfach anpassen.

Mehr lesen

LLMs scheitern bei Set, Reasoning-Modelle siegen

2025-02-19
LLMs scheitern bei Set,  Reasoning-Modelle siegen

Ein Experiment testete die Fähigkeiten großer Sprachmodelle (LLMs) im Kartenspiel Set. Set erfordert das Identifizieren von Dreiergruppen aus zwölf Karten, basierend auf spezifischen Regeln zu Form, Farbe, Anzahl und Schattierung. LLMs wie GPT-4o, Sonnet-3.5 und Mistral scheiterten daran, konsistent korrekte Gruppen zu identifizieren und schlugen oft ungültige Kombinationen vor oder behaupteten, es gäbe keine Gruppen. Neuere Reasoning-Modelle, DeepThink-R1 und o3-mini, lösten das Problem jedoch erfolgreich und zeigten überlegene logische Fähigkeiten. Dies unterstreicht eine Limitation von LLMs bei komplexen logischen Aufgaben, obwohl sie im Natural Language Processing exzellent sind, während spezialisierte Reasoning-Modelle einen klaren Vorteil aufweisen.

Mehr lesen

RustOwl: Visualisierung von Ownership und Lebensdauer in Rust

2025-02-18
RustOwl: Visualisierung von Ownership und Lebensdauer in Rust

RustOwl ist ein leistungsstarkes Tool, das Ownership und Lebensdauer von Variablen in Rust-Code visualisiert. Mit farbcodierten Unterstreichungen zeigt RustOwl intuitiv die Lebensdauer von Variablen, unveränderliche Ausleihen, veränderliche Ausleihen und Wertverschiebungen an und unterstützt Entwickler so bei Debugging und Optimierung. Es unterstützt Editoren wie VSCode, Neovim und Emacs und bietet verschiedene Installationsmethoden, darunter eine einfache Installation über die Kommandozeile und eine manuelle Installation aus dem Quellcode. Obwohl gelegentlich kleinere Anzeigeprobleme auftreten können, hat RustOwl ein erhebliches Potenzial zur Steigerung der Effizienz der Rust-Entwicklung gezeigt.

Mehr lesen
Entwicklung

Entwicklung von mt32-pi aufgrund von Online-Missbrauch eingestellt

2025-02-17
Entwicklung von mt32-pi aufgrund von Online-Missbrauch eingestellt

Der Entwickler von mt32-pi, einem Bare-Metal-MIDI-Synthesizer für Raspberry Pi, der den Roland MT-32-Audio-Modul emuliert, hat die Einstellung des Projekts aufgrund anhaltenden Online-Missbrauchs angekündigt. Dies beinhaltet persönliche Angriffe, Code-Diebstahl und gestohlene 3D-Druckdesigns. Der Entwickler gab die negativen Auswirkungen auf seine psychische Gesundheit als Grund für die Einstellung der Entwicklung an und beklagte mangelnde Dankbarkeit und Ermutigung seitens der Community.

Mehr lesen
Entwicklung Online-Missbrauch

ELKS auf einem NES ausführen: Das NES86-Projekt

2025-02-17
ELKS auf einem NES ausführen: Das NES86-Projekt

Das NES86-Projekt ist eine beeindruckende technische Leistung: ein IBM-PC-Emulator, der auf einem NES läuft! Durch die Emulation eines Intel-8086-Prozessors und unterstützender PC-Hardware wird das ELKS (Embeddable Linux Kernel Subset) erfolgreich ausgeführt, einschließlich einer Shell und von Dienstprogrammen. Das bedeutet, dass Sie einige x86-Software auf Ihrem alten NES ausführen können, wenn auch auf ein einfaches serielles Terminal beschränkt. Das Projekt ist Open Source und bietet detaillierte Anweisungen zum Erstellen, die sowohl die Kompilierung des ELKS-Images als auch die Generierung des NES86-ROMs abdecken. Machen Sie sich bereit für eine Herausforderung – ein modernes Betriebssystem auf Retro-Hardware auszuführen!

Mehr lesen
Entwicklung

Visualisierung des Denkprozesses eines großen Sprachmodells (R1)

2025-02-17
Visualisierung des Denkprozesses eines großen Sprachmodells (R1)

Forscher visualisierten den „Denkprozess“ eines großen Sprachmodells, R1, indem sie dessen Gedankengänge als Text speicherten, diese mit der OpenAI-API in Einbettungen umwandelten und sie sequenziell mit t-SNE plotteten. Durch die Berechnung der Kosinusähnlichkeit zwischen aufeinanderfolgenden Schritten beobachteten sie einen potenziellen dreistufigen Prozess: „Suche“, „Denken“ und „Schlussfolgern“. Zehn verschiedene Eingabeaufforderungen wurden verwendet, von der Beschreibung der Funktionsweise eines Fahrrads bis hin zur Entwicklung neuer Transportmittel. Die Forscher stellen Methoden zur Verfügung, um auf die Daten der Gedankenkette und den Code zuzugreifen.

Mehr lesen

Bag of Words: Intelligente Daten-Apps mit KI erstellen und teilen

2025-02-17
Bag of Words: Intelligente Daten-Apps mit KI erstellen und teilen

Mit Bag of Words können Benutzer umfassende Dashboards mit nur einer Eingabeaufforderung erstellen und iterativ verfeinern. Es integriert sich nahtlos in verschiedene Datenquellen, darunter Datenbanken, APIs und Business-Systeme, und ermöglicht so eine effiziente Datennutzung. Zu den Hauptfunktionen gehören natürliche Sprachfragen, Dashboard-Management und Kompatibilität mit mehreren LLMs (OpenAI, Anthropic usw.). Das Projekt bietet Docker-Deployment und detaillierte Setup-Anleitungen für Python- und Node.js-Umgebungen unter der AGPL-3.0-Lizenz.

Mehr lesen

Umami: Eine datenschutzorientierte Alternative zu Google Analytics

2025-02-17
Umami: Eine datenschutzorientierte Alternative zu Google Analytics

Umami ist eine einfache, schnelle und datenschutzorientierte Alternative zu Google Analytics. Es unterstützt MariaDB, MySQL und PostgreSQL Datenbanken. Die Installation ist unkompliziert: Klonen Sie das GitHub-Repository, installieren Sie die Abhängigkeiten und konfigurieren Sie die Datenbankverbindung. Standardmäßig startet es auf http://localhost:3000. Docker-Images stehen für eine einfache Bereitstellung zur Verfügung. Eine detaillierte Anleitung zum Einstieg wird bereitgestellt.

Mehr lesen
Entwicklung Analyse

Shell-Befehlseffizienz-Hack: Identifizieren Sie schnell frühere Befehle mit Icons

2025-02-16
Shell-Befehlseffizienz-Hack: Identifizieren Sie schnell frühere Befehle mit Icons

Suchen und führen Sie Befehle häufig in Ihrem Shell-Verlauf erneut aus? Der Autor teilt einen cleveren Trick: Fügen Sie Icon- oder Text-Bezeichner vor Befehlen hinzu (z. B. ✅; ./utils/check.sh). Diese Bezeichner beeinflussen die Befehlsausführung nicht, verbessern aber die visuelle Erkennung erheblich, sodass Sie den gewünschten Befehl schnell finden und die Frustration durch häufiges Durchblättern des Verlaufs verringern können. Dies ist eine einfache, aber effektive Möglichkeit, die Shell-Effizienz zu verbessern.

Mehr lesen

Remco: Ein leichtgewichtiges Konfigurationsmanagement-Tool

2025-02-16
Remco: Ein leichtgewichtiges Konfigurationsmanagement-Tool

Remco ist ein leichtgewichtiges Konfigurationsmanagement-Tool, inspiriert von confd. Es hält lokale Konfigurationsdateien mithilfe von Daten aus Key-Value-Stores wie etcd oder Consul aktuell, verarbeitet Templatedateien und lädt Anwendungen automatisch neu. Im Gegensatz zu confd unterstützt Remco mehrere Quell-/Zielpaare und Backends pro Templatedatei, verwendet die Pongo2-Template-Engine und bietet Funktionen wie Zombie-Reaping, Plugin-Support für zusätzliche Backends und die einfache Erstellung benutzerdefinierter Template-Filter mit JavaScript. Die Installation ist unkompliziert, mit Optionen zum Erstellen aus dem Quellcode oder Herunterladen vorkompilierter Binärdateien.

Mehr lesen

Gixy: Ein leistungsstarkes Sicherheitsprüfungstool für Nginx-Konfigurationen

2025-02-16
Gixy: Ein leistungsstarkes Sicherheitsprüfungstool für Nginx-Konfigurationen

Gixy ist ein Tool zur Analyse von Nginx-Konfigurationen, um unsichere Konfigurationen zu verhindern und die Fehlererkennung zu automatisieren. Es unterstützt Python 3.6 bis 3.13 und wurde hauptsächlich unter GNU/Linux getestet. Gixy erkennt verschiedene Nginx-Konfigurationsprobleme, wie z. B. HTTP-Splitting-Schwachstellen. Die Installation ist flexibel und unterstützt pip, yum und Docker. Benutzer können den Konfigurationspfad angeben, Pipelines verwenden und Tests überspringen. Gixy wird aktiv gepflegt und begrüßt Code-Beiträge und Verbesserungen der Dokumentation.

Mehr lesen
Entwicklung Prüfung

Golf von Mexiko: Eine Programmiersprache, die die Regeln bricht

2025-02-16
Golf von Mexiko: Eine Programmiersprache, die die Regeln bricht

DreamBerd wurde in Golf von Mexiko umbenannt, eine eigenwillige Programmiersprache mit ungewöhnlichen Eigenschaften. Anweisungen enden mit Ausrufezeichen, das Semikolon ist der 'nicht'-Operator, es gibt vier Deklarationstypen (const const, const var, var const, var var), Arrays beginnen bei Index -1, Gleitkommazahlen-Indizes werden unterstützt, das Schlüsselwort `when` überprüft Variablenmutationen, es gibt einen Garbage Collector, die Lebensdauer von Variablen ist anpassbar (einschließlich negativer Lebensdauern für Hoisting), und es gibt keine Schleifen. Die Installation ist komplex, boolesche Werte können wahr, falsch oder vielleicht sein, Leerzeichen bestimmen die Priorität arithmetischer Operationen, Brüche und Zahlennamen werden unterstützt, die Einrückung beträgt exakt 3 Leerzeichen, es gibt mehrere Vergleichsoperatoren, die Funktionsdeklaration ist flexibel, die Division durch Null liefert undefiniert, Strings können auf verschiedene Weisen deklariert werden, die Interpolation regionaler Währungen wird unterstützt, Typannotationen sind optional, reguläre Ausdrucks-Typen werden unterstützt, und die Schlüsselwörter `previous`, `next` und `current` greifen auf den Variablenverlauf zu. Der Code kann mit fünf oder mehr Gleichheitszeichen in mehrere Dateien aufgeteilt werden. Es unterstützt die Codeumkehr, globale Variablen und die automatische Einfügung von Ausrufezeichen, Klammern und Anführungszeichen. Der Golf von Mexiko unterstützt auch Rich Text und einen turnbasierten Ausführungsmechanismus für asynchrone Funktionen.

Mehr lesen

OmniParser V2: Bildschirm-Parsing-Tool für rein visuell basierte GUI-Agenten

2025-02-15
OmniParser V2: Bildschirm-Parsing-Tool für rein visuell basierte GUI-Agenten

OmniParser ist eine umfassende Methode zum Parsen von Screenshots von Benutzeroberflächen in strukturierte und leicht verständliche Elemente, was die Fähigkeit von GPT-4V, Aktionen zu generieren, die genau in den entsprechenden Bereichen der Benutzeroberfläche verankert sind, deutlich verbessert. Die kürzlich veröffentlichte Version OmniParser V2 erreicht State-of-the-Art-Ergebnisse (39,5 % auf dem neuen Screen Spot Pro-Benchmark) und führt OmniTool ein, mit dem eine Windows 11-VM mit dem visuellen Modell Ihrer Wahl gesteuert werden kann. Detaillierte Installationsanweisungen und Demos werden bereitgestellt, wobei Modellgewichte auf Hugging Face verfügbar sind.

Mehr lesen

Schemesh: Eine Lisp-skriptierbare Unix-Shell

2025-02-15
Schemesh: Eine Lisp-skriptierbare Unix-Shell

Schemesh ist eine interaktive Shell, die in Lisp skriptbar ist und als benutzerfreundliche Alternative zu bash, zsh und anderen traditionellen Unix-Shells konzipiert wurde. Sie bietet interaktive Zeileneditierung, automatische Vervollständigung und Verlauf, während sie nahtlos ein vollständiges Lisp-REPL integriert, das von Chez Scheme unterstützt wird, um komplexe Aufgaben zu bewältigen. Benutzer können mühelos zwischen Shell-Syntax und Lisp-Syntax wechseln, wobei zahlreiche Funktionen zur Verwaltung von Unix-Prozessen bereitgestellt werden. Für Skripte und ernsthafte Programmierung ersetzt Schemesh das langsame und fehleranfällige traditionelle Shell-Scripting durch ein leistungsstarkes Lisp-REPL, wodurch Effizienz und Zuverlässigkeit gesteigert werden.

Mehr lesen
Entwicklung

Jill: Eine neue funktionale Programmiersprache für Nand2Tetris

2025-02-15
Jill: Eine neue funktionale Programmiersprache für Nand2Tetris

Jill ist eine funktionale Programmiersprache, die für die Nand2Tetris-Plattform entwickelt wurde, als Alternative zur ursprünglichen Jack-Hochsprache. Sie ist als direkter Ersatz für Jack konzipiert und verwendet denselben VM-Befehlssatz und die zugrunde liegende HACK-Architektur, bietet aber einen eleganteren und funktionaleren Stil. Zu den Hauptmerkmalen gehören First-Class-Funktionen, optimierte Tail-Call-Rekursion, algebraische Datentypen mit Mustermatching und ein minimalistisches Design mit nur drei Kernkonzepten. Kompilierte Projekte geben .vm-Dateien in ein /bin-Verzeichnis aus. Jill kann mit `cargo run -- path_to_jill_project_root` oder `jillc [path_to_jill_project_root]` kompiliert werden.

Mehr lesen
Entwicklung

Synergetica: Eine End-to-End Desktop-Anwendung für das Design genetischer Schaltkreise

2025-02-15
Synergetica: Eine End-to-End Desktop-Anwendung für das Design genetischer Schaltkreise

Synergetica ist eine leistungsstarke Desktop-Anwendung für das Design genetischer Schaltkreise. Sie bietet einen vollständigen Workflow, von der Gestaltung und Simulation von Schaltkreisen bis zur Generierung von DNA-Sequenzen, alles auf einer einzigen Plattform. Benutzer können Schaltkreise mithilfe einer knotenbasierten oder codebasierten Schnittstelle entwerfen, die Proteinexpression interaktiv simulieren und DNA-Sequenzen basierend auf Simulationsparametern generieren. Die Anpassung ist einfach durch Hinzufügen genetischer Teile, und die Offline-Funktionalität gewährleistet vollständige Kontrolle und Datenschutz.

Mehr lesen

Kreuzberg: Eine leistungsstarke Python-Bibliothek zur Textextraktion aus lokalen Dokumenten

2025-02-15
Kreuzberg: Eine leistungsstarke Python-Bibliothek zur Textextraktion aus lokalen Dokumenten

Kreuzberg ist eine leistungsstarke Python-Bibliothek zur Textextraktion aus verschiedenen Dokumenten. Sie bietet eine einheitliche asynchrone Schnittstelle mit Unterstützung für PDFs, Bilder, Office-Dokumente und mehr. Die Bibliothek konzentriert sich auf die lokale Verarbeitung, benötigt keine externen APIs oder Cloud-Dienste, zeichnet sich durch hohe Ressourceneffizienz, minimale Abhängigkeiten und Batch-Verarbeitung aus. Kreuzberg verwendet einen intelligenten Ansatz zur PDF-Textextraktion, versucht zunächst die direkte Extraktion und greift bei Bedarf auf OCR zurück. Sie bietet umfassende Fehlerbehandlung und Funktionen wie asynchrone/synchronen APIs, Metadatenextraktion und parallele Verarbeitung.

Mehr lesen
Entwicklung Textextraktion

Goku: Flussbasierte Video-Generative Foundation Models erreichen Spitzenleistung

2025-02-15
Goku: Flussbasierte Video-Generative Foundation Models erreichen Spitzenleistung

Ein gemeinsames Team von ByteDance und HKU stellt Goku vor, eine Familie von Bild- und Videogenerierungsmodellen, die auf rektifizierten Flow-Transformatoren basieren. Goku erreicht branchenführende Leistung in der visuellen Generierung durch sorgfältige Datenkuratierung, fortschrittliches Modelldesign und Flussformulierung. Es unterstützt die Generierung von Text zu Video, Bild zu Video und Text zu Bild und erzielt Top-Ergebnisse bei wichtigen Benchmarks wie GenEval, DPG-Bench und VBench. Insbesondere Goku-T2V erzielte am 7. Oktober 2024 mit 84,85 Punkten auf VBench den zweiten Platz und übertraf mehrere führende kommerzielle Text-zu-Video-Modelle.

Mehr lesen

LLM Debugger: KI-gestütztes Debugging in VS Code

2025-02-15
LLM Debugger: KI-gestütztes Debugging in VS Code

LLM Debugger ist eine VS Code-Erweiterung, die große Sprachmodelle (LLMs) für aktives Debugging verwendet. Im Gegensatz zu traditionellen LLM-basierten Debugging-Ansätzen, die nur statischen Quellcode analysieren, liefert LLM Debugger einen Echtzeit-Laufzeitkontext, einschließlich Variablenwerten, Funktionsverhalten und Verzweigungsentscheidungen, wodurch das LLM Fehler schneller und genauer diagnostizieren kann. Die Erweiterung generiert auch synthetische Daten, indem sie Ausführungsdetails erfasst und einzigartige Einblicke in das Programmverhalten bietet. Sie enthält Live-Debugging-Informationen, automatische Breakpoint-Verwaltung, Laufzeitinspektion und gängige Debugging-Operationen, die alle über ein Seitenfenster zugänglich sind. Obwohl es sich um ein experimentelles Forschungsprojekt handelt, zeigt LLM Debugger das Potenzial der Kombination von Live-Debugging-Daten mit LLM-Funktionen, um traditionelle Debugging-Praktiken zu revolutionieren.

Mehr lesen

Nping: Ein blitzschnelles, visuelles Ping-Tool in Rust

2025-02-15
Nping: Ein blitzschnelles, visuelles Ping-Tool in Rust

Nping, ein leistungsstarkes Ping-Tool in Rust, bietet paralleles Pingen für mehrere Adressen mit Echtzeit-Datenvisualisierung und einer benutzerfreundlichen Oberfläche. Es zeigt wichtige Kennzahlen wie maximale, minimale und durchschnittliche Latenz, Paketverlustrate und unterstützt sowohl IPv4 als auch IPv6. Nping verfügt außerdem über einen Host-Unterbefehl, um IP-Adressdetails für Domänennamen anzuzeigen, und ermöglicht die Anpassung der Ping-Anzahl und des Intervalls. Sein intuitives Design macht es zu einem wertvollen Werkzeug für Netzwerkadministratoren und Entwickler.

Mehr lesen
Entwicklung Netzwerktool

VimLM: Ein lokaler LLM-basierter Coding-Assistent für Vim

2025-02-15
VimLM: Ein lokaler LLM-basierter Coding-Assistent für Vim

VimLM ist ein lokaler, LLM-basierter Coding-Assistent für Vim, inspiriert von GitHub Copilot. Er integriert kontextuelles Code-Verständnis, Zusammenfassung und KI-Unterstützung direkt in Ihren Vim-Workflow. Er ist modellos, verwendet jedes MLX-kompatible Modell, bietet eine native Vim-Benutzeroberfläche und arbeitet vollständig offline für erhöhte Sicherheit. Benutzer interagieren über intuitive Tastenkombinationen für Aufgaben wie Code-Konvertierung, -Generierung und -Zusammenfassung und nutzen dabei ein tiefes Kontextverständnis, das die aktuelle Datei, Auswahlen, referenzierte Dateien und die Projektstruktur umfasst.

Mehr lesen
Entwicklung Coding-Assistent

Yash: Eine neue Shell, die maximale POSIX-Konformität anstrebt

2025-02-15
Yash: Eine neue Shell, die maximale POSIX-Konformität anstrebt

Yash ist eine POSIX-kompatible Kommandozeilen-Shell, geschrieben in C99, die maximale POSIX-Konformität anstrebt. Sie bietet Funktionen wie globale Aliase, Arrays, verschiedene Umleitungsmethoden, geschweifte Klammern-Erweiterung, erweiterte Globbing, Gleitkommazahlen in arithmetischen Ausdrücken, Komplettierung von Befehlen und Vorhersage von Befehlen. Yash wird auf GitHub gewartet, entspricht größtenteils POSIX.1-2008 und erhält regelmäßige Wartungsupdates. Es lässt sich auf verschiedenen POSIX-Umgebungen kompilieren und ausführen, hauptsächlich getestet auf Fedora, macOS und Cygwin. Nach der Installation können Benutzer Umgebungsvariablen, Aliase, Eingabeaufforderungen und mehr über Konfigurationsdateien anpassen.

Mehr lesen
Entwicklung

Browser-Erweiterung bekämpft Trans-Auslöschung

2025-02-14
Browser-Erweiterung bekämpft Trans-Auslöschung

Eine Browser-Erweiterung namens "Marsha P Johnson" bekämpft die Auslöschung von Transgender-Personen, indem sie "LGB" durch "LGBTQ+🧱" ersetzt. Der Entwickler hebt die aktive Entfernung von Erwähnungen von Transgender-Personen von Regierungswebsites durch die US-Regierung hervor, einschließlich der Entfernung von "TQ+" von LGBTQ+ auf der Website des Stonewall National Monument. Diese offensichtliche Auslöschung wird aktiv von der Erweiterung bekämpft, so dass Benutzer die Zensur sehen und dagegen protestieren können.

Mehr lesen
Sonstiges
1 2 35 36 37 39 41 42 43 50 51