Neurox:简化AI工作负载监控的Helm图表
2025-04-29
Neurox是一个用于监控Kubernetes GPU集群上运行的AI工作负载的工具,其Helm图表简化了安装流程。它提供预构建的仪表板和报告,结合指标和实时Kubernetes运行时状态数据,为管理员、开发人员和财务审计人员提供相关见解。安装程序会自动配置子域名、镜像注册表凭据、身份提供程序和TLS证书。Neurox免费监控最多64个GPU,支持NVIDIA GPU,并提供企业级许可选项。安装前需要准备Kubernetes集群、cert-manager、ingress-nginx、NVIDIA GPU Operator和Kube Prometheus Stack。
AI
Helm图表