nCompass: Innovación que reduce el costo de la inferencia de IA

2024-12-16

nCompass Technologies ha desarrollado un software innovador de servicio de inferencia de IA que reduce el costo de servir modelos de IA a escala hasta en un 50%. Mediante el uso de software personalizado de inferencia de IA y un programador de solicitudes con conocimiento del hardware y escalamiento automático de Kubernetes, nCompass mantiene un servicio de alta calidad con menos GPUs, lo que resulta en una mejora de hasta 4 veces en el tiempo de respuesta y costos de infraestructura de GPU significativamente reducidos. Los usuarios acceden a modelos de código abierto a través de una API sin límites de velocidad y reciben un crédito de registro de $100. También hay disponibles soluciones locales para empresas que exigen rentabilidad y capacidad de respuesta.