Scrydon

vLLM

Inférence auto-hébergée à haut débit

Vendor ID : vllm · Catégories : IA

vLLM — moteur d'inférence à haut débit et efficace en mémoire. Expose une surface API compatible OpenAI.

Authentification

CredentialNotes
apiKey (optionnel)Si votre déploiement vLLM est protégé. De nombreuses installations auto-hébergées ne l'activent pas.
noneSi le serveur vLLM est accessible directement.

Capacités

CapacitéProtocole filaire
LLMopenai-chat-v1
Embeddingcompatible openai-chat-v1

Configuré par intégration avec un baseUrl pointant vers le point de terminaison vLLM.

Sur cette page

Sur cette page