Combining Kubernetes and vLLM to Deliver Scalable, Distributed Inference with…

Greg Pereira, llm-d maintainer - Combining Kubernetes and vLLM to Deliver Scalable, Distributed Inference with llm-d