分离 – 陈少文的网站

阿里云 eRDMA 测试及 PD 分离应用部署

📅 2026年01月17日 · ☕ 4 分钟

PD 分离部署场景下，经常会采用异构型号的显卡，跨机进行部署模型，这会导致跨机通信压力倍增。通常会借助 RDMA 设备加速 kvcache 在不同节点之间的传输，以获得更低的 FTTL。本篇将介绍如何测试 eRDMA 设备，并部署 PD 分离应用。 1. 驱动 1.1 安装驱动安装驱动 1 2 3 4 5 6 apt-get update -y

vLLM 部署 PD 分离应用

📅 2025年09月20日 · ☕ 5 分钟

1.为什么要 PD 分离部署大模型应用在大模型推理的过程中，有两个串行阶段：处理全量的输入上下文，生成 KV Cache（Prefill 阶段）增量生成新的 token（Decode 阶段）这两个阶段对资源的需求不一样。Prefill 阶段要计算大量的 KV Cac