博文 – 陈少文的网站

3FS 关键技术和设计

📅 2025年03月24日 · ☕ 3 分钟

1. Direct IO Direct IO 绕过了操作系统的页缓存(page cache)，直接与硬件设备进行数据交互。 Direct IO 的特点：新数据多，不需要缓存内存占用少大文件顺序读写对于超过阈值(默认 1MB)的同步读取操作，3FS 的客户端会将其转为 AIO (以 Direct IO 方式打开文件)操作以提高

DeepSeek 3FS 运维指南

📅 2025年03月20日 · ☕ 9 分钟

记录一些 DeepSeek 3FS 的运维操作，持续更新中。 1. 基本概念及注意事项 Chain 一个 Chain 是由若干个 Target 组成，每个 Target 是一个存储的副本。在全部提交就绪的情况下，一个 Chain 的所有 Target 都是一致的。一个 Chain 上的 Target 不能在同一个节点上。 Chain 就是存储的空间，写文件是会被分配到一个 Chain 上，读文件

容器化部署 DeepSeek 3FS 存储系统

📅 2025年03月15日 · ☕ 7 分钟

1. 部署方案在开始容器化部署之前，先提几点要求: 为了简化交付，只需要一个镜像为了可靠性，尽可能多副本部署通过不同的参数启动不同的服务通过环境变量注入配置，渲染到配置文件中下面是 DeepSeek 3FS 的部署方案: 需要部署: 一个 Monitor 用来收集监控数据，数据存储在 ClickHouse 中一

1. 硬件测试有两块 NVMe SSD SAMSUNG MZQL27T6HBLA-00A07，两个节点组成的 3FS 集群，每个节点有 4 个 IB 网口。 1.1 单线程磁盘 FIO 128 K，读 1 fio -numjobs=1 -fallocate=none -iodepth=2 -ioengine=libaio -direct=1 -rw=read -bs=128K --group_reporting -size=100M -time_based -runtime=30 -name=fio-test -directory=/data/fio 1 Jobs: 1 (f=1): [R(1)][100.0%][r=2211MiB/s][r=17.7k IOPS][eta 00m:00s] 磁盘 FIO 128 K，写 1 fio -numjobs=1 -fallocate=none -iodepth=2 -ioengine=libaio -direct=1 -rw=write -bs=128K --group_reporting -size=100M -time_based -runtime=30 -name=fio-test -directory=/data/fio 1 Jobs: 1 (f=1): [W(1)][100.0%][w=3703MiB/s][w=29.6k IOPS][eta 00m:00s] 磁盘 FIO 4 M，

在 Kubernetes 中使用 Fluid 挂载 3FS 存储及性能测试

📅 2025年03月09日 · ☕ 6 分钟

1. 为什么要将 3FS 对接到 Fluid 3FS 是 DeepSeek 开源的分布式存储系统，因其极优异的性能测试结果，而被津津乐道，star 量快速飙升。我所在的团队也对 3FS 展开了技术上的跟踪，寻找合适的应用场景，发挥 AI 硬件基础设施的最大价值。我们线上推理、训练服务使用的存储系统都是通

博文