陈少文的网站

高频 IO 的 POD 并不适合设置 Limit

📅 2024年06月03日 · ☕ 2 分钟

1. 现象基于 Kubernetes 的 Elasticsearch 频繁重启，导致服务几乎不可用。在导入数据过程中，Pod 的内存使用持续增长 Pod 内存使用接近 Limit 之后，继续导入就会触发 Pod 异常退出，错误日志 ERROR: Elasticsearch exited unexpectedly Pod 内存使用率并不会下降，而是维持在 Limit 附近，不久又异常退出 Elasticsearch Pod 内存限制在 64GB，而 JVM 内

部署基于内存存储的 Elasticsearch - 一亿+条数据，全文检索 100ms 响应

📅 2024年05月29日 · ☕ 6 分钟

1. 在主机上挂载内存存储目录创建目录用于挂载 1 mkdir /mnt/memory_storage 挂载 tmpfs 文件系统 1 mount -t tmpfs -o size=800G tmpfs /mnt/memory_storage 存储空间会按需使用，也就是使用 100G 存储时才会占用 100G 内存。主机节点上有 2T 内存，这里分配 800G 内存用于存储 Elasticsearch 数据。提前创建好目录 1 2 3 mkdir /mnt/memory_storage/elasticsearch-data-es-jfs-prod-es-default-0 mkdir /mnt/memory_storage/elasticsearch-data-es-jfs-prod-es-default-1 mkdir /mnt/memory_storage/elasticsearch-data-es-jfs-prod-es-default-2 如果没有提前创建好目录，并

模型研发周期中的数据存储

📅 2024年05月26日 · ☕ 3 分钟

1. 基于对象存储的数据交付如上图，在模型研发过程中，主要涉及三个子平台，分别是: 数据平台数据平台主要负责数据相关的管理，比如: 数据接入、数据处理，最终生成训练所需的数据。数据平台将原始数据存储到对象存储中，在处理时，从对象存储中获取数据，进行

存储性能及成本对比

📅 2024年05月25日 · ☕ 2 分钟

1. 存储的分层与互联 2. 各种存储类型存储类型带宽容量响应延时单位存储成本存储原理适用场景 CPU L1 Cache 256-512GB/s 32-64KB/核心 <1ns 约$2000/MB SRAM CPU 核心最近层缓存 CPU L2 Cache 64-256GB/s 256KB-2MB/核心组 2-5ns 约$1000/MB 部分 SRAM,部分嵌入式 DRAM CPU 下一级缓

使用 JuiceFS 存储 Elasticsearch 数据

📅 2024年05月22日 · ☕ 4 分钟

1. 存储方案三种存储方案：基于目录隔离公用一个 JuiceFS Elasticsearch 的节点共用一个 JuiceFS，通过子目录挂载不同的 Elasticsearch 节点。 /0/ 对应节点 Node-0 /1/ 对应节点 Node-1 /2/ 对应节点 Node-2 这种方式的好处主要是，易于扩展、配置方便。基于 JuiceFS 隔离节点数据 Elasticsearch 每个节点都对接一个独立的 JuiceF