使用 Iceberg 和 Spark 在 Kubernetes 上处理数据📅 2024年09月12日 · ☕ 10 分钟1. 数据处理架构 主要分为四层: 处理能力层,Spark on Kubernetes 提供流式的数据处理能力 数据管理层,Iceberg 提供 ACID、table 等数据集访问操作能力 存储层,Hive MetaStore 管理 Iceberg 表元数据,Postgresql 作为 Hive MetaStore 存储后端,S3 作为数据存储后端 资
Python读写Excel📅 2017年04月16日 · ☕ 3 分钟Python、Excel常用于数据处理,难免会产生相互的数据传递、计算处理。本文主要介绍Python-Excel系列的库,以及xlrd和xlwt两个库是使用。 1. 常用库 xlwings,openpyxl,pandas,win32com,xlsx