大模型

什么是模型量化

📅 2025年09月06日 · ☕ 4 分钟

1. 什么是模型量化模型量化是将高精度的模型（通常为 32 位浮点数 FP32 或 16 位浮点数 FP16 ）的权重和激活值转换为低精度模型（如 8 位整数 INT8）的过程。 FP32 的值范围为 -3.4*10^38 到 3.4*10^38，有 40 亿个值。而对于 INT8，我们只能看到可能值集内的 256 个值，值范围为

同样适用于桌面环境。 1. 准备 node.js 环境安装 nvm 1 curl -o- https://raw.githubusercontent.com/nvm-sh/nvm/v0.40.3/install.sh | bash 1 2 echo 'export NVM_DIR="$([ -z "${XDG_CONFIG_HOME-}" ] && printf %s "${HOME}/.nvm" || printf %s "${XDG_CONFIG_HOME}/nvm")"' >> ~/.bashrc echo '[ -s "$NVM_DIR/nvm.sh" ] && \. "$NVM_DIR/nvm.sh"' >> ~/.bashrc 1 source ~/.bashrc 查看 nvm 版本 1 nvm --version 安装 node.js 1 nvm install 20 升级 npm 1 npm install -g npm 2. 安装 claude-code 安装包 1 npm install -g @anthropic-ai/claude-code 查看版本 1 claude --version 1 1.0.96 (Claude Code) 3. 安装 claude-code-router claude-code 目前仅能调用 Claude 的 API。使

AI 相关论文

📅 2025年07月05日 · ☕ 3 分钟

2025 Intrinsic Fingerprint of LLMs [发布日期: 07-04] 点击查看论文提出了一种基于注意力参数矩阵（Q/K/V/O）层间标准差分布模式的鲁棒指纹识别方法，用于检测大型语言模型（LLM）的血缘关系（如是否通过继续训练/微调/升级再造衍生自另一模型），并声称该方法揭示了华为 Pangu Pro

在服务器上使用 Gemini CLI

📅 2025年07月04日 · ☕ 3 分钟

1. 获取项目 ID 和 API 密钥访问 https://aistudio.google.com/apikey 获取项目 ID 和 API 密钥，并设置为环境变量 1 2 echo "export GOOGLE_CLOUD_PROJECT=" >> ~/.bashrc echo "export GEMINI_API_KEY=" >> ~/.bashrc 1 source ~/.bashrc 2. 准备 node.js 环境安装 nvm 1 curl -o- https://raw.githubusercontent.com/nvm-sh/nvm/v0.40.3/install.sh | bash 1 2 echo 'export NVM_DIR="$([ -z "${XDG_CONFIG_HOME-}" ] && printf %s "${HOME}/.nvm" || printf %s "${XDG_CONFIG_HOME}/nvm")"' >> ~/.bashrc echo '[ -s "$NVM_DIR/nvm.sh" ] && \. "$NVM_DIR/nvm.sh"' >> ~/.bashrc 1 source ~/.bashrc 查看 nvm 版本 1 nvm --version 安装 node.js 1 nvm install 20 升级 npm 1 npm install -g npm 3. 安装 gemini 1

容器化部署 DeepSeek 3FS 存储系统

📅 2025年03月15日 · ☕ 7 分钟

1. 部署方案在开始容器化部署之前，先提几点要求: 为了简化交付，只需要一个镜像为了可靠性，尽可能多副本部署通过不同的参数启动不同的服务通过环境变量注入配置，渲染到配置文件中下面是 DeepSeek 3FS 的部署方案: 需要部署: 一个 Monitor 用来收集监控数据，数据存储在 ClickHouse 中一