DeepSeek 1.5B手机部署指南 - 手把手教你本地运行大模型

什么是 DeepSeek 1.5B？

DeepSeek 1.5B 是由 DeepSeek 公司开发的一个拥有约 15 亿参数的开源大语言模型。它在保持较小体积的同时，具备较强的自然语言理解和生成能力，非常适合在资源受限的设备上部署，如智能手机和平板电脑。

在手机上本地部署 DeepSeek 1.5B 意味着你可以：

从 F-Droid 或官网下载并安装 Termux，避免使用 Google Play 版本以获得最新支持。

pkg update && pkg upgrade
pkg install python git wget
pip install --upgrade pip

推荐使用优化过的 llama.cpp：

git clone https://github.com/ggerganov/llama.cpp
cd llama.cpp && make

从 Hugging Face 下载量化后的模型文件（推荐 4-bit 或 5-bit 量化以节省内存）：

cd ~/llama.cpp
wget https://huggingface.co/DeepSeek/DeepSeek-1.5B-GGUF/resolve/main/deepseek-1.5b-Q4_K_M.gguf

./main -m deepseek-1.5b-Q4_K_M.gguf -p "你好，你是谁？" -n 512

提示： 首次运行会较慢，后续加载会缓存部分数据，速度会提升。

手机CPU推理大模型本就较慢，建议使用更小的量化模型或减少生成长度（-n 参数）。

尝试使用 Q3 或 Q4 低精度量化模型，或更换内存更大的设备。

目前 Termux 对 Vulkan 和 Metal 支持有限，主要依赖CPU计算。未来可能通过 MLX 等框架实现更好支持。