大文件处理

当你通过 Git 在 Zeabur 上部署项目时，你的仓库会被下载并作为构建上下文使用。仓库中的大文件（如二进制文件、数据集、媒体文件或机器学习模型）会显著增加构建时间，甚至可能导致构建失败。

本指南说明大文件为何会造成问题，以及如何处理它们。

为什么大文件会造成问题

从 GitHub 部署时，Zeabur 会将你的仓库下载为 ZIP 压缩包。此压缩包有 1 GiB 的大小限制 — 如果你的仓库超过此限制，构建将会失败。即使在此限制以下，较大的仓库也会因为下载和解压时间增加而导致构建速度变慢。

⚠️

Zeabur 目前不支持 Git Large File Storage（Git LFS）。通过 Git LFS 跟踪的文件在构建过程中不会被下载，这将导致构建时或运行时出现文件缺失错误。

如果你的仓库使用了 Git LFS，构建服务器只会收到 LFS 指针文件，而不是实际的文件内容。你需要将这些文件移至外部存储方案。

包含在最终容器镜像中的大文件会增加部署、扩展和重启服务所需的时间。保持镜像精简可确保更快的冷启动和更高效的资源使用。

由于 Zeabur 会下载整个仓库进行构建，大文件无法通过 .dockerignore 或类似机制排除。你应该直接从仓库中移除大文件。

使用 .gitignore 防止大文件被提交：

.gitignore

# 数据集和大型媒体文件
*.csv
*.parquet
data/
assets/videos/

# 构建产物
dist/
*.log

# 机器学习模型
*.bin
*.h5
*.onnx

如果你已经提交了大文件，并且想从 Git 历史记录中移除它们以缩小仓库大小，可以使用 git filter-repo 或 BFG Repo-Cleaner 等工具。仅在新的提交中删除文件并不会缩小仓库大小，因为 Git 会在历史记录中保留该文件。

对于大型静态资源（如图片、视频或机器学习模型），请将它们存储在外部对象存储服务中（例如 AWS S3、Cloudflare R2 或任何 S3 兼容的服务），并在应用程序中通过 URL 引用它们。

这样可以保持仓库和容器镜像的精简，同时让你的应用程序在运行时能访问所需的文件。

如果你的应用程序在运行时会生成或需要大文件（如用户上传的文件、缓存文件或数据库），请使用持久化存储，而不是将它们包含在容器镜像中。

存储在 Volumes 中的文件会在部署和服务重启之间持续保留，且不会影响你的构建上下文大小。

遵循以下一般最佳实践来保持仓库的精简：