離線優先模式快速入門指南 (Offline-First Mode) 🔌

版本需求: V14.0.0+ 系統需求: Python 3.10+, 8GB+ RAM (推薦 16GB)

Boring-Gemini V14.0 引入了真正的 離線優先 (Offline-First) 架構。本指南將協助您建立一個完全自主、零網路依賴的本地開發環境。

1. 快速設定

離線模式需要 llama-cpp-python 進行本地推理。

# 安裝包含本地支援的額外套件
pip install boring-aicoding[local]

# 或者手動安裝
pip install llama-cpp-python

GPU 加速: 如果您擁有 NVIDIA GPU，請安裝支援 CUDA 的版本： CMAKE_ARGS="-DGGML_CUDA=on" pip install llama-cpp-python

使用內建 CLI 下載推薦的 GGUF 模型。

# 列出推薦模型
boring model list

# 下載平衡型模型 (例如 Llama-3-8B-Quantized)
boring model download --name "llama-3-8b-instruct-q4_k_m.gguf"

模型將存儲於 ~/.boring/models/ 目錄中。

您可以全域啟用離線模式，或僅針對當前工作階段啟用。

選項 A: CLI 切換 (持久化)

boring offline enable

選項 B: 環境變數 (暫時性)

export BORING_OFFLINE_MODE=true
boring start

執行 doctor 命令來驗證您的離線狀態。

boring doctor

輸出應顯示：

5. Offline Mode
  - Status: ENABLED

6. Local LLM Models
  - Models: 1 available
    - llama-3-8b-instruct-q4_k_m.gguf

當離線模式啟用時：

如果啟用了離線模式但未加載任何本地模型，系統將會優雅地報錯，建議您執行 boring model download。

在您的專案中建立 .env 檔案以調整效能：

# .env
BORING_LOCAL_MODEL_PATH=~/.boring/models/my-custom-model.gguf
BORING_LOCAL_CTX_WINDOW=8192
BORING_LOCAL_GPU_LAYERS=35  # 將層轉移至 GPU 運算

最後更新: V14.0.0