端计算(Edge/On-device Computing) 定义 在用户设备或边缘节点进行计算与推理,具备低延迟、隐私与离线可用性优势。 工程要点 模型压缩:蒸馏、剪枝、模型量化(如 GGUF模型量化); 设备适配:算力/内存/功耗约束;与 云计算 形成端云协同。