```

feat(iOS): 更新MNN后端模型配置优化性能将MNN主模型从Qwen3.5-4B(~2.64GiB)降级为Qwen3.5-2B(~1.1GiB)，因为4B版本实测运行过慢，影响用户体验。iPhone17+/SME2设备使用2B模型，保留MLX 兜底方案用于模拟器和备用场景，确保AI推理性能和存储效率的平衡。 ```
2026-06-09 22:20:07 +08:00
parent ca5a3fa38b
commit b79ae54b7b
40 changed files with 1327 additions and 452 deletions
--- a/康康/AI/ModelStore.swift
+++ b/康康/AI/ModelStore.swift
@@ -2,19 +2,19 @@ import Foundation

 nonisolated enum ModelKind: String, CaseIterable {
    /// 也是沙盒 Models/ 下的子目录名 / CDN 路径段。
-    /// 同一个 Qwen3.5-4B,两种格式两种引擎:
-    /// - mnnLLM:MNN(CPU/SME2,考核路径)文本+视觉一肩挑,taobao-mnn 预转换。真机主用,只露它。
-    /// - llm:MLX(GPU)兜底,Qwen3.5-4B-4bit 多模态(同时兜底文本与视觉,走 qwen3_5)。
+    /// 同一个 Qwen3.5-2B,两种格式两种引擎:
+    /// - mnnLLM:MNN(CPU/SME2,考核路径)文本+视觉一肩挑,taobao-mnn 预转换。iPhone17+(A19/SME2)主用,只露它。
+    /// - llm:MLX(GPU)兜底,Qwen3.5-2B-4bit 多模态(同时兜底文本与视觉,走 qwen3_5)。
    /// - vl:已废弃(MLX VL 改走 .llm 多模态),保留枚举避免动一圈穷举 switch,不再下载/展示。
-    case llm    = "Qwen3.5-4B-4bit"
+    case llm    = "Qwen3.5-2B-4bit"
    case vl     = "Qwen3-VL-4B-Instruct-4bit"
-    case mnnLLM = "Qwen3.5-4B-MNN"
+    case mnnLLM = "Qwen3.5-2B-MNN"

    var displayName: String {
        switch self {
-        case .llm:    return "Qwen3.5-4B (MLX)"
+        case .llm:    return "Qwen3.5-2B (MLX)"
        case .vl:     return "Qwen3-VL-4B"
-        case .mnnLLM: return "Qwen3.5-4B (MNN/SME2)"
+        case .mnnLLM: return "Qwen3.5-2B (MNN/SME2)"
        }
    }

@@ -25,7 +25,7 @@ nonisolated enum ModelKind: String, CaseIterable {
    var sentinelFilename: String { "config.json" }

    /// 面向用户的模型集合:模型管理页 / 下载全部 / 就绪计数对外只暴露统一的
-    /// Qwen3.5-4B(MNN,文本+视觉全包,真机走它)。
+    /// Qwen3.5-2B(MNN,文本+视觉全包,iPhone17+ 走它)。
    /// MLX 的 .llm/.vl 仅作模拟器与兜底路径,保留枚举与下载能力(旁路导入仍可单独导),
    /// 但不在「我的 · 模型管理」展示,也不计入「下载全部」与就绪计数。
    static let userFacing: [ModelKind] = [.mnnLLM]