feat(AI): MNN 模型纳入下载体系 ModelKind.mnnLLM(Phase 4)

文本 MNN 模型用 taobao-mnn/Qwen3.5-2B-MNN 官方预转换格式(~1.10GiB), 不再从头转换(避开多模态转文本风险,官方转更可靠)。 - ModelStore.ModelKind 新增 .mnnLLM = "Qwen3.5-2B-MNN" - ModelManifest:.mnnLLM 文件清单(config.json/llm_config.json/llm.mnn/ llm.mnn.weight 1.1GB/tokenizer.txt/visual.mnn,HF API 实测字节) - AIRuntime:mnnModelFolder + 就绪判定改走 ModelStore.isComplete(.mnnLLM) - ModelManagementView:subtitle 加 .mnnLLM 文案(仅此一处,未动其它 WIP) - ModelManifestTests:+4 条 mnnLLM 断言(文件数/总字节/必需文件/URL) 模拟器 ModelManifestTests TEST SUCCEEDED。下载经现有链路,需上传到 file.myv0.com/Qwen3.5-2B-MNN/(CDN 清单随附)。 Co-Authored-By: Claude Opus 4.8 (1M context) <noreply@anthropic.com>
2026-06-08 19:38:16 +08:00
parent 9da3fbc87e
commit 39b1521f00
5 changed files with 51 additions and 13 deletions
--- a/康康/AI/ModelStore.swift
+++ b/康康/AI/ModelStore.swift
@@ -1,15 +1,19 @@
 import Foundation

 nonisolated enum ModelKind: String, CaseIterable {
-    /// 与 HuggingFace mlx-community 仓库名一一对应,也是沙盒 Models/ 下的子目录名。
-    /// 文本 LLM 用 Qwen3.5-2B(多模态权重,走 mlx-swift-lm 的 qwen3_5 → Qwen35Model 文本路径加载)。
-    case llm = "Qwen3.5-2B-4bit"
-    case vl  = "Qwen3-VL-4B-Instruct-4bit"
+    /// 也是沙盒 Models/ 下的子目录名 / CDN 路径段。
+    /// - llm:MLX(GPU)文本兜底,Qwen3.5-2B(多模态权重,走 qwen3_5 文本路径)。
+    /// - vl :MLX(GPU)拍照识别,Qwen3-VL-4B。
+    /// - mnnLLM:MNN(CPU/SME2,挑战赛考核路径)文本,Qwen3.5-2B 预转换 MNN 格式(taobao-mnn)。
+    case llm    = "Qwen3.5-2B-4bit"
+    case vl     = "Qwen3-VL-4B-Instruct-4bit"
+    case mnnLLM = "Qwen3.5-2B-MNN"

    var displayName: String {
        switch self {
-        case .llm: return "Qwen3.5-2B"
-        case .vl:  return "Qwen3-VL-4B"
+        case .llm:    return "Qwen3.5-2B (MLX)"
+        case .vl:     return "Qwen3-VL-4B"
+        case .mnnLLM: return "Qwen3.5-2B (MNN/SME2)"
        }
    }