```

feat(AI): 集成MNN推理引擎替换MLX作为主AI运行时 - 引入MNN(alibaba) + Arm SME2 + CPU作为主AI运行时，支持A19/iPhone17的 SME2和A17的NEON加速 - 添加MLX Swift作为兜底GPU推理方案，实现双后端切换机制 - 使用单一Qwen3.5-2B多模态模型(1.2GB)，替代原有的LLM+VL分离架构 - 实现InferenceEngine.current引擎选择逻辑，真机默认MNN，模拟器回退MLX - 更新AIAgent架构，通过MNNLLMBridge(ObjC++) → MNNBackend进行推理 - 修改队列机制防止并发推理导致OOM，使用信号量闸门控制显存占用 - 更新文档中的技术栈说明、模块边界和周次交付计划 ```
2026-06-15 09:24:59 +08:00
parent 6c6a950140
commit 9d856fcfc4
37 changed files with 2605 additions and 430 deletions
--- a/康康/AI/Prompts/MedicationPrompts.swift
+++ b/康康/AI/Prompts/MedicationPrompts.swift
@@ -7,42 +7,55 @@ import Foundation
 nonisolated enum MedicationPrompts {

    static func medicationsFromText(_ ocrText: String) -> String {
+        // ≤5 张合并 OCR,放宽到 2400(单张 1200 偏小,易把背面用法截掉)。
        medicationsFromTextTemplate
-            .replacingOccurrences(of: "{{OCR_TEXT}}", with: VLPrompts.clipOCR(ocrText, limit: 1200))
+            .replacingOccurrences(of: "{{OCR_TEXT}}", with: VLPrompts.clipOCR(ocrText, limit: 2400))
    }

    private static let medicationsFromTextTemplate: String = #"""
-你是药品包装识别助手。下面是对一张药盒、药品说明书或处方单做 OCR 得到的纯文本,可能有错字、换行混乱或无关噪声。
+你是药品包装识别助手。下面是对一种药品的多张照片(药盒正面/背面/说明书/处方单)做 OCR 得到的纯文本,各张之间用「---」分隔,可能有错字、换行混乱或无关噪声。
 请从中提取药品信息,只输出一段合法 JSON,不要解释、不要 markdown 围栏、不要任何前后缀文字。

 JSON schema(严格):
 {
  "medications": [
    {
-      "name": string,      // 药品通用名或商品名,如 "缬沙坦胶囊"
+      "name": string,      // 药品名,见下方「name 怎么填」
      "strength": string,  // 规格,如 "80mg"、"0.5g×24片";识别不出填 ""
      "usage": string      // 用法用量,如 "每日一次,一次一粒";包装上没有就填 ""
    }
  ]
 }

-规则:
- 只提取药品本身;"国药准字"批准文号、生产厂家、批号、有效期、条形码一律忽略。
- 一张药盒通常只有 1 种药;处方单可能有多种,都要提取。
+name 怎么填(关键,别搞混):
+- 药品名 = 通用名(化学/药典名),这是要填进 name 的主体。中文药名照中文写,英文药名(如 "Metformin"、"Amoxicillin")就照英文原样抄,不要翻译、不要丢。
+- 若包装上同时印有商品名/商标名(厂商起的牌子名,如 "代文""泰诺""Tylenol"),把它放在通用名后的括号里,例如 "缬沙坦胶囊(代文)"。只读到商品名、读不到通用名时,就直接用商品名当 name。
+- 生产厂家/公司名/品牌 LOGO 文字(如 "XX药业有限公司""诺华""拜耳")不是药名,一律不要当 name,也不要塞进括号。
+
+通用规则:
+- 只提取药品本身;"国药准字"批准文号、生产厂家、批号、有效期、条形码、贮藏、二维码一律忽略。
+- 多张照片通常是同一种药的不同面,合并成一条,不要因为来自不同照片就重复输出;处方单可能有多种药,才分多条。
 - 不要发明药品。名称读不清的整条跳过;strength / usage 读不清就填 "",不要编造。
 - 不要输出任何服药建议或剂量调整建议,只抄录包装上已有的文字。
 - 同一药品只输出一次。

-示例 1(药盒):
-输入 OCR 文本: 缬沙坦胶囊  80mg×7粒  国药准字H20103521  XX药业有限公司
+示例 1(药盒,含商品名 + 厂商):
+输入 OCR 文本: 代文  缬沙坦胶囊  80mg×7粒  国药准字H20103521  北京诺华制药有限公司
 输出:
-{"medications":[{"name":"缬沙坦胶囊","strength":"80mg×7粒","usage":""}]}
+{"medications":[{"name":"缬沙坦胶囊(代文)","strength":"80mg×7粒","usage":""}]}

 示例 2(说明书含用法):
 输入 OCR 文本: 二甲双胍缓释片  0.5g×30片  用法用量:口服,一次1片,一日2次,随餐服用
 输出:
 {"medications":[{"name":"二甲双胍缓释片","strength":"0.5g×30片","usage":"口服,一次1片,一日2次,随餐服用"}]}

+示例 3(英文药名,正反两张合并):
+输入 OCR 文本: Amoxicillin Capsules  500mg  GSK
+---
+Dosage: Take one capsule three times daily
+输出:
+{"medications":[{"name":"Amoxicillin","strength":"500mg","usage":"Take one capsule three times daily"}]}
+
 现在请解析下面这段 OCR 文本,只输出 JSON。/no_think

 OCR 文本:
--- a/康康/AI/Prompts/VLPrompts.swift
+++ b/康康/AI/Prompts/VLPrompts.swift
@@ -112,6 +112,53 @@ JSON schema(严格):
 {"title":"春季年度体检","type":"checkup","report_date":"2026-04-12","institution":"协和医院","page_count":1,"summary":"血脂偏高、其他正常","indicators":[{"name":"低密度脂蛋白","value":"3.84","unit":"mmol/L","range":"< 3.40","status":"high","source_page":1,"source_box":[0.12,0.31,0.76,0.07]},{"name":"谷丙转氨酶","value":"32","unit":"U/L","range":"9 - 50","status":"normal","source_page":1,"source_box":[0.12,0.39,0.76,0.07]},{"name":"空腹血糖","value":"5.2","unit":"mmol/L","range":"3.9 - 6.1","status":"normal","source_page":1,"source_box":[0.12,0.47,0.76,0.07]}]}
 {{OCR_SECTION}}
 现在请识别图片并输出 JSON:
+"""#
+
+    // MARK: - 报告归档 · 轻量 meta(只抽日期/机构/类型/标题,不识别指标)
+
+    /// 报告归档新链路:只保存原图,**不逐项识别指标**(逐项多模态识别在 2B 上易 OOM / 卡死)。
+    /// 用 Vision OCR 出纯文本后,交文本 LLM 只抽报告级 meta —— 输出极小(~50 token),快且稳。
+    /// 识别不到就留空,UI 用占位(今天 / 空机构),用户可手填。
+    static func reportMetaFromText(_ ocrText: String, today: Date = .now) -> String {
+        let f = DateFormatter()
+        f.locale = Locale(identifier: "en_US_POSIX")
+        f.dateFormat = "yyyy-MM-dd"
+        let todayStr = f.string(from: today)
+        return reportMetaTemplate
+            .replacingOccurrences(of: "{{TODAY}}", with: todayStr)
+            .replacingOccurrences(of: "{{OCR_TEXT}}", with: clipOCR(ocrText, limit: 1500))
+    }
+
+    private static let reportMetaTemplate: String = #"""
+你是体检/化验报告归档助手。下面是对一份报告做 OCR 得到的纯文本,可能有错字、错位、噪声。
+请只提取这份报告的「元信息」,**不要提取任何具体指标/数值**。只输出一段合法 JSON,不要解释、不要 markdown 围栏、不要任何前后缀文字。
+
+今天的日期是 {{TODAY}}。
+
+JSON schema(严格):
+{
+  "title": string,        // 报告抬头,如 "春季年度体检";读不出就填 ""
+  "type": "checkup" | "lab" | "imaging" | "prescription" | "other",
+  "report_date": "YYYY-MM-DD",  // 报告/采样/体检日期;实在读不出就填 ""
+  "institution": string   // 医院/体检机构名;读不出就填 ""
+}
+
+规则:
+- 只输出上面 4 个字段,绝不输出 indicators / 数值 / 参考范围。
+- type:化验单→"lab";体检套餐→"checkup";影像(B超/CT/X光/MRI)→"imaging";处方→"prescription";拿不准→"other"。
+- 日期挑「报告日期 / 检查日期 / 采样日期」其一,统一成 YYYY-MM-DD;只有年月就补 -01;读不出填 ""。
+- institution 取医院/体检中心全称,去掉「检验科/报告单」等栏目词;读不出填 ""。
+- 不要编造;读不出的字段填 ""。
+
+示例 OCR 文本:
+协和医院体检中心  健康体检报告  姓名:张三  体检日期:2026-04-12  低密度脂蛋白 3.84 ↑ ...
+输出:
+{"title":"健康体检报告","type":"checkup","report_date":"2026-04-12","institution":"协和医院体检中心"}
+
+现在请解析下面这段 OCR 文本,只输出 JSON。/no_think
+
+OCR 文本:
+{{OCR_TEXT}}
 """#

    // MARK: - 局部小框识别(指标速记)