kangkang/康康/AI/Prompts/VLPrompts.swift

import Foundation

/// VL 模型(Qwen3-VL)用于体检 / 化验单识别的 prompt 模板。
/// 输出契约:严格 JSON,无任何解释文字、markdown 围栏或前后缀。
/// 解析失败 → CaptureService 回退到手动录入(§3.2 失败回退红线)。
nonisolated enum VLPrompts {

    /// 输出 JSON 的字段定义(写进 prompt 里教模型):
    /// ```
    /// {
    ///   "title": "春季年度体检",        // 报告抬头,无则 "拍摄识别"
    ///   "type": "checkup|lab|imaging|prescription|other",
    ///   "report_date": "YYYY-MM-DD",   // 报告日期(无则今天)
    ///   "institution": "XX 医院",       // 可空字符串
    ///   "page_count": 1,
    ///   "summary": "整体趋势短句",       // 可空字符串
    ///   "indicators": [
    ///     {
    ///       "name": "低密度脂蛋白",
    ///       "value": "3.84",
    ///       "unit": "mmol/L",
    ///       "range": "< 3.40",
    ///       "status": "high|low|normal",
    ///       "source_page": 1,
    ///       "source_box": [0.18, 0.42, 0.68, 0.49]
    ///     }
    ///   ]
    /// }
    /// ```
    /// `kind` 字段省略 —— UI 由 indicators 数量决定走 A2(单项)或 B3(多项)。

    /// VL 模型不知"今天"是哪天,且 few-shot 示例里写死了日期,
    /// 必须把当天日期显式注入 prompt,模型在无报告日期时才会用对正确的回退值。
    /// ocrText 非空时把 Vision OCR 的结果作为参考文本注入 —— Vision 抄数字比
    /// 2B 多模态读密集小字稳;版面与表格结构仍以图片为准。
    static func reportExtraction(today: Date = .now, ocrText: String = "") -> String {
        let f = DateFormatter()
        f.locale = Locale(identifier: "en_US_POSIX")
        f.dateFormat = "yyyy-MM-dd"
        let todayStr = f.string(from: today)
        let ocrSection: String
        if ocrText.isEmpty {
            ocrSection = ""
        } else {
            ocrSection = """


            OCR 参考文本(系统对同一报告做文字识别的结果,可能有错字、串行或漏行;版面与表格结构以图片为准,但数值、小数点以 OCR 文字更可靠):
            \(clipOCR(ocrText))

            """
        }
        return reportExtractionTemplate
            .replacingOccurrences(of: "{{TODAY}}", with: todayStr)
            .replacingOccurrences(of: "{{OCR_SECTION}}", with: ocrSection)
    }

    /// OCR 文本截断:限制进入 prompt 的体量(2B 模型上下文有限)。截到最后一个完整行。
    static func clipOCR(_ text: String, limit: Int = 1800) -> String {
        guard text.count > limit else { return text }
        let clipped = String(text.prefix(limit))
        if let lastNewline = clipped.lastIndex(of: "\n") {
            return String(clipped[..<lastNewline]) + "\n(后续内容过长已截断)"
        }
        return clipped + "\n(后续内容过长已截断)"
    }

    private static let reportExtractionTemplate: String = #"""
你是一个医学体检报告识别助手。请只输出一段合法 JSON,不要解释、不要 markdown 围栏、不要任何前后缀文字。

今天的日期是 {{TODAY}}。

JSON schema(严格):
{
  "title": string,
  "type": "checkup" | "lab" | "imaging" | "prescription" | "other",
  "report_date": "YYYY-MM-DD",
  "institution": string,
  "page_count": number,
  "summary": string,
  "indicators": [
    {
      "name": string,
      "value": string,
      "unit": string,
      "range": string,
      "status": "high" | "low" | "normal",
      "source_page": number,
      "source_box": [number, number, number, number]
    }
  ]
}

规则:
- status 根据 value 与 range 自己判断:value > range 上限 → "high",< 下限 → "low",否则 → "normal"。
- range 字段保留原文(如 "< 3.40"、"3.9 - 6.1"、"0 - 5"),不要解析成区间对象。
- 无法识别的字段填空字符串(institution / summary)。
- report_date 必须从图片中识别;实在看不清就填上面给出的「今天」({{TODAY}})。下面示例里的日期只是格式参考,不要直接抄。
- 不要发明指标。数值看不清的整行跳过;但**没有参考范围不是跳过的理由**,结论页叙述式文字(如「总胆红素: 23.0(μmol/L)↑」)同样要提取,range 填 "",status 按箭头/「偏高」等标记判断。
- 化验单一般 type = "lab",体检套餐 = "checkup"。
- source_page 是该指标所在图片页码,从 1 开始。
- source_box 是该指标整行在该页图片里的归一化矩形 [x,y,width,height],左上角为 (0,0),右下角为 (1,1)。尽量框住指标名、数值、单位、参考范围和异常标记所在整行;不确定位置时填 [0,0,0,0]。

示例 1(化验单 · 单项):
输入: 一张化验单照片,只能看清「低密度脂蛋白 3.84 mmol/L 参考 <3.40」
输出:
{"title":"低密度脂蛋白单项","type":"lab","report_date":"2026-05-25","institution":"","page_count":1,"summary":"","indicators":[{"name":"低密度脂蛋白","value":"3.84","unit":"mmol/L","range":"< 3.40","status":"high","source_page":1,"source_box":[0.18,0.42,0.68,0.08]}]}

示例 2(体检 · 多项):
输入: 一份春季体检,3 项可读
输出:
{"title":"春季年度体检","type":"checkup","report_date":"2026-04-12","institution":"协和医院","page_count":1,"summary":"血脂偏高、其他正常","indicators":[{"name":"低密度脂蛋白","value":"3.84","unit":"mmol/L","range":"< 3.40","status":"high","source_page":1,"source_box":[0.12,0.31,0.76,0.07]},{"name":"谷丙转氨酶","value":"32","unit":"U/L","range":"9 - 50","status":"normal","source_page":1,"source_box":[0.12,0.39,0.76,0.07]},{"name":"空腹血糖","value":"5.2","unit":"mmol/L","range":"3.9 - 6.1","status":"normal","source_page":1,"source_box":[0.12,0.47,0.76,0.07]}]}
{{OCR_SECTION}}
现在请识别图片并输出 JSON:
"""#

    // MARK: - 报告归档 · 轻量 meta(只抽日期/机构/类型/标题,不识别指标)

    /// 报告归档新链路:只保存原图,**不逐项识别指标**(逐项多模态识别在 2B 上易 OOM / 卡死)。
    /// 用 Vision OCR 出纯文本后,交文本 LLM 只抽报告级 meta —— 输出极小(~50 token),快且稳。
    /// 识别不到就留空,UI 用占位(今天 / 空机构),用户可手填。
    static func reportMetaFromText(_ ocrText: String, today: Date = .now) -> String {
        let f = DateFormatter()
        f.locale = Locale(identifier: "en_US_POSIX")
        f.dateFormat = "yyyy-MM-dd"
        let todayStr = f.string(from: today)
        return reportMetaTemplate
            .replacingOccurrences(of: "{{TODAY}}", with: todayStr)
            .replacingOccurrences(of: "{{OCR_TEXT}}", with: clipOCR(ocrText, limit: 1500))
    }

    private static let reportMetaTemplate: String = #"""
你是体检/化验报告归档助手。下面是对一份报告做 OCR 得到的纯文本,可能有错字、错位、噪声。
请只提取这份报告的「元信息」,**不要提取任何具体指标/数值**。只输出一段合法 JSON,不要解释、不要 markdown 围栏、不要任何前后缀文字。

今天的日期是 {{TODAY}}。

JSON schema(严格):
{
  "title": string,        // 报告抬头,如 "春季年度体检";读不出就填 ""
  "type": "checkup" | "lab" | "imaging" | "prescription" | "other",
  "report_date": "YYYY-MM-DD",  // 报告/采样/体检日期;实在读不出就填 ""
  "institution": string   // 医院/体检机构名;读不出就填 ""
}

规则:
- 只输出上面 4 个字段,绝不输出 indicators / 数值 / 参考范围。
- type:化验单→"lab";体检套餐→"checkup";影像(B超/CT/X光/MRI)→"imaging";处方→"prescription";拿不准→"other"。
- 日期挑「报告日期 / 检查日期 / 采样日期」其一,统一成 YYYY-MM-DD;只有年月就补 -01;读不出填 ""。
- institution 取医院/体检中心全称,去掉「检验科/报告单」等栏目词;读不出填 ""。
- 不要编造;读不出的字段填 ""。

示例 OCR 文本:
协和医院体检中心  健康体检报告  姓名:张三  体检日期:2026-04-12  低密度脂蛋白 3.84 ↑ ...
输出:
{"title":"健康体检报告","type":"checkup","report_date":"2026-04-12","institution":"协和医院体检中心"}

现在请解析下面这段 OCR 文本,只输出 JSON。/no_think

OCR 文本:
{{OCR_TEXT}}
"""#

    // MARK: - 局部小框识别(指标速记)

    /// 指标速记专用:输入是报告/化验单的**局部照片**(常常只有一两行指标)。
    /// 只要 indicators 数组,不要报告标题/机构/日期等元信息 —— 这条路径只存数值,不建 Report。
    static func regionExtraction(today: Date = .now) -> String {
        let f = DateFormatter()
        f.locale = Locale(identifier: "en_US_POSIX")
        f.dateFormat = "yyyy-MM-dd"
        let todayStr = f.string(from: today)
        return regionExtractionTemplate.replacingOccurrences(of: "{{TODAY}}", with: todayStr)
    }

    private static let regionExtractionTemplate: String = #"""
你是一个医学化验单识别助手。下面给你的是一张化验单/体检报告的**局部照片**,通常只框住了一两行指标。
照片内容可能是表格行,也可能是**结论页的叙述式文字**(如「九、检验:(1)总胆红素(TB): 23.0(μmol/L)↑」),两种都要提取。
请只输出一段合法 JSON,不要解释、不要 markdown 围栏、不要任何前后缀文字。

今天的日期是 {{TODAY}}。

JSON schema(严格):
{
  "indicators": [
    {
      "name": string,
      "value": string,
      "unit": string,
      "range": string,
      "status": "high" | "low" | "normal"
    }
  ]
}

规则:
- 凡是「指标名 + 数值」清楚可读的,都要提取——**没有参考范围不是跳过的理由**。只有数值本身看不清才跳过,绝不发明指标。
- status 判断优先级:① 文字旁的箭头或标记(↑/H/偏高 → "high",↓/L/偏低 → "low")最优先;② 没有标记时再用 value 与 range 比较;③ 都没有 → "normal"。
- range 字段保留原文(如 "< 3.40"、"3.9 - 6.1"、"0 - 5"),不要解析成区间对象;照片里没有参考范围就填 ""。
- 识别不出单位/范围就填空字符串,不要编造。
- name 用规范指标名;如果同一行重复出现指标名(如「总胆红素(TB): 总胆红素: 23.0」),只取一次。
- 不要输出 title / institution / date / summary 等任何报告级字段,只输出 indicators 数组。

示例 1(表格单行):
输入: 局部照片,清楚可读「低密度脂蛋白 3.84 mmol/L 参考 <3.40 ↑」
输出:
{"indicators":[{"name":"低密度脂蛋白","value":"3.84","unit":"mmol/L","range":"< 3.40","status":"high"}]}

示例 2(表格两行):
输入: 局部照片,清楚可读「尿酸 486 μmol/L 208-428」与「空腹血糖 5.2 mmol/L 3.9-6.1」
输出:
{"indicators":[{"name":"尿酸","value":"486","unit":"μmol/L","range":"208 - 428","status":"high"},{"name":"空腹血糖","value":"5.2","unit":"mmol/L","range":"3.9 - 6.1","status":"normal"}]}

示例 3(结论页叙述式 · 无参考范围,只有箭头):
输入: 局部照片,体检结论文字「九、检验: (1)总胆红素(TB): 总胆红素: 23.0(μmol/L)↑」,周围还有其他结论文字
输出:
{"indicators":[{"name":"总胆红素","value":"23.0","unit":"μmol/L","range":"","status":"high"}]}

现在请识别这张局部照片并输出 JSON:
"""#

    // MARK: - OCR 文本 → 指标(LLM 解析,非 VL)

    /// 「拍照识别」新链路:先用 Vision OCR 把化验单读成纯文本,再用 Qwen3-1.7B 从文本结构化抽指标。
    /// 比让 3B VL 直接读密集小字稳得多。输入是 OCR 文本(可能有错字/错位/噪声)。
    static func indicatorsFromText(_ ocrText: String, today: Date = .now) -> String {
        let f = DateFormatter()
        f.locale = Locale(identifier: "en_US_POSIX")
        f.dateFormat = "yyyy-MM-dd"
        let todayStr = f.string(from: today)
        return indicatorsFromTextTemplate
            .replacingOccurrences(of: "{{TODAY}}", with: todayStr)
            .replacingOccurrences(of: "{{OCR_TEXT}}", with: ocrText)
    }

    private static let indicatorsFromTextTemplate: String = #"""
你是医学化验单/体检报告的结构化助手。下面是对一张报告做 OCR 得到的纯文本,可能有错字、错位、多余符号或换行混乱。
请从中提取所有「指标名 + 数值」,只输出一段合法 JSON,不要解释、不要 markdown 围栏、不要任何前后缀文字。

今天的日期是 {{TODAY}}。

JSON schema(严格):
{
  "indicators": [
    {
      "name": string,
      "value": string,
      "unit": string,
      "range": string,
      "status": "high" | "low" | "normal"
    }
  ]
}

规则:
- 只提取「有明确数值」的检验/体检指标;页眉、医院名、医生签名、采样时间、栏目标题、OCR 噪声一律忽略。
- status 判断优先级:① 文本里的箭头/标记(↑/H/偏高 → "high",↓/L/偏低 → "low")最优先;② 没有标记时用 value 与 range 比较;③ 都没有 → "normal"。
- range 保留原文(如 "3.9 - 6.1"、"< 3.40"、"208 - 428");OCR 把破折号写成 "--" / "~" 都归一成 " - ";没有参考范围就填 ""。
- 单位识别不出就填 "",不要编造;不要发明指标;同一指标只输出一次。
- name 用规范中文指标名(行内重复的去掉,英文缩写括注可保留)。
- 数值明显是 OCR 乱码(字母混入数字)且无法判断的,跳过该行。

示例 OCR 文本:
淋巴细胞数  3.0  1.8 -- 6.3  X10^9/L
尿酸  486  208-428  μmol/L
总胆红素(TB): 23.0 (μmol/L) ↑
对应输出:
{"indicators":[{"name":"淋巴细胞数","value":"3.0","unit":"X10^9/L","range":"1.8 - 6.3","status":"normal"},{"name":"尿酸","value":"486","unit":"μmol/L","range":"208 - 428","status":"high"},{"name":"总胆红素","value":"23.0","unit":"μmol/L","range":"","status":"high"}]}

现在请解析下面这段 OCR 文本,只输出 JSON。/no_think

OCR 文本:
{{OCR_TEXT}}
"""#
}