```

feat(iOS): 更新MNN后端模型配置优化性能将MNN主模型从Qwen3.5-4B(~2.64GiB)降级为Qwen3.5-2B(~1.1GiB)，因为4B版本实测运行过慢，影响用户体验。iPhone17+/SME2设备使用2B模型，保留MLX 兜底方案用于模拟器和备用场景，确保AI推理性能和存储效率的平衡。 ```
2026-06-09 22:20:07 +08:00
parent ca5a3fa38b
commit b79ae54b7b
40 changed files with 1327 additions and 452 deletions
--- a/scripts/build-mnn-xcframework.sh
+++ b/scripts/build-mnn-xcframework.sh
@@ -9,7 +9,7 @@
 # 关键 flag:
 #   MNN_BUILD_LLM=ON       —— 编入 llm 引擎(并导出 llm/llm.hpp),自动开 MNN_LOW_MEMORY
 #   MNN_BUILD_LLM_OMNI=ON  —— VL(图→文)所需:多模态 Omni + OpenCV 图像解码。
-#                            统一模型(Qwen3.5-4B-MNN 一肩挑文本+视觉)必须开。
+#                            统一模型(Qwen3.5-2B-MNN 一肩挑文本+视觉)必须开。
 #   MNN_SME2=ON            —— CMake 默认 ON,A19/iPhone17 运行时经 KleidiAI 自动启用,A17 回退 NEON
 #   MNN_METAL=OFF          —— 考核走 CPU+SME2,关 Metal 保持精简
 set -e