Project Docs

异常报告自动入库与分析 Skill · auto-import.md

在线查看上传的 Markdown 项目文档。

自动入库规则

触发原则

当用户:

  • 发送新的“异常报告”Excel 文件
  • 提供本地路径并说明这是异常报告
  • 指定一个目录让系统批量处理异常报告历史文件

就先执行导入,再继续分析。

单文件自动入库

如果收到一个 Excel 文件,且满足以下任一条件:

  • 文件名包含“异常报告”
  • 用户明确说明这是钉钉 OA 的“异常报告”导出文件

执行:

bash
python3 scripts/import_exception_report.py <excel_path>

默认会按文件哈希去重:

  • 相同文件内容再次导入时,直接跳过
  • 如果用户明确要求重新导入,可加 --force

批量补录历史文件

如果用户给的是目录,执行:

bash
python3 scripts/scan_exception_reports.py <folder>

规则:

  • 递归扫描 .xlsx / .xls
  • 仅处理文件名包含“异常报告”的文件
  • 对每个文件自动导入
  • 相同文件内容按哈希跳过

对话行为

  • 先导入,后分析
  • 导入完成后告诉用户:导入了几份文件、跳过了几份、是否有报错
  • 如果用户随后提出分析问题,直接基于 SQLite 回答,不再要求手工重复导入

注意

  • 数据主键仍然是 数据id
  • 文件级防重复依赖 imports.file_hash
  • 业务级防重复依赖 reports.数据id
  • 若后续出现新的 Excel 列,导入脚本会自动给 reports 表补列