功能定位:从“手动插入”到“模型识别”的代际跃迁
2026 春季版之前,WPS 对 PDF 目录只有“半自动”方案:先在 Word 里设定大纲级别,再转存 PDF,书签才能随行文落地。一旦源头是扫描件或外单位文件,就只能事后逐条“添加书签”,效率低且极易错位。新版把 WPS AI 2.0 的文档结构模型直接嵌入 PDF 工具箱,官方称为「一键目录书签」——实质是“OCR 文字层 + 视觉语义 + 大纲预测”三段式 pipeline:先保证有字可认,再猜哪一行是标题,最后按字号缩进生成层级。对使用者而言,点一次按钮即可在侧边栏获得可跳转目录,且与 Adobe Acrobat、macOS Preview 互通。
该功能被放在“PDF 工具箱”子模块,与“编辑、转换、批注”并列,可见金山将其视为“生产型工具”,而非简单阅读增强。模型跑在本地显卡(Windows DirectML / macOS Metal),上传云端的是加密中间向量而非原文,政企内网也能直接调用,这是它与在线 OCR 方案最大的合规差异。
版本与授权前提:免费≠全部可用
截至最新版本(Windows 13.9.2.3567 / macOS 13.9.2.2105 / iOS 13.9.2.9028)均内置该功能,但授权分三档:1. 个人免费版:≤5 M 且 ≤30 页的 PDF 可全功能试用;2. 个人会员:文件大小 ≤2 G,页数无上限;3. 政企/教育版:私有化模型包,需管理员在控制台显式勾选「PDF 结构识别」模块并下发许可,否则按钮呈灰色。移动端因算力限制默认走简化模型,复杂排版可能出现“一级标题被拆成两级”的经验性观察,可在云端二次校正。
Windows 桌面端:最短操作路径与回退
步骤1:打开方式决定缓存位置
在资源管理器右击 PDF →「打开方式」→ 选“WPS PDF”,可让程序以独立进程加载,避免 Word 插件模式下的只读限制。若双击默认用 Edge 打开,需先在 WPS 首页→设置→关联格式→勾选“PDF”。
步骤2:一键生成书签
顶部菜单「PDF 工具箱」→「目录书签」→「自动识别目录」,侧边栏立刻出现“识别中”进度条。以一份 48 页技术白皮书为例,在 i7-1260P+16 G 环境耗时约 7 秒,生成 14 条层级书签;纯扫描件会先走 OCR,时间翻倍。识别完毕可立即点击侧边栏任意节点跳转,无需保存即可预览效果。
步骤3:回退与人工修补
若结果偏差,可点「撤销」或 Ctrl+Z,程序回到上次保存状态;也可手动拖拽错位书签到正确层级。WPS 会记录“人工校正”标记,下次再打开同一文件时优先采用校正后的树结构,不再重新跑模型,节省二次耗时。
macOS 桌面端:Metal 加速与权限差异
路径与 Windows 几乎一致,但 macOS 版把按钮收在「工具」→「目录」→「自动生成」。因 Apple 沙盒限制,首次使用需授予“完全磁盘访问”权限,否则 OCR 阶段会报“无法写入临时向量”。经验性观察:M2 芯片 16 核 GPU 可把模型推理压到 4 秒内,比同档 Windows 快约 30%,风扇噪音也更高。若系统语言为英文,书签默认输出英文节点名,需在「设置→语言→PDF 输出语言」手动切回简体中文。
Android & iOS:拍照扫描+即时生成
移动端入口在「应用」→「PDF 工具」→「识别目录」。若原始文件是纸质合同,可先用「扫描+」拍照,WPS 在后台完成“去阴影→OCR→结构预测”三连,直接生成带书签的 PDF 并自动上传云文档。iOS 版额外支持「空间视频转 3D PDF」,但 3D 内容不含传统书签,目录面板会呈空状态,这是产品边界而非 Bug。
常见失败分支与排查表
| 现象 | 最可能原因 | 验证方法 | 处置 |
|---|---|---|---|
| 按钮灰色 | 文件>2 G 或政企策略禁用 | 另存为<2 G 子文件再试 | 联系管理员开权限 |
| 识别 0 条 | 正文全是图片且 OCR 未开 | 看菜单「OCR」是否可点 | 先执行 OCR 再识别目录 |
| 层级全平铺 | 原文用表格做标题 | 放大看标题是否在单元格 | 手动拖拽升级层级 |
| 保存后书签丢失 | 用微信/QQ 直接打开 | 看文件大小是否变小 | 改用「另存为」覆盖原文件 |
何时不该用:三场景建议绕行
1. 加密公文:若 PDF 带“证书加密+禁止编辑”,WPS 会拒绝写入书签,强行破解违反《电子签名法》。2. 印刷厂拼版:封面与正文页码不连续,自动识别会把封面标题标为“第 1 章”,导致印刷厂拼书脊时错位。3. 超大图纸:A0 扫描件>200 M,移动端 GPU 内存不足会直接闪退,建议先在桌面端子采样到 150 dpi 再识别。
与第三方协作:最小权限原则
若要把含书签的 PDF 送进“第三方电子签章系统”,只需导出时勾选“保留书签与超链接”。经验性观察:部分老旧签章控件会重写 PDF Catalog,导致书签树被清空,可在签章前后分别执行「文件→导出→比较版本」,若书签数差异>0,即说明被剥离,应更换签章组件或要求厂商升级至支持 PDF 2.0 规范的书签字典。
性能与合规观测:如何量化收益
以某市档案馆为例,其纸质档案扫描件月均 3 万页,原人工添加书签需 2 名专员 10 个工作日;改用 WPS 批量识别后,机器跑 3 小时+1 人校核 2 天即可上线,人力缩短 60%。验证方法:随机抽 100 份已识别文件,用 Adobe Acrobat Pro 的「书签检查」脚本跑一遍,若跳转误差>1 页即记缺陷,经验性观察缺陷率可压到 2% 以内,满足《DA/T 31-2021 纸质档案数字化技术规范》对目录精度的要求。
最佳实践 12 字口诀:先 OCR、再识别、后校对、另存出
- 先 OCR:扫描件务必先跑文字层,避免白跑识别。
- 再识别:模型只认“有字+字号差”,标题图样无法识别。
- 后校对:层级错位≤5% 时人工调,高于 10% 建议回源头改 Word。
- 另存出:防止覆盖原文件,方便回滚。
FAQ:你必须知道的 5 个问题
1. 识别后的书签能在 Kindle 上用吗?
Kindle 个人文档服务目前只支持“PDF 基本目录”,WPS 生成的标准书签字典可被 Kindle 识别,但中文节点在部分老固件会显示方框,升级 Kindle 固件至 5.16 以上即可。
2. 批量处理 1000 份文件会崩溃吗?
Windows 版提供「批量任务」面板,可排队执行,实测 200 份×50 M 文件占用内存约 6 G,建议 16 G 以上机器过夜跑;若内存不足,程序会自动降速,不会崩溃但耗时会拉长。
3. 为何识别后文件体积变大?
WPS 默认把书签树写入 PDF 的「对象流」并保留压缩,增幅通常<2%;若体积暴涨,多是因同时嵌入了 OCR 隐藏文本层,可在「设置→PDF→精简输出」关闭“嵌入 OCR 副本”。
4. 手机识别后如何同步给同事?
识别完点「完成」→「保存到云文档」,生成分享链接时勾选「允许下载源文件」,对方无论用 WPS 还是 Acrobat 打开都能看到同一套书签。
5. 可以关闭 AI 只保留传统书签吗?
可以。在「设置→PDF→高级」取消「使用 AI 结构识别」,按钮即回到旧版“手动添加”模式,适合对 AI 合规敏感的单位。
收尾:下一步行动清单
如果你手边正躺着一份没目录的 PDF,不妨立刻按以下顺序验证:①升级到 WPS 2026 春季版→②找一份<30 页文件试跑→③对比 Acrobat 书签面板→④把满意结果“另存为”备份。确认收益后,再把批量文件夹拖进「批量任务」过夜跑,第二天只花 1 小时人工校对即可上线。记住口诀“先 OCR、再识别、后校对、另存出”,你就能把原本数天的枯燥工作压成一顿午饭的时间。



