功能定位：从“手动插入”到“模型识别”的代际跃迁

2026 春季版之前，WPS 对 PDF 目录只有“半自动”方案：先在 Word 里设定大纲级别，再转存 PDF，书签才能随行文落地。一旦源头是扫描件或外单位文件，就只能事后逐条“添加书签”，效率低且极易错位。新版把 WPS AI 2.0 的文档结构模型直接嵌入 PDF 工具箱，官方称为「一键目录书签」——实质是“OCR 文字层 + 视觉语义 + 大纲预测”三段式 pipeline：先保证有字可认，再猜哪一行是标题，最后按字号缩进生成层级。对使用者而言，点一次按钮即可在侧边栏获得可跳转目录，且与 Adobe Acrobat、macOS Preview 互通。

该功能被放在“PDF 工具箱”子模块，与“编辑、转换、批注”并列，可见金山将其视为“生产型工具”，而非简单阅读增强。模型跑在本地显卡（Windows DirectML / macOS Metal），上传云端的是加密中间向量而非原文，政企内网也能直接调用，这是它与在线 OCR 方案最大的合规差异。

版本与授权前提：免费≠全部可用

截至最新版本（Windows 13.9.2.3567 / macOS 13.9.2.2105 / iOS 13.9.2.9028）均内置该功能，但授权分三档：1. 个人免费版：≤5 M 且 ≤30 页的 PDF 可全功能试用；2. 个人会员：文件大小 ≤2 G，页数无上限；3. 政企/教育版：私有化模型包，需管理员在控制台显式勾选「PDF 结构识别」模块并下发许可，否则按钮呈灰色。移动端因算力限制默认走简化模型，复杂排版可能出现“一级标题被拆成两级”的经验性观察，可在云端二次校正。

Windows 桌面端：最短操作路径与回退

步骤1：打开方式决定缓存位置

在资源管理器右击 PDF →「打开方式」→ 选“WPS PDF”，可让程序以独立进程加载，避免 Word 插件模式下的只读限制。若双击默认用 Edge 打开，需先在 WPS 首页→设置→关联格式→勾选“PDF”。

步骤2：一键生成书签

顶部菜单「PDF 工具箱」→「目录书签」→「自动识别目录」，侧边栏立刻出现“识别中”进度条。以一份 48 页技术白皮书为例，在 i7-1260P+16 G 环境耗时约 7 秒，生成 14 条层级书签；纯扫描件会先走 OCR，时间翻倍。识别完毕可立即点击侧边栏任意节点跳转，无需保存即可预览效果。

步骤3：回退与人工修补

若结果偏差，可点「撤销」或 Ctrl+Z，程序回到上次保存状态；也可手动拖拽错位书签到正确层级。WPS 会记录“人工校正”标记，下次再打开同一文件时优先采用校正后的树结构，不再重新跑模型，节省二次耗时。

macOS 桌面端：Metal 加速与权限差异

路径与 Windows 几乎一致，但 macOS 版把按钮收在「工具」→「目录」→「自动生成」。因 Apple 沙盒限制，首次使用需授予“完全磁盘访问”权限，否则 OCR 阶段会报“无法写入临时向量”。经验性观察：M2 芯片 16 核 GPU 可把模型推理压到 4 秒内，比同档 Windows 快约 30%，风扇噪音也更高。若系统语言为英文，书签默认输出英文节点名，需在「设置→语言→PDF 输出语言」手动切回简体中文。

Android & iOS：拍照扫描+即时生成

移动端入口在「应用」→「PDF 工具」→「识别目录」。若原始文件是纸质合同，可先用「扫描+」拍照，WPS 在后台完成“去阴影→OCR→结构预测”三连，直接生成带书签的 PDF 并自动上传云文档。iOS 版额外支持「空间视频转 3D PDF」，但 3D 内容不含传统书签，目录面板会呈空状态，这是产品边界而非 Bug。

常见失败分支与排查表

现象	最可能原因	验证方法	处置
按钮灰色	文件>2 G 或政企策略禁用	另存为<2 G 子文件再试	联系管理员开权限
识别 0 条	正文全是图片且 OCR 未开	看菜单「OCR」是否可点	先执行 OCR 再识别目录
层级全平铺	原文用表格做标题	放大看标题是否在单元格	手动拖拽升级层级
保存后书签丢失	用微信/QQ 直接打开	看文件大小是否变小	改用「另存为」覆盖原文件

何时不该用：三场景建议绕行

1. 加密公文：若 PDF 带“证书加密+禁止编辑”，WPS 会拒绝写入书签，强行破解违反《电子签名法》。2. 印刷厂拼版：封面与正文页码不连续，自动识别会把封面标题标为“第 1 章”，导致印刷厂拼书脊时错位。3. 超大图纸：A0 扫描件>200 M，移动端 GPU 内存不足会直接闪退，建议先在桌面端子采样到 150 dpi 再识别。

与第三方协作：最小权限原则

若要把含书签的 PDF 送进“第三方电子签章系统”，只需导出时勾选“保留书签与超链接”。经验性观察：部分老旧签章控件会重写 PDF Catalog，导致书签树被清空，可在签章前后分别执行「文件→导出→比较版本」，若书签数差异>0，即说明被剥离，应更换签章组件或要求厂商升级至支持 PDF 2.0 规范的书签字典。

性能与合规观测：如何量化收益

以某市档案馆为例，其纸质档案扫描件月均 3 万页，原人工添加书签需 2 名专员 10 个工作日；改用 WPS 批量识别后，机器跑 3 小时+1 人校核 2 天即可上线，人力缩短 60%。验证方法：随机抽 100 份已识别文件，用 Adobe Acrobat Pro 的「书签检查」脚本跑一遍，若跳转误差>1 页即记缺陷，经验性观察缺陷率可压到 2% 以内，满足《DA/T 31-2021 纸质档案数字化技术规范》对目录精度的要求。

最佳实践 12 字口诀：先 OCR、再识别、后校对、另存出

先 OCR：扫描件务必先跑文字层，避免白跑识别。
再识别：模型只认“有字+字号差”，标题图样无法识别。
后校对：层级错位≤5% 时人工调，高于 10% 建议回源头改 Word。
另存出：防止覆盖原文件，方便回滚。

FAQ：你必须知道的 5 个问题

1. 识别后的书签能在 Kindle 上用吗？

Kindle 个人文档服务目前只支持“PDF 基本目录”，WPS 生成的标准书签字典可被 Kindle 识别，但中文节点在部分老固件会显示方框，升级 Kindle 固件至 5.16 以上即可。

2. 批量处理 1000 份文件会崩溃吗？

Windows 版提供「批量任务」面板，可排队执行，实测 200 份×50 M 文件占用内存约 6 G，建议 16 G 以上机器过夜跑；若内存不足，程序会自动降速，不会崩溃但耗时会拉长。

3. 为何识别后文件体积变大？

WPS 默认把书签树写入 PDF 的「对象流」并保留压缩，增幅通常<2%；若体积暴涨，多是因同时嵌入了 OCR 隐藏文本层，可在「设置→PDF→精简输出」关闭“嵌入 OCR 副本”。

4. 手机识别后如何同步给同事？

识别完点「完成」→「保存到云文档」，生成分享链接时勾选「允许下载源文件」，对方无论用 WPS 还是 Acrobat 打开都能看到同一套书签。

5. 可以关闭 AI 只保留传统书签吗？

可以。在「设置→PDF→高级」取消「使用 AI 结构识别」，按钮即回到旧版“手动添加”模式，适合对 AI 合规敏感的单位。

收尾：下一步行动清单

如果你手边正躺着一份没目录的 PDF，不妨立刻按以下顺序验证：①升级到 WPS 2026 春季版→②找一份<30 页文件试跑→③对比 Acrobat 书签面板→④把满意结果“另存为”备份。确认收益后，再把批量文件夹拖进「批量任务」过夜跑，第二天只花 1 小时人工校对即可上线。记住口诀“先 OCR、再识别、后校对、另存出”，你就能把原本数天的枯燥工作压成一顿午饭的时间。

WPS如何为PDF一键生成可跳转目录书签？