提取文本
功能说明
从PDF中提取文本信息。
注:当前组件仅适用于可编辑的文字型PDF,不可直接编辑的图片型PDF建议使用OCR组件
参数说明
名称 | 类型 | 方向 | 说明 | 注意 | |
---|---|---|---|---|---|
1 | 选择PDF | 字符串、文件 | 输入 | 选择或输入文件地址,如:d:\111.pdf 或 111.pdf |
|
2 | 提取范围 | 下拉框 | 输入 | 可选项:单页 、全部 、范围 |
|
3 | 页数 | 数字(整数) | 输入 | 提取范围 为单页 时有效,输入要提取的页码 |
|
4 | 起始页数 | 数字(整数) | 输入 | 提取范围 为范围 时有效,输入要提取的起始页码 |
|
5 | 结束页数 | 数字(整数) | 输入 | 提取范围 为范围 时有效,输入要提取的结束页码 |
|
6 | 将提取的内容保存给 | 字符串 | 输出 | 输出为变量,如:变量_1 |