通用表格识别
活动说明
通用表格识别,可以识别标准或非标准表格,结果支持返回 DataSet 或 json。使用该活动需要联网并确认额度充足
执行逻辑:通过识别表格中的内容,并将其转换成字符串形式,供后续活动使用
属性说明
输入项
查找元素超时时间
指定查找元素的超时时间。此属性仅在图片信息选择"元素选择器"作为输入时生效
将第一行作为列名
[单选项]
指定是否需要将第一行作为列名展示
图片信息
[下拉选项]
输入需要进行识别的卡证,提供三种输入方式,可三选一:
图片路径:输入本地图片文件
PDF文件:输入本地PDF文件
元素选择器:选择界面上的卡证元素
页面识别范围
[下拉选项]
若图片信息选择"PDF文件"作为输入方式,可选:
单页输入:指定需要识别表格的PDF页码
范围输入:指定需要识别表格的PDF页码范围
输出项
指定识别结果输出的形式,可选:
json字符串
输出为json格式
数据表集合
输出为处理后的结构化字符串
使用示例
属性栏设置:
运行结果:
表格1:
注意事项
若图片信息选择"PDF文件"作为输入方式,范围输入:指定需要识别表格的PDF页码范围如需识别第1页和3到5页,则填写[1,\"3-5\"]