331661921 发表于 2022-1-5 20:26:06

怎么把采集失败的网址导出来?

因为对标题做了内容过滤,然后就有很多网址采集提示 :记录被过滤,原因:【标题】不符合不得包含条件 xxxx,,现在想把这些网址全部提取出来。

leweizxl 发表于 2022-1-10 10:54:08

您好,如果您对不符合采集条件的地址,设置的是跳过操作的话,那网站是保留在规则数据库中的,您可以选中规则,右键打开Data文件夹,用数据库工具查看SpiderResult.db3的文件夹,未采未发的地址就是您要的,可以通过查询语句查询出他们的地址进行处理。
如果您对不符合采集条件的地址,设置的是直接删除的话,就无法找到您要的地址了。
页: [1]
查看完整版本: 怎么把采集失败的网址导出来?