willingzhu 发表于 2021-6-9 10:52:33

火车头采集内容的问题请教

本帖最后由 willingzhu 于 2021-6-9 10:54 编辑

在A网页中获取了B网页地址,采集内容要包含B网页地址里的内容,如何处理?
b网页的地址和a网页地址就差其中部分字段

A网页 https://ebook.chinabuilding.com.cn/zbooklib/book/detail/show?SiteID=1&bookID=136479 B网页 https://ebook.chinabuilding.com.cn/zbooklib/bookpdf/probation?SiteID=1&bookID=136479

我想获取的数据一部分来源A网页,一部分来源B网页
网址采集规则,采集到的时A网页的地址

leweizxl 发表于 2021-6-11 09:09:09

您好,如果两个网址的区别仅在于不同的ID的话,可以尝试使用关联多页组合成您新的网址进行访问和采集
页: [1]
查看完整版本: 火车头采集内容的问题请教