火车头采集内容的问题请教
本帖最后由 willingzhu 于 2021-6-9 10:54 编辑在A网页中获取了B网页地址,采集内容要包含B网页地址里的内容,如何处理?
b网页的地址和a网页地址就差其中部分字段
A网页 https://ebook.chinabuilding.com.cn/zbooklib/book/detail/show?SiteID=1&bookID=136479 B网页 https://ebook.chinabuilding.com.cn/zbooklib/bookpdf/probation?SiteID=1&bookID=136479
我想获取的数据一部分来源A网页,一部分来源B网页
网址采集规则,采集到的时A网页的地址
您好,如果两个网址的区别仅在于不同的ID的话,可以尝试使用关联多页组合成您新的网址进行访问和采集
页:
[1]