发新话题
打印

采集的标字符串问题

采集的标字符串问题

我在采集过程中发现许多网站的
起始标字符串中有我要采集字符的链接
如:
<a href="/search/power_search/power_search.asp?key1=%B2%A9%CE%C4%CA%D3%B5%E3O%" target=_blank>XXXXX出版社</a>
这样不好采集,有别的内容
还有网站上有多个模板,我个人认为要有多个标字符串。

TOP

这是我还会用火车头
这问题不是问题!!!!

TOP

发新话题
Powered by Discuz! 6.0.0  © 2001-2007 Comsenz Technology Ltd
Processed in 0.194646 second(s), 6 queries, Gzip enabled
当前时区 GMT+8, 现在时间是 2008-11-24 04:41 皖ICP备06000549 清除 Cookies - 联系我们 - 火车采集器官方站 - 静态归档