aven 发表于 2008-5-25 04:09:29

强烈建议完善对这样站的采集!!!!

内容为JS且JS路径与网址没直接关系,http://www.bookgg.com/library.j?page_type=BooKChapter&Bid=70506&CId=3975856


内容JS<script type="text/javascript" src="BookCont/2008-4/24/V101C3975856.js">

就是上面的网址,其内容是JS,这倒不说什么,关键是JS的路径无法由当前采集网址替换得到

各位高手有什么高招没,请指教!

如果火车能在一个标签内先根据规则提取当前页面中地址,再对结果中的地址进行采集这样就好了,

lbjyuer 发表于 2016-2-10 03:03:13

支持火车。。。。历史帖子回顾中。
页: [1]
查看完整版本: 强烈建议完善对这样站的采集!!!!