求助新开页面采集规则
大家好!最近我想采集一个网站的内容,可写网站的采集规则遇到了一点问题:就是一篇文章,如果字数在500字以内,整篇文章就能全部显示,也就能采集;
如果文章字数大于500字,文章底部会有一个显示"浏览更多"的按钮,点击按钮,才能看到全部的文章
请问大家这种采集规则如何写,小弟,在此向大家请教,希望大家指点,谢谢!
或者加我QQ:18368361,一起研究,祝大家采集多多,赚钱多多! 文章网址:
http://www.mie168.com/chuangye/2007-05/209038.htm 这个是没有办法的.
他们的全文的最终构造是
http://www.mie168.com/htmlcontent.asp?htmlpath='/chuangye/2007-05/209038.htm'
或者
http://www.mie168.com/htmlconten ... /2007-05/209038.htm
或者
http://www.mie168.com/htmlcontent.asp?htmlpath="/chuangye/2007-05/209038.htm"
但是遗憾的是他们的htmlcontent.asp 不接收get值,只接收post值,所以直接构造网址是采集不到的.
[ 本帖最后由 sushy 于 2007-12-14 12:57 编辑 ]
页:
[1]