5元钱采集一个很简单的网站
5元钱采集一个很简单的网站,一个很简单的网站。http://enews.bsyjrb.com/baise/index_2.html
http://enews.bsyjrb.com/baise/index_6.html
就采集上面的栏目得了,
要求采集标题,时间,作者(不规则的可以不采集),新闻的内容。
特别要求:在新闻的内容中采集进这个新闻的网址,如:
http://enews.bsyjrb.com/baise/2011_02_10_82889.html这个网页:
采集内容如下:
标题:乐业:立足特色旅游业 增强县域经济发展活力
力争2011年旅游综合收入突破8000万元
时间:2011-2-10 11:05:36
作者:顾桂源
内容:本网乐业讯(通讯员 顾桂源)2011年是中国共产党成立90周年,也是“十二五”开局之年。在此机遇与发展并存时期
文章出处:http://enews.bsyjrb.com/baise/2011_02_10_82889.html
我差不多弄好了,只是比较忙,没有时间完善,谁有空的,我愿意出5元。 联系我 qq:358-46-46 {:4_180:}有高手帮忙吗?
帮我一下啊 联系QQ:284145780 ...额滴神。呐,为了5块钱。。哎。。 主要是这个确实很简单!
规则神马的都很好写!
添加网址那个我不知道专门弄!
HOHO……问一下 混饭吃艰难啊{:1_201:} 向你们学习了我正在学习规则 添加原文链接找到了……
新建标签……
正则匹配内容:(?<content>[\s\S]*?)$
就有了!
页:
[1]