真不会了,谁能帮帮我?
真不会了,谁能帮帮我?采集http://news.sina.com.cn/hotnews/
我只要采集里面的新闻地址 地址以文本形式保存不要内容内容标签怎么设置都不行
内容 正则
<tr><td>(*)</td><td class='ConsTi'><a href='[参数]' target='_blank'>(*)</a></td><td>
这样采集下来出现
【内容】:"+MyNewsList['url']+"' target='_blank'"+">"+MyNewsList['title']+""+MyNewsList['media'].replace(/_稿费/g,'')+""+month+"-"+day+" "+hour+":"+min+"<!-- <a href='"+MyNewsList['comment_url']+""+data.url+"' target='_blank' "+videoNewsLeft+">"+data.title.replace(/视频:|视频:|视频-/g, '')+""+data.top_num+""+month+"-"+day+" "+hour+":"+min+"<!-- <a href='"+data.comment_url+""+MySlideList['url']+"' target='_blank'"+">"+MySlideList['title']+""+MySlideList['media'].replace(/_稿费/g,'')+""+month+"-"+day+" "+hour+":"+min+"<!-- <a href='"+MySlideList['comment_url']+""+MySlideList['url']+"' target='_blank'"+">"+MySlideList['title']+""+MySlideList['media'].replace(/_稿费/g,'')+""+month+"-"+day+" "+hour+":"+min+"<!-- <a href='"+MySlideList['comment_url']+""+MyNewsList['url']+"' target='_blank' "+">"+MyNewsList['title']+"<a href='"+MyNewsList['comment_url']+""+data.url+"' target='_blank' "+videoNewsLeft+">"+data.title.replace(/视频:|视频:|视频-/g, '')+""+data
下面采集地址正常
如果内容正则写成
内容 正则
<tr><td>1</td><td class='ConsTi'><a href='[参数]' target='_blank'>(*)</a></td><td>
采集样式正常
【内容】:http://news.sina.com.cn/c/2013-08-28/033428064602.shtml
http://news.sina.com.cn/c/2013-08-24/232128038785.shtml
http://news.sina.com.cn/c/2013-08-28/033428064602.shtml
http://news.sina.com.cn/s/2013-08-28/041928065161.shtml
http://news.sina.com.cn/w/2013-08-28/041028065077.shtml
http://video.sina.com.cn/p/news/w/v/2013-08-21/111062812115.html
http://news.sina.com.cn/c/2013-08-21/215128012171.shtml
http://news.sina.com.cn/s/2013-08-27/122928059303.shtml
http://ent.sina.com.cn/s/m/2013-08-28/03303996933.shtml
http://finance.sina.com.cn/chanjing/gsnews/20130828/023916582348.shtml
http://mil.news.sina.com.cn/2013-08-28/0533737596.html
但是只能采集到以个栏目地址 其他的只能更改<tr><td>1</td>里面的数字才可以
真弄不成了谁能帮帮我啊 谢谢各位大侠啦 采集结果里面逛出现这些东西去不掉
】:"+MyNewsList['url']+"' target='_blank'"+">"+MyNewsList['title']+""+MyNewsList['media'].replace(/_稿费/g,'')+""+month+"-"+day+" "+hour+":"+min+"<!-- <a href='"+MyNewsList['comment_url']+""+data.url+"' target='_blank' "+videoNewsLeft+">"+data.title.replace(/视频:|视频:|视频-/g, '')+""+data.top_num+""+month+"-"+day+" "+hour+":"+min+"<!-- <a href='"+data.comment_url+""+MySlideList['url']+"' target='_blank'"+">"+MySlideList['title']+""+MySlideList['media'].replace(/_稿费/g,'')+""+month+"-"+day+" "+hour+":"+min+"<!-- <a href='"+MySlideList['comment_url']+""+MySlideList['url']+"' target='_blank'"+">"+MySlideList['title']+""+MySlideList['media'].replace(/_稿费/g,'')+""+month+"-"+day+" "+hour+":"+min+"<!-- <a href='"+MySlideList['comment_url']+""+MyNewsList['url']+"' target='_blank' "+">"+MyNewsList['title']+"<a href='"+MyNewsList['comment_url']+""+data.url+"' target='_blank' "+videoNewsLeft+">"+data.title.replace(/视频:|视频:|视频-/g, '')+""+data 在线等啊谢谢各位啦 没人吗 拜托啦{:soso_e179:} 这样呢
</td><td class='ConsTi'><a href='[参数]' 【内容】:"+MyNewsList["+MyNewsList["+data.url+""+MyVideoList["+MySlideList["+MyVideoList["+MySlideList["+MyNewsList["+MyNewsList["+data.url+""+MyNewsList["+MyNewsList["+data.url+""+MyNewsList["+MyNewsList["+data.url+""+MyNewsList["+MyNewsList["+data.url+""+MyNewsList["+MyNewsList["+data.url+""+MyNewsList["+MyNewsList["+data.url+""+MyNewsList["+MyNewsList["+data.url+""+MyNewsList["+MyNewsList["+data.url+"http://news.sina.com.cn/c/2013-08-28/033428064602.shtml {:soso_e181:}还是不行郁闷
页:
[1]