cana800 发表于 2013-8-28 12:53:10

真不会了,谁能帮帮我?

真不会了,谁能帮帮我?

采集http://news.sina.com.cn/hotnews/   
我只要采集里面的新闻地址 地址以文本形式保存不要内容内容标签怎么设置都不行

内容 正则
<tr><td>(*)</td><td class='ConsTi'><a href='[参数]' target='_blank'>(*)</a></td><td>

这样采集下来出现
【内容】:"+MyNewsList['url']+"' target='_blank'"+">"+MyNewsList['title']+""+MyNewsList['media'].replace(/_稿费/g,'')+""+month+"-"+day+" "+hour+":"+min+"<!-- <a href='"+MyNewsList['comment_url']+""+data.url+"' target='_blank' "+videoNewsLeft+">"+data.title.replace(/视频:|视频:|视频-/g, '')+""+data.top_num+""+month+"-"+day+" "+hour+":"+min+"<!-- <a href='"+data.comment_url+""+MySlideList['url']+"' target='_blank'"+">"+MySlideList['title']+""+MySlideList['media'].replace(/_稿费/g,'')+""+month+"-"+day+" "+hour+":"+min+"<!-- <a href='"+MySlideList['comment_url']+""+MySlideList['url']+"' target='_blank'"+">"+MySlideList['title']+""+MySlideList['media'].replace(/_稿费/g,'')+""+month+"-"+day+" "+hour+":"+min+"<!-- <a href='"+MySlideList['comment_url']+""+MyNewsList['url']+"' target='_blank' "+">"+MyNewsList['title']+"<a href='"+MyNewsList['comment_url']+""+data.url+"' target='_blank' "+videoNewsLeft+">"+data.title.replace(/视频:|视频:|视频-/g, '')+""+data
下面采集地址正常

如果内容正则写成
内容 正则
<tr><td>1</td><td class='ConsTi'><a href='[参数]' target='_blank'>(*)</a></td><td>
采集样式正常
【内容】:http://news.sina.com.cn/c/2013-08-28/033428064602.shtml
http://news.sina.com.cn/c/2013-08-24/232128038785.shtml
http://news.sina.com.cn/c/2013-08-28/033428064602.shtml
http://news.sina.com.cn/s/2013-08-28/041928065161.shtml
http://news.sina.com.cn/w/2013-08-28/041028065077.shtml
http://video.sina.com.cn/p/news/w/v/2013-08-21/111062812115.html
http://news.sina.com.cn/c/2013-08-21/215128012171.shtml
http://news.sina.com.cn/s/2013-08-27/122928059303.shtml
http://ent.sina.com.cn/s/m/2013-08-28/03303996933.shtml
http://finance.sina.com.cn/chanjing/gsnews/20130828/023916582348.shtml
http://mil.news.sina.com.cn/2013-08-28/0533737596.html

但是只能采集到以个栏目地址 其他的只能更改<tr><td>1</td>里面的数字才可以
真弄不成了谁能帮帮我啊   谢谢各位大侠啦

cana800 发表于 2013-8-28 12:54:19

采集结果里面逛出现这些东西去不掉
】:"+MyNewsList['url']+"' target='_blank'"+">"+MyNewsList['title']+""+MyNewsList['media'].replace(/_稿费/g,'')+""+month+"-"+day+" "+hour+":"+min+"<!-- <a href='"+MyNewsList['comment_url']+""+data.url+"' target='_blank' "+videoNewsLeft+">"+data.title.replace(/视频:|视频:|视频-/g, '')+""+data.top_num+""+month+"-"+day+" "+hour+":"+min+"<!-- <a href='"+data.comment_url+""+MySlideList['url']+"' target='_blank'"+">"+MySlideList['title']+""+MySlideList['media'].replace(/_稿费/g,'')+""+month+"-"+day+" "+hour+":"+min+"<!-- <a href='"+MySlideList['comment_url']+""+MySlideList['url']+"' target='_blank'"+">"+MySlideList['title']+""+MySlideList['media'].replace(/_稿费/g,'')+""+month+"-"+day+" "+hour+":"+min+"<!-- <a href='"+MySlideList['comment_url']+""+MyNewsList['url']+"' target='_blank' "+">"+MyNewsList['title']+"<a href='"+MyNewsList['comment_url']+""+data.url+"' target='_blank' "+videoNewsLeft+">"+data.title.replace(/视频:|视频:|视频-/g, '')+""+data

cana800 发表于 2013-8-28 12:54:55

在线等啊谢谢各位啦

cana800 发表于 2013-8-28 13:12:36

没人吗 拜托啦{:soso_e179:}

303718 发表于 2013-8-28 13:27:02

这样呢
</td><td class='ConsTi'><a href='[参数]'

cana800 发表于 2013-8-28 14:10:19

【内容】:"+MyNewsList["+MyNewsList["+data.url+""+MyVideoList["+MySlideList["+MyVideoList["+MySlideList["+MyNewsList["+MyNewsList["+data.url+""+MyNewsList["+MyNewsList["+data.url+""+MyNewsList["+MyNewsList["+data.url+""+MyNewsList["+MyNewsList["+data.url+""+MyNewsList["+MyNewsList["+data.url+""+MyNewsList["+MyNewsList["+data.url+""+MyNewsList["+MyNewsList["+data.url+""+MyNewsList["+MyNewsList["+data.url+"http://news.sina.com.cn/c/2013-08-28/033428064602.shtml

cana800 发表于 2013-8-28 14:10:42

{:soso_e181:}还是不行郁闷
页: [1]
查看完整版本: 真不会了,谁能帮帮我?