申请会员
登录
搜索
帮助
火车采集器|信息数据采集论坛
»
采集器讨论区
» 【立杆】本人免费为菜鸟写规则,要规则的进来,包写【新加小说规则讲解】
‹‹ 上一主题
|
下一主题 ››
35
‹‹
1
2
3
4
发新话题
发布投票
发布商品
发布悬赏
发布活动
发布辩论
发布视频
打印
[3.2版]
【立杆】本人免费为菜鸟写规则,要规则的进来,包写【新加小说规则讲解】
史巴托的腹肌
还是腹肌
VIP(标准)用户
就一块腹肌
UID
9615
帖子
502
活跃度
812 点
火车车厢
1 节
注册时间
2006-12-9
个人空间
发短消息
加为好友
当前离线
31楼
大
中
小
发表于 2008-10-1 15:30
只看该作者
这名字取的好 立杆
史巴托的腹肌
^
^
^
^
^
^
^
^
^
^
^
^
盘龙
老婆爱上我
网游小说
免费小说
UID
9615
帖子
502
精华
0
积分
852
活跃度
812 点
火车车厢
1 节
阅读权限
100
在线时间
1545 小时
注册时间
2006-12-9
最后登录
2008-11-27
查看详细资料
TOP
shuiyuai
注册会员
UID
93355
帖子
7
活跃度
7 点
火车车厢
0 节
注册时间
2008-9-16
个人空间
发短消息
加为好友
当前离线
32楼
大
中
小
发表于 2008-10-6 18:02
只看该作者
不知道楼主还帮新手写不,写谢过了
http://www.cnwebmasters.com/forumdisplay.php?fid=11
这个网址打开后,按发布时间排序
采集从第10页到第20页就行
UID
93355
帖子
7
精华
0
积分
7
活跃度
7 点
火车车厢
0 节
阅读权限
10
在线时间
20 小时
注册时间
2008-9-16
最后登录
2008-11-13
查看详细资料
TOP
creazywing
注册会员
UID
76292
帖子
16
活跃度
28 点
火车车厢
1 节
注册时间
2007-12-13
个人空间
发短消息
加为好友
当前离线
33楼
大
中
小
发表于 2008-10-6 21:01
只看该作者
以下红色部分为需要的提取的参数,请问正则规则怎么写啊?谢谢
</tr>
<tr>
<td class="lb6" smallfont" align="left">
<span class="texthigh"></span>
</td>
<td class="lb6">
2008-10-06
</td>
<td class="lb6">
<span class="hotlink" >
<span class="texthigh"></span>
航空航天制造业行业:神舟7号发射,中国载人航天的又一大步
</span>
</td>
<td class="lb6">
<span class="texthigh"></span>
中投证券
</td>
<td class="lb6">
<span class="texthigh"></span>
真怡
</td>
<td class="lb6" align="center">
<a href="
YCPJYW.aspx?user=&guid=&wjs=00000028100603.pdf
">
<img alt="" src='img/filetype/pdf.gif' align="middle" style='cursor:hand;border:0px;' />
</a>
</td>
</tr>
<tr>
UID
76292
帖子
16
精华
0
积分
28
活跃度
28 点
火车车厢
1 节
阅读权限
10
在线时间
115 小时
注册时间
2007-12-13
最后登录
2008-10-29
查看详细资料
TOP
Kyung
注册会员
UID
95238
帖子
7
活跃度
9 点
火车车厢
1 节
注册时间
2008-10-5
个人空间
发短消息
加为好友
当前离线
34楼
大
中
小
发表于 2008-10-6 21:23
只看该作者
採集網址:
http://bbs.wefong.com/forumdisplay.php?fid=147
採集要求:只要能正常顯示文章即可
拜託大大囉,這下我就可以有得參考囉
真的是辛擾你了
UID
95238
帖子
7
精华
0
积分
9
活跃度
9 点
火车车厢
1 节
阅读权限
10
在线时间
35 小时
注册时间
2008-10-5
最后登录
2008-10-11
查看详细资料
TOP
webgenius
注册会员
UID
95194
帖子
6
活跃度
12 点
火车车厢
0 节
注册时间
2008-10-5
个人空间
发短消息
加为好友
当前离线
35楼
大
中
小
发表于 2008-10-7 18:25
只看该作者
楼主,麻烦你了.为了这个,我已经折腾了24小时还是没有搞定:
采集网址:
http://aminophenol.spaces.live.com/blog/
采集要求:采集上面所有的博文,只采集标题和文章即可
遇到的问题:不知道如何得到博文链接,因为博文(固定链接)的地址没有规律
采集到的标题为乱码(已经尝试过所有的编码,看的出来,MSN的是UTF8,我的网站是GBK,都不行)
UID
95194
帖子
6
精华
0
积分
12
活跃度
12 点
火车车厢
0 节
阅读权限
10
在线时间
55 小时
注册时间
2008-10-5
最后登录
2008-10-14
查看详细资料
TOP
‹‹ 上一主题
|
下一主题 ››
35
‹‹
1
2
3
4
论坛管理及公告
论坛记事、活动、培训区
火车采集器交流与讨论
程序发布
悬赏求助区
采集器讨论区
原1.X版本子讨论区
原2.0版本子讨论区
使用教程区
模块资源区
原1.2.0/1.2.1版本模块保留区
站点任务规则资源区
原1.X版本规则保留区
原2.0版本规则保留区
BUG报告
采集器资源求购区
程序建议区
各种CMS,论坛讨论区(与3.2发布同时开设)
Discuz! | & Supsite
PHPWind & VeryCMS
PHPCMS
DedeCMS
Powereasy动易
Foosun风讯
HBCMS
Dvbbs & DvPHP
WordPress 等Blog程序
Joomla等国外程序
ECMS帝国
新云程序
站长交流区
建站交流
网站赚钱
SEO技术交流
网站系统经验分享
火车域名注册
控制面板首页
编辑个人资料
积分交易
积分记录
公众用户组
个人空间管理
基本概况
流量统计
客户软件
发帖量记录
版块排行
主题排行
发帖排行
积分排行
交易排行
在线时间
管理团队
管理统计
Powered by
Discuz!
6.0.0
© 2001-2007
Comsenz Technology Ltd
Processed in 0.185804 second(s), 6 queries, Gzip enabled
当前时区 GMT+8, 现在时间是 2008-12-2 08:05
皖ICP备06000549
清除 Cookies
-
联系我们
-
火车采集器官方站
-
静态归档
>
界面风格
----------
默认风格
喝彩奥运
深邃永恒
粉妆精灵
诗意田园
春意盎然