火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2643|回复: 8

请问这个规则要怎么采集

[复制链接]
发表于 2008-11-7 09:14:26 | 显示全部楼层 |阅读模式
比如说网页http://www.xxxxx.com
我在首页中查到了内容页
http://www.xxxxx.com/index/html/20081106201833000006666.shtml
这是内容页地址

然后在内容页里面
又出现了
<td align="center"><a href=/play_p2p.shtml?id=39023 target=_blank class="playlist">xxxxxxxx</a></td>

这样的数据
我要得到  /play_p2p.shtml?id=39023 换成参数

请问这个规则要怎么来写>?



另外问一下..火车头有没有字符串比对.?

比如说  我换取页面上有个商品  类型是衣服
我得到衣服2个字与后台进行内容字符串比对
比对有衣服  就加入到衣服这个分类里面去
请问有没有这个功能

[ 本帖最后由 xintuo 于 2008-11-7 09:24 编辑 ]
 楼主| 发表于 2008-11-7 10:36:41 | 显示全部楼层
就没有一个人帮忙回答一下么...
好冷清的论坛
发表于 2008-11-7 11:21:31 | 显示全部楼层
你只给了这么点资料,怎么去回答呢?按你这种表达,只能这样写<td align="center"><a href=[参数] target=_blank class="playlist">   在另一边就直接写一个[参数1]
 楼主| 发表于 2008-11-7 11:54:00 | 显示全部楼层
那我贴完整一点
<tr>
  <td width=100><a href=/index/html/20081106035552000006661.shtml target=_blank><img src=/upload/2008110603524269318.jpg class=pic style="BORDER-RIGHT: #DDDDDD 1px solid; BORDER-TOP: #DDDDDD 1px solid; BORDER-LEFT: #DDDDDD 1px solid; BORDER-BOTTOM: #DDDDDD 1px solid;width:90px;height:120px;"></a></td>
  <td width=161 valign=top><table border=0 align=center cellpadding=0 cellspacing=0 width="100%">
   <tr>
    <td height=5></td>
   </tr>
   <tr>
    <td><b><a class=qt target=_blank href=/index/html/20081106035552000006661.shtml>购物惊魂记/勇妇智斗暴徒</a></b> <img src=/images/film.jpg border=0 /></td>
   </tr>
   <tr>
    <td height=10></td>
   </tr>
   <tr>
    <td><b>类别:</b>惊悚片</td>
   </tr>
   <tr>
    <td><b>主演:</b>金·贝辛格 </td>
   </tr>
   <tr>
    <td><b>上传:</b>2008-11-6</td>
   </tr>
   <tr>
    <td><b>地区:</b>欧美</td>
   </tr>
   <tr>
    <td height=25><a href=/index/html/20081106035552000006661.shtml target=_blank><img border=0 src=/images/watch.jpg /></a></td>
   </tr>
  </table></td>
  <td width="300" valign="top" bgcolor=#FAFDF5 align=center><table border=0 align=center cellpadding=0 cellspacing=3 width=296>
   <tr>
    <td><b>内容介绍:</b></td>
   </tr>
   <tr>
    <td align=left height=110 valign=top style="line-height:120%">一位在郊区生活的家庭主妇在去往商场的途中,必须经过一片荒凉的森林,在那里,她遇到了四名危险的暴徒。为了生存,她必须想尽办法保护自己,而她仅有的只是一个工具箱和强烈的求生意志。<BR></td>
   </tr>
  </table></td>
</tr>
<tr>
  <td height=3></td>
</tr>
<tr>
  <td colspan=3 height=1 background=/images/dashed.gif></td>
</tr>


这一段是重复的
拿数据的地方
用我自己的自定义方法连接
<tr>
  <td width=100><a href=[参数] target=_blank><img src=[缩略图] class=pic
获取到了地址以及图
然后得到了下级地址
红色部分
进入二级地址里面获取内容

<td align="center"><a href=/play_p2p.shtml?id=60991 target=_blank class="playlist">xxxxx</a></td>
        <td align="center"><a href=/play_p2p.shtml?id=60992 target=_blank class="playlist">xxxxx</a></td>


我现在有获取这个红色部分
应该怎么去获取?
 楼主| 发表于 2008-11-7 15:45:49 | 显示全部楼层
还是没人回答我...
发表于 2008-11-7 19:33:12 | 显示全部楼层
学习中,,,,],,,,,
发表于 2008-11-7 19:33:45 | 显示全部楼层
谁能教我采集小说到我的论坛(5d6d社区的)



50RMB找人教我用采集器采集小说..教会我用
QQ470474830
发表于 2008-11-8 11:23:08 | 显示全部楼层
看看,哦,原来是这样!这样一来应该不难解决的!
 楼主| 发表于 2008-11-11 09:33:15 | 显示全部楼层
是不够详细
还是这个软件论坛
根本没人帮?
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-7-17 03:50

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表