火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2154|回复: 4

怎么在列表页关联用户名采集

[复制链接]
发表于 2010-10-15 16:33:58 | 显示全部楼层 |阅读模式
我设置帖子列表页为默认页,采集深度为0
默认页的页面部分源码如下

这只是列表项中的一项:
  1. <tr id='bg110830'>
  2.                                                                         <td class="TextLineHeight"><a href='/B2B/Buy/Detail/2010/10/15/110830.shtml' class="ProductName" target="_blank">日本冬青,数量2000棵</a>(2010-10-15)<br>
  3.                                                                                 日本冬青,数量2000棵,高度要求1.2-1.5M,另要求2分叉以上,请短信报价,注明价格,联..
  4.                                                                                 <br>
  5.                                                                                 <a href='http://peipei315.yuanlin.com'  target='_blank'>裴文俊(个体经营)</a> <span class='AltText'></span>
  6.                                                                                 <br>
  7.                                                                                 <a href='http://peipei315.yuanlin.com/' title='会员商铺' target='_blank' class='ListLookSite'>查看会员商铺</a>
  8.                                                                         </td>
  9.                                                                         <td align="center">江苏/常州</td>
复制代码
我想要采集到 代码最后一行的 常州,
因为列表项的每条信息都是不同的,所以应该采集到的地址也是不同的。
我的问题就是:怎么将这个地址和用户名关联起来?

麻烦各位大侠指点一二。。
 楼主| 发表于 2010-10-15 16:38:41 | 显示全部楼层
按正常的采集的话 只能是要么把页面上的地址信息全部采集出来,要么设置只采集一条 这样就只能采集第一个匹配项了,我想采集对应的项
发表于 2010-10-15 21:26:26 | 显示全部楼层
使用正则去采集就好了
 楼主| 发表于 2010-10-16 16:26:59 | 显示全部楼层
回复 3# zjyk1984

麻烦问下 免费版的 正则表达式里边支持标签吗?
发表于 2010-10-16 17:27:26 | 显示全部楼层
给你个思路可以这样做
<tr id='*'>* <td align="center">【参数】</td>
第一个*以防ID是变的
第二个*过滤中间内容
参数是采集最后的
中间都类似
不明白联系我 17547523
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

企业微信|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2026-5-3 20:09

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表