idaydayup 发表于 2010-10-15 16:33:58

怎么在列表页关联用户名采集

我设置帖子列表页为默认页,采集深度为0
默认页的页面部分源码如下

这只是列表项中的一项:<tr id='bg110830'>
                                                                        <td class="TextLineHeight"><a href='/B2B/Buy/Detail/2010/10/15/110830.shtml' class="ProductName" target="_blank">日本冬青,数量2000棵</a>(2010-10-15)<br>
                                                                                日本冬青,数量2000棵,高度要求1.2-1.5M,另要求2分叉以上,请短信报价,注明价格,联..
                                                                                <br>
                                                                                <a href='http://peipei315.yuanlin.com'target='_blank'>裴文俊(个体经营)</a> <span class='AltText'></span>
                                                                                <br>
                                                                                <a href='http://peipei315.yuanlin.com/' title='会员商铺' target='_blank' class='ListLookSite'>查看会员商铺</a>
                                                                        </td>
                                                                        <td align="center">江苏/常州</td> 我想要采集到 代码最后一行的 常州,
因为列表项的每条信息都是不同的,所以应该采集到的地址也是不同的。
我的问题就是:怎么将这个地址和用户名关联起来?

麻烦各位大侠指点一二。。

idaydayup 发表于 2010-10-15 16:38:41

按正常的采集的话 只能是要么把页面上的地址信息全部采集出来,要么设置只采集一条 这样就只能采集第一个匹配项了,我想采集对应的项

zjyk1984 发表于 2010-10-15 21:26:26

使用正则去采集就好了

idaydayup 发表于 2010-10-16 16:26:59

回复 3# zjyk1984

麻烦问下 免费版的 正则表达式里边支持标签吗?

lypying 发表于 2010-10-16 17:27:26

给你个思路可以这样做
<tr id='*'>* <td align="center">【参数】</td>
第一个*以防ID是变的
第二个*过滤中间内容
参数是采集最后的
中间都类似
不明白联系我 17547523
页: [1]
查看完整版本: 怎么在列表页关联用户名采集