火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 3310|回复: 4

JS列表翻页,如何将列表中部分资料与二级链接内容合采成一条数据?

[复制链接]
发表于 2009-2-27 12:54:55 | 显示全部楼层 |阅读模式
本帖最后由 lyj16900 于 2009-2-27 14:03 编辑

  使用的是JS转跳下一页列表方式.
  现在需要将列表中"地区"字段数据与同一行的二级链接中的数据一起合成采集成一条数据,
  请教如果操作?(二级链接中的数据中,没有"地区"这一信息).

即将:
广东-广州-  和在 /html/2009-02/91/aaa.htm 链接中采集到的内容合成一条记录
广州-佛山-  和在 html/2009-02/28/bbb.html 链接中采集到的内容合成一条记录

应该不需要分二次采集再将两将采集的数据手动合并吧?

以下是首页列表中的部分代码:
-----------------------------------------

</script>
<!--列表开始-->
        <div class="listTitle"><span class="tongji">共计:455项</span>  
   

</div>
    <div class="listBox">
            <div class="listTitleRow">
                <ul>
                    <li class="b">类型</li>
                <li class="c">地区</li>
                <li class="d">公司名称</li>
                <li class="e">公司电话</li>
                <li class="f">联系人</li>
                <li class="g">手机号</li>
            </ul>
        
        </div>


      
        <div class="listContentRow">
           <ul>
                    <li class="b">原料供应商
            
                </li>
                <li class="c">

广东-广州-
                </li>
                <li class="d"><a href="/html/2009-02/91/aaa.html" target="_blank">广州**有限公司</a></li>
                <li class="e"> </li>
                <li class="f">齐</li>
                <li class="g">13510101010</li>
            </ul>
        
        </div>
      
        <div class="listContentRow">
           <ul>
                    <li class="b">配件供应

                </li>
                <li class="c">

广东-佛山-
               
                </li>
                <li class="d"><a href="/html/2009-02/28/bbb.html" target="_blank">***实业有限公司</a></li>
                <li class="e"></li>
                <li class="f">罗先生</li>
                <li class="g">13823352333</li>
            </ul>
        
        </div>
发表于 2009-2-27 13:43:13 | 显示全部楼层
2009版自定义网址中正好有这功能,不过我没用过,不知道对免费版来说是不是摆设
 楼主| 发表于 2009-2-27 14:26:57 | 显示全部楼层
非常感谢 soarb的回复,
你指的是不是在"采集地址规则"中, "手动填写链接地址规则"->自定义链接格式对吗?

我想做的是:先采集列表页中A记录的数据,然后采集A记录中下一个链接的数据,最后把A记录数据+A记录下一链接数据合成一条采集数据出来.
 楼主| 发表于 2009-2-27 15:28:22 | 显示全部楼层
呵呵,最差的办法就是,分做两次采集,并以二级链接地址做为匹配字段写个语句判断一下将两个采集到的数据库合并起来.  要是数据量大的话这样可非常的头痛的.

想看看火车头能不能一步搞定
在2009的->手动填写链接地址->启用自定义连接格式得到地址->[标签XXX]的"新功能标签"有这样的描述:
以前仅能通过自定义格式在列表页采集到网址和缩略图,2009版起,可以自设置标签,在采集网址的同时采集列表页的内容,并同时可以保存到数据库内,发布时该标签和在内容页规则内定义的标签调用方式相同

可惜不能完成我这样的任务
 楼主| 发表于 2009-2-27 22:57:07 | 显示全部楼层
自己再顶一下,有老手介绍个好方法吗?
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-8-30 10:36

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表