火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 4180|回复: 3

【求助】采集结果由一级网址和二级网址的内容拼接而成

[复制链接]
发表于 2010-6-11 19:05:54 | 显示全部楼层 |阅读模式
1火车车厢
本帖最后由 xiao12 于 2010-6-11 19:16 编辑

本人由于学位论文需要需要采集数据进行分析,希望各位大牛帮忙,小女子感激不尽~~~~
查看教程发现可以实现“使用多页同时采集多个页面”,但只能由一个确定的默认网址进行关联。

我的需求稍微要复杂一点,默认网址的结构如下所示,据此可以采集到每条微博的内容、作者。

但我希望结果还包含作者的其他信息(如所在城市、标签等),而这些信息可根据链接(如http://t.sina.com.cn/bingcon)到微博作者的详细页面采集,有什么方法能够把最后结果整合为“内容、作者、作者所在城市”呢?

  1. <ul class="MIB_feed">
  2.   <li class="MIB_linedot2">
  3.     <p class="sms" mid="21110061116485" type="1">
  4.       <a href="http://t.sina.com.cn/bingcon">大小鱼炳</a>:
  5.       看车展 迎世界杯 现代ix35 世界杯
  6.     </p>
  7.   </li>
  8.   <li class="MIB_linedot2">
  9.     <p class="sms" mid="21110061116500" type="1">
  10.       <a href="http://t.sina.com.cn/1747530103">小云深深</a>:
  11.       一个拒绝别人圈钱失去发财机会的故事(股市神话东方一千零一夜)
  12.     </p>
  13.   </li>
  14. </ul>
复制代码

发表于 2010-6-11 21:56:03 | 显示全部楼层
联系QQ详谈  979514383
发表于 2010-6-13 12:59:09 | 显示全部楼层
多页采集可以解决 qq 1073313989
发表于 2010-6-25 20:47:09 | 显示全部楼层
找人写火车头发布模板联系qq748354404
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-6-21 03:36

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表