mmzhuzhu 发表于 2011-5-16 14:25:16

30 RMB 求采集内容为被采集页加载中的TXT

本帖最后由 mmzhuzhu 于 2011-5-16 14:28 编辑

30 RMB 求采集内容为被采集页加载中的TXT

列表页获取后,获取了被采集文章页内容,

在被采集文章页里获取了标题,而这文章页是内容是加载另一个TXT里的文章的。求这个规则。

http://www.kenwen.com/cview/27/27799/index.html被采集的列表页。
http://www.kenwen.com/cview/27/27799/3375877.html   被采集的内容页。
被采集的内容页有2个被采集的项目。
1是标题 <h1>内容</h1>
   2是 /27/27799/3375877.txt这个TXT里的内容。

qq四八二八七八

272070210 发表于 2011-5-16 15:27:16

你好。可以联系我QQ272070210

zayautov 发表于 2011-5-16 16:59:33

你好 广州火车头采集   284145780
页: [1]
查看完整版本: 30 RMB 求采集内容为被采集页加载中的TXT