aping32 发表于 2010-8-10 19:10:21

回复 6# zhgggs


    文件太大,还是发你邮箱好点,自己上去查下,谢谢支持!!!

alixiu 发表于 2010-8-15 17:32:18

楼主能提供QQ或者其他联系方式?有点小问题请教一下

xxts520 发表于 2010-8-15 21:46:19

所采集地址:http://www.lwwmw.net/otype.asp?classid=6&owen2=创建全省未成年人思想道德建设先进城市
采集要求:采集“创建全省未成年人思想道德建设先进城市”栏目里两页内容
采集字段:文章内容
标题:只采集文章标题
时间:文章发布时间
QQ:24361301

alixiu 发表于 2010-8-16 22:24:21

采集规则不是应该是ljob文件么?怎么是mdb的?如何操作?

benls 发表于 2010-9-3 15:32:38

楼主你好!
这样的页面内容你能否采集到全部内容,http://www.100md.com/Html/Dir0/13/74/24.htm
需要登录,火车头就是设置了登录,取到cokie值还是采集不到真正的内容页内容,这个对我这种新手来说有点难度,希望得到您的帮助,谢谢!

smart2003 发表于 2010-9-3 15:59:19

你好,我要抓取一个网站的若干数据信息,该网站要抓取网页的URL特点是这样的http://www.ggsoso.com/price.asp?cityid=(参数1)&blockid=(参数2)&date=(参数3)
其中参数1和参数2是一系列数字,但不是连续的数字;参数3是时间,如2010-9-3
请问这个抓取地址应该如何写?非常感谢

基溥 发表于 2010-9-14 21:44:58

所采集地址:http://www.zappos.com/womens-ugg

采集要求:内容 图片 去掉超链接

采集字段:文章内容
标题:只采集文章标题
内容:

谢谢了

我就看怎么写规则的

QQ:123556699

pengan 发表于 2010-9-25 12:51:22

所采集地址:http://www.91feizhuliu.com/feizhuliumeinv/1-1.html

采集要求:采集图片

采集字段:
标题:
内容:

heimofa 发表于 2010-11-4 23:00:05

所采集地址:http://www.feiku.com/Book/LN/136.html

采集要求:只要采集出来的是以书名格式显示的而不是章节显示的就可以了
标题:只采集文章标题
内容:不要超链接和图片
时间:发布时间
QQ:651413315
好了的话可以直接邮箱!谢谢!

china0475 发表于 2010-11-17 10:31:33

谢谢先帮我写一个吧
所采集的地址:
采集    要求:所有电器内容分类按京东360来
采集    字段:

例如:
所采集地址:http://www.360buy.com/electronic.html
采集要求:采集哪些分类
要过滤哪些标签,外部连接
要采集的页面等。www.360buy.com/electronic.html


采集字段:
标题: 所有分页里的内容
内容:
回复:
时间:
页: 1 [2] 3 4
查看完整版本: 免费写火车头规则!!!