aping32
发表于 2010-8-10 19:10:21
回复 6# zhgggs
文件太大,还是发你邮箱好点,自己上去查下,谢谢支持!!!
alixiu
发表于 2010-8-15 17:32:18
楼主能提供QQ或者其他联系方式?有点小问题请教一下
xxts520
发表于 2010-8-15 21:46:19
所采集地址:http://www.lwwmw.net/otype.asp?classid=6&owen2=创建全省未成年人思想道德建设先进城市
采集要求:采集“创建全省未成年人思想道德建设先进城市”栏目里两页内容
采集字段:文章内容
标题:只采集文章标题
时间:文章发布时间
QQ:24361301
alixiu
发表于 2010-8-16 22:24:21
采集规则不是应该是ljob文件么?怎么是mdb的?如何操作?
benls
发表于 2010-9-3 15:32:38
楼主你好!
这样的页面内容你能否采集到全部内容,http://www.100md.com/Html/Dir0/13/74/24.htm
需要登录,火车头就是设置了登录,取到cokie值还是采集不到真正的内容页内容,这个对我这种新手来说有点难度,希望得到您的帮助,谢谢!
smart2003
发表于 2010-9-3 15:59:19
你好,我要抓取一个网站的若干数据信息,该网站要抓取网页的URL特点是这样的http://www.ggsoso.com/price.asp?cityid=(参数1)&blockid=(参数2)&date=(参数3)
其中参数1和参数2是一系列数字,但不是连续的数字;参数3是时间,如2010-9-3
请问这个抓取地址应该如何写?非常感谢
基溥
发表于 2010-9-14 21:44:58
所采集地址:http://www.zappos.com/womens-ugg
采集要求:内容 图片 去掉超链接
采集字段:文章内容
标题:只采集文章标题
内容:
谢谢了
我就看怎么写规则的
QQ:123556699
pengan
发表于 2010-9-25 12:51:22
所采集地址:http://www.91feizhuliu.com/feizhuliumeinv/1-1.html
采集要求:采集图片
采集字段:
标题:
内容:
heimofa
发表于 2010-11-4 23:00:05
所采集地址:http://www.feiku.com/Book/LN/136.html
采集要求:只要采集出来的是以书名格式显示的而不是章节显示的就可以了
标题:只采集文章标题
内容:不要超链接和图片
时间:发布时间
QQ:651413315
好了的话可以直接邮箱!谢谢!
china0475
发表于 2010-11-17 10:31:33
谢谢先帮我写一个吧
所采集的地址:
采集 要求:所有电器内容分类按京东360来
采集 字段:
例如:
所采集地址:http://www.360buy.com/electronic.html
采集要求:采集哪些分类
要过滤哪些标签,外部连接
要采集的页面等。www.360buy.com/electronic.html
采集字段:
标题: 所有分页里的内容
内容:
回复:
时间: