庚辛 发表于 2009-6-27 22:56:39

采集后保存为TXT出现了PageUrl: http:等这些我不想要的内容

我采集论坛的用户名,保存为TXT ,但是出现了我不想要的内容,如 缩略图:
缩略图:PageUrl: http://bbs.

   我只想要用户名,一个一行,怎么办啊?是DISCUZ接口里面随机用户名使用的。
=============================================

缩略图:
username: yinmei10
PageUrl: http://bbs.qzzn.com/read-htm-tid-10585880-fpage-5-page-3.html
缩略图:
缩略图:
username: 10梨落10
PageUrl: http://bbs.qzzn.com/read-htm-tid-10585880-fpage-5-page-2.html
缩略图:
缩略图:
username: liulikui
PageUrl: http://bbs.qzzn.com/read-htm-tid-10585880-fpage-5-page-1.html
缩略图:
缩略图:
username: fly200
PageUrl: http://bbs.qzzn.com/read-htm-tid-10382224-fpage-5-page-2.html
缩略图:
缩略图:
username: 希拉蕾
PageUrl: http://bbs.qzzn.com/read-htm-tid-10382224-fpage-5-page-1.html
缩略图:
缩略图:
username: frankpjx
PageUrl: http://bbs.qzzn.com/read-htm-tid-10510803-fpage-5-page-2.html


======================================================
我想要的格式为:

yinmei10
10梨落10
liulikui
fly200
希拉蕾
frankpjx
蜗牛飞飞




================================================
和下面的格式

10梨落10|realchj2|zxqzxqing|chen7|喜欢宝宝|xiaoyuqq|yule829|lei_0877|xiaoyuqq|月色毒药|慈眉善目|小草一棵|执手|appleivan|235859572|80473373|月色毒药|chen3950|yanbo828|馨妮sun

庚辛 发表于 2009-6-27 22:57:16

有没有办法啊?

zqhyyj20070715 发表于 2009-6-27 23:54:00

本帖最后由 zqhyyj20070715 于 2009-6-27 23:56 编辑

不是要采什么就采什么吗?你是设置采集内容错误吧。不过,火车头采集后保存为TXT时出现错误的现象我倒是常见。不知道是不是我们错误引起的。要不是,就是火车头存在这样的问题了。

wmdly 发表于 2009-6-28 00:10:24

发布模板你改了么、

庚辛 发表于 2009-6-28 12:34:22

4# wmdly


保存为txt的发布模板在哪里啊?
没有看见过啊。

发布到网站的模板跟保存为txt的是不同的吧
页: [1]
查看完整版本: 采集后保存为TXT出现了PageUrl: http:等这些我不想要的内容