PHPCMSV9 支持到0413 本人已采集了1万多文章测试无问题 文章模型免登陆接口 [免费的]
本帖最后由 非马 于 2011-5-11 00:16 编辑恩 我这是纯开源免费的 最最重要的是 我这个比别人的要好
v9的tags太让我失望了 所以转战别的cms了
留给大家个采集接口也算是造福v9众了
论坛里别人的不能统计文章点击数 这是最让人郁闷的
首先选择你的phpcms是gbk还是utf-8的
jiekou.php传到你phpcmsv9根目录下
然后修改里面第一行的密码 123456修改成你自己的
然后进入火车头 载入phpcmsv9.cwr然后把里面每一页的123456改成你自己的密码
下面我说一下详细的说明
cid=[分类ID]&title=[标签:标题]&content=[标签:内容]记住V9文章分页连接符是&author=[随机用户名]可以使用火车头的随机用户名来设置 我用的商业版 不知道你们有没有这功能&date=[标签:时间] 时间格式 2011-04-15 12:35:33&keywords=[标签:关键字]火车头内可以设置自动采集标题 或者 内容 或者标题和内容中出现频率高的指定数量的词 记住v9的关键词是,或者空格为连接符的&description=[标签:描述] 火车头可以采集文章前多少字当描述©from=[标签:来源]&pic=[标签:图片]这个就是缩略图了 采集这个图片需要在抓取列表页实现 如果要抓取的网站没有列表页缩略图 那就选上文章第一张图片当缩略图 (火车头的这个功能必须是商业版的才行貌似 图片内选择探测+下载)
支持手动分页 “paginationtype” => 2, 如果填0 是不分页1是自动分页(自动采集10000字符数为一页)2是手动分页 (如果文章内有必须手动分页才能显示效果)
**** Hidden Message ***** 本帖最后由 非马 于 2011-4-22 22:20 编辑
今天采集了1万的数据 3g的图片 无错 链接不用更新 无错
由于火车头的采集器是FTP上传采集的图片的 无法实现图片加水印的方法 这个问题也一直困扰着我 好在我们有百度大神么 搜了一下找到一篇关于linux下批量添加指定文件夹下指定格式水印的方法 绕口 晕....
首先要安装Imagemagick
CentOS上安装
yum install ImageMagick -y
Debian上安装
apt-get install ImageMagick -y
脚本:
#!/bin/bash
for each in /要处理的图片目录/*{.jpg,.gif}
do
s=`du -k $each | awk '{print $1}'`
if [ $s -gt 10 ]; then
#convert -quality 80 -resize 600x800 $each $each
composite -gravity southeast -dissolve 80 /水印目录/mark.jpg $each $each 2>/dev/null
echo "$each: done!"
fi
done
exit 0
主要是脚本 我们来分析一下
convert -quality 80 -resize 600x800 $each $each
这个是进行图片缩小的
-quality 80 代表图片质量
600x800 图片的大小 600宽X800高
不需要的去掉就好!
composite -gravity southeast -dissolve 80 /水印目录/mark.jpg $each $each 2>/dev/null
这句是加图片水印的
-gravity southeast 图片水印的位置south就是南east就是东也就是图片的右下角
-dissolve 80这个是设置水印的透明度的.越小越透明.
/水印目录/mark.jpg 水印图片的位置
if [ $s -gt 10 ] 判断图片大小 小于10K的不加水印
for each in /要处理的图片目录/*{.jpg,.gif}需要加水印的目录 需要加水印的文件格式
上面文件配置好之后保存为watermark.sh
然后运行就好 sh ./watermark.sh 听起来不错~~~~~支持 广告位出租ali68ls 想学习,谢谢,看看谢谢 新的吗?好用不学习一下! 是吗,支持多网站吗? tags太让我失望了。付了钱还不让用。。。。准备不用了 111111133333的身份的撒 好用不学习一下!