枫树采集-TQCMS网站管理系统

插件市场 Muban

当前位置：插件市场 >

枫树采集

枫树采集

更新时间：2022-12-07编码：/ 大小：M/ 模板语言：/ 模板等级：

简介：

一款可以自动提取标题和内容还附带有api推送的采集工具...

选择使用

生成海报

详细介绍：

暂不支持PHP8！

暂不支持PHP8！！

暂不支持PHP8！！！

私信很少看

有任何问题建议在技术问答下留言

一些不足之处：

不支持php8版本推荐使用PHP7.4版本

不支持用PhantomJS运行无头浏览器加载网页进行采集

不支持图片下载到本地或OSS

不支持采集的时候支持使用代理

不支持采集的时候使用自定义cookie或ua头

不支持发起post请求，仅支持get

不支持采集api接口

必须安装迅睿CMS内容系统

安装插件后需要安装内容系统(内容系统插件在后台->应用->应用管理->内容系统 / module)
接着需要在后台->设置->内容设置->模块管理->安装文章/news 模块(news模块即迅睿官方的前台文章内容)
之后在后台->内容->内容管理->共享栏目中添加一个栏目(假如您没有任何栏目，这一步骤不可省略)

使用说明：

添加采集： 枫树采集演示

可视化xpath获取文章链接：

可视化xpath获取文章内容：

注意
如果是采集图片在得到的xpath规则后面要添加/@src
比如用可视化xpath选择图片后得到xpath规则：//[@id="post"]/img
这时候要手动在xpath规则后面加/@src
也就是//[@id="post"]/img/@src

入库设置：

采集反馈：

定时采集：
先去获取定时任务的链接

如果我想用【定时任务】去采集名称为【枫树网自动采集】的采集任务
可以看到这个采集任务的id为1
所以采集链接为：http://caiji.md5.com.cn/index.php?s=Puyicaiji&c=collect&m=run&mode=list&token=4ec546f2d22a6cfa&id=1
得到链接后就可以设置定时任务发起curl请求去定时采集了

但有两点要注意：
1.建议把PHP和NGINX的超时时间设置久一点比如300秒，如果PHP或nginx超时时间过短会导致采集失败
2.发起curl请求的时候 curl也有超时时间建议好设置为长一点比如300秒（不过还是受限于PHP和nginx的超时时间）
设置curl超时时间的命令为：
curl --max-time 300s http://caiji.md5.com.cn/index.php?s=Puyicaiji&c=collect&m=run&mode=list&token=4ec546f2d22a6cfa&id=1

以宝塔为例
每1小时执行一次采集任务
而且一次执行三个任务
采集任务id分别为1,2,3

不管是定时任务还是手动触发采集
如果文章链接已经被采集了
是不会重复采集的

其他功能：

数据处理:

全局过滤词：

百度、必应、神马的api推送：

robots生成：

文章Tag: 采集,文章
本文地址：https://www.tqcms.cn/index.php?s=cloud&c=show&id=539

商店购物插件

商店购物插件

模块内容同步到多站点

模块内容同步到多站点

文章自动压缩图片

文章自动压缩图片

百度小程序API数据推送

百度小程序API数据推送

多终端网站

多终端网站

导入微信文章

导入微信文章

chatgpt根据标题生成文章

chatgpt根据标题生成文章

售后工单系统

售后工单系统

Ckeditor编辑器

Ckeditor编辑器

SEO文章配图优化

SEO文章配图优化

Mok导出Word

IP白名单

积分付费下载_功能增强版

积分付费下载_功能增强版

后台内容管理权限

后台内容管理权限

简数采集器发布插件

简数采集器发布插件

骏豪在线教育视频培训

骏豪在线教育视频培训

签到管理

关注公众号查看更多

关注公众号查看更多

模块内容单页

模块内容单页

文章ASCII码伪原创

文章ASCII码伪原创

TQCMS网站管理系统

获取最新网站管理系统源码TQCMS

V4.6.2

TQCMS4.6.2本站下载网盘提取密码：1vqb 网盘下载地址

业务电话
一对一售前售后服务
7x24小时技术保障

模板网站
教育培训

增值服务

关于我们

案例中心

关注我们企业微信

Copyright © 2014-2022 TQCMS网站管理系统 www.tqcms.cn All Rights Reserved. 苏ICP备14050514号站点地图

建站客服