首页>文库>火车采集器>火车采集器内容发布规则

火车采集器内容发布规则

一、Web在线发布

①打开Web发布配置
②选择发布模块
③对发布模块 编辑,新建,删除,导入,导出 操作
④网页编码:与要发布的网站编码,保持一致
⑤全局变量:可以在发布模块中所有位置使用,方便设置和修改某些参数。
⑥网站地址:一般指网站域名,实际操作中根据发布模块里的地址做实际调整,
需和模块里的地址组合成一个完整的绝对地址
⑦登录方式:分3种,内置浏览器登录,数据包登录,不登录。

内置浏览器登录:获取浏览器标识和用户信息。 数据包登录:填写用户名,密码以及获取到的验证码后登录。 此种方法需要发布模块里 `网站自动登录` 有对应设置。 不登录:一般对接不需要登录,或者免登陆发布接口使用。

⑧获取列表:可刷新出栏目ID 和栏目名称。需要发布模块里 获取栏目列表 有对应设置 ⑨Web发布配置列表:管理所有的Web发布配置

设置完成后即可保存配置,测试当前发布。如下图(填写自定义值,点击测试):

内容发布规则–Web在线发布 对应勾选就完成了导入到数据库的设置了。

二、导入到数据库

此功能用于将采集的数据发布到自定义的数据库里面,
本教程通过把数据导入到本地的mysql数据库为例来讲解发布模块的制作。

我们打开开始菜单——数据库发布配置,如图:

①打开数据库发布配置
②对入库模块 编辑,新建,删除,导入,导出 操作
③入库模块
④数据库链接信息配置
⑤数据库发布配置列表

我们先新建个入库模块,选择数据库类型,写好入库语句,如图:

.若是单表或多表无关联,则直接写INSERT语句即可;
2.若是多表,且存在某字段相互关联,则用[文章编号:表名XXX]来关联上一个表的自增ID;
3.自增ID字段和值需要删除,不需要写入SQL语句内

入库模块完成后,保存即可。

然后在 数据库发布管理 界面设置好链接信息,测试链接数据库,成功后。

即可保存配置,测试发布。如下图(填写自定义值,点击测试):

内容发布规则–导入到数据库 对应勾选就完成了导入到数据库的设置了。

三、保存为本地文件

支持保存为本地Excel、Txt、Word、Html、Csv类型的文件。

启用本地文件保存后,填写保存文件格式、保存方式、保存位置、文件模板、文件名格式、文件编码等
信息后点击保存即可。
注意:1、文件模板中的标签必须与规则里的标签名相对应,否则将保存出错。
2、文件模版的编码需与软件此处设置的编码保存一致,否则发布后显示乱码。
3、点击下图小箭头即可查看默认模版

下面以TXT为例,演示模版的制作

比如采集规则有上图标签,分别是:店名,点评星级,口味,环境,服务,地址,电话 那么我们对应写TXT模版如下图,标签一 一对应。

注:文件-另存为时,要注意编码。ansi编码在采集器里 文件编码对应选择GBK ,utf-8编码 文件编码对应选择UTF-8

其他模版制作原理类似。

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
购物车
优惠劵
搜索