火车采集器是一款专业的互联网数据抓取、处理、分析,挖掘软件,可以灵活迅速地抓取网页中大量非结构化的文本,图片等资源信息,然后通过一系列的分析处理,准确挖掘出所需数据。并可以选择发布到网站后台、导入数据库或者保存在本地Excel,Word等格式的文件中。是目前最受欢迎的网页数据采集软件。
火车头程序目录结构:
|-Configuration用户配置保存目录 |-Synonym 用户同义词保存目录 <<<<<<< .mine |-CategoryDirweb 模块网站栏目 ======= |-CategoryDir 模块网站栏目 >>>>>>> .r480 --LoginConfig.ini登陆用户账号信息 --config.db3 任务规则配置文件 |-Data 采集数据保存目录 |-1、2、3等 任务采集数据存储目录 |-History_1,2,3 任务采集网址库存储目录 |-Module Web发布模块及数据库发布模块目录 |-Plugins c#和PHP插件存储目录 |-System 系统文件目录 |-Logs 程序错误日志 --LocoySpider.exe 火车采集器启动文件 --CodeEditor.exe 源码编辑器 --DatabaseManager.exe 数据库发布配置管理工具 --HttpPostGet.exe HTTP请求测试工具 --LocoyProxy.exe 二级代理程序 --WebPostManager.exe Web发布配置管理工具 --uninst.exe 卸载程序 --UpdateToV9.exe V7,V8升级到V9程序