广告合作
  • 今日头条

    今日头条

  • 百度一下

    百度一下,你就知道

  • 新浪网

    新浪网 - 提供新闻线索,重大新闻爆料

  • 搜狐

    搜狐

  • 豆瓣

    豆瓣

  • 百度贴吧

    百度贴吧——全球领先的中文社区

  • 首页 尚未审核订阅工具 订阅

    火车头自定义文章批量发布上传

    来源:网络收集  点击:  时间:2024-08-12
    【导读】:
    虽然人人都知道互联网提倡原创精神,也有少部分行业/站长避免不了与采集打交道,特别是在百度的算法更新后,采集站越来越难以生存,采集站长们也被迫面临一些新的选择。这里虽然给大家介绍一些有关采集的知识经验,也并不是希望大家走上采集站的道路,只是借由一种经验方法来拓展大家的视野,分享一些建站的小技巧。说到采集站其实工具也很多,有免费也有收费,有传统的命令行形式也有经过美化的界面软件,无论哪一种其工作原理都是大同小异:分析目标链接采集储存本地数据库发布,这里介绍的一种就是使用人数较多操作也相对而言比较简单的火车头采集器。大部分站长都具备一些html+css知识,应对采集器的基本链接分析和内容截取应该不成问题,甚至有些朋友对此一无所知也能熟练的把数据采集到本地,但在发布到网站后台时却往往难以弄懂其中原理,特别是在开源后台更新较频繁,接口更换时需要自定义发布规则时,火车头的发布规则简直成了采集站长的拦路虎,甚至不乏有人在威客平台付费编写发布规则等等。工具/原料more火车头软件fiddler软件方法/步骤1/7分步阅读

    这是一个通用版本的火车头采集发布页面,页面大致分为四个部分:web发布到网站,保存到本地文件,保存到数据库,其他扩展。保存到数据库以及其他扩展涉及的知识面过多,鉴于篇幅这里就不一一详解,日后在维特博客的其他文章中再做介绍。

    2/7

    通过web发布数据到网站

    勾选发布到web站点时,我们发现无法添加发布配置,这是由于我们还未进行相关的配置,首先我们需要点击web发布配置管理来进行相关的数据配置。

    在web发布配置管理中,软件帮我们内置了一些常见的开源CMS模块,如果恰巧版本相同而且没有任何BUG,直接选中是最简单的方式,如果是小众CMS抑或其他后台,则需要自定义相关的配置,这里我们可以点击1在线选择发布模块中的新建来配置一个适合自己的模块。

    3/7

    网站自动登录方面我们可以直接填写后台地址的一部分,譬如后台地址是:

    网站根网址/admin.php

    这里我们可以填写/admin.php,简单的说可以填写出去根网址的后缀,如果关闭验证码登录则可以忽略验证码填写,后面的内容就不必再填,待会利用cookie直接登录会更简单,从顶部的选项卡上跳转到内容发布参数。

    在发布页面中填写发布地址后缀与后台地址后缀同理,不作详细介绍,这里主要讲如何填写接口。

    监听接口的传输可以用chrome或者ff自带的控制栏,这可能不太友好,这里我推荐一款软件fiddler,利用fiddler可以轻松简单的弄清表单传输的方式。

    4/7

    这是一个fiddler安装完成的页面,首先点击左下角直到只监听web,同时注意关闭一些浏览器代理工具,然后我们只需要打开网站后台发布文章页面,发布一篇文章,fiddler就能自动的帮我们记录所有的请求。

    5/7

    点击发布文章后我们能看到fiddler的左边已经记录请求,双击它则可以在右边的inspectors中的webforms中看到详细的属性与值。很显然post_title属性的意思就是标题,我的文章标题是“新的标题”,所以其对应值无疑也是“新的标题”,以此类推,将这些属性与值填写进火车头的内容发布参数中,最后别忘了点保存!

    6/7

    回到web发布配置管理中,全局变量如果没有需求/不了解可以不选,编码这些不再细说,填入网站根网址,然后再内置浏览器中登录就可以自动记录cookie值,省去了不少麻烦。最后当然是保存,回到发布内容设置中点击添加发布配置,添加刚才的配置模块就已经大功告成。

    7/7

    保存到本地

    这种方式相比来说比较简单,但后期还是需要手动发布到网站,如果数据较大也是不小的困扰,点击查看默认模板就能找到系统帮我们预设的几个简单模板,其实就是的方式,如果自己在采集时添加了其他属性,也可以自行添加。

    这里唯一需要注意的一点是编码的选择一定要正确,同时模板也有编码,如果文件编码已经选择正确仍旧乱码,则把默认模板的编码改动一下即可。

    虽然步骤有些繁琐,但设置好之后面对频繁的采集和发布也省心不少。对于采集方面的其他经验知识我会在维特博客wittsay.cc以后的更新中提到,有兴趣的朋友可以收藏一下博客,一起分享经验。最后不得不重新再提一次,采集并不是一条成功的捷径,好的网站与原创是密不可分的,采集技巧也是给大家一个参考启发的方式。

    上传
    本文关键词:

    版权声明:

    1、本文系转载,版权归原作者所有,旨在传递信息,不代表看本站的观点和立场。

    2、本站仅提供信息发布平台,不承担相关法律责任。

    3、若侵犯您的版权或隐私,请联系本站管理员删除。

    4、文章链接:http://www.1haoku.cn/art_1114410.html

    相关资讯

    ©2019-2020 http://www.1haoku.cn/ 国ICP备20009186号05-07 06:38:44  耗时:0.027
    0.0271s