广告合作
  • 今日头条

    今日头条

  • 百度一下

    百度一下,你就知道

  • 新浪网

    新浪网 - 提供新闻线索,重大新闻爆料

  • 搜狐

    搜狐

  • 豆瓣

    豆瓣

  • 百度贴吧

    百度贴吧——全球领先的中文社区

  • 首页 尚未审核订阅工具 订阅

    如何用asp.net采集网站数据

    来源:网络收集  点击:  时间:2024-08-07
    【导读】:
    对于一个cms类型的项目来说最重要是数据,而对于庞大的客服群体而滋生的庞大的数据如果手动去录入那将是一项繁琐且无趣的工作。工具/原料morevisual studio 2012sqlserver 2008 r2方法/步骤1/6分步阅读

    首先你明确你要采集的数据类型,和采集数据的过程,打开visual studio 新建一个项目,或者在老项目中添加一个新的控制器(mvc) 或者asp页面。

    由于是教程所以作者采用了新建的方式。项目结构相对于粗糙。

    一个页面首页,一个client的资源模型 ,一个sql数据操作的帮助类

    2/6

    接下来,你要选择你所要采集的数据的网站。并熟悉他的规则

    比如说我有一个文章网站那么正常的路由规则是这样的

    www.sss.com/article/1.html

    www.sss.com/article/2.html

    www.sss.com/article/3.html.....

    根据这个规则我们可以制定相对于的函数

    如图,将会拼接字符串形成一条条完整的url

    3/6

    如图,清晰的注释相信大家都看的懂,关于我断点的位置那是为了防止当你获取到404页面或者目标网址的404页面时,显然并没有数据所以直接略过重新循环,是否大于我写的那个数据请根据你们要采集的网址情况来定

    4/6

    图四获取的目标网址的html文件将会被当成字符串,这就相当于你调试时候查看页面源代码一样,这时候根据字符串的载取你就能轻松的获取你想要的数据,生成一个模型

    5/6

    最后一步就是添加到数据库了

    6/6

    当你执行完你所有的采集,会发现数据库会有许多重复的数据,或者空对象的数据。这时候请根据正则执行sql的语句来进行删除,或者修改,你就获得了你们网站所需要的数据

    注意事项

    url路径一定要分析明确

    字符串的匹配切割也不能重复

    请先执行一个页面或者多个页面进行调试

    本文关键词:

    版权声明:

    1、本文系转载,版权归原作者所有,旨在传递信息,不代表看本站的观点和立场。

    2、本站仅提供信息发布平台,不承担相关法律责任。

    3、若侵犯您的版权或隐私,请联系本站管理员删除。

    4、文章链接:http://www.1haoku.cn/art_1074863.html

    相关资讯

    ©2019-2020 http://www.1haoku.cn/ 国ICP备20009186号05-07 20:21:28  耗时:0.031
    0.0315s