网上也出现一些抓取妹子图的python 代码,今天我们用c#实现爬虫过程。

请看我的网站: www.di81.com

        private void www_94xmn_Com(string url, string urlType, int allpage, int typeID)
        {
            new Thread(() =>
            {
                PublicHtml p = new PublicHtml();
                CookieContainer c = new CookieContainer();

                Invoke(new Action(() =>
                {
                    this.listBoxno.Items.Add(urlType);
                }));

                ; i < allpage; i++)
                {
                    //GetDataGetHtml
                    string homeurl = string.Format(url, i);
                    string html = PubsLibrary.HttpHelper.GetDataGetHtml(homeurl, "", c);
                    MatchCollection mcs = new Regex("(?is)(?<=\"wf-cld\").+?(?=</span></div>)").Matches(html);
                    foreach (Match m in mcs)
                    {
                        WarehouseService ms = new WarehouseService();

爬取成功后就直接装入库。

最新文章

  1. N个数依次入栈,出栈顺序有多少种?
  2. maven eclipse 插件下载地址
  3. 转:Python一些特殊用法(map、reduce、filter、lambda、列表推导式等)
  4. SSH(2)-- ssh_config和sshd_config
  5. URI中的常用属性
  6. 【Android】SDK工具学习 - bmgr
  7. UVA 11300 Spreading the Wealth
  8. 写文件前, 检查目录写权限(PHP)
  9. apache 实用配置
  10. Linux GCC
  11. Android listview 的优化
  12. MZL&#39;s xor
  13. chrome浏览器强制采用https加密链接
  14. oc加载动态图片
  15. Trouble Shooting
  16. WPF Prism框架下基于MVVM模式的命令、绑定、事件
  17. 杭电ACM2020--绝对值排序
  18. LNMP构建动态网站WordPress
  19. Linux基础命令---top显示进程信息
  20. VHDL 数字时钟设计

热门文章

  1. unary_function和binary_function详解
  2. [C++] Swap Two Num
  3. tp5写日志
  4. linux下安装或升级GCC4.8.2,以支持C++11标准[转]
  5. CSS选择器种类及介绍
  6. 解决Emoji存储MySQL报错问题
  7. 【转载】redis.conf文件详解
  8. centos 学习总结
  9. Python之算法基础
  10. Autoconf 中文手册