分类 项目 中的文章

以Ruia为例:如何实现一个Python爬虫框架

这篇文章的题目有点大,但这并不是说我自觉对Python爬虫这块有多大见解,我只不过是想将自己的一些经验付诸于笔,对于如何写一个爬虫框架,我想一步一步地结合具体代码来讲述如何从零开始编写一个自己的爬虫框架 2018年到如今,我花精力比较多的一个开源项目算是Ruia了,这是一个基于Py……

阅读全文

talospider - 简单的爬虫框架

为什么写这个? 一些简单的页面,无需用比较大的框架来进行爬取,自己纯手写又比较麻烦 因此针对这个需求写了talospider: 1.针对单页面的item提取 - 具体介绍点这里 2.spider模块 - 具体介绍点这里 介绍&&使用 item 这个模块是可以独立使用的,对于一些请求比较简单的……

阅读全文

owllook -- 一个简洁的网络小说搜索引擎

前言 上一篇介绍了自己在使用sanic过程中遇到的一些问题,这次就想介绍下这个owllook,上面是演示demo,具体可以见https://www.owllook.net/ 本项目纯属共享学习之用,不得用于商业! 首先我想说下目前的项目进度: v0.1.0: 小说的基本搜索解析功能 搜索记录……

阅读全文

ITBooks—简单的书籍下载小工具

1.前言 我有个习惯就是收藏一些书籍,比如说编程类的,总是会去某些网站刷刷,若有新书籍更新恰又是自己感兴趣的,自然会立马下载下来,写程序的都知道,编程书籍更新换代太快,国内的翻译的速度很难全面地跟上,对此,阅读国外的电子书籍是个途径。 很早就想写个书籍集成的脚本,本周女朋友回学校改论……

阅读全文