请求的一生

本篇讲述:当你在浏览器中输入http://www.baidu.com并按下回车,世界是如何到你面前的。解析URL浏览器通过你输入的http://www.baidu.com进行解析,得知:协议:http域名:www.baidu.com资源:/进行DNS查询检查浏览器缓存的DNS记录检查操作系统Host

一百行代码实现异步爬虫

一个优雅的爬虫需要一下这些东西:请求器页面解析器链接生成器调度器请求器负责发送请求。页面解析器负责从页面上解析出继续爬的链接。链接生成器负责处理继续爬虫的链接并放入队列。调度器决定链接是否应该被爬去的核心部件。异步同时有多个请求在发送,即时异步爬虫。代码相关代码已上传到Github[https://

CI: 单打独斗必备

什么是CI持续集成(英语:Continuousintegration,缩写CI),又译为持续集成,是一种软件工程流程,是将所有软件工程师对于软件的工作副本持续集成到共享主线(mainline)的一种举措。该名称最早由葛来迪·布区(GradyBooch)在他的布区方法中提出,不过他并不支持在一天中进行

编辑距离

编辑距离是针对二个字符串(例如英文字)的差异程度的量化量测,量测方式是看至少需要多少次的处理才能将一个字符串变成另一个字符串。编辑距离可以用在自然语言处理中,例如拼写检查可以根据一个拼错的字和其他正确的字的编辑距离,判断哪一个(或哪几个)是比较可能的字。DNA也可以视为用A、C、G和T组成的字符串,

搜索引擎 之 倒排索引

世界上最伟大的互联网产品,说是搜索引擎,绝对没有别的产品可以替代,尤其是伟大的先在市场占用率最高的搜索引擎,GoogleSearch.还有很多差一大截的,比如Bing,Yahoo和YANDEX.什么是搜索引擎所谓搜索引擎,就是根据用户需求与一定算法,运用特定策略从互联网检索出制定信息反馈给用户的一门

操作系统 之 内核

最近华为鸿蒙系统沸沸扬扬,宣传自己用了微内核,可以支持各种设备。那么内核是什么?为什么微内核可以支持各种设备呢?内核(英语:Kernel,又称核心)在计算机科学中是一个用来管理软体发出的资料I/O(输入与输出)要求的电脑程式,将这些要求转译为资料处理的指令并交由中央处理器(CPU)及电脑中其他电子元

Tornado Auto Etag 机制

为了研究缓存看了tornadoweb.py里的finish函数代码如下deffinish(self,chunk:Union[str,bytes,dict]=None)->"Future[None]":"""Finishesthisrespons

树-数据结构(Python)

title:树-数据结构(Python)树是计算机科学中常用的数据结构之一,常见的地方有,Java的继承树等。还有一些基于树的特殊数据结构,比如二叉树,B树,等等。本篇会讲述一些关于简单关于树的操作。树的定义树(英语:tree)是一种抽象数据类型(ADT)或是实作这种抽象数据类型的数据结构,用来模拟

KMP 算法

在计算机科学中,Knuth-Morris-Pratt字符串查找算法(简称为KMP算法)可在一个主文本字符串S内查找一个词W的出现位置。此算法通过运用对这个词在不匹配时本身就包含足够的信息来确定下一个匹配将在哪里开始的发现,从而避免重新检查先前匹配的字符。这个算法是由高德纳(DonaldErvinKn

Pipenv + Autoenv 更友善的工作环境

Python包管理一直都是一个问题,如今3.6推荐采用Pipenv出自Requests的大牛做所。配合上他写的Autoenv切换环境再也不是问题。安装MacOSbrewinstallpipenvbrewinstallautoenv其他平台自行Google。Pipenvpipenv在安装之后会在当前目
Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×