编辑距离

编辑距离是针对二个字符串(例如英文字)的差异程度的量化量测,量测方式是看至少需要多少次的处理才能将一个字符串变成另一个字符串。编辑距离可以用在自然语言处理中,例如拼写检查可以根据一个拼错的字和其他正确的字的编辑距离,判断哪一个(或哪几个)是比较可能的字。DNA也可以视为用A、C、G和T组成的字符串

搜索引擎 之 倒排索引

世界上最伟大的互联网产品,说是搜索引擎,绝对没有别的产品可以替代,尤其是伟大的先在市场占用率最高的搜索引擎,Google Search. 还有很多差一大截的,比如 Bing, Yahoo 和 YANDEX. 什么是搜索引擎 所谓搜索引擎,就是根据用户需求与一定算法,运用特定策略从互联网检索出制定信息

操作系统 之 内核

最近华为鸿蒙系统沸沸扬扬,宣传自己用了微内核,可以支持各种设备。 那么内核是什么? 为什么微内核可以支持各种设备呢? 内核(英语:Kernel,又称核心)在计算机科学中是一个用来管理软体发出的资料I/O(输入与输出)要求的电脑程式,将这些要求转译为资料处理的指令并交由中央处理器(CPU)及电脑

ARTS Week 2

上周的 ARTS 写的比较仓促,其实只能算是个凑数文,因为确实是时间不够写,但是 ART 都做完了,S 就草草写了,理论上这周发布这篇的时候会将上周的 S 写成一篇完整的 Blog。 Algorithm 两两交换链表中的节点 给定一个链表,两两交换其中相邻的节点,并返回交换后的链表。 你不能只

Thoughtworks 一月

距离加入 Thoughtworks 已有一个月。 这家公司也并非互联网公司,没有高强度的工作节奏,没有996,有一些敏捷信仰。 对于武汉来说,也算是一个优秀的公司。 同时正如网上所言:该有的缺点也是有的。好奇的同学可以去看一下我司黑粉头子耗子叔(陈皓)的文章。 技术变更 通过一个月的折磨,本人成为一

ARTS Week 1

Algorithm # # @lc app=leetcode.cn id=111 lang=python3 # # [111] 二叉树的最小深度 # # Definition for a binary tree node. # class TreeNode: # def __init__(s

Tornado Auto Etag 机制

为了研究缓存看了 tornado web.py 里的 finish 函数 代码如下 def finish(self, chunk: Union[str, bytes, dict] = None) -> "Future[None]": "&q
Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×