公号:码农充电站pro 主页:https://codeshellme.github.io 1,倒排索引 倒排索引是一种数据结构,经常用在搜索引擎的实现中,用于快速找到某个单词所在的文档. 倒排索引会记录一个单词词典(Term Dictionary)和一个倒排列表: 单词词典:包含了所有文档包含的所有 Term. 倒排列表:由一系列的倒排索引项组成,每个倒排索引项包含 4 项内容,分别是: 文档 ID 词频 TF:Term 在文档中出现的次数,用于相关性评分. 位置 Position:Term 在