博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
为什么商业搜索引擎选择的索引更新策略是完全重建策略
阅读量:2197 次
发布时间:2019-05-02

本文共 391 字,大约阅读时间需要 1 分钟。

我在阅读《这就是搜索引擎:核心技术详解》这本书的时候,看到原文第三章中以下这句话引起我的思考:

这种重建策略比较适合小文档集合,因为完全重建索引的代价较高,但是目前主流商业搜索引擎一般是采用此种方式来维护索引的更新,这与互联网本身的特性有关。

目前索引更新策略有四种:

  1. 完全重建策略
  2. 再合并策略
  3. 原地更新策略
  4. 混合策略

如果希望了解这4种索引更新策略可以去看《这就是搜索引擎:核心技术详解》作者的博客:

我对这四种策略进行比较后才发现主要的原因:

完全重建策略虽然重建索引策略代价比较高,但是这个策略是唯一能够保证重建期间索引依然生效的策略,对于商用的搜索引擎,应该保证系统无论何时都可以正常运作。

再合并策略原地更新策略都是创建增量索引之后与旧索引进行合并,在合并期间旧索引是无法生效,而所谓的混合策略只是根据情况选择使用再合并策略与原地更新策略,依然无法保证索引一直生效。

转载地址:http://ghoub.baihongyu.com/

你可能感兴趣的文章
【LEETCODE】20-Valid Parentheses
查看>>
【LEETCODE】290-Word Pattern
查看>>
【LEETCODE】36-Valid Sudoku
查看>>
【LEETCODE】205-Isomorphic Strings
查看>>
【LEETCODE】204-Count Primes
查看>>
【LEETCODE】228-Summary Ranges
查看>>
【LEETCODE】27-Remove Element
查看>>
【LEETCODE】66-Plus One
查看>>
【LEETCODE】26-Remove Duplicates from Sorted Array
查看>>
【LEETCODE】118-Pascal's Triangle
查看>>
【LEETCODE】119-Pascal's Triangle II
查看>>
【LEETCODE】88-Merge Sorted Array
查看>>
【LEETCODE】19-Remove Nth Node From End of List
查看>>
【LEETCODE】125-Valid Palindrome
查看>>
【LEETCODE】28-Implement strStr()
查看>>
【LEETCODE】6-ZigZag Conversion
查看>>
【LEETCODE】8-String to Integer (atoi)
查看>>
【LEETCODE】14-Longest Common Prefix
查看>>
【LEETCODE】38-Count and Say
查看>>
【LEETCODE】278-First Bad Version
查看>>