数据库设计 – 大型搜索引擎使用哪些数据库技术?

有人知道谷歌或雅虎如何针对非常大量的数据搜索关键词吗?他们为此采用了哪种数据库或技术?

它需要几毫秒,但它们有超过十亿页索引.

解决方法

我确信有一些组合:

>严重的硬件
>大量的 – 数据在许多节点和不同的数据中心之间分布和复制

>(实际上在谷歌的情况下,至少我相信他们有成千上万的真正的低端服务器)

>缓存了许多常见查询的结果,注意他们如何预先填充您以前从未搜索过的内容的潜在搜索;他们预测你可能会搜索什么,并希望他们已经预先计算出你的结果并在某处缓存.在他们的很多情况下 – 你今天在Google上提出的搜索次数并不多,而你之前没有人问过.当他们确实得到一个新的搜索短语时,他们可能会使用像自由文本搜索这样的东西 – 我希望在首次抓取页面时在语义上提取关键字,而不是在搜索完文档后尝试在文档中查找关键字.当然,他们必须定期使这些缓存无效,重新计算页面排名,并在缓存中分发新的缓存结果 – 我相信这背后有很多严肃的工程.

相关文章

SELECT a.*,b.dp_name,c.pa_name,fm_name=(CASE WHEN a.fm_n...
if not exists(select name from syscolumns where name=&am...
select a.*,pano=a.pa_no,b.pa_name,f.dp_name,e.fw_state_n...
要在 SQL Server 2019 中设置定时自动重启,可以使用 Window...
您收到的错误消息表明数据库 'EastRiver' 的...
首先我需要查询出需要使用SQL Server Profiler跟踪的数据库标...