文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

写给MongoDB开发者的50条建议Tip22

2024-04-02 19:55

关注

本系列文章翻译自《50 Tips and Tricks for MongoDB Developers》,暂时没有找到中文版,反正自己最近也在深入学习mongodb,所以正好拿来翻译一下。一方面加强自己学习的效果,另一方面让大 家也一起来体验一下需要我们这些mongodb使用者需要注意的地方。

首先声明自己的英文水平不是太高,加之有些英文翻译成中文也找不到合适的词来表达,所以在文章中可能会出现英文原词,或者说有些地方的翻译会有些生 硬,也就是说会出现直译的地方。翻译该书的主要目的是为大家学习探讨用的,如果有翻译不精准的地方,或者说有更加精准的翻译,还请大家指出,我会及时的更 正的,在此先谢过各位了。

Tip#22.Use indexes to do more with less memory

通过索引实现用较少的内存做更多的事情

图22.1是一张查询请求的示意图。

 

写给MongoDB开发者的50条建议Tip22

图22.1 查询流程图

假设你有一台机器,有256G的数据,16G的内存。大部分数据在一个集合中,并且你正在查询这个集合。mongodb会怎么做呢?

假设每页包含4K的数据。

mongodb将第一页从磁盘加载到内存中,然后和你的查询比较。然后再加载一页,和你的查询比较,再加载一页。这样会加载整个256G的数据。没有什么捷径,不查看文档,它不知道那个文档是匹配查询请求的,因此它必须要查看所有的文档才会知道那些文档是符合查询条件的。因此,需要加载所有256G的数据到内存中(操作系统需要把旧的数据交换出内存,需要加载新的数据)。这样会花费很长的时间。

如何才能避免在一次查询中不加载所有256G数据到内存呢?我们可以告诉mongodb在字段x上建立索引,mongodb会建立一棵树,保存字段的值。mongodb会预处理这些数据,将集合中x字段的值都加到一个有序数中(如图22.2)。树的每个节点包含一个x的值,和指向包含x值的文档的指针。

 

写给MongoDB开发者的50条建议Tip22

图22.2 有序B树

树只包含一个执行文档的指针,而不是文档本身,意味着索引要比整个集合小很多。

当你的查询中包含x字段的时候,mongodb会注意到查询条件中包含一个索引字段x,会通过有序树来查询x。现在,不是查找每一个文档了。mongodb就回问,x是大于当前节点的值?还是小于当前节点的值?如果大于,就去右节点中继续找;如果小于,就去左节点中继续找。将会以这种方式继续查找,直到找到节点值是x的节点。如果找到了,就会根据节点指针找到对应的文档,返回文档(如图22.3)。

 

写给MongoDB开发者的50条建议Tip22

图22.3 一个包含值的索引指向一个文档

如果不使用索引,我们需要加载6400万页的数据到内存中。

 

  1. Pages of data: 256G/(4KB/page)=64 million pages 

 

假设我们的索引是80G。索引是2000万页。

 

  1. Numbers of pages in our index: 80G/(4KB/page)=20 million pages 

因为索引是有序的,意味着我们不用查找每一个。我们只需要加载特定的节点。那么是多少呢?

 

  1. Numbers of pages of the index that must be loaded into memory: len(20,000,000)=17 pages 

从6400万页下降到17页!

当然了,不只是17页。一旦我们在索引中找到结果,就需要将对应的文档加载到内存中,因此还需要加载文档大小的页。和之前的整个集合相比,还是小了很多。

希望你现在可以想象出索引对于加快查询的帮助有多么大了。

阅读原文内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-数据库
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯