万维网最大的站点在哪些数据库上运行? [英] What databases do the World Wide Web's biggest sites run on?
问题描述
这个问题旨在作为主要网站使用的数据库及其配置的列表,对于任何想将其网站扩展到 Twitter、Facebook 甚至 Google 规模的人来说,都是一个很好的参考.
This question is meant to serve as a list of databases and their configurations that the major web sites use and would be a great reference for anyone thinking of scaling their web site to the size of Twitter, Facebook or even Google.
请尽量减少您的回答,并确保引用所使用的任何来源.
另外,请加粗网站名称和数据库,以便于扫描.
Also, please bold both the web-site name and the database for easier scanning.
推荐答案
- MySQL 与 MyRocks.用于存储用户信息和社交活动,例如喜欢、评论和分享.
- Hive(Hadoop 数据仓库,支持表和SQL 的变体,称为 hiveQL).用于简单的摘要作业、商业智能和机器学习以及许多其他应用程序"
- Cassandra(多维分布式键值存储).目前用于 Facebook 的私人消息.
目前在具有 Hive 数据存储的单个集群中运行 610 个(很快将成为 1000 个)Hadoop 节点.Hive 和 Cassandra 均已由 Facebook 开源.
Currently running 610 (soon to be 1000) Hadoop nodes in a single cluster with Hive datastore. Both Hive and Cassandra have been open-sourced by Facebook.
Facebook 统计数据:
Facebook stats:
- 超过 2 亿活跃用户
- 每天至少有超过 1 亿用户登录 Facebook 一次
- 超过 3000 万用户每天至少更新一次状态
- 平均用户在网站上有 120 个朋友
来源:
- http://www.dbms2.com/2009/05/11/facebook-hadoop-and-hive/
- http://www.facebook.com/note.php?note_id=89508453919
- http://www.facebook.com/press/info.php?statistics
- http://hadoop.apache.org/hive/
- http://wiki.apache.org/hadoop/Hive/Design
- http://www.facebook.com/note.php?note_id=24413138919
- https://code.facebook.com/posts/190251048047090/myrocks-a-space-and-write-optimized-mysql-database
这篇关于万维网最大的站点在哪些数据库上运行?的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!