大型网站数据库系统，怎么连接那么多并发数量的?

大型网站数据库系统，怎么连接那么多并发数量的?比如腾讯类的大互联网公司，或者是51一类的博客，系统怎么做到同时并发连接数量，他们使用的是什么数据库和技术呢?。因为我刚刚学... 大型网站数据库系统，怎么连接那么多并发数量的?比如腾讯类的大互联网公司，或者是51一类的博客，系统怎么做到同时并发连接数量，他们使用的是什么数据库和技术呢?
。因为我刚刚学习数据库，并发连接数量只支持几百个。展开

 我来答

3个回答

#热议# 上班途中天气原因受伤算工伤吗？

匿名用户
2013-05-29

展开全部

按我个人经验有以下几种方法：1.在连接数据库的时候可以优化，使用连接池。主要就是不要频繁地创建，销毁连接。这是很费时的一个操作。因此，使用连接池来代替普通的建立连接操作，能提高并发度。2. 使用缓存技术。并不是每次都需要去数据库里面查询的，我们其实可以把前一次的查询结果放在内存里，如果下一次用户来查询相同的内容，直接内存返回即可，不需要再次查询。这样可以大大降低查询频率。3.使用分布式技术，将数据库分布在多台服务器上，同时也将用户分区（如根据用户ID的哈希值分区），不同的服务器负责不同用户群，这样就能大大减少单台服务器的负载，使得整体的吞吐量提高。这几样技术可以同时使用，你的并发数量将获得非常大的提高。

已赞过 已踩过<

评论收起

dongdng
2015-09-01 · TA获得超过8158个赞

知道大有可为答主

回答量：9168

采纳率：88%

帮助的人：2321万

我也去答题访问个人页

关注

展开全部

在连接数据库的时候可以优化，使用连接池。主要就是不要频繁地创建，销毁连接。这是很费时的一个操作。因此，使用连接池来代替普通的建立连接操作，能提高并发度。
使用缓存技术，并不是每次都需要去数据库里面查询的，我们其实可以把前一次的查询结果放在内存里，如果下一次用户来查询相同的内容，直接内存返回即可，不需要再次查询。这样可以大大降低查询频率。
使用分布式技术，将数据库分布在多台服务器上，同时也将用户分区（如根据用户ID的哈希值分区），不同的服务器负责不同用户群，这样就能大大减少单台服务器的负载，使得整体的吞吐量提高。这几样技术可以同时使用，你的并发数量将获得非常大的提高。
大型数据库介绍：

1 SQL Server
　　概括地说，SQL Server具有如下特点：
　　A客户/服务器体系结构；
　　B图形化的用户界面，使系统的管理更加直观和简单。
　　C丰富的编程接口，为用户进行应用程序设计提拱了更大的选择余地。
　　D与Windows NT操作系统的有机集成，多线程体系结构设计，提供了系统对用户并发访问的速度。
　　E对Web技术的支持，使用户能够很容易地将数据库中的数据发布到网上。
　　F价格上的优势。与其他一些大型数据库系统。如Oracle、Sybase等相比，SQL Server的价格非常便宜。
　　G作为微软在Windows系列平台上开发的数据库，SQL Server一经推出就以其易用性和兼容性得到了很多用户的青睐，是Windows环境商业应用的首选数据库。

2 Oracle
　　甲骨文公司（Oracle）的产品，可以运行于很多操作系统之上（包括Windows），是大型企业级数据库。Oracle它是以高级结构化查询语言为基础的大型关系型数据库，是目前最流行的客户/服务器体系机构的数据库之一。提供对Internet全面支持的管理平台和系统集成工具，完全支持所有的工业标准，占有相当大的市场份额。因其专业性较强，操作繁杂，不易上手，价格较高，一般作为UNIX下的应用较多，适于大型网站选用。

3 DB2
　　IBM公司的产品，可以运行于很多操作系统上（包括Windows），是大型企业级数据库。DB2具有很好的并行性。把数据库管理扩充到了并行的、多节点的环境。其操作简单、兼容性好，广泛应用于大型企业。
　　DB2是内嵌于IBM的AS/400系统上的数据库管理系统，直接由硬件支持。它支持标准的SQL语言，具有与异种数据库相连的GATEWAY。因此他具有速度快、可考性好的优点。但是，只有硬件平台选择了IBM的AS/400，才能选择使用DB2数据库管理系统。

4 MySQL

　　MySQL是当今UNIX或Linux类服务器上广泛使用的Web数据库系统。也可以运行于Windows平台。它是一个多用户、多线程、跨平台的SQL数据库系统，同时是具有客户/服务器体系结构的分布式数据库管理系统，属自由数据库系统，开放源代码数据库产品。
　　MySQL于1996年诞生于瑞典的TcX公司。其设计思想为快捷、高效、实用。虽然它对ANSI SQL标准的支持并不完善，但支持所有常用的内容，完全可以胜任一般Web数据库的工作。由于它不支持事务处理，MySQL的速度比一些商业数据库块2-3倍，并且MySQL还针对很多操作平台做了优化，完全支持多CPU系统的多线程方式。
　　在编程方面，MySQL也提供了C、C++、Java、Perl、Python和TCL等API接口，而且有MyODBC接口，任何可以使用ODBC接口的语言都可以使用它。
　　MySQL是中小企业网站Linux平台的首选。MySQL在Linux下应用较多，Linux+MySQL+PHP是基于Linux的最佳组合。由于属开放源代码自由软件，性价比较高，是中小企业网站、个人网站不错的选择。

本回答被网友采纳

已赞过 已踩过<

评论收起

爱可生云数据库
2020-07-21 · MySQL开源数据库领先者

爱可生云数据库

爱可生，金融级开源数据库和数据云服务整体解决方案提供商；优秀的开源数据库技术，企业级数据处理技术整体解决方案提供商；私有云数据库云服务市场整体解决方案提供商。

向TA提问

关注

展开全部

现象

Sysbench对MySQL进行压测, 并发数过大(>5k)时, Sysbench建立连接的步骤会超时.

猜想

猜想: 直觉上这很简单, Sysbench每建立一个连接, 都要消耗一个线程, 资源消耗过大导致超时.

验证: 修改Sysbench源码, 调大超时时间, 仍然会发生超时.

检查环境

猜想失败, 回到常规的环境检查:

MySQL error log 未见异常.
syslog 未见异常.
tcpdump 观察网络包未见异常, 连接能完成正常的三次握手; 只观察到在出问题的连接中, 有一部分的TCP握手的第一个SYN包发生了重传, 另一部分没有发生重传.
自己写一个简单的并发发生器, 替换sysbench, 可重现场景. 排除sysbench的影响

猜想2

怀疑 MySQL 在应用层因为某种原因, 没有发送握手包, 比如卡在某一个流程上:

检查MySQL堆栈未见异常, 仿佛MySQL在应用层没有看到新连接进入.
通过strace检查MySQL, 发现 accept() 调用确实没有感知到新连接.

怀疑是OS的原因, Google之, 得到参考文档: A TCP “stuck” connection mystery【http://www.evanjones.ca/tcp-stuck-connection-mystery.html】

分析

参考文档中的现象跟目前的状况很类似, 简述如下:

正常的TCP连接流程:

Client 向 Server 发起连接请求, 发送SYN.
Server 预留连接资源, 向 Client 回复SYN-ACK.
Client 向 Server 回复ACK.
Server 收到 ACK, 连接建立.
在业务层上, Client和Server间进行通讯.

当发生类似SYN-flood的现象时, TCP连接的流程会使用SYN-cookie, 变为:

Client 向 Server 发起连接请求, 发送SYN.
Server 不预留连接资源, 向 Client 回复SYN-ACK, 包中附带有签名A.
Client 向 Server 回复ACK, 附带 f(签名A) (对签名进行运算的结果).
Server 验证签名, 分配连接资源, 连接建立.
在业务层上, Client和Server间进行通讯.

当启用SYN-cookie时, 第3步的ACK包因为某种原因丢失, 那么:

从Client的视角, 连接已经建立.
从Server的视角, 连接并不存在, 既没有建立, 也没有”即将建立” (若不启用SYN-cookie, Server会知道某个连接”即将建立”)

发生这种情况时:

若业务层的第一个包应是从 Client 发往 Server, 则会进行重发或抛出连接错误
若业务层的第一个包应是从 Server 发往 Client的, Server不会发出第一个包. MySQL的故障就属于这种情况.

TCP握手的第三步ACK包为什么丢失

参考文档中, 对于TCP握手的第三步ACK包的丢失原因, 描述为:

Some of these packets get lost because some buffer somewhere overflows.

我们可以通过Systemtap进一步探究原因. 通过一个简单的脚本:

probe kernel.function("cookie_v4_check").return
{
source_port = @cast($skb->head + $skb->transport_header, "struct tcphdr")->source
printf("source=%d, return=%d\n",readable_port(source_port), $return)
}
function readable_port(port) {
return (port & ((1<<9)-1)) << 8 | (port >> 8)
}

观察结果, 可以确认cookie_v4_check (syn cookie机制进行包签名检查的函数)会返回 NULL(0). 即验证是由于syn cookie验证不通过, 导致TCP握手的第三步ACK包不被接受.

之后就是对其中不同条件进行观察, 看看是哪个条件不通过. 最终原因是accept队列满(sk_acceptq_is_full):

static inline bool sk_acceptq_is_full(const struct sock *sk){ return sk->sk_ack_backlog > sk- >sk_max_ack_backlog;}

恢复故障与日志的正关联

在故障处理的一开始, 我们就检查了syslog, 结论是未见异常.

当整个故障分析完成, 得知了故障与syn cookie有关, 回头看syslog, 里面是有相关的信息, 只是和故障发生的时间不匹配, 没有正关联, 因此被忽略.

检查Linux源码:

if (!queue->synflood_warned &&
sysctl_tcp_syncookies != 2 &&
xchg(&queue->synflood_warned, 1) == 0)
pr_info("%s: Possible SYN flooding on port %d. %s.
Check SNMP counters.\n",
proto, ntohs(tcp_hdr(skb)->dest), msg);

可以看到日志受到了抑制, 因此日志与故障的正关联被破坏.

粗看源码, 每个listen socket只会发送一次告警日志, 要获得日志与故障的正关联, 必须每次测试重启MySQL.

解决方案

这种故障一旦形成, 难以检测; 系统日志中只会出现一次, 在下次重启MySQL之前就不会再出现了; Client如果没有合适的超时机制, 万劫不复.

解决方案:
1. 修改MySQL的协议, 让Client先发握手包. 显然不现实.
2. 关闭syn_cookie. 有安全的人又要跳出来了.
3. 或者调高syn_cookie的触发条件 (syn backlog长度). 降低系统对syn flood的敏感度, 使之可以容忍业务的syn波动.

有多个系统参数混合影响syn backlog长度, 参看【http://blog.dubbelboer.com/2012/04/09/syn-cookies.html】

下图为精华总结

请点击输入图片描述

已赞过 已踩过<

评论收起

1条折叠回答

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

大型网站数据库系统，怎么连接那么多并发数量的?

其他类似问题

为你推荐：