数据库变慢的情况及处理方法

 我来答

1个回答

#合辑# 面试问优缺点怎么回答最加分？

户如乐9318
2022-10-23 · TA获得超过6653个赞

知道小有建树答主

回答量：2559

采纳率：100%

帮助的人：139万

我也去答题访问个人页

关注

展开全部

数据库慢一般有三种情况

　　逐渐变慢

　　突然变慢

　　不定时变慢

　　第一种情况逐渐变慢要建立一个长期的监控机制比如写个shell脚本每天的忙时(通常 ~ etc )定时收集os neork db的信息每个星期出report对收集到的信息进行分析这些数据的积累可以决定后期的优化决策并且可以是DBA说服manager采用自己决策的重要数据 DBA的价值就在每个星期的report中体现

　　第二种情况突然变慢也是最容易解决的先从业务的角度看是DB的使用跟以前有何不同然后做进一步判断硬件/网络故障通常也会引起DB性能的突然下降

　　第一步: 察看DB/OS/NEORK的系统log 排除硬件/网络问题

　　第二步察看数据库的等待事件根据等待事件来判断可能出问题的环节如果没有等待事件可以排除数据库的问题如果有等待时间根据不同的等待事件来找引起这些事件的根源

　　比如latch free等跟SQL parse有关系的等待事件 OS的表现是CPU 的占用率高

　　db file scattered read等跟SQL disk read有关系的等待时间 OS的表现是iostat可以看到磁盘读写量增加

　　第三步: 察看os的信息 CPU/IO/MEMORY等

　　a Cpu 的占用率

　　CPU占用率与数据库性能不成反比 CPU占用率高不能说明数据库性能慢通常情况一个优化很好而且业务量确实很大的数据库 CPU的占用率都会高而且会平均分布在每个进程上反过来 CPU的占用率都会高也不代表数据库性能就好要结合数据库的等待事件来判断CPU占用率高是否合理

　　如果某个进程的cpu占用高肯定是这个进程有问题如果不是oracle的进程可以让application察看是否程序有死循环等漏洞如果是oracle的进程可以根据pid查找oracle数据字典看看这个进程的发起程序正在执行的sql语句以及等待事件然后不同情况使用不同的方法来解决

　　b IO

　　排除硬件的IO问题数据库突然变慢一般来说都是一个或几个SQL语句引起的

　　如果IO很频繁可以通过优化disk reads高的TOP SQL来解决当然这也是解决IO问题的最笨也是最有效的办法

　　OS以及存储的配置也是影响IO的一个重要的原因

　　比如最常见的HP unix下异步IO的问题如果DBA GROUP没有MLOCK的权限 ORACLE是不使用AIO的偏偏OS与DB的两方的admin如果配合不够好地话这个配置就很容易给漏掉了

　　c Memory

　　第二种情况与memory的关系比较小只要SGA区配置合理没有变化一般来说只要不是Application Memory leak 不会引起突然变慢的现象

　　第三种情况不定时变慢是最难解决的现场出现的问题原因也是五花八门千奇百怪最重要的是出现慢的现象时以最快的速度抓取到最多的信息以供分析先写好抓取数据的shell 脚本并在现象发生时及时按下回车键

　　一个例子

　　数据库突然变慢

　　背景: 一个新应用上线后数据库突然变慢

　　第一步调查新应用

　　据开发人员讲新应用访问的都是新建立的表表的数据量很小没有复杂的SQL查询

　　查询 v$sqlarea 分别按照disk_reads / buffer_gets / executions 排序 TOP SQL 中没有新应用的SQL 排除新应用数据库访问照成的性能问题

　　第二步察看数据库log/ OS log

　　数据库log中可以看到大量的ORA 错误以及大量的dump文件分析dump文件(时间久了没有dump文件可参考具体细节没法描述下来 ) 发现是新应用通过dblink访问remote DB时生成的dump文件应用开发人说没法修改 Oracle也没有相应的patch解决

　　OS log中没有错误信息

　　第三步察看statspack report

　　从wait events中看到 Top event是 buffer busy waits db file parallel write 等于IO相关的等待事件

　　从buffer busy waits 的统计信息来看是等待data block

　　还有些physical reads等信息与从前比没有太多的异常

　　Tablespace 的IO reads/writes也没有异常但是wait明显增加

　　初步确定是IO问题

　　第四步察看OS的信息

　　 top 命令(输出为实验室数据仅作格式参考)

　　load averages: : :

　　 processes: sleeping zombie stopped on cpu

　　CPU states: % idle % user % kernel % iowait % swap

　　Memory: M real M free M swap in use M swap free

　　PID USERNAME THR PRI NICE SIZE RES STATE TIME CPU MAND

　　 a K K cpu/ : % top

　　 mpgj M K sleep : % view_server

　　当时现场数据显示 iowait 值与以前相比大很多没有异常进程

　　 sar –d (输出为实验室数据仅作格式参考)

　　SunOS sc Generic_ sun u / /

　　 : : device %busy avque r+w/s blks/s avwait avserv

　　sd a

　　sd b

　　sd c

　　sd g

　　当时现场数据显示放数据文件的设备 avwait avque blks/s值偏大

　　第五步察看数据库的等待事件

　　一个大业务量的数据库如果性能不好的话一般来说都会有大量的等待事件上百个等待事件很常见我通常会按照EVENT进行group

　　Select count(*) event from v$session_wait where event not in ( *** on timer pmon timer rdbms ipc message SQL*Net message from client ) group by event order by desc;

　　输出结果显示最多的等待事件是buffer busy waits

　　进一步分析找出等待的原因

　　Select count(*) p p p from v$session_wait where event = buffer busy waits group by p p p ;

　　在buffer busy waits等待事件中

　　P = file#

　　P = block#

　　P = id ( 此id对应为等待的原因)

　　按照p p p group是为了明确buffer busy waits的等待集中在哪些对象上

　　Metalink对buffer busy waits等待事件的描述有如下一段话

　　 If P shows that the buffer busy wait is waiting for a block read to plete then the blocking session is likely to be waiting on an IO wait (eg: db file sequential read or db file scattered read for the same file# and block#

　　输出结果显示等待分布在多个不同的对象上等待原因为 waiting for a block read to plete 进一步分析为IO的问题

　　如果 buffer busy waits等待集中在某个对象上说明有hot block 通过重新rebuild这个对象增加freelist来解决 RAC环境增加freelist group

　　通过以下SQL可以找到具体的object

　　Select owner segment_name segment_type from dba_extents where file_id=P and P beeen block_id and block_id+blocks;

　　P P 是上面v$session_wait查出的具体的值

　　第六步明确原因找出解决步骤

　　分析

　　磁盘的IO流量增加

　　磁盘的IO等待增加

　　 DB的IO流量没有增加

　　 DB的IO等待增加

　　由可以推出有数据库以外的IO访问磁盘

　　察看磁盘配置该VG只存放了数据库数据文件和数据库系统文件排除数据文件产生IO的是数据库系统文件

　　数据库系统文件一般来说不会产生IO 有IO读写的地方只有log和dump文件

　　结论 ora 产生的大量core dump文件堵塞IO

　　解决办法

　　消除ora (应用不改的情况下无法解决)

　　把dump目录指向别的VG

　　让oracle尽量少的去写core dump文件

　　background_core_dump = partial

lishixinzhi/Article/program/Oracle/201311/18969

已赞过 已踩过<

评论收起

万山数据
2024-11-14 广告

实时数仓处理是我们北京万山数据科技有限公司数据处理能力的核心之一。它基于先进的流处理技术，能够实时捕获、处理和分析海量数据，确保数据的时效性和准确性。通过构建高效的实时数据管道，我们能够实现数据的即时入库与查询，为业务决策提供强有力的支持。... 点击进入详情页

本回答由万山数据提供

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

数据库变慢的情况及处理方法

其他类似问题

为你推荐：