数据库每日监控反馈.docx
- 文档编号:26794958
- 上传时间:2023-06-22
- 格式:DOCX
- 页数:22
- 大小:20.32KB
数据库每日监控反馈.docx
《数据库每日监控反馈.docx》由会员分享,可在线阅读,更多相关《数据库每日监控反馈.docx(22页珍藏版)》请在冰豆网上搜索。
数据库每日监控反馈
XXXX数据库监控反馈
检查人:
XXX
监督:
XXX
检查结束时间:
XXXX年XX月XX日星期XXX:
XX
监督结束时间:
XXXX年XX月XX日星期XXX:
XX
注意:
红色字为有疑问或有问题。
1磁盘空间使用率监控
命令:
df–hl
结果:
[root@localhost~]#df-hl
FilesystemSizeUsedAvailUse%Mountedon
/dev/mapper/VolGroup00-LogVol00
400G228G152G61%/
/dev/sda199M13M81M14%/boot
none2.0G02.0G0%/dev/shm
3数据库基本运行状况监测
主要介绍如何对数据库的基本状况进行检查,内容共分四个部分,分别是:
检查Oracle的进程;检查Oracle监听进程;检查Oracle实例状态;检查主库、备库状态。
3.1检查Oracle的进程
命令:
ps-ef|grep"ora_"|grep-vgrep
结果:
[oracle@localhostroot]$ps-ef|grep"ora_"|grep-vgrep
oracle149691022:
16?
00:
00:
00ora_qmn0_oracle1
oracle174801018:
01?
00:
00:
00ora_pmon_oracle
oracle174821018:
01?
00:
01:
21ora_dbw0_oracle
oracle174841018:
01?
00:
01:
50ora_lgwr_oracle
oracle174861018:
01?
00:
00:
00ora_ckpt_oracle
oracle174881018:
01?
00:
00:
00ora_smon_oracle
oracle174901018:
01?
00:
00:
00ora_reco_oracle
oracle174921018:
01?
00:
00:
03ora_cjq0_oracle
oracle174941018:
01?
00:
00:
02ora_qmn0_oracle
oracle174961018:
01?
00:
00:
00ora_s000_oracle
oracle174981018:
01?
00:
00:
00ora_d000_oracle
oracle175001018:
01?
00:
00:
00ora_arc0_oracle
oracle175021018:
01?
00:
00:
08ora_arc1_oracle
oracle175161018:
02?
00:
00:
00ora_pmon_oracle1
oracle175181018:
02?
00:
00:
00ora_dbw0_oracle1
oracle175201018:
02?
00:
00:
00ora_lgwr_oracle1
oracle175221018:
02?
00:
00:
00ora_ckpt_oracle1
oracle175241018:
02?
00:
00:
00ora_smon_oracle1
oracle175261018:
02?
00:
00:
00ora_reco_oracle1
oracle175281018:
02?
00:
00:
00ora_cjq0_oracle1
oracle175321018:
02?
00:
00:
00ora_s000_oracle1
oracle175341018:
02?
00:
00:
00ora_d000_oracle1
oracle175361018:
02?
00:
00:
00ora_arc0_oracle1
oracle175381018:
02?
00:
00:
00ora_arc1_oracle1
oracle175471018:
04?
00:
00:
01ora_mrp0_oracle1
[oracle@localhostroot]$
结果分析:
成功!
检查结果至少包括以下一些进程:
1数据文件写进程ora_dbw0_oracle
2日志写进程ora_lgwr_oracle
3系统监控进程ora_smon_oracle
4进程监控进程ora_pmon_oracle
5归档进程ora_arc0_oracle和ora_arc1_oracle
6检查点进程ora_ckpt_oracle
7恢复进程ora_reco_oracle
8如果应用程序使用了job的话,还要注意任务进程ora_cjq0_oracle
3.2检查Oracle监听进程
命令:
lsnrctlstatus
结果:
[oracle@localhostroot]$lsnrctlstatus
LSNRCTLforLinux:
Version9.2.0.8.0-Productionon05-FEB-200922:
21:
07
Copyright(c)1991,2006,OracleCorporation.Allrightsreserved.
Connectingto(DESCRIPTION=(ADDRESS=(PROTOCOL=IPC)(KEY=EXTPROC)))
STATUSoftheLISTENER
------------------------
AliasLISTENER
VersionTNSLSNRforLinux:
Version9.2.0.8.0-Production
StartDate02-DEC-200812:
10:
07
Uptime65days10hr.10min.59sec
TraceLeveloff
SecurityOFF
SNMPOFF
ListenerParameterFile/usr/local/oracle/product/oracle9i/network/admin/listener.ora
ListenerLogFile/usr/local/oracle/product/oracle9i/network/log/listener.log
ListeningEndpointsSummary...
(DESCRIPTION=(ADDRESS=(PROTOCOL=ipc)(KEY=EXTPROC)))
(DESCRIPTION=(ADDRESS=(PROTOCOL=tcp)(HOST=localhost.localdomain)(PORT=1521)))
ServicesSummary...
Service"PLSExtProc"has1instance(s).
Instance"PLSExtProc",statusUNKNOWN,has1handler(s)forthisservice...
Service"oracle"has2instance(s).
Instance"oracle",statusUNKNOWN,has1handler(s)forthisservice...
Instance"oracle",statusREADY,has1handler(s)forthisservice...
Service"oracle1"has2instance(s).
Instance"oracle1",statusUNKNOWN,has1handler(s)forthisservice...
Instance"oracle1",statusREADY,has1handler(s)forthisservice...
Service"oracleXDB"has1instance(s).
Instance"oracle",statusREADY,has1handler(s)forthisservice...
Thecommandcompletedsuccessfully
[oracle@localhostroot]$
结果分析:
成功!
“ServicesSummary…”项表示Oracle的监听进程正在监听哪些数据库实例,至少应该有Instance"oracle",statusREADY和Instance"oracle1",statusREADY两项。
错误处理:
如果出现错误,请提供如下两个文件:
ListenerParameterFile/usr/local/oracle/product/oracle9i/network/admin/listener.ora
ListenerLogFile/usr/local/oracle/product/oracle9i/network/log/listener.log
3.3检查Oracle实例状态
命令:
connsys/pwdassysdba或者connsystem/pwd
selectinstance_name,version,status,database_statusfromv$instance;
主库检查结果:
SQL>selectinstance_name,version,status,database_statusfromv$instance;
INSTANCE_NAMEVERSIONSTATUSDATABASE_STATUS
--------------------------------------------------------------
oracle9.2.0.8.0OPENACTIVE
SQL>
备库检查结果:
SQL>selectinstance_name,version,status,database_statusfromv$instance;
INSTANCE_NAMEVERSION
------------------------------------------------------------------
STATUSDATABASE_STATUS
----------------------------------------------------------
oracle19.2.0.8.0
MOUNTEDACTIVE
SQL>
结果分析:
正常!
其中“STATUS”表示Oracle当前的实例状态,主库必须是“OPEN”,备库必须是“MOUNTED”;“DATABASE_STATUS”表示Oracle当前数据库的状态,主库、备库必须都是“ACTIVE”。
3.4检查主库、备库状态
命令:
归档命令:
archiveloglist
角色命令:
setlin300
selectname,open_mode,protection_mode,database_rolefromv$database;
主库检查结果:
主库归档:
SQL>archiveloglist
DatabaselogmodeArchiveMode
AutomaticarchivalEnabled
Archivedestination/usr/local/oracle/product/arch_oracle/
Oldestonlinelogsequence7350
Nextlogsequencetoarchive7354
Currentlogsequence7354
SQL>
主库角色检查:
SQL>selectname,open_mode,protection_mode,database_rolefromv$database;
NAMEOPEN_MODEPROTECTION_MODEDATABASE_ROLE
-------------------------------------------------------
ORACLEREADWRITEMAXIMUMPERFORMANCEPRIMARY
SQL>
主库检查结果分析:
正常!
主库的“OPEN_MODE”必须是“READWRITE”,“PROTECTION_MODE”项必须是“MAXIMUMPERFORMANCE”,“DATABASE_ROLE”项必须是“PRIMARY”。
备库检查结果:
备库归档检查:
SQL>archiveloglist
DatabaselogmodeArchiveMode
AutomaticarchivalEnabled
Archivedestination/usr/local/oracle/product/arch_oracle/
Oldestonlinelogsequence7350
Nextlogsequencetoarchive0
Currentlogsequence7354
SQL>
结果分析:
正常!
这里的“Currentlogsequence”项要与主库保持一致。
备库状态检查:
NAMEOPEN_MODEPROTECTION_MODEDATABASE_ROLE
--------------------------------------------------------
ORACLEMOUNTEDMAXIMUMPERFORMANCEPHYSICALSTANDBY
结果分析:
正常!
备库的“OPEN_MODE”必须是“MOUNTED”,“PROTECTION_MODE”项必须与主库保持一致,“DATABASE_ROLE”项必须是“PHYSICALSTANDBY”。
日志应用检查:
命令:
selectsequence#,appliedfromv$archived_log;
SEQUENCE#APP
-------------
7349YES
7350YES
7351YES
7352YES
7353YES
7354YES
2195rowsselected.
SQL>
结果分析:
正常!
应该所有的日志的“APPLIED”都是“YES”状态。
否则,请参考《9i_DataGuard日常管理与维护手册》解决。
日志gap检查:
SQL>select*fromv$archive_gap;
norowsselected
SQL>
结果分析:
正常!
应该没有日志gap。
否则,请参考《9i_DataGuard日常管理与维护手册》解决。
4操作系统检查
主要介绍如何检查数据库的相关日志文件,主要包括两项:
检查Oracle日志文件;检查Oracle核心转储目录。
以下以oracle数据库为例,oracle1数据库也需要照此检查。
4.1检查Oracle日志文件
命令1:
su-oracle
cat$ORACLE_BASE/admin/oracle/bdump/alert_oracle.log|grep-iora-
检查结果1:
[oracle@localhostbdump]$cat$ORACLE_BASE/admin/oracle/bdump/alert_oracle.log|grep-iora-
ORA-03113:
end-of-fileoncommunicationchannel
ORA-03113:
end-of-fileoncommunicationchannel
ORA-03113:
end-of-fileoncommunicationchannel
ORA-03113:
end-of-fileoncommunicationchannel
ORA-03113:
end-of-fileoncommunicationchannel
ORA-03113:
end-of-fileoncommunicationchannel
ORA-03113:
end-of-fileoncommunicationchannel
ORA-03113:
end-of-fileoncommunicationchannel
ORA-03113:
end-of-fileoncommunicationchannel
结果分析1:
正常!
比如,出现的ORA-03113错误。
ORA-03113出现的原因在于主库与备库之间短暂的网络中断。
在实施DataGuard之前,已经考虑到这个问题了,故而设置了参数,如果归档日志由主库传输到备库失败,那么会隔60秒会自动重新再传。
目前,这个错误不需要太多的关注。
如果出现其他错误,请MAIL给我。
如果发现ORA-00600或者ORA-07445等严重错误,请先把alert文件MAIL给我,并给我电话。
命令2:
su-oracle
cat$ORACLE_BASE/admin/oracle/bdump/alert_oracle.log|grep-ierr
检查结果2:
[oracle@localhostbdump]$cat$ORACLE_BASE/admin/oracle/bdump/alert_oracle.log|grep-ierr
Errorsinfile/usr/local/oracle/product/admin/oracle/bdump/oracle_arc0_4526.trc:
ARC0:
Error3113Creatingarchivelogfileto'standby'
Errorsinfile/usr/local/oracle/product/admin/oracle/bdump/oracle_arc0_4526.trc:
ARC0:
Error3113Creatingarchivelogfileto'standby'
Errorsinfile/usr/local/oracle/product/admin/oracle/bdump/oracle_arc0_4526.trc:
ARC0:
Error3113Creatingarchivelogfileto'standby'
Errorsinfile/usr/local/oracle/product/admin/oracle/bdump/oracle_arc0_4526.trc:
ARC0:
Error3113Creatingarchivelogfileto'standby'
Errorsinfile/usr/local/oracle/product/admin/oracle/bdump/oracle_arc0_4526.trc:
ARC0:
Error3113Creatingarchivelogfileto'standby'
Errorsinfile/usr/local/oracle/product/admin/oracle/bdump/oracle_arc0_4526.trc:
ARC0:
Error3113Creatingarchivelogfileto'standby'
Errorsinfile/usr/local/oracle/product/admin/oracle/bdump/oracle_arc0_4526.trc:
ARC0:
Error3113Creatingarchivelogfileto'standby'
Errorsinfile/usr/local/oracle/product/admin/oracle/bdump/oracle_arc0_4526.trc:
结果分析2:
如果出现较多的Error,请直接把alert_oracle.logtar并压缩之后,MAIL给我。
命令3:
su-oracle
cat$ORACLE_BASE/admin/oracle/bdump/alert_oracle.log|grep-ifail
检查结果3:
[oracle@localhostbdump]$cat$ORACLE_BASE/admin/oracle/bdump/alert_oracle.log|grep-ifail
[oracle@localhostbdump]$
结果分析3:
正常!
如果出现较多的Error,请直接把alert_oracle.logtar并压缩之后,MAIL给我。
4.2检查Oracle核心转储目录
命令:
su-oracle
cd$ORACLE_BASE/admin/oracle/cdump/
ls-l|wc–l
检查结果:
[oracle@localhostcdump]$ls-l|wc-l
1
[oracle@localhostcdump]$
cd$ORACLE_BASE/admin/oracle/udump/
ls-l|wc-l
检查结果:
[oracle@localhostudump]$ls-l|wc-l
5
[oracle@localhostudump]$
结果分析:
有待SUN协助检查,不知如何追踪检查文件和查看什么信息
上面命令的结果是一个数字,如果cdump下的这个数字每天增长10个以上,则说明Oracle进程经常发生核心转储,某些用户进程或者数据库后台进程由于无法处理的原因而异常退出。
频繁的核心转储特别是数据库后台进程的核心转储会导致数据库异常终止。
如果udump下的数字每天增长很多,需要检查是哪个进程产生的trc文件。
比如,下面的就是DataGuard传输日志的进程追踪文件。
-rw-r-----1oracleoinstall675Jan1313:
22oracle_ora_31331.trc
-rw-r-----1oracleoinstall898Jan1313:
29oracle_ora_31363.trc
-rw-r-----1oracleoinstall673Feb518:
00oracle_ora_884.trc
-rw-r-----1oracleoinstall894Feb518:
04oracle_ora_947.trc
5检查Oracle对象的状态
5.1检查控制文件
命令:
Select*fromv$controlfile ;
结果:
SQL>setlin300
SQL>colnam
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据库 每日 监控 反馈