Oracle健康监控及健康检查(Health Monitor)

一、Oracle健康监控及健康检查

Oracle数据库包括一个名为Health Monitor的框架,用于运行诊断检查数据库的各种组件。Oracle健康监视器检查各种组件数据库包括文件,内存,事务完整性,元数据和进程使用。在检查器运行后,它生成一个包含有关检查器发现的信息的报告,包括优先事项(低,高或关键),调查结果及其后果的描述,和关于执行的基本统计。 Health Monitor使用XML生成报表并存储ADR报告。可以使用V$ HM_RUN,DBMS_HM,ADRCI或企业管理器查看相应的调查结果报告以及解决问题的建议。

下图为健康监控组件框架

二、检查的具体组件及描述

sql> select * from v$version;

BANNER
--------------------------------------------------------------------------------
Oracle Database 11g Enterprise Edition Release 11.2.0.3.0 - 64bit Production

sql> select 'Leshami' Author,'http://blog.csdn.net/leshami' Blog,2  '645746311' QQ from dual;

AUTHOR  BLOG                         QQ
------- ---------------------------- ---------
Leshami http://blog.csdn.net/leshami 645746311

sql> SELECT name,internal_check,offline_capable,description FROM v$hm_check;

NAME                             I O DESCRIPTION
-------------------------------- - - -----------------------------------------------------------------
HM Test Check                    Y Y Check for health monitor functionality
DB Structure Integrity Check     N Y Checks integrity of all database files
CF Block Integrity Check         N Y Checks integrity of a control file block
Data Block Integrity Check       N Y Checks integrity of a data file block
Redo Integrity Check             N Y Checks integrity of redo log content
Logical Block Check              Y N Checks logical content of a block
Transaction Integrity Check      N N Checks a transaction for corruptions
Undo Segment Integrity Check     N N Checks integrity of an undo segment
No Mount CF Check                Y Y Checks control file in NOMOUNT mode
Mount CF Check                   Y Y Checks control file in mount mode
CF Member Check                  Y Y Checks a multiplexed copy of the control file
All Datafiles Check              Y Y Checks all datafiles in the database
Single Datafile Check            Y Y Checks a data file
Tablespace Check Check           Y Y Checks a tablespace
Log Group Check                  Y Y Checks all members of a log group
Log Group Member Check           Y Y Checks a particular member of a log group
Archived Log Check               Y Y Checks an archived log
Redo Revalidation Check          Y Y Checks redo log content
IO Revalidation Check            Y Y Checks file accessibility
Block IO Revalidation Check      Y Y Checks file accessibility
Txn Revalidation Check           Y N Revalidate corrupted transaction
Failure Simulation Check         Y Y Creates dummy failures
Dictionary Integrity Check       N N Checks dictionary integrity
ASM Mount Check                  Y Y Diagnose mount failure
ASM Allocation Check             N Y Diagnose allocation failure
ASM disk Visibility Check        Y Y Diagnose add disk failure
ASM File Busy Check              Y Y Diagnose file drop failure
ASM Toomanyoff Check             Y Y Diagnose mount Failed because there were too many offline disks
ASM Insufficient disks Check     Y Y Diagnose mount Failed because there were insufficient disks

以下列出一些重要检查描述

数据库结构完整性检查(DB Structure Integrity Check)

  此检查将验证数据库文件的完整性,如文件无法访问,损坏或不一致,并报告这些故障。如果数据库处于挂载或打开模式,则此检查将检查控制文件中列出的日志文件和数据文件。如果数据库处于NOMOUNT模式,则仅检查控制文件

数据块完整性检查(Data Block Integrity Check)
  此检查检测磁盘映像块损坏,如校验和异常,头/尾不匹配和块内的逻辑不一致。大多数损坏可以使用块介质恢复进行修复。还会在V$DATABASE_BLOCK_CORRUPTION视图中捕获损坏的块信息。此检查不会检测到块间或段间损坏。

重做完整性检查(Redo Integrity Check)
  此检查扫描重做日志的内容获取可访问性和损坏以及归档日志(如果可用)。重做完整性检查报告如归档日志或重做损坏故障。

撤消段完整性检查(Undo Segment Integrity Check)
  此检查发现逻辑撤销损坏。找到撤销损坏后,此检查使用PMON和SMON尝试恢复损坏的事务。如果此恢复失败,则Health Monitor将存储有关损坏的信息V$CORRUPT_XID_LIST。大多数撤销损坏可以通过强制提交来解决

事务完整性检查(Transaction Integrity Check)
  此检查与撤消段完整性检查相同,只是它仅检查一个特定事务。

字典完整性检查(Dictionary Integrity Check)
  此检查检查核心字典对象的完整性,如tab$和col$。它执行以下操作:

    验证每个字典对象的字典条目的内容
    执行跨行级别检查,该检查验证字典中行的逻辑约束是否被强制执行。
    执行对象关系检查,该检查验证字典对象之间的父子关系是否被强制执行。

三、健康检查支持的模式及运行方式

1、支持模式

反应式
  故障诊断基础架构可以自动运行健康检查以响应严重错误

手动式
  可以使用DBMS_HM PL/sql软件包或Enterprise Manager界面手动运行健康状况检查。也可以根据需要定期运行检查程序

健康监视器在自动诊断存储库(ADR)中检查存储结果,建议和其他信息。

2、运行方式

DB-online(即在OPEN模式下)
健康检查可以在数据库打开时运行(或称联机模式)。

DB-offline(数据库脱机)
健康检查可以在实例可用并且数据库本身关闭时运行(NOMOUNT模式)。

四、演示健康健康检查

1、使用DBMS_HM PL / sql包实施检查

DBMS_HM包主要包括2个存储过程,一个是RUN_CHECK,主要用于实施健康检查,支持参数输入;一个是GET_RUN_REPORT,用于获取健康检查的结果。
以下为支持的相关参数列表

sql> SELECT c.name check_name,p.name parameter_name,p.type,2  p.default_value,p.description
  3  FROM v$hm_check_param p,v$hm_check c
  4  WHERE p.check_id = c.id and c.internal_check = 'N'
  5  ORDER BY c.name;
CHECK_NAME                    ParaMETER_NAME       TYPE                 DEFAULT_VALUE    DESCRIPTION
----------------------------- -------------------- -------------------- ---------------- ---------------------------------------
ASM Allocation Check          ASM_disK_GRP_NAME    DBKH_ParaM_TEXT                       ASM group name
CF Block Integrity Check      CF_BL_NUM            DBKH_ParaM_UB4                        Control file block number
Data Block Integrity Check    BLC_DF_NUM           DBKH_ParaM_UB4                        File number
Data Block Integrity Check    BLC_BL_NUM           DBKH_ParaM_UB4                        Block number
Dictionary Integrity Check    CHECK_MASK           DBKH_ParaM_TEXT      ALL              Check mask
Dictionary Integrity Check    TABLE_NAME           DBKH_ParaM_TEXT      ALL_CORE_TABLES  Table name
Redo Integrity Check          SCN_TEXT             DBKH_ParaM_TEXT      0                SCN of the latest good redo (if kNown)
Transaction Integrity Check   TXN_ID               DBKH_ParaM_TEXT                       Transaction ID
Undo Segment Integrity Check  USN_NUMBER           DBKH_ParaM_TEXT                       Undo segment number

--演示实施健康检查

RMAN> backup database plus archivelog;  --先备份

sql> select file#,name from v$datafile where name like '%user%';

     FILE# NAME
---------- ------------------------------------------------------------
         4 /app/oracle/ora11g/oradata/ora11g/users01.dbf

$ cat /dev/null>/app/oracle/ora11g/oradata/ora11g/users01.dbf

sql> alter system flush buffer_cache;

System altered.

sql> select count(*) from scott.emp;
select count(*) from scott.emp
*
ERROR at line 1:
ORA-01115: IO error reading block from file  (block # )
ORA-01110: data file 4: '/app/oracle/ora11g/oradata/ora11g/users01.dbf'
ORA-27072: File I/O error
Additional information: 4
Additional information: 155

sql> BEGIN
  2     DBMS_HM.RUN_CHECK (check_name   => 'DB Structure Integrity Check',3                        run_name     => 'my_db_strc_check');
  4  END;
  5  /

PL/sql procedure successfully completed.

--查看报告
SET LONG 100000
SET LONGCHUNKSIZE 1000
SET PAGESIZE 1000
SET LInesIZE 512
SELECT DBMS_HM.GET_RUN_REPORT('my_db_strc_check') FROM DUAL;

DBMS_HM.GET_RUN_REPORT('MY_DB_STRC_CHECK')
--------------------------------------------------------------
Basic Run information
 Run Name                     : my_db_strc_check
 Run Id                       : 107795
 Check Name                   : DB Structure Integrity Check
 Mode                         : MANUAL
 Status                       : COMPLETED
 Start Time                   : 2017-07-03 17:13:49.550575 +08:00
 End Time                     : 2017-07-03 17:13:50.202535 +08:00
 Error Encountered            : 0
 Source Incident Id           : 0
 Number of Incidents Created  : 0

Input Paramters for the Run
Run Findings And Recommendations
 Finding
 Finding Name  : Corrupt Datafile  --找到损坏的数据文件
 Finding ID    : 107799
 Type          : FAILURE           --类型为失败
 Status        : OPEN              --状态为OPEN
 Priority      : HIGH              --级别为高 
 Message       : Datafile 4: '/app/oracle/ora11g/oradata/ora11g/users01.dbf'is corrupt
 Message       : Some objects in tablespace USERS might be unavailable

2、使用OEM实施检查

实施检查

查看报告

3、通过ADRCI接口查看报告

adrci>
adrci> show hm_run –列出所有检查运行过的健康监控(可查询V$HM_RUN视图获取)
adrci> create report hm_run run_name –创建报告
adrci> show report hm_run run_name –查看报告

五、相关视图

V$HM_CHECK –所有能够被check的组件
V$HM_CHECK_ParaM –check组件可传递的相关参数
V$HM_RUN –所有健康健康检查相关信息及其状态
V$HM_FINDING –相关检查成果
V$HM_RECOMMENDATION –相关检查建议
V$HM_INFO –关于健康检查runs,findings,and recommendations信息

相关文章

Java Oracle 结果集是Java语言中处理数据库查询结果的一种方...
Java AES和Oracle AES是现代加密技术中最常使用的两种AES加密...
Java是一种广泛应用的编程语言,具备可靠性、安全性、跨平台...
随着移动互联网的发展,抽奖活动成为了营销活动中不可或缺的...
Java和Oracle都是在计算机领域应用非常广泛的技术,他们经常...
Java 是一门非常流行的编程语言,它可以运行于各种操作系统上...