类别 |
事件 |
DBAmon 监视 什么 |
行动 采取 |
可用性 |
1. Oracle实例运行 (自动修复) |
- 数据库打开
- 背景过程:运行pmon,smon,lgwr,dbw *
- 能够通过svrmgrl / sqlplus运行sql
|
(自动修复:Oracle Crash) 如果满足以下所有条件,则DBAmon发现pmon任务已死时,它将尝试启动Oracle:
|
可用性 |
2.侦听器正在运行 (自动修复) |
|
( 自动修复:侦听器关闭)侦听器自动启动(lsnrctl启动)。 |
可用性 |
3.表空间已满 (自动修复) |
|
(自动修复:表空间已满或几乎已满)
- 表空间达到警告严重性阈值时,将调用DBC T_TS_Command:命令。这将导致将空间添加到该表空间。
|
可用性 |
4.对象范围 (自动修复) |
|
(自动修复:对象在最大范围内或附近)
|
可用性 |
5. Archivelog文件系统已满 (自动修复) |
- 检查每个存档日志目标的UX文件系统。如果发现至少有 DBC指定的T_Arclog: 已满百分比,则会发生事件。
- 自上次成功执行存档日志备份以来的小时数(可选)。如果 超过了 DBC指定的Backup_Age:小时数,则会发生“备份期限事件”。
- 记录每个备份(ARC,ARCFSCHECK,ARCKEEPn,ARCEMERGENCY)的时间戳的逻辑已合并到备份工具中。
|
(自动修复:存档日志文件系统已满,或自上次成功存档日志备份以来已耗费太多时间)
|
可用性 |
6.侦听器日志 (自动修复) |
- 在$ ORACLE_HOME /网络/日志/ LISTENER.LOG会变得非常大,甚至造成$ ORACLE_HOME文件系统来填充。如果大小超过50M,则会发生事件。
|
(自动修复:数据库侦听器日志> 50M)
- 在$ ORACLE_HOME /网络/日志/ LISTENER.LOG自动gzip压缩。
|
后备 |
7.数据库备份 期限(自动修复) |
- 测量自上次成功备份以来的小时数。如果 超过了 DBC指定的Backup_Age:小时数,则会发生“备份期限事件”。
- 记录每个备份(RMAN,完整,导出,TBS,BCV)时间戳的逻辑已集成到我们的每个备份工具中。
|
(自动修复:自从上一次成功的数据库备份以来已耗费太多时间)
|
后备 |
8.挂起RMAN OS处理消耗cpu (AutoFix) |
-
如果有任何rman OS进程:
- 父PID为1
- 消耗> 1个cpu的75%
- 已经运行了至少5分钟
是孤立的过程。具有这些属性的RMAN进程始终是孤立的进程,它们永远不会独立死亡。
|
(自动修复:挂起的孤立的RMAN进程)
|
安全 |
9.具有明显密码的数据库“系统”用户 (自动修复) |
- 如果找到具有默认密码的“系统”用户(SYS,SYstem,OUTLN等),则会发生事件。
|
(自动修复:发现数据库系统用户使用不安全的密码)
- (仅适用于HP-UX)此用户的密码已更改为您选择的密码之一。
|
安全 |
10.听众密码 (自动修复) |
- 需要为侦听器(/etc/listener.ora)设置密码。
|
(自动修复:未设置侦听器密码)
|
|
可用性 |
11.警报日志 |
- 检查警报日志中是否存在某些字符串(可由用户配置)。如果找到这些字符串中的任何一个(排除字符串未排除),则将发生严重事件。实例特定的EXCLUDE字符串可以在文件/home/oracle/.dbamon_ORACLESID_alert_exclude.txt中指定 。
|
可用性 |
12.对象下一个范围大小 |
- 如果对象的下一个范围不适合其表空间,则会发生事件。(如果为实例启用了“范围检查”,则此功能可用)。
|
可用性 |
13. SGA已满 |
- 如果SGA已满100%,则将发生严重事件。
- 如果SGA已满== 99%,将发生警告事件。
|
可用性 |
14. ORACLE_HOME文件系统已满 |
- 如果发生这种情况,Oracle可能会挂起。如果该文件系统> = 99%已满,将发生一个事件。
|
可用性 |
15.已启用受限会话 |
- 如果Oracle在RESTRICTED SESSION中,则将发生一个事件。
|
可用性 |
16.脱机数据文件 |
- 如果任何数据文件都不在线(来自v $ datafile),则会发生事件。
|
可用性 |
17.存档目标状态 |
- 如果任何存档日志目标(v $ archive_dest)处于错误状态,则将发生事件。
|
可用性 |
18.重做日志成员状态 |
- 如果任何重做日志成员具有非空(v $ logfile)状态,则将发生事件。
|
可用性 |
19.工艺表 |
- 如果当前的数据库进程数接近INIT.ORA 进程参数值,则将发生事件。
|
可用性 |
20. I / O从站计数 |
- I / O从站(dbwr或磁带)的最大数量为40。如果接近这个数目,则会发生事件。
|
可用性 |
21. UX文件描述符 |
- 如果当前UX文件描述符的数量接近内核配置的值,则将发生此事件。
|
可用性 |
22.孤儿数据文件 |
- 如果在应放置数据库数据文件的位置中找到任何未使用的数据文件(不在v $ datafile中),并且这些文件与活动数据文件的命名约定相同,则将发生此事件。如果删除了表空间并且未手动删除数据文件(9i之前的版本),则可能会发生这种情况。
|
可用性 |
23.非双工控制文件 |
|
可用性 |
24.没有数据文件的表空间 |
- 如果找到没有数据文件的表空间,则会发生事件。即使在使用TEMP表空间作为备用数据库的情况下,也要创建至少1个tempfile是一个好习惯。
|
可用性 |
25. UX“ maxuprc”进程限制 |
- 如果运行数据库的UX用户ID的当前OS进程计数接近maxuprc HP-UX内核值,则将发生事件。
|
后备 |
26.挂起RMAN OS进程 |
- 如果有任何rman OS进程已运行至少24小时,则将发生一个事件。
|
后备 |
27.备份-不可恢复的更改 |
- 如果自从最近的RMAN LVL0备份以来没有任何不可恢复的更改,则将发生一个事件。
|
DRP |
28.备用数据库-主增量 |
|
DRP |
29.备用数据库-NOLOGGING对象 |
|
DRP |
30.配置保存 |
- 要在服务器崩溃(或???)后重建实例,拥有INIT.ORA,数据文件映射和表空间映射的副本将很有用。
|
- 对于每个实例,此信息的副本将自动保存在 / opt / dbamon / dat / config_save /中。
|
DRP |
31.备用数据库-不可恢复的更改 |
- 如果自从主数据库以来发生了任何不可恢复的更改,那么将发生最后一个备用数据库重建事件。可以使用DBC指定的InSync *参数来指定这些事件的严重性 。将在DBAMON.STANDBY_REBUILD表和最近不可恢复的更改的日期之间进行比较。成功重建备用数据库后,备用数据库重建工具会自动在DBAMON.STANDBY_REBUILD中插入一行。
|
DRP |
32.强制记录 |
- 在9i +中,可以在数据库级别设置“强制日志记录”。这消除了备用和备份不可恢复更改的问题。如果强制日志记录为OFF,则将发生此事件。
|
性能 |
33. OTRACE是否打开? |
- Oracle OTRACE可能会导致性能问题。如果存在 $ ORACLE_HOME / otrace / admin * .dat 文件,则甚至会发生这种情况。
|
性能 |
34. sql_TRACE是否打开? |
- 实例范围的Oracle sql_TRACE可能会导致性能问题。如果sql_TRACE init.ora参数打开,则将发生此事件。
|
性能 |
35.回滚段获取:等待比率 |
- 如果回滚段等待的比率> 1%,则可能需要更多的回滚段。请注意,在9i + SMU中,这是自动管理的,因此可能不会发生此事件。
|
性能 |
36.具有默认表空间SYstem的用户 |
|
性能 |
37.具有SYstem临时表空间的用户 |
|
性能 |
38. TEMP表空间的类型为永久 |
- 主要性能问题可能是由于TEMP(临时)表空间是永久表空间而导致的。检查所有用户的临时表空间的表空间类型。
|
性能 |
39.是否对数据字典进行了分析 |
- 分析SYS和SYstem对象可能会导致严重的性能问题(高响应性cpu)。如果已分析这些对象中的任何一个,则将发生事件。
|
性能 |
40.数据库缓冲区高速缓存命中率 |
- 如果数据库高速缓存命中率<= 50%,则会发生事件。
|
性能 |
41.不正确的默认/临时表空间 |
- 在10g +中,您可以指定默认的默认表空间和临时表空间。如果将其中任何一个设置为SYstem,则将发生一个事件。
|
性能 |
42. SMU |
- 在9i +中,应该启用SMU(系统管理的UNDO)。如果不是,则会发生事件。
|
性能 |
43.数据库缓冲区高速缓存1粒度 |
- 可以创建带有少量BYTES的DB缓存(尤其是在9i +中)。Oracle将四舍五入到最接近的粒度。如果该值仅是1个颗粒,那么那一定是发生了什么。将会发生一个事件。
|
性能 |
44.使用中的MTS |
- MTS(在非RAC环境中)可能会降低性能。如果发现打开,则会发生事件。
|
性能 |
45.库缓存命中率 |
|
性能 |
46.字典缓存命中率 |
- 如果字典高速缓存命中率小于90%,将发生一个事件。
|
性能 |
47.服务器内存利用率 |
- 如果服务器内存已使用> = 99%,则会发生警告事件。
- 如果服务器内存已使用> = 95%,则会发生性能事件。
|
安全 |
48.危险的INIT.ORA参数 |
- 如果设置了任何危险的INIT.ORA参数(例如,将O7_DICTIONARY_ACCESSIBILITY设置为TRUE),则会发生事件。
|
安全 |
49.具有Userid = Password的DB用户 |
- 如果任何用户的密码都等于userid,则会发生事件。这是严重的安全漏洞。
|
安全 |
50. DBA组中的UX用户 |
- 如果将除oracle以外的任何其他用户放入dba组,则将发生安全事件。
|
安全 |
51.使用DBA角色的非系统用户 |
- 如果已将任何非系统DB用户授予DBA角色,则会发生安全事件。
|
安全 |
52. Oracle文件权限 |
- 如果某些Oracle配置文件具有全球可读的权限,则会发生安全事件。
|
管理 |
53. DBMS软件监督 |
- 如果已经(通过DBAmon Console)配置了DBMS软件监督,则将Oracle版本与该版本系列的“最低良好版本”进行比较。如果小于,那么将发生一个事件。
|
管理 |
54. DBAMON.TIMESTAMP行 |
- DBAMON.TIMESTAMP表用于记录数据库的时间戳。如果由于某种原因而无法使用ora_timestamp工具的清除过程,则该表可能会变得很大。如果DBAMON.TIMESTAMP的行计数超过100,000,则将发生严重事件。
|
管理 |
55.注册表组件不匹配 |
- 如果在DBA_REGISTRY中找到其版本与DBMS不匹配的组件,则会发生警告事件。
|
管理 |
56.自动启动软件 |
- 如果不存在Oracle的服务器自动启动配置(HP-UX:/sbin/init.d),或者存在但不调用oraadmine的服务器,则将发生事件。
|
管理 |
57.工具时间戳 |
- 如果/usr/local/dba/tools/TIMESTAMP.txt文件在28小时内未更新,则将发生严重事件。
|
管理 |
58.半双工局域网 |
- 该的lanadmin运行命令来测试所有已知的LAN卡。如果发现处于半双工模式,则会发生严重事件。尚未在28小时内更新,则将发生严重事件。结果票证将自动分配给UX小组。
|
管理 |
59. DBMS补丁管理 |
- DBAmon跟踪哪些补丁已应用于Oracle。然后可以查看详细的报告(通过WWW界面),以查看特定风险级别的所有实例是否合规。请参阅 补丁报告 。
|
管理 |
60.备份时间表 |
(自定义逻辑)如果不存在备份计划(ARC和LVL *),则将发生严重事件。 |
管理 |
61.奇怪的时间表 |
(定制逻辑)如果未在cron中计划ora_oddjob,则将发生严重事件。 |
管理 |
62. DB_FILES的用法 |
将V $ DATAFILE中的行数与DB_FILE init.ora设置进行比较。如果发现> = 95%的DB_FILES值,则将发生严重事件。 |
管理 |
63. cron守护程序 |
如果cron OS守护程序未运行,则将发生严重事件。 |
管理 |
64.数据库损坏 |
如果在V $ DATABASE_BLOCK_CORRUPTION中找到行,则将发生严重事件。 |
管理 |
65. ASM磁盘组 |
对于+ ASM实例,将监视磁盘组的完整性。 |
管理 |
66.闪存恢复区已满 |
对于archivelog dest为FRA的+ ASM实例,将监视FRA磁盘组是否已满。 |
管理 |
67.兼容参数 |
如果将COMPATIBLE pfile参数设置为比软件版本低至少一个版本,则将发生事件。 |
管理 |
68. DST2007修补程序状态 |
DBAmon将自动确定是否需要和安装DST2007补丁程序(用于TZ-Columns或JVM)。如果需要并且未安装它们,则会发生事件。 |