DM8 数据库健康状态检查
一.主机配置检查
网卡检查
ifconfig , ethtool ,
防火墙
--redhat 6
service iptables status
--redhat 7
systemctl status firewalld.service
若防火墙开启,检查数据库端口策略
--redhat 6
iptables -L -n
--redhat 7
firewall-cmd --list-all
若防火墙已开启,且未设置端口策略,关闭防火墙
-- redhat 6
service iptables status
chkconfig iptables off
--redhat 7
systemctl disable firewalld.service
systemctl stop firewalld.service
关闭selinux
set enforce 0
vim /etc/selinux/config
or
cp /etc/selinux/config /etc/selinux/config.bak
sed -i 's^SELINUX=enforcing^SELINUX=disabled^g' /etc/selinux/config
cpu型号及核数
查看型号 -- 建议 Pentium 4 1.6GHz 以上处理器
cat /proc/cpuinfo |grep "model name" | head -n 1
or
lscpu
内存检查
-- 建议 512 MB 以上内存 .
free -m
磁盘空间检查
--查看本地磁盘容量
df -h
服务器时间检查
--查看当前时间
date
--添加 NTP 服务器进行时间同步
--redhhat 7
重启时间同步服务:# systemctl restart chronyd.service
查看时间同步状态:# systemctl status chronyd.service
查看时间同步源:# chronyc sources -v
查看时间同步源状态:# chronyc sourcestats -v
二.系统资源限制
-
data seg size
建议用户设置为 1048576(即 1 GB)以上或 unlimited(无限制),此参数过小将可能导致数据库启动失败。
-
file size
建议用户设置为 unlimited(无限制),此参数过小将可能导致数据库安装或初始化失败。
-
open files
建议用户设置为 65536 以上或 unlimited(无限制)。
-
virtual memory
建议用户设置为 1048576(即 1 GB)以上或 unlimited(无限制),此参数过小将可能导致数据库启动失败。
登录数据库运行用户,执行以下命令:
ulimit -a
修改 limit 配置,即登录 root 修改
/etc/security/limits.conf
core 文件设置
--查看core文件大小
ulimit -c
--修改core文件大小(只在当前会话有效)
ulimit -c filesize
--永久有效
vi /etc/security/limits.conf
dmdba soft core ulimited
dmdba hard core ulimited
--查看core默认生成路径
cat /porc/sys/kernel/core_pattern
--修改默认生成路径
echo "/corefile/core-%e-%p-%t" > /proc/sys/kernel/core_pattern
sysctl -w kernel.core_pattern=/corefile/core.%e.%p.%s.%E
磁盘调度算法
--查看磁盘调度算法
cat /sys/block/sda/queue/scheduler
--修改硬盘调度算法
echo deadline > /sys/block/sda/queue/scheduler
--永久
grubby --update-kernel=ALL --args="elevator=deadline"
reboot
磁盘状态检查
数据库目录及磁盘空间
df -h /opt/dm8/data
磁盘读写检查
写入测试
dd if=/dev/zero of=test bs=64k count=4k oflag=dsync
正常写速度:机械磁盘在
50 MB/s~90 MB/s
,固态硬盘在
150 MB/s-300 MB/s
。
读取测试
dd if=test of=/dev/zero bs=64k count=4k oflag=dsync
操作系统资源利用率
cpu占用率
top / nmon
%id:空闲 CPU 百分比,若该值很低,则需要检查 CPU 具体被哪个进程占用,是否存在瓶颈。 %us:用户空间占用 CPU 百分比。
内存使用率
free -m / nmon
关注 buffer/cache 和 free 内存,若 swap 可用过少,服务器内存使用可能有存在内存问题。
可用 `cat /proc/sys/vm/swappiness` 查看当物理内存使用多少后才会用到 swap。
该参数建议修改为 60% ,如果内存充足,可以关闭swap .
磁盘io速率
iostat -xm -t 1 / nmon
如果 %iowait 的值过高,表示硬盘存在 I/O 瓶颈。 如果 %idle 值高,表示 CPU 较空闲。 如果 %idle 值高但系统响应慢时,可能是 CPU 等待分配内存,应加大内存容量。 如果 %idle 值持续低于 10,表明 CPU 处理能力相对较低,系统中最需要解决的资源是 CPU。
数据库版本检查
DM 数据库版本分操作系统和 CPU 架构不同而有所不同,不同操作系统及不同 CPU 架构的版本不能通用。
select * from SYS."V$VERSION" ;
数据库架构
DM 数据库具备多种数据库集群解决方案,其中包括:
数据守护集群 (DataWatch)、共享存储集群 (DMDSC) 和 MPP 集群
等。
通过数据同步工具 (DMHS),可实现同构、异构数据库间的数据同步,基于此工具,可实现在现应急灾备、多业务中心、异构资源信息整合等多种使用场景。
数据库参数
DM 数据库的
ini 参数
对于数据库的运行至关重要,不仅关系到数据库性能,还可能会影响到数据库的正常使用,默认和数据文件存放在同一目录。
对于单实例数据库而言,需要关注的有
dm.ini、dmarch.ini、sqllog.ini
等参数配置文件。不同的集群类型,在单实例的基础上,增加了
dmmal.ini、dmwatcher.ini、dmdcr.ini
等多种配置文件。
-
dm.ini 配置文件
参数名称
|
默认值
|
参数描述及建议
|
属性
|
MAX_OS_MEMORY
|
95
|
该值用来定义数据库主内存池的扩展上限,通常定义为 70-90 之间即可(表示主池最大占用总内存的 70 %-90 %),如果数据库服务器上还运行其他应用软件,可适当调低。
|
静态
|
MEMORY_POOL
|
200
|
数据库的主内存池,是在服务器启动时从 OS 申请的大片内存,后续服务器运行过程中,需要内存分配的地方大部分都是从该池分配。该值用来设置服务器启动时候的主池大小,以 MB 为单位。默认为 200,高并发时应调大,避免频繁向 OS 申请内存。
|
静态
|
MEMORY_TARGET
|
0
|
数据库主内存池在扩展到此大小以上后,空闲时间收缩会此指定大小,以 MB 为单位,通常保持默认为 0,代表不限制。
|
静态
|
BUFFER
|
100
|
数据库中的数据缓冲区,用来保存从磁盘中读取到的数据,单位为 MB。该缓冲区根据实际用途划分成多区域:普通数据缓冲区、快速数据缓冲区、数据回收缓冲区等等。如果数据量小于内存,则设置为数据量大小;否则设置为总内存的 2/3 比较合适。
|
静态
|
PWD_POLICY
|
2
|
用来设置新建用户的密码策略,建议生产中按照生产规范来做要求,密码定期修改,并杜绝泄漏。
|
静态
|
MAX_BUFFER
|
100
|
数据缓冲区扩展的最大值,建议和 BUFFER 值设置的一样
|
静态
|
SORT_BUF_SIZE
|
2
|
排序缓存区,单位 MB,有大量排序操作时建议调大点。
|
动态,会话级
|
BUFFER_POOLS
|
4
|
BUFFER 的分区数,一般配置为质数,并发较大的系统需要配置这个参数,减少数据缓冲区并发冲突
|
静态
|
RECYCLE
|
64
|
用于缓冲临时表空间,单位为 MB,高并发或大量使用 with、临时表、排序等应该调大点
|
静态
|
RECYCLE_POOLS
|
19
|
RECYCLE 缓冲区分区数,一般配置为质数,并发较大的系统需要配置这个参数,减少数据缓冲区并发冲突
|
静态
|
DICT_BUF_SIZE
|
5
|
用于缓存数据字典,单位为 MB,系统中对象个数较多时适当加大
|
静态
|
WORKER_THREADS
|
4
|
工作线程的个数,建议设置为 CPU 核数或其两倍
|
静态
|
MAX_SESSIONS
|
100
|
用户最大连接数,一般设置为 2000 即可满足绝大多数应用
|
静态
|
OLAP_FLAG
|
2
|
OLTP 系统建议设置为 2,OLAP 系统建议设置为 1
|
动态,会话级
|
TEMP_SPACE_LIMIT
|
0
|
临时表空间大小上限,单位为 MB,如果有大量排序、临时表操作时可能会占用。关系到磁盘空间占用,建议根据磁盘情况设置上限
|
动态,系统级
|
SVR_LOG
|
0
|
是否打开 SQL 日志功能,0:表示关闭;1:表示打开;2:按文件中记录数量切换日志文件。一般生产环境建议设置为 2,搭配参数 SVR_LOG_FILE_NUM 使用
|
动态,系统级
|
SVR_LOG_FILE_NUM
|
0
|
总共记录多少个日志文件,当日志文件达到这个设定值以后,再生成新的文件时,会删除最早的那个日志文件,建议根据磁盘情况设置,不宜过多。
|
动态,系统级
|
ENABLE_MONITOR
|
0
|
用于打开或者关闭系统的监控功能。1:打开;0:关闭。打开后会对数据库运行情况进行记录,对性能有所损耗,生产环境建议关闭
|
动态,系统级
|
ARCH_INI
|
0
|
数据库的归档开关,0:不启用;1:启用;生产环境务必打开,否则会影响到数据库备份。和 dmarch.ini 共同作用
|
动态,系统级
|
以上参数属性分为三种:静态、动态和手动。
-
静态:可以被动态修改,修改后重启服务器才能生效。
-
动态:可以被动态修改,修改后即时生效。动态参数又分为会话级和系统级两种。会话级参数被修改后,新参数值只会影响新创建的会话,之前创建的会话不受影响;系统级参数的修改则会影响所有的会话。
-
手动:不能被动态修改,必须手动修改 dm.ini 参数文件,然后重启才能生效。
上面提到的可动态修改是指 DBA 用户可以在数据库服务器运行期间,通过调用系统过程,执行以下命令:
SP_SET_PARA_VALUE()、SP_SET_PARA_DOUBLE_VALUE()和
SP_SET_PARA_STRING_VALUE()对参数值进行修改。
-
dmarch.ini 配置文件
该配置文件主要用来配置归档,在单实例下,一般配置为本地归档,并建议分配独立的磁盘存放归档文件,设置每个归档文件 2 GB 大小,并根据磁盘情况设置归档上限,以免撑满磁盘。如下图所示:

数据守护集群
数据守护集群涉及到的配置文件除了以上介绍的单实例部分,还包含
dmmal.ini、dmwatcher.ini、dmmoitor.ini、dmtimer.ini
等。大部分为功能性参数,只要满足集群搭建要求即可,需要重点关注检查的参数如下:
-
dmarch.ini 配置文件
该配置文件主要是控制归档文件的形成,数据守护集群的架构下因为主库需要向备库同步归档或者当备库切换为主库是也需要向原主库同步归档,因此都需要比单机的归档配置多配置一个归档类型,详细配置如下:

参数名称
|
默认值
|
参数描述及建议
|
属性
|
ARCH_FILE_SIZE
|
1024
|
单位 MB,本地单个归档文件最大值。
建议 2048
|
动态
|
ARCH_SPACE_LIMIT
|
0
|
单位 MB,0 表示无限制,范围 1024~4294967294 MB。
建议为归档存放目录容量的 80%
|
动态
|
-
dmmal.ini 配置文件
dmmal.ini 是集群数据库各个节点之前内部通讯的验证文件因此需要各个节点配置严格保持一致不然会影响集群的运行,
建议参数 MAL_CHECK_INTERVAL 和 MAL_CONN_FAIL_INTERVAL 修改为 60 s
,以避免因为网络延时出现脑裂的情况,详细配置如下:
Copy
cd /dmdata/实例名/
vi dmmal.ini

参数名称
|
默认值
|
参数描述及建议
|
属性
|
MAL_CHECK_INTERVAL
|
30
|
检测线程检测间隔,范围 (0~1800),如果配置为 0,则表示不进行链路检测,建议修改为 60 s
|
静态
|
MAL_CONN_FAIL_INTERVAL
|
10
|
检测线程认定链路断开的时间,默认 10 s,范围 (2~1800),建议修改为 60 s
|
静态
|
-
dmwatcher.ini 配置文件
dmwatcher.ini 是集群守护进程的配置文件,其中请注意这些参数
DW_MODE,INST_AUTO_RESTART,INST_INI 和 INST_STARTUP_CMD
,以避免不必要的麻烦,详细配置如下:
Copy
cd /dmdata/实例名/
vi dmwatcher.ini

参数名称
|
默认值
|
参数描述及建议
|
属性
|
DW_MODE
|
MANUAL
|
主备切换模式:MANUAL 手动切换模式,AUTO 自动切换模式。
建议使用自动切换模式
|
静态
|
INST_AUTO_RESTART
|
0
|
是否自动重启数据库实例,0:不自动重启 1:自动重启。
建议为 1
|
静态
|
INST_STARTUP_CMD
|
无
|
启动数据库的命令,请写数据库进程的决定路径。
|
静态
|
-
dmmoitor.ini 配置文件
dmmonitor.ini 是守护集群的监视器的配置文件,其中有需要确认的是参数
MON_DW_Confirm,MON_LOG_INTERVAL,MON_LOG_FILE_SIZE和MON_LOG_SPACE_LIMIT
,详细配置如下:
Copy
cd /dmdata/实例名/
vi dmmonitor.ini

参数名称
|
默认值
|
参数描述及建议
|
属性
|
MON_DW_CONFIRM
|
0
|
是否配置为确认模式。0:监控模式;1:确认模式。
|
静态
|
MON_LOG_FILE_SIZE
|
64
|
单个日志文件大小,范围 16~2048,单位为 MB,达到最大值后,会自动生成并切换到新的日志文件中。
建议为 64 MB
|
静态
|
MON_LOG_SPACE_LIMIT
|
0
|
日志总空间大小,取值 0 或者 256~4096 单位为 MB,表示没有空间限制,如果达到设定的总空间限制,会自动删除创建时间最早的日志文件。
建议为 2048 MB
|
静态
|
共享存储集群
共享存储集群涉及到的配置文件除了以上介绍的单实例部分,还包含
dmarch.ini、dmdcr_cfg.ini、dmdcr.ini、dminit.ini、dmmal.ini、dmcssm.ini
等,大部分为功能性参数,只要满足集群搭建要求即可,需要重点关注检查的参数如下:
-
dmdcr.ini 配置文件
dmdcr.ini 为共享存储集群各个进程输入参数的配置文件,并且还记录该节点在集群中的编号。需要注意的相关参数有
DMDCR_ASM_RESTART_INTERVAL,DMDCR_DB_RESTART_INTERVAL,和DMDCR_AUTO_OPEN_CHECK
,详细配置如下:
Copy
cd /dmdb/dmdata
Vi dmdcr.ini

参数名称
|
默认值
|
参数描述及建议
|
属性
|
DMDCR_ASM_RESTART_INTERVAL
|
60
|
DMCSS 认定 DMASM 节点故障重启的时间间隔(取值 0~86400 s),DMCSS 只负责和 DMDCR_SEQNO 节点号相等的 DMASM 节点的故障重启如果配置为 0,则不会执行自动拉起操作。
建议值为 60
|
静态
|
DMDCR_DB_RESTART_INTERVAL
|
60
|
DMCSS 认定 DMDSC 节点故障重启的时间间隔(取值 0~86400 s),DMCSS 只负责和 DMDCR_SEQNO 节点号相等的 DMDSC 节点的故障重启,如果配置为 0,则不会执行自动拉起操作。
建议值为 60
|
静态
|
-
dmcssm.ini 配置文件
dmcssm.ini 是共享存储集群的监视器的配置文件,其中需要注意的参数为
CSSM_LOG_FILE_SIZE 和 CSSM_LOG_SPACE_LIMIT
,详细配置如下:
Copy
Cd /dmdb/dmdbms/cssm
Vi dmcssm.ini

参数名称
|
默认值
|
参数描述及建议
|
属性
|
CSSM_LOG_FILE_SIZE
|
64
|
单个日志文件大小,范围 16~2048,单位为 MB,达到最大值后,会自动生成并切换到新的日志文件中。
建议为 64 MB
|
静态
|
CSSM_LOG_SPACE_LIMIT
|
0
|
日志总空间大小,取值 0 或者 256~4096 单位为 MB,表示没有空间限制,如果达到设定的总空间限制,会自动删除创建时间最早的日志文件。
建议为 2048 MB
|
静态
|
运行日志健康检查
单实例日志检查
数据库服务日志
数据库服务日志记录了数据库服务启动,刷检查点,写归档、刷盘等一系列实例的运行过程,按月生成,一般默认命名为
dm_实例名称_月份.log
。
该日志的位置为
$DAMENG_HOME/log
过滤服务器日志中 ERROR 关键字,并将结果输出至文件中,如下所示
cat dm_DMSERVER_202011.log | grep "ERROR" >1.log
DMAP进程日志
damp 日志是记录 DMAP 插件的运情况的日志,DMAP 日志的位置和数据库运行日志的位置相同,命名方式为
dm_DMAP_日期.log
数据库备份日志
数据库备份日志,是记录了是数据库备份情况的日志,主要用于记录数据库备份的过程信息,判断备份是否完成的日志,日志存放的位置和数据库运行日志相同,命名格式为
dm_BAKES_日期.log
数据守护日志检查
数据守护集群,由至少两台数据库服务器组成相比单实例数据库多出了守护进程日志需要检查,并且集群中的每一个节点的数据库日志,守护进程日志都要检查。
数据库守护进程日志:
数据守护进程日志,主要记录守护进程对数据库进程运行情况的监控信息和守护集群之间的内部通讯信息,守护进程日志的命名方式为
dm_watcher_日期.log
共享存储集群日志检查
共享存储集群,是由多台数据库服务器组成的相比单实例数据库,多出了 CSS 日志和 ASM 日志需要检查,并且每一个节点都要对数据运行日志,CSS 日志和 ASM 日志进行检查。
数据库守护进程日志:
数据库运行日志的查看日志和单实例的方式相同,请参考单实例日志的检查方式。
数据库 DMCSS 日志:
DMCSS 日志是数据库集群监控进程的运行日志,日志的命名格式为 dm_CSS节点名_日期.log.
数据库 DMASM 日志:
DMASM 日志是 DM 分布式文件系统的运行日志,其中记录了 DMASM 系统的运行信息和报错信息,命名格式为 dm_ASM节点名_日期.log
REDO 和归档日志
日志文件分为
REDO 日志
(联机日志文件)和
归档日志
文件.
非归档模式下,数据库会只将重做日志写入 REDO 日志文件中进行存储。
归档模式下,数据库会同时将重做日志写入联机日志文件和归档日志文件中分别进行存储表空间及数据文件。 (
强烈建议
生产环境运行在归档模式
下)
redo 日志
在一个 DM 实例中,最少有 2 个 REDO 日志,和数据文件同一个目录,默认每个 256 MB,需要在数据库实例初始化时设定。在数据变动频繁的业务系统中,如果 REDO 日志文件设置的太小,会引起频繁的 REDO 切换,从而有性能上的损耗。
我们建议在 OLTP 业务系统中,设置为 2 GB。
初始化实例时,定义 2 GB 的 REDO 日志.
日志扩充命令:
ALTER DATABASE RESIZE LOGFILE 'dameng_003.log' to 2048;
归档日志
系统在归档模式下运行时,会产生归档日志文件,此时系统管理员应该事先预留出足够的磁盘空间以便存储归档日志文件。
我们建议归档文件采用单独的磁盘存放,且不要存放其他文件,以免影响归档空间的上限判断;单个归档的大小设置成和 REDO 日志相同
表空间及数据文件
表空间检查
查看表空间使用率
SELECT
a.tablespace_name "表空间名称" ,
total / (1024 * 1024) "表空间大小(M)" ,
free / (1024 * 1024) "表空间剩余大小(M)" ,
(total - free) / (1024 * 1024 ) "表空间使用大小(M)" ,
total / (1024 * 1024 * 1024) "表空间大小(G)" ,
free / (1024 * 1024 * 1024) "表空间剩余大小(G)" ,
(total - free) / (1024 * 1024 * 1024) "表空间使用大小(G)",
round((total - free) / total, 4) * 100 "使用率 %"
FROM
(
SELECT
tablespace_name,
SUM(bytes) free
FROM
dba_free_space
GROUP BY
tablespace_name
)
a,
(
SELECT
tablespace_name,
SUM(bytes) total
FROM
dba_data_files
GROUP BY
tablespace_name
)
b
WHERE
a.tablespace_name = b.tablespace_name;
数据文件检查
select path,total_size/ (page /256),free_size/(page /256)from v$datafile;
temp表空间及回滚段
temp表空间
TEMP 表空间完全由 DM 数据库自动维护。
Temp 表空间可自动扩充,为了不影响磁盘空间的使用,通常会通过 ini 参数
TEMP_SIZE
配置大小
,
TEMP_SPACE_LIMIT
设置上限
,通过存储过程
SP_TRUNC_TS_FILE
来
收缩 Temp 表空间文件
。
生产环境中要针对 Temp 表空间的大小做专项检查,经常过大可能说明内存过小或者存在大量排序或者中间结果集存放,需要视情况开展优化工作。
检查 Temp 表空间的大小,SQL 语句如下所示:
SELECT
a.tablespace_name "表空间名称" ,
total / (1024 * 1024) "表空间大小(M)" ,
free / (1024 * 1024) "表空间剩余大小(M)" ,
(total - free) / (1024 * 1024 ) "表空间使用大小(M)" ,
total / (1024 * 1024 * 1024) "表空间大小(G)" ,
free / (1024 * 1024 * 1024) "表空间剩余大小(G)" ,
(total - free) / (1024 * 1024 * 1024) "表空间使用大小(G)",
round((total - free) / total, 4) * 100 "使用率 %"
FROM
(
SELECT
tablespace_name,
SUM(bytes) free
FROM
dba_free_space
GROUP BY
tablespace_name
)
a,
(
SELECT
tablespace_name,
SUM(bytes) total
FROM
dba_data_files
GROUP BY
tablespace_name
)
b
WHERE
a.tablespace_name = b.tablespace_name and a.tablespace_name='TEMP';
回收 Temp 表空间,SQL 语句如下所示:
CALL SP_TRUNC_TS_FILE (ts_id ,file_id, to_size);
其中 ts_id,file_id 可以通过
v$datafile
查询,to_szieb 表示指定将文件截断至多大,以 MB 为单位;to_size 大小换算成页数后,值必须在 4096 到 2 GB 之间。
-
Ts_id 对应 GROUP_ID。
-
File_id 对应 ID。
-
CALL SP_TRUNC_TS_FILE (3 ,0, 32) 表示将临时表空间文件号为 0 的文件截断缩小到 32 MB 大小
undo回滚段
Undo 回滚段也被称为 undo 表空间,是由 DM 数据库自动维护管理。记录的是数据变动过程中的各个版本,在数据库数据发生频繁变动时,会生成大量的回滚段记录,由参数
UNDO_RETENTION
来控制回滚页保持时间,默认为 90 s,一般保持默认即可,设置太小,可能会影响数据大批量查询,设置太大会在数据库启动时做过多的回滚操作。
安全性设置
密码策略检查
密码策略决定了新建用户的密码复杂度,由 ini 参数 PWD_POLICY 决定,默认为 2,即密码长度不小于9。
检查密码复杂度的方式如下所示:
Select * from v$dm_ini where para_name='PWD_POLICY';
默认用户密码检查
DM 数据库初始化默认生成多个可登录用户,包括:SYSDBA(数据库管理用户)、SYSAUDITOR(数据库审计用户)、SYSSSO(数据库库安全用户),默认密码和用户名相同。默认用户不能删除,建议修改默认密码后妥善保存。
默认用户的密码丢失,无法找回
。
默认端口使用检查
DM 数据库默认端口为 5236,在初始化实例时可以指定,或者直接修改 ini 文件中参数
PORT_NUM
后重启即可生效。
生产环境建议不要使用默认端口
。
cat dm.ini | grep PORT_NUM
用户资源限制检查
用户资源限制中,可对用户登录失败次数,口令锁定期,口令宽限期进行设置。
通讯加密检查
应用和数据库之间的通信加密可通过配置 dm.ini 参数
COMM_ENCRYPT_NAME
来实现,消息加密算法名。
如果为空则不进行通信加密;如果给的加密算法名错误,则用使用加密算法 DES_CFB。DM 支持的加密算法名可以通过查询动态视图
V$CIPHERS
获取。
无特殊要求,请勿开启该参数
,以免造成不必要的性能消耗.
集群配置健康检查
守护集群监视器
通过监视器,可以监控数据守护系统的运行情况,获取主备库状态、守护进程状态、以及主备库数据同步情况等信息.
监视器 (dmmonitor) 还提供了一系列命令来管理数据守护系统,监视器属于集群的仲裁机,需要确认是否可用。检查监视器是否可用,前台启动监视器,命令如下所示:
./dmmonitor dmmonitor.ini
切换模式
切换模式分为自动切换和手动切换,可检查主备库 dmwatcher.ini 文件的
DW_MODE
参数。
MANUAL :
故障手动切换模式,故障时前台启动监视器进行切换。
AUTO :故障自动切换模式,需要后台运行确认监视器。
DSC集群
归档检查: 本地归档,远程归档
DSC集群监视器
需要在监视器中确认各实例状态是否为 open 状态,命令如下所示:
$DM_HOME/bin/dmcssm ini_path=dmcssm.ini
MPP集群
检查网络,服务器时间.
HA 集群
检查网络,服务器时间.
配置文件检查
因为 HA 是操作系统的高可用软件,所以详细的检查方式,请咨询 HA 软件的厂商。
数据库参数配置:HA 要配置 IP 互斥 (HA_INST_CHECK_IP,HA_INST_CHECK_PORT),检查各节点 dm.ini 配置参数,命令如下所示:
HA_INST_CHECK_IP:HA 实例启动检测 IP,需要配置为另一个节点的 ip
HA_INST_CHECK_PORT:HA 实例监听端口
节点ini文件检查
检查 HA 各节点 $DM_HOME/bin 目录下是否都存放相同的 dm.ini 文件
cd $DM_HOME/bin
ls -al dm.ini
挂载目录检查
检查 HA 各节点 DM 相关的挂载目录是否保持一致,命令如下所示:
df -h --检查dmdata dmarch dmbak 目录是否各节点保持一致
数据备份检查
备份策略
--DM 数据库支持全量备份和增量备份,备份方式包括 V1.0到 V2.0,数据服务器对备份版本的支持可通过 dm.ini 参数
BAK_POLICY
来定义。
备份空间
如果是单实例或者是 Data Watch 集群,备份文件可保留在服务器本地的文件系统中,如果是 DMDSC 集群可保留在本地,或者 ASM 磁盘中。
不论是何种数据库架构,我们建议
备份文件存放在服务器节点的本地文件系统中
。并单独划分磁盘空间保存,空间建议最少可保存一个周期的完整备份。
定时备份任务
在归档空间充足的条件下,数据量在 100 GB~2 TB 的数据库系统,建议采用每周全备一次,每天增量备份一次的定时备份调度策略,并在备份时选择同时备份日志文件。检查定时任务的方式如下
定时删除任务
为了确保备份空间能循环使用,建议制定定时删除备份任务。
查看备份目录
Select * from v$dm_ini where para_name=’ BAK_PATH’;
备份检查
CHECK BACKUPSET...
命令用于校验特定备份集,每次只能检验一个备份集

设置备份定期检查任务
备份日志检查
通过备份日志和 DMAP 日志,可以获得备份任务执行情况