数据库实例健康检查是数据库健康检查的重要内容,通过对实例相关的内容进行检查,能够及时发现隐藏风险,及时消除风险点,保障数据库实例平稳运行。达梦数据库的实例健康检查主要包含以下内容:
- 日志健康检查
- 数据库参数检查
- 表空间检查
- 死锁与阻塞检查
- 内存池信息检查
- 数据库统计信息检查
- 安全性设置检查
- 作业检查
- 回滚(Rollback):程序或数据处理错误,将程序或数据恢复到上一次正确状态的行为。回滚包括程序回滚和数据回滚等类型。
- 刷盘:接收到数据后,数据会先写入缓冲区,再将缓冲区的数据写入到磁盘的过程称为刷盘。
- 全量备份:也称为完全备份,指对某个指定时间点的所有数据和对应的结构进行一个完全的备份。
- 增量备份:是指在一次全备份或上一次增量备份后,以后每次的备份只需备份与前一次相比增加或者被修改的文件。
- 作业:作业是由 DM 代理程序按顺序执行的一系列指定的操作。作业可以执行更广泛的活动,包括运行 DMPL/SQL 脚本、定期备份数据库、对数据库数据进行检查等。
本文中所涉及内容适用于 DM7 及 DM8 版本数据库产品。
数据库运行日志记录了数据库服务启动、刷检查点、写归档、刷盘等一系列实例的运行过程。该日志存放在 %DM_HOME/log,按月生成,一般默认命名为 “dm_实例名称_月份.log”。例如数据库实例日志 “dm_DMSERVER_202203.log”。对该日志进行分析,可了解数据库的运行状态,通过检查点刷盘,也可以分析业务的繁忙程度,作为调整内存、检查点参数的依据。
可以通过 命令筛选检查具有 ERROR 或者 FATAL 关键字的日志。若需要过滤服务器日志中 ERROR 关键字,并将结果输出至 error.log 文件中,可参考如下命令:
damp 进程日志是记录 DMAP 进程运行情况的日志。该日志存放在 %DM_HOME/log 中,命名方式为 “dm_DMAP_日期.log”。例如 DMAP 进程日志 “dm_DMSERVER_202203.log”。
可以通过 命令筛选检查具有 ERROR 或者 FATAL 关键字的日志。若需要过滤服务器日志中 ERROR 关键字,并将结果输出至 error.log 文件中,可参考如下命令:
数据库备份日志,是记录了是数据库备份情况的日志,主要用于记录数据库备份的过程信息,判断备份是否完成的日志。该日志存放在 %DM_HOME/log,命名格式为 “dm_BAKES_日期.log”。例如数据库备份日志 “dm_DMSERVER_202203.log”。
可以通过 命令筛选检查具有 ERROR 或者 FATAL 关键字的日志。若需要过滤服务器日志中 ERROR 关键字,并将结果输出至 error.log 文件中,可参考如下命令:
在一个数据库实例中,最少有 2 个 REDO 日志,和数据文件同一个目录,默认每个 256 MB,需要在数据库实例初始化时设定。
通过以下命令可查看 redo 日志信息,包括路径,大小,可用空间,总空间等。
在数据变动频繁的业务系统中,如果 REDO 日志文件设置的太小,会引起频繁的 REDO 切换,造成性能上的损耗。建议在 OLTP 业务系统中,设置为 2 GB。
初始化实例时,定义 2 GB 的 REDO 日志,可参考命令:。也可以对现有实例的 REDO 日志进行扩充,可参考命令:
DM 数据库可以在非归档模式和归档模式下运行:
- 非归档模式下,数据库会只将重做日志写入 REDO 日志文件中进行存储;
- 归档模式下,数据库会同时将重做日志写入联机日志文件和归档日志文件中分别进行存储表空间及数据文件。
默认不开启归档模式,若需要开启请参考 开启本地归档。
系统在归档模式下运行,会产生归档日志文件,系统管理员应该事先预留出足够的磁盘空间以便存储归档日志文件。此外,还需检查超期未删除的归档,进入归档保存目录检查是否存在超期未删除的文件和是否存在超过归档上限的情况,防止出现上述情况导致磁盘被撑爆。
SQL 日志内容包含系统各会话执行的 SQL 语句、参数信息、错误信息等。跟踪日志主要用于分析错误和分析性能问题,基于跟踪日志可以对系统运行状态有一个分析,可以挑出系统现在执行速度较慢的 SQL 语句,进而对其进行优化。
SQL 日志文件是一个纯文本文件。当 PART_STOR=0 时,以 “dmsql_实例名_日期_时间” 命名;当 PART_STOR=1 时,以 “dmsql_实例名_用户名_日期_时间” 命名。缺省生成在 DM 安装目录的 log 子目录下面。例如 “dmsql_DAMENG_20220923_145913”。
更多详细 sql 日志内容可参考:配置数据库 SQLLOG 日志、达梦 SQL 日志分析工具 DMLOG。
DM 数据库的参数配置对数据库运行至关重要,不仅关系到数据库性能,还可能会影响到数据库的正常使用。参数设置对应的配置文件默认与数据文件存放在同一目录。对于单实例数据库而言,需要关注的参数配置文件主要有 dm.ini、dmarch.ini、sqllog.ini 等。
单实例配置参数数量较多,绝大部分保持默认即可,只有极小部分需要根据系统实际情况进行配置,部分参数配置建议如下:
的内存。有效值范围:32 位平台(642000),64 位平台为
(6467108864)。可根据系统实际情况进行适当调整。
小,以 M 为单位。通常保持默认为 0,代表不限制。
系统级
可用物理内存的 60%~80%。有效值范围(8~1048576)。
要求,密码定期修改,并杜绝泄漏。
系统级
(1~2048)。有大量排序操作时建议适当调大。
会话级
置这个参数,减少数据缓冲区并发冲突。
(8~16777216)。高并发或大量使用 with、临时表、排序等情
况下应适当调大。
要配置这个参数,减少数据缓冲区并发冲突。
调大。
二者中较小的值,有效值范围(1~65000)。建议用户按照实
际内存和业务需求来配置。
倾向于使用索引范围扫描。OLTP 系统建议设置为 2,OLAP 系
统建议设置为 1。
会话级
操作时可能会占用。关系到磁盘空间占用,建议根据磁盘情况
设置上限。
系统级
SQLLOG.INI 中的配置来记录 SQL 日志;2:打开,按文件中
记录数量切换日志文件,日志记录为详细模式;3:打开,不
切换日志文件,日志记录为简单模式,只记录时间和原始语句。
建议根据磁盘情况设置,不宜过多。
系统级
后会对数据库运行情况进行记录,对性能有所损耗,生产环境
建议关闭。
系统级
则会影响到数据库备份。
系统级
以上参数属性分为三种:静态、动态和手动。
- 静态:可以被静态修改的参数,修改后重启服务器才能生效。
- 动态:可以被动态修改的参数,修改后即时生效。动态参数又分为会话级和系统级两种。会话级参数被修改后,新参数值只会影响新创建的会话,之前创建的会话不受影响;系统级参数的修改则会影响所有的会话。
- 手动:不能被动态修改的参数,必须手动修改 dm.ini 参数文件,然后重启才能生效。
其中,在数据库服务器运行期间,DBA 用户可以通过调用系统过程对动态参数进行修改。主要可使用以下三种系统过程:
- SP_SET_PARA_VALUE():设置 DM.INI 文件中整型的参数值。
- SP_SET_PARA_DOUBLE_VALUE():设置 DM.INI 参数中浮点型的参数值。
- SP_SET_PARA_STRING_VALUE():设置 DM.INI 文件中的字符串型参数值。
更多详细函数使用方法可参考数据库安装目录的 doc 下《DM8_SQL 语言使用手册》。
该配置文件主要用来配置归档,在单实例下,一般配置为本地归档,并建议分配独立的磁盘存放归档文件,设置每个归档文件的大小,并根据磁盘情况设置归档上限,以免撑满磁盘。
部分参数详解如下表所示:
即时归档 TIMELY;远程归档 REMOTE。
除最早生成的本地归档日志文件。0 表示无空间限制,取值范围
(1024M~2147483647M),缺省为 0。
更多归档配置内容可参考:开启本地归档。
sqllog.ini 配置文件主要用于配置 sql 日志。如果需要开启 SQL 日志,则必须配置日志切换模式 SWITCH_MODE 和日志文件个数 FILE_NUM,防止日志无限增长导致磁盘撑爆,同步日志会严重影响系统效率,生产环境必须设置为异步日志。sqllog.ini 配置文件示例如下:
部分参数详解如下表所示:
(50~409600)。
录数量切换;2:按文件大小切换;3:按时间间隔切换
1、按数量切换时,一个日志文件中的 SQL 记录条数达到多
少条之后系统会自动将日志切换到另一个文件中。一个日
志文件中的 SQL 记录条数达到多少条之后系统会自动将日
志切换到另一个文件中。有效值范围(1000~ 10000000);
2、按文件大小切换时,一个日志文件达到该大小后,系统
自动将日志切换到另一个文件中,单位为 M。有效值范围
(1~ 2000);
3、按时间间隔切换时,每个指定的时间间隔,按文件新建
时间进行文件切换,单位为分钟。有效值范围(1~ 30000)。
再生成新的文件时,会删除最早的那个日志文件,日志文件
的命令格式为 dmsql_实例名_日期_时间.log。当这个参数配
置成 0 时,只会生成两个日志相互切换着记录。有效值范围
(0~1024)。
更多参数详解可参考数据库安装目录的 doc 下《DM8 系统管理员手册》。
通过以下语句可查看表空间基本信息:表空间大小,剩余空间大小,表空间使用率等。
在某系统中,执行结果如下:
上图中,可以看到 ROLL 表空间,空间剩余大小为 115.53125M,表空间已使用 36.46875M,表空间使用率 23.99% 等信息。当发现表空间使用率较高,剩余表空间不足或剩余表空间难以支撑有关业务时,须告知相关运维人员及时进行处理。
通过以下 sql 语句可查看数据文件信息:数据文件保存路径,数据文件创建时机,数据文件大小,数据文件个数等。
结果集字段说明请参考数据库安装目录的 doc 下《DM8 系统管理员手册》。
通过以下语句可查看表空间与数据文件对应关系。
在某系统中,执行结果如下:
上图中,可以看到 SYSTEM 表空间对应的数据文件是 “/data/dm8_20220304/DM” 目录下的 SYSTEM.DBF 文件,其他以此类推。
TEMP 表空间完全由 DM 数据库自动维护。当用户的 SQL 语句需要磁盘空间来完成某个操作时,DM 数据库会从 TEMP 表空间分配临时段。如创建索引、无法在内存中完成的排序操作、SQL 语句中间结果集以及用户创建的临时表等都会使用到 TEMP 表空间。查看方法如下:
Undo 回滚段也被称为 undo 表空间,是由 DM 数据库自动维护管理。记录的是数据变动过程中的各个版本信息。在数据库数据发生频繁变动时,会生成大量的回滚段记录,由参数 UNDO_RETENTION 来控制回滚页保持时间,默认为 90s,一般保持默认即可。设置太小,可能会影响数据大批量查询;设置太大,则会在数据库启动时做过多的回滚操作。
通过以下命令可以查看数据库死锁历史信息记录。
如果在结果集中发现有死锁需要及时进行排查并释放锁,避免影响业务正常运行。
通过以下命令可以查看数据库是否存在阻塞。
如果在结果集中发现有阻塞需要及时进行排查和优化,避免影响业务正常运行。
更多锁查询、阻塞和慢 SQL 监控等内容,请参考 实例状态监控—SQL 监控 和 运维常见问题—SQL 监控查询语句汇总。
通过 SQL 命令查询动态性能视图 V$DB_CACHE,可以查看当前字典缓存信息、包括数据字典地址、缓存池总空间、实际使用空间等字典缓存信息。
更多动态性能视图 V$DB_CACHE 字段详解请参考数据库安装目录的 doc 下《DM8 系统管理员手册》。
通过 SQL 命令查询页面缓冲区动态性能表 V$BUFFERPOOL,可以查看缓冲区页数、页大小、空闲页、淘汰的页数、数据页被引用的次数等页面缓冲区信息。
更多动态性能视图 V$BUFFERPOOL 字段详解请参考数据库安装目录的 doc 下《DM8 系统管理员手册》。
通过 SQL 命令查询动态性能视图 V$MEM_POOL 可以查看内存结构地址、是否是共享内存池、初始大小、当前总大小、数据占用大小等内存池信息。
更多动态性能视图 V$MEM_POOL 字段详解请参考数据库安装目录的 doc 下《DM8 系统管理员手册》。
通过 SQL 命令查询动态性能视图 V$SYSSTAT 统计系统对象的信息,包括对象的 id、对象类型、统计对象名、统计值等。
更多动态性能视图 V$SYSSTAT 字段详解请参考数据库安装目录的 doc 下《DM8 系统管理员手册》。
通过以下 SQL 命令可以查询到会话信息,包括会话活动状态、客户端 IP、客户端类型、当前模式、当前用户、会话数量等。
更多详细字段说明请参考数据库安装目录的 doc 下《DM8 系统管理员手册》。
通过以下 SQL 命令可以查询到对象信息,包括表空间名、类型和数量等。
通过以下 SQL 命令可以查询表行数统计信息。
通过以下 SQL 命令可以查询到 DBlink 信息,包括所有者、连接名、用户名和地址等。
通过以下 SQL 命令可以查询到最慢的 20 条 SQL 信息。
当发现存在较慢 SQL 影响到业务流畅度时要及时处理,避免影响业务正常运行。
通过以下 SQL 命令可以查询到高内存的 20 条 SQL 信息,包括会话 id、SQL ID、SQL 文本、使用内存数、执行结束时间、执行次数等。
当发现存在较高内存占用 SQL 是要及时排查 SQL 逻辑是否存在问题,是否存在阻塞,及时优化,避免内存资源被过度占用,影响业务进行。
动态性能视图 V$SYSTEM_EVENT 可以查看到包括自系统启动以来所有等待事件的详细信息。通过以下 SQL 命令可以查询到前 20 条长耗时等待事件信息。
当发现系统当前存在长耗时等待事件时,要及时进行排查并处理,防止产生大量 SQL 阻塞。
更多动态性能视图 V$SYSSTAT 字段详解请参考数据库安装目录的 doc 下《DM8 系统管理员手册》。
作业是由 DM 代理程序按顺序执行的一系列指定的操作。作业可以执行更广泛的活动,包括运行 DM PL/SQL 、SQL 脚本、定期备份数据库、对数据库数据进行检查等。
本节以定时备份作业为例,介绍详细的作业检查步骤。其他作业检查步骤,也可参考本节内容。
DM 数据库支持全量备份和增量备份。达梦数据库常用备份策略有两种,可根据实际业务需求进行选择。
- 全量 + 删除(推荐使用)备份策略。例如:设置每天 23:00 全量备份、删除 30 天前的全量备份。
- 全量 + 增量 + 删除备份策略,例如:每月第一个周六 23:00 全量备份。每天(除周六) 23:00 增量备份、删除 30 天前的增量备份、删除 40 天前的全量备份。
更多备份策略详细内容可参考:数据库备份。
通常情况下,生产系统都需要制定定时备份任务,备份时间点建议避开业务高峰期。每次备份的时间间隔,需要根据间隔时间段内生成归档量来判断,务必保证两次备份间隔时间的归档能完整保存,否则会导致备份失败。
在归档空间充足的条件下,数据量在 100 GB~2 TB 的数据库系统,建议采用每周全备一次,每天增量备份一次的定时备份调度策略,并在备份时选择同时备份日志文件。
数据库中的作业任务可通过管理工具或 SQL 命令两种方式进行检查。以下介绍详细检查步骤。
方法一:管理工具检查
- 查看数据库是否开启代理。通过管理工具查看,代理环境状态。若已开启代理环境,则会显示【作业】、【警报】和【操作员】选项。
- 检查是否创建了定时备份的任务。在代理中选择【作业】-右键点击【相关作业】-选择【属性】,如下图所示,即表明数据库中有定时备份任务。
- 在【作业调度】中点击对应调度可以查看具体调度设置。
方法二:SQL 命令检查
为了确保备份空间能循环使用,建议制定定时删除备份任务。检查定时删除备份任务的方式如下:
在代理中选择【作业】-右键点击【相关作业】-选择【属性】,如下图所示,即表明数据库中有定时删除备份任务。
此外,还需检查检查备份目录是否还存在过期备份,检查方式如下:
- 查询数据库的备份目录。
- 进入备份集保存目录。查看是否存在有超过规定日期的的备份集,如果存在,要及时排查原因,防止出现大量未删除备份进而导致磁盘被撑爆。
单实例或者是 Data Watch 集群,备份文件可保留在服务器本地的文件系统中。DMDSC 集群的备份文件可保留在本地,也可保留在 ASM 磁盘中。
不论是何种数据库架构,建议备份文件存放在服务器节点的本地文件系统中,并单独划分磁盘空间保存,至少保证剩余空间可保存一个周期的完整备份。
- 查找备份文件存放路径,通过以下命令可以查询到备份文件存放目录。
- 执行 命令查看备份所在目录大小。
- 执行 命令找到备份目录所在根目录磁盘查看剩余空间大小。
备份作业执行成功与否对维护数据库安全非常重要,也是数据库管理员每日需要关注的事情。建议定期巡检备份执行情况。
定时任务执行情况可通过管理工具或备份日志进行检查。
方法一:使用 manager 管理工具检查。选择【代理】-->【作业】--> 右键点击需要检查的备份任务--> 选择【查看作业历史信息】,即可看到备份任务的执行情况。未出现错误的作业历史信息如下图所示。若作业历史信息存在错误,须及时排查故障原因,保证备份作业正常运行。
方法二:通过 SQL 命令检查。通过执行以下命令查看作业运行历史信息。
方法三:备份日志检查。通过备份日志和 DMAP 日志,可以获得备份任务执行情况,详细请参考实例资源监控-备份日志。
达梦数据库提供联机备份校验和脱机备份校验,可按照实际需求进行选择。例如:设备类型:DISK 或 TAPE。待校验的备份集目录为 “/home/dm_bak/db_bak_for_check”,通过如下两种方式进行校验。
方法一:联机备份校验。使用 SF_BAKSET_CHECK 函数对备份集进行校验。
方法二:脱机备份校验。利用 dmrman 工具校验备份文件的有效性。
查看用户信息,包括用户名、用户密码、默认表空间、索引表空间、数据文件等信息。
密码策略决定了新建用户的密码复杂度,由 dm.Ini 参数 PWD_POLICY 决定,默认为 2,即密码长度不小于 9。
不同的生产环境,可能有不同的管理要求,但强烈建议设置较高指数的密码策略,密码做定期修改,杜绝密码泄漏。检查密码复杂度的方式如下所示:
参数 PWD_POLICY 详细说明:
0:无限制。但总长度不得超过 48 个字节;
1:禁止与用户名相同;
2:口令长度需大于等于 PWD_MIN_LEN 设置的值;
4:至少包含一个大写字母(A-Z);
8:至少包含一个数字(0-9);
16:至少包含一个标点符号(英文输入法状态下,
除―和空格外的所有符号;
若为其他数字,则表示配置值的和,如 3=1+2,表示同时启用
第 1 项和第 2 项策略。当 COMPATIBLE_MODE=1 时,PWD_POLICY
的实际值均为 0。
DM 数据库初始化默认生成多个可登录的系统用户,包括:SYSDBA(数据库管理用户)、SYSAUDITOR(数据库审计用户)、SYSSSO(数据库安全用户,安全版数据库才能登录),默认密码和用户名相同。
默认用户不能删除,建议修改默认密码后妥善保存。若默认用户的密码丢失,则无法找回。
用户资源限制中,可对用户登录失败次数,口令锁定期,口令宽限期进行设置。处于安全考虑,建议生产环境中要有常用的资源限制措施。需要修改用户资源限制时,可打开 DM 管理工具,在左侧对象导航栏中,选择【用户】--> 点击【管理用户】--右键点击待修改的用户--> 选择【修改】--> 选择【资源限制】,即可在【资源限制】页面进行相关内容设置,如下图所示:
通过以下 SQL 命令可以对用户的权限信息进行检查,包括用户名、权限、类型等信息。
DM 数据库默认端口为 5236,在初始化实例时可以指定。也可通过修改 dm.ini 文件中参数 PORT_NUM 后重启实例服务,即可修改成功。生产环境建议不要使用默认端口。
应用和数据库之间的通信加密可通过配置 dm.ini 参数 COMM_ENCRYPT_NAME 来实现通信加密。如果为空则不进行通信加密;如果加密算法名错误,则用使用加密算法 DES_CFB。
DM 支持的加密算法名可以通过查询动态视图 V$CIPHERS 获取。无特殊要求,请勿开启该参数,以免造成不必要的性能消耗。