Category Archives: Oracle故障处理
Oracle Linux切换uek内核到rhck内核解决ACFS兼容问题
背景:协助客户做验证,客户使用的是RHEL7.6环境,我这边是OEL7.6环境,开始以为区别不大,结果acfs兼容还是遇到问题,特此记录下 Continue reading
有些尴尬的一次集群启动故障排错
因为工作性质改变,有许久没动手处理故障了,今天的排错也是非生产环境,为验证一些测试临时搭的一套11g RAC环境,为了省时间,直接拿之前备份的vbox的环境拷贝,结果启动机器发现集群无法启动.. Continue reading
案例:使用sqlplus登录报ORA-12547错误
现象:Exadata刷机之后grid/oracle用户的环境变量是没有设置的,需要手工进行设置,设置完成后发现grid用户执行报错ORA-12547 Continue reading
案例:ADG环境遇到redo日志member路径有误以及RMAN-6571错误
最近先后帮客户做了两套从虚拟化环境到物理机的数据库迁移,都是Linux系统,Oracle 11.2.0.4的RAC,最终选定ADG方案实现迁移,简单高效。但本次环境准备时还是遇到些小问题,本文记录下解决过程。 Continue reading
小知识:TFA收集日志报错空间不足
今天在某客户环境下分析某节点驱逐的故障,发现有安装TFA,所以使用一键收集包含故障时刻的日志 Continue reading
小知识:解决EXP-00003的报错
客户有个需求:某用户程序(含exp导出任务)报错EXP-00003,这个错误并不会影响整个导出任务的结束,但由于是晚上的定时任务,该错误会触发夜间告警。客户想通过数据库层面来规避掉此错误。 Continue reading
案例:OGG目标端进程ABENDED处理
故障现象:源端表结构某字段数据类型长度增加,并插入对应数据,目标端因还是之前的数据类型长度,导致应用进程无法更新对应数据进而导致ABENDED,一般来说,只需目标端依据源端修改为一致的字段长度即可,但这里发现依然会ABENDED,且报错信息不变。 Continue reading
案例:归档自动清理脚本失效及连带影响
现象概述:发现OGG进程abended,原因是主库归档满,但是实际已配置归档自动清理脚本(归档空间使用大于90%时清理),进一步查看发现根源是归档清理失效,报错RMAN-08137,导致的影响有很多,首先主库无法进行测试数据写入,其次ADG备库产生延迟,然后OGG源端抽取进程因超时报错OGG-02149导致abended.. Continue reading
记录一则因主机名讹误导致的RAC启动异常
最近遇到客户的一套19c测试环境,在一次主机重启后发现集群无法启动,使用crsctl stat res -t -init查看集群启动阶段时发现直接报错如下信息 Continue reading
案例:DG备库报错ORA-600[2619]致使mrp进程异常终止
很多刚入行的DBA往往一看有ORA-600这类错误就不知所措,直接就想寻求中高级DBA支持,甚至在网上还看到有人说,判断一个Oracle DBA是否达到中级以上,就是看其是否可以独立思考处理ORA-600这类问题,而实际上.. Continue reading
案例:DG主库未设置force logging导致备库坏块
DG搭建时,官方文档手册有明确提到要设置数据库为force_logging,防止有nologging操作日志记录不全导致备库应用时出现问题。 Continue reading
OSW Analyzer分析oswbb日志发生异常
使用OSW Analyzer分析oswbb日志发生大量异常,最终通过java -Duser.language=en -Duser.country=us -jar oswbba.jar -i 解决 Continue reading
记录一则数据库死锁故障的分析过程
客户的监控告警频繁提示系统xx数据库死锁增长个数高于当前阈值_当前值1.00。
下面是详细的故障分析诊断过程,以及详细的解决方案描述。 Continue reading
模拟一则ORA-600 [4194][][]故障并处理
本次实验环境模拟的是相关的undo/rollback block在system rollback segment上的场景 Continue reading