一次 Oracle 18c 生产恢复实战:业务视图 WMPROD.V_YN_GSP_NBR 被误修改,不采用整库回退,而是使用 RMAN Duplicate 创建辅助库 WMSAUX,恢复到误修改前时间点,提取旧视图定义后精准恢复生产视图。
一篇 Linux OS 层性能排障手册,系统梳理 uptime、top、vmstat、mpstat、pidstat、iostat、iotop、free、sar、ss、tcpdump 等命令的用法、关键参数、重点字段和生产判断标准。
一次 Oracle 18c 生产故障复盘:WMS 数据库出现 ORA-03135 和 ORA-3136,Hang Manager 指向 MMAN,v$sga_resize_ops 显示 shared pool shrink,sar 证明故障窗口存在明显 swap-in,最终建议固定 shared_pool_size 下限并监控 SGA resize。
通过操作系统 PID、v$session、dba_scheduler_running_jobs、dbms_xplan 等手段,定位 Oracle CPU 高的根因,并给出 SQL 和索引优化思路。
当 ORA-01187 / ORA-01110 指向 Oracle TEMP tempfile 时,处理重点是创建 TEMP_NEW、切换默认临时表空间、释放旧 TEMP 会话、删除旧 TEMP,并最终将 TEMP_NEW 改回 TEMP。
一篇数据库磁盘 I/O 排查方法总结,基于 iostat 核心指标分析磁盘延迟、队列、IOPS、吞吐量和典型生产现象,并给出数据库场景下的告警阈值和判断方法。
一次由表新增字段引发的 Oracle 生产故障复盘:SCM_PUBLIC、SCM_PURBILL 包体 INVALID,业务高并发触发 library cache 争用,部分会话持有 DML 锁后无法提交,最终形成 enq: TX 行锁阻塞。
通过 pg_stat_activity、pg_locks、pg_blocking_pids 定位 PostgreSQL 锁等待和 idle in transaction 阻塞源,并给出生产处理流程。
一次 Oracle 目录权限事故复盘:误执行 chown -R 和 chmod -R 破坏 /u01 权限体系,引发 ORA-12547。通过恢复 ORACLE_HOME、ORACLE_BASE、oraInventory、bin/oracle 权限以及运行目录权限,最终恢复数据库和监听。
一次达梦 SQL 优化实战:SQL 最终只返回 15 行,但因缺少 SO_ID、SO_DET_NO 联合索引,在 SHOP_SALE_ORDER_DETAIL 宽表上产生大量 BLKUP2 回表。通过新增联合索引和收集统计信息,逻辑读从 40046153 页降到 46 页。