<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>故障处理 on Greatfinish Blog</title><link>https://greatfinish.top/tags/%E6%95%85%E9%9A%9C%E5%A4%84%E7%90%86/</link><description>Recent content in 故障处理 on Greatfinish Blog</description><generator>Hugo -- gohugo.io</generator><language>zh-cn</language><copyright>© 2026 Greatfinish Blog · [沪ICP备2026022892号](https://beian.miit.gov.cn/)</copyright><lastBuildDate>Fri, 22 May 2026 16:30:00 +0800</lastBuildDate><atom:link href="https://greatfinish.top/tags/%E6%95%85%E9%9A%9C%E5%A4%84%E7%90%86/index.xml" rel="self" type="application/rss+xml"/><item><title>Oracle 18c 使用 RMAN Duplicate 恢复被误修改视图实战</title><link>https://greatfinish.top/posts/oracle18c-rman-duplicate-restore-view/</link><pubDate>Fri, 22 May 2026 16:30:00 +0800</pubDate><guid>https://greatfinish.top/posts/oracle18c-rman-duplicate-restore-view/</guid><description>一次 Oracle 18c 生产恢复实战：业务视图 WMPROD.V_YN_GSP_NBR 被误修改，不采用整库回退，而是使用 RMAN Duplicate 创建辅助库 WMSAUX，恢复到误修改前时间点，提取旧视图定义后精准恢复生产视图。</description><media:content xmlns:media="http://search.yahoo.com/mrss/" url="https://greatfinish.top/posts/oracle18c-rman-duplicate-restore-view/featured.jpg"/></item><item><title>Linux 性能故障诊断实战：CPU、I/O、内存与网络排查命令详解</title><link>https://greatfinish.top/posts/linux-performance-troubleshooting-commands/</link><pubDate>Fri, 22 May 2026 14:30:00 +0800</pubDate><guid>https://greatfinish.top/posts/linux-performance-troubleshooting-commands/</guid><description>一篇 Linux OS 层性能排障手册，系统梳理 uptime、top、vmstat、mpstat、pidstat、iostat、iotop、free、sar、ss、tcpdump 等命令的用法、关键参数、重点字段和生产判断标准。</description><media:content xmlns:media="http://search.yahoo.com/mrss/" url="https://greatfinish.top/posts/linux-performance-troubleshooting-commands/featured.jpg"/></item><item><title>Oracle 18c WMS 数据库卡顿故障处理实战：一次 ASMM 调整 shared pool 引发的 ORA-03135</title><link>https://greatfinish.top/posts/oracle18c-wms-ora03135-asmm-shared-pool/</link><pubDate>Tue, 19 May 2026 22:10:00 +0800</pubDate><guid>https://greatfinish.top/posts/oracle18c-wms-ora03135-asmm-shared-pool/</guid><description>一次 Oracle 18c 生产故障复盘：WMS 数据库出现 ORA-03135 和 ORA-3136，Hang Manager 指向 MMAN，v$sga_resize_ops 显示 shared pool shrink，sar 证明故障窗口存在明显 swap-in，最终建议固定 shared_pool_size 下限并监控 SGA resize。</description><media:content xmlns:media="http://search.yahoo.com/mrss/" url="https://greatfinish.top/posts/oracle18c-wms-ora03135-asmm-shared-pool/featured.jpg"/></item><item><title>一次 Oracle CPU 高故障处理实战</title><link>https://greatfinish.top/posts/oracle-cpu-high/</link><pubDate>Sun, 17 May 2026 20:56:00 +0800</pubDate><guid>https://greatfinish.top/posts/oracle-cpu-high/</guid><description>通过操作系统 PID、v$session、dba_scheduler_running_jobs、dbms_xplan 等手段，定位 Oracle CPU 高的根因，并给出 SQL 和索引优化思路。</description><media:content xmlns:media="http://search.yahoo.com/mrss/" url="https://greatfinish.top/posts/oracle-cpu-high/featured.jpg"/></item><item><title>Oracle TEMP 文件报 ORA-01187 / ORA-01110 的处理案例</title><link>https://greatfinish.top/posts/oracle-temp-ora-01187/</link><pubDate>Thu, 14 May 2026 20:56:00 +0800</pubDate><guid>https://greatfinish.top/posts/oracle-temp-ora-01187/</guid><description>当 ORA-01187 / ORA-01110 指向 Oracle TEMP tempfile 时，处理重点是创建 TEMP_NEW、切换默认临时表空间、释放旧 TEMP 会话、删除旧 TEMP，并最终将 TEMP_NEW 改回 TEMP。</description><media:content xmlns:media="http://search.yahoo.com/mrss/" url="https://greatfinish.top/posts/oracle-temp-ora-01187/featured.jpg"/></item><item><title>Oracle 表结构变更引发包体失效、library cache pin 和行锁阻塞故障处理复盘</title><link>https://greatfinish.top/posts/oracle-package-invalid-library-cache-pin/</link><pubDate>Sat, 09 May 2026 18:30:00 +0800</pubDate><guid>https://greatfinish.top/posts/oracle-package-invalid-library-cache-pin/</guid><description>一次由表新增字段引发的 Oracle 生产故障复盘：SCM_PUBLIC、SCM_PURBILL 包体 INVALID，业务高并发触发 library cache 争用，部分会话持有 DML 锁后无法提交，最终形成 enq: TX 行锁阻塞。</description><media:content xmlns:media="http://search.yahoo.com/mrss/" url="https://greatfinish.top/posts/oracle-package-invalid-library-cache-pin/featured.jpg"/></item><item><title>数据库磁盘 I/O 瓶颈排查：基于 iostat 的核心指标解读与生产判断方法</title><link>https://greatfinish.top/posts/database-io-bottleneck-iostat/</link><pubDate>Sat, 09 May 2026 18:30:00 +0800</pubDate><guid>https://greatfinish.top/posts/database-io-bottleneck-iostat/</guid><description>一篇数据库磁盘 I/O 排查方法总结，基于 iostat 核心指标分析磁盘延迟、队列、IOPS、吞吐量和典型生产现象，并给出数据库场景下的告警阈值和判断方法。</description><media:content xmlns:media="http://search.yahoo.com/mrss/" url="https://greatfinish.top/posts/database-io-bottleneck-iostat/featured.jpg"/></item><item><title>PostgreSQL 锁排查处理流程</title><link>https://greatfinish.top/posts/postgresql-lock/</link><pubDate>Fri, 08 May 2026 16:24:03 +0800</pubDate><guid>https://greatfinish.top/posts/postgresql-lock/</guid><description>通过 pg_stat_activity、pg_locks、pg_blocking_pids 定位 PostgreSQL 锁等待和 idle in transaction 阻塞源，并给出生产处理流程。</description><media:content xmlns:media="http://search.yahoo.com/mrss/" url="https://greatfinish.top/posts/postgresql-lock/featured.jpg"/></item><item><title>从 ORA-12547 到数据库恢复：一次目录 owner 与权限误改的完整排障记录</title><link>https://greatfinish.top/posts/oracle-ora-12547-permission-restore/</link><pubDate>Mon, 06 Apr 2026 20:41:00 +0800</pubDate><guid>https://greatfinish.top/posts/oracle-ora-12547-permission-restore/</guid><description>一次 Oracle 目录权限事故复盘：误执行 chown -R 和 chmod -R 破坏 /u01 权限体系，引发 ORA-12547。通过恢复 ORACLE_HOME、ORACLE_BASE、oraInventory、bin/oracle 权限以及运行目录权限，最终恢复数据库和监听。</description><media:content xmlns:media="http://search.yahoo.com/mrss/" url="https://greatfinish.top/posts/oracle-ora-12547-permission-restore/featured.jpg"/></item><item><title>达梦 SQL 优化实战：一次 BLKUP2 回表代价过高问题的定位与解决</title><link>https://greatfinish.top/posts/dm-blkup2-sql-optimization/</link><pubDate>Tue, 17 Mar 2026 21:00:00 +0800</pubDate><guid>https://greatfinish.top/posts/dm-blkup2-sql-optimization/</guid><description>一次达梦 SQL 优化实战：SQL 最终只返回 15 行，但因缺少 SO_ID、SO_DET_NO 联合索引，在 SHOP_SALE_ORDER_DETAIL 宽表上产生大量 BLKUP2 回表。通过新增联合索引和收集统计信息，逻辑读从 40046153 页降到 46 页。</description><media:content xmlns:media="http://search.yahoo.com/mrss/" url="https://greatfinish.top/posts/dm-blkup2-sql-optimization/featured.jpg"/></item><item><title>记一次 1000+ 每秒 UPDATE 引发的 Redo 风暴：AWR 定位 log file switch checkpoint incomplete</title><link>https://greatfinish.top/posts/oracle-redo-storm-log-file-switch-checkpoint-incomplete/</link><pubDate>Thu, 11 Dec 2025 21:30:00 +0800</pubDate><guid>https://greatfinish.top/posts/oracle-redo-storm-log-file-switch-checkpoint-incomplete/</guid><description>一次 Oracle Redo 风暴处理实战：生产库磁盘使用率超过 90%，日志切换从每小时十几次飙升到数百次，AWR 显示 log file switch checkpoint incomplete 占 DB time 约 41%，最终定位 SQL_ID 0vq0s6rm8fawn 每小时执行 376 万次，约 1000+ 次/秒 UPDATE。</description><media:content xmlns:media="http://search.yahoo.com/mrss/" url="https://greatfinish.top/posts/oracle-redo-storm-log-file-switch-checkpoint-incomplete/featured.jpg"/></item></channel></rss>