博客
关于我
ORACLE11g 云上Data Guard环境备库down机恢复实战过程
阅读量:550 次
发布时间:2019-03-09

本文共 1675 字,大约阅读时间需要 5 分钟。

Oracle备库故障处理及恢复方法

故障现象

微软云上的Oracle备库意外发生故障,导致ping不通,各种监控报警接连上来。联系微软云后台工程师,告知问题可能出在存储设备上的文件损坏。系统启动检查发现,除非重启系统,否则无法正常启动到登录界面。


故障诊断

系统启动检查发现:

  • /dev/sdc1的superblock损坏,无法识别文件系统。
  • 备用数据库无法启动,报警信息显示文件不一致,数据恢复失败。

  • 故障处理措施

    1. 系统重启

    微软云团队根据建议,进入管理界面,关闭数据库服务并重启系统。 3小时后,工程师反馈恢复完成,备库服务器正常启动。

    登录系统后发现:

    • 数据文件目录仍在原位置。
    • 启动数据库时,报错:
      SQL> startup
      ORACLE instance started.
      ...
      ORA-10458: stadby database requires recovery
      ORA-01196: file 1 is inconsistent due to a failed media recovery session
    • 数据文件恢复失败,提示介质恢复失败。

    2. 启动归档传输

    为了确保数据恢复,启动归档传输:

    SQL> alter database recover managed standby database using current logfile disconnect from session;

    执行后确认完成:

    SQL>

    3. 实时观察日志应用

  • 主库查看
  • # 主库查看归档日志是否已传输
    SQL> select sequence#,applied from v$archived_log order by sequence#;

    输出显示,归档日志已传输到备库,但还在应用中。

    1. 备库查看
    2. # 备库查看回流进度
      SQL> select sequence#,applied from v$archived_log order by sequence#;

      输出显示,归档日志已完全传输,但正在进行应用。


      4. 检查日志应用进度

      通过检查v$dataguard_stats

      SQL> set linesize 2000
      SQL> select name,value from v$dataguard_stats;

      输出显示:

      • transport lag: +00 00:00:00
      • apply lag: +02 01:23:55
      • apply finish time: +00 00:06:31.000
      • estimated startup time: 11

      日志应用仍在进行中。


      5. 结束归档恢复

      随着日志应用逐步完成,后台日志显示:

      Media Recovery Log /oracle/app/oracle/flash_recovery_area/archivelog1_16855_906253421.dbf
      ...
      Recovery of Online Redo Log: Thread 1 Group 4 Seq 16856 (in transit)

      6. 启用数据库

      尝试打开数据库:

      SQL> alter database recover managed standby database cancel;
      SQL> alter database open;
      SQL> alter database recover managed standby database using current logfile disconnect;

      最终,验证数据库状态:

      SQL> select name,open_mode from v$database;

      输出:

      NAME  OPEN_MODE
      POWERDES MOUNTED

      验证修复成果

    3. 数据文件完整性恢复。
    4. 极化传输完成,主备同向一致。

    5. 总结

      通过系统重启、启动归档传输以及实时日志观察,最终成功恢复了Oracle备库,主备数据库保持了数据的一致性和服务可用性。

    转载地址:http://nkjsz.baihongyu.com/

    你可能感兴趣的文章
    Netty源码—4.客户端接入流程二
    查看>>
    Netty源码—5.Pipeline和Handler一
    查看>>
    Netty源码—5.Pipeline和Handler二
    查看>>
    Netty源码—6.ByteBuf原理一
    查看>>
    Netty源码—6.ByteBuf原理二
    查看>>
    Netty源码—7.ByteBuf原理三
    查看>>
    Netty源码—7.ByteBuf原理四
    查看>>
    Netty源码—8.编解码原理一
    查看>>
    Netty源码—8.编解码原理二
    查看>>
    Netty源码解读
    查看>>
    Netty的Socket编程详解-搭建服务端与客户端并进行数据传输
    查看>>
    Netty相关
    查看>>
    Netty遇到TCP发送缓冲区满了 写半包操作该如何处理
    查看>>
    Netty:ChannelPipeline和ChannelHandler为什么会鬼混在一起?
    查看>>
    Netty:原理架构解析
    查看>>
    Network Dissection:Quantifying Interpretability of Deep Visual Representations(深层视觉表征的量化解释)
    查看>>
    Network Sniffer and Connection Analyzer
    查看>>
    Network 灰鸽宝典【目录】
    查看>>
    NetworkX系列教程(11)-graph和其他数据格式转换
    查看>>
    Networkx读取军械调查-ITN综合传输网络?/读取GML文件
    查看>>