月归档:2013 年六月

Flashcache WriteBack的常用Metric和event

User guide上列出了全部的Metric,这里只说些一般比较关注的: FC_BY_USED – number of MB cached (total) FC_BY_DIRTY – number of dirty MB cached (data written only to FlashCache but not to disks) GD_BY_FC_DIRTY – number of dirty MB cached for the griddisk CD_BY_FC_DIRTY – number of dirty … 继续阅读

发表在 FAQ, POC和性能调整, 体系架构, 硬件配置 | 标签为 , , | 留下评论

关于Exadata的万兆网的配置初级篇

今天忽然好多人问起来万兆模块的事情,微博上写不下,我放在这里。 首先,万兆模块通常的作用有两个: 1,作为备份和灾备的网络,高效快速。有人问为啥不用Infiniband,那个说来话长,用不用都可以,关键看客户的整体架构,从技术上没啥不行的,直接插一根线到IB switch就行了………… 2,作为public ip,用于client的访问,比如地台eth1和eth0,做绑定,这个有N个文档都说了,比如owner guide,还比如MOS等等,这里不赘述,只是一点稍微嘱咐下,如果是初始配置,那么只要按部就班的用onecommand就搞定,如果是后面更改,除了考虑物理的网络连线,客户的交换机是否有万兆模块或者支持万兆,还要考虑软件本身的因素,其实配置好了以后(如果需要可以做绑定,也可以不绑定,根据客户需要),就是参考mos的文档做更改public ip和vip,scan ip等的设置。 在补充一句,在每个Exadata自带的机器上有document文档,其中owner guide上“Changing from 1 GbE Connections to 10 GbE Connections”是专门的一个章节,写的非常详细。 具体就是如下的配置文件,配置万兆使用命令: ethtool [root@dm01db01 ~]# dcli -l root -g dbs_group “ethtool eth4” dm01db01: Settings for eth4: dm01db01: Supported ports: [ FIBRE ] … 继续阅读

发表在 安装和升级, 硬件配置 | 标签为 , | 留下评论

Exadata X2的硬件配置清单

最近询问是否可以山寨XD的有不少人了,特别是客户关心的是过了1年的质保,怎么办? 比如一个FULL RACK,如果续服务费,list的22%,你懂的………… 今天刚发现,这里有个SUN服务器海外渠道 http://sunmicrosystems.taobao.com/ :具体什么情况,真心未知,o(∩_∩)o 哈哈 下面是X2的硬件清单,具体还可以参考ORACLE 官网的白皮书和机器自带的文档,文档位置: http://blog.csdn.net/lunar2000/article/details/7881896 别的不担心,这东西越来越觉得可以山寨(readme中有明确方法告诉你跳过硬件检测的参数),但是估计法律风险很大,慎重…… 计算节点: 存储节点

发表在 硬件配置 | 标签为 , | 留下评论

ASM磁盘头被fdisk损坏的修复过程

一大早起来折腾昨天的12c(我装的是standalone),发现使用文件虚拟成设备的方法,磁盘IO效率很低(我猜是这个原因),于是铲掉打算重新安装 铲掉12c RAC跟铲掉11.2 RAC没啥区别,参考前面的文章 5分钟内搞定。 安装完grid,感觉磁盘不够用,于是把vm停了,加一块新的盘,然后启动后,fdisk /dev/sde 悲剧了,刚弄完就想起来,这个是ASM的DATADG…………于是,你懂的…… 查看日志,ora.DATA.dg 资源状态异常: 使用kfed可以清晰的看到,盘头损坏了: 在ASM中也可以看到,/dev/sdb原本是DATA DG的设备(HEADER_STATU应为 MEMBER),现在确变成“CANDIDATE”: 我们知道,每个ASM磁盘的UNIT 1,块254(Allocation unit# 1, Block# 254)是盘头的备份,因此查看下,这个块是否是好的: 手工把ASM磁盘组DATA挂载上: 好了,可以安装db软件,然后建库了…………

发表在 ASM, backup&recovery | 标签为 , | 一条评论

记一次低级错误——dbca找不到ASM磁盘组

今天忽然想起来装一个12c,首先声明,12c中,创建CDB和PDB的功能是一个选项,可以在创建数据库的时候,选择是否创建成这个模式,或者沿用以前的模式: 在标准创建中可以选择“Create as container database”: 或者在高级选项中选择“Create as container database” 本次发现一个问题,使用dbca建库,找不到磁盘组,但是从grid用户看disk和diskgroup都是正常的: 检查一圈,发现原来是orace用户组设置错误: 检查grid: 修改oracle组为以下: 可以正常建库了:

发表在 ASM | 标签为 , | 留下评论

Linux下手工卸载11.2 RAC(非MOS的deinstall方法)

用了下11.2的deinstall卸载慢的很,熬人,自创了一个,感觉很好,5分钟内搞定,可以稍微改改,写成脚本,o(∩_∩)o 哈哈 思路来自于经典的《How to Proceed From a Failed 10g or 11.1 Oracle Clusterware (CRS) Installation (Doc ID 239998.1)》 补充了一些11.2特有的内容。 下载11.2 RAC的官方方法: How to Proceed from Failed 11gR2 Grid Infrastructure (CRS) Installation (Doc ID 942166.1) 本次没有采用这个方法,其主要是执行deintall脚本,但是我的环境中,执行时间很久,不喜欢……………… 以下是一个节点的,2个节点也一样: 最好先执行这个: 当然,按照我下面的,不执行也没有问题…… 检查是否还有 d.bin … 继续阅读

发表在 Installation and Deinstall, RAC, Scripts | 标签为 , , , | 2 条评论

linux 误删除文件恢复

创建测试表空间 创建表插入数据 删除datafile 数据还在,因为从buffer cache中读到的 执行flush buffer cache 可以看见,再次查询,报错文件状态不对了(找不到了) 检查dbwr进程的spid 找到dbwr的句柄 进入dbwr进程的File Descriptor number目录中 恢复过程 检查下,文件已经恢复完成,大小为10m 将数据文件offline 恢复datafile 将数据文件online 好了,完成恢复了

发表在 backup&recovery | 标签为 , , | 2 条评论