遭遇最能让人心惊肉跳的事情

对于日常工作和生活都离不开计算机的人,遇到什么问题最让人抓狂?计算机故障?其实并不算,硬件虽然需要用钱买,但毕竟是可以买到的,而硬件中存储的数据一旦丢失,那就真的很让人抓狂了。虽然我工作中用到的所有文档都同时备份到外部移动硬盘以及网络空间中,可以算得上是万无一失,但除此之外依然有很多值得保存的好东西。今天就遇到一个非常让人抓狂的问题,虽然最终没有造成任何损失,不过我觉得以后我对数据安全肯定会更加重视起来。

问题是这样的:我现在用的主力电脑,是去年11月底自己装的,使用技嘉GA-P55-UD3L主板(Intel P55芯片组),另外有三块西捷1.5 TB硬盘,其中一块是基本盘,另外两块设置为动态盘,并使用Windows自带的功能创建了一个3TB容量的跨区卷(也就是软RAID 0)。当初这样做的主要考虑是,我平时需要在虚拟机中做大量实验,而有些实验比较复杂,需要同时运行四五台,甚至七八台虚拟机。因此磁盘的I/O性能肯定会成为一个很大的瓶颈,因此更加偏重性能的RAID 0成了我的首选。又因为硬件RAID卡比较贵,并且不好买,于是只能使用软件形式的动态盘。

当然,不管软件或硬件形式的RAID,RAID 0在本质上就无法提供数据保护,而且一旦组成阵列的任何一块硬盘故障,整个阵列都将故障,数据全部都将无法找回。因此如果有N块相同规格的硬盘组成RAID 0卷,每块硬盘的故障几率都相同,那么整个阵列故障的几率就会增大N倍。不过当时依然抱着侥幸的想法,再加上这些数据并没有重要到丢失后会要命,因此就这样用着了。

原本一切正常,可前几天闲来无事重装了系统,然后问题就来了。昨晚睡前让电脑睡眠,早起开机后没开显示器就去吃早饭了。等饭毕归来登录系统后发现,系统貌似重新启动了,因为昨晚睡前打开的程序都没有开启。我原本以为可能是系统自动安装了更新并重启动,于是也没有怎么理会。准备首先找一些歌曲播放,然后开始今天的工作。

WMP的媒体库中导入了大量歌曲,原本直接选中播放就好,可为啥会提示找不到目标文件?打开“计算机”一看,神啊,我的E盘没有了。运行diskmgmt.msc打开磁盘管理后看到,由两块硬盘组成的RAID 0卷中显示一块硬盘丢失,因此整个卷都暂时无法访问。

丢失一块硬盘后的RAID 0卷

当时感觉头立刻就大了,这可受不了,这个卷里保存了我的所有虚拟机硬盘文件,保存的音乐,保存的电影电视剧等内容。虽然这些内容并不是无法重新找回,可总归要费太多心思。因为我的硬盘都是西捷的,因此随后立刻使用西捷提供的SeaTools工具进行检测,这个工具一样找不到丢失的硬盘,但检测其他硬盘,完全正常,没有任何错误。

回想到饭毕后发现系统已经重启动了,于是打开事件查看器,发现记录了一个蓝屏和一个非正常关机的错误信息。

异常关机信息如下:


Windows
摘要
异常关闭
日期
‎2010/‎9/‎1 7:56
状态
解决方案可用
问题签名
问题事件名称:    BlueScreen
OS 版本:    6.1.7600.2.0.0.256.1
区域设置 ID:    2052
关于该问题的额外信息
BCCode:    7a
BCP1:    0000000000000020
BCP2:    FFFFFFFFC000009D
BCP3:    FFFFFA8009C277C8
BCP4:    0000000000000000
OS Version:    6_1_7600
Service Pack:    0_0
Product:    256_1
存储段 ID:    X64_0x7a_c000009d
服务器信息:    fa845eca-e1fa-43d0-a13d-a9f9e5a6dfc6

蓝屏关机信息如下:

描述
计算机已经从检测错误后重新启动。检测错误: 0x0000007a (0x0000000000000020, 0xffffffffc000009d, 0xfffffa8009c277c8, 0x0000000000000000)。已将转储的数据保存在: C:\Windows\MEMORY.DMP。报告 ID: 090110-35209-01。

这是个很奇怪的问题,因为硬件配置没有变过,并且软件也没有太大变化。于是再次进行试验,发现,如果是正常关机,那么开机后可以正确进入。但如果让系统睡眠或者休眠,开机后,等待片刻就会立刻蓝屏,并显示上述错误信息,同时再次启动有可能会找不到E盘。因为BIOS自检中可以看到所有硬盘,只是在进入系统后才看不到,因此基本可以确定,应该是驱动问题,尤其是磁盘子系统驱动的问题。

出问题的系统只安装了Intel官网提供的INF芯片组驱动,这和原先的系统有所不同,原先系统同时还装了Intel的快速存储驱动,只不过我感觉这个驱动貌似没啥用处,于是新装的系统就没有装。于是干脆也装上试试看吧。装好,重启动,进入系统,系统报告找到新设备,自动安装驱动,然后再次重启动。随后正常启动后,将系统置于睡眠状态,等待片刻后重新开机,这次终于正常了,不再蓝屏,并且尝试了三次,也没有再遇到硬盘丢失的问题。

貌似问题已经完全解决了。

另外,在网上搜索的过程中还遇到另一个相关的案例:Windows 7/Windows Server 2008系统中,如果安装容量超过1 TB的大容量SATA硬盘,有可能会在从睡眠/休眠等状态恢复的时候蓝屏,并显示几个不同的STOP错误代码。这是一个已经确认的Bug,微软已经提供了补丁,并会在SP1中包含。因此如果有筒子遇到类似问题,但上述方法无法解决,也可以试试看向微软索取这个补丁来装,相关信息可参考KB 977178

说真的,RAID 5,或者能提供更高保护等级的RAID阵列设备,也许该列入采购议程了。

分享:

《遭遇最能让人心惊肉跳的事情》有8个想法

  1. 嘿嘿,以后准备自己装一台文件服务器来的

    盗梦空间,我正准备今天下午去看呢,可惜我家就我喜欢这种类型的片子,而且今天别人都忙,就我一个人去看-_-

  2. 我觉得这事情纯粹是在拼人品呢,有些人一块硬盘用六七年都不会有问题,有些人一块硬盘刚买回来装满数据就挂了,没办法,希望老天保佑大家的人品都很好

    1. 对啊,是7200.11系列的,不过还好,当时出现这个问题后就验证过了,倒是没问题,要不可真就杯具了。不过好在这次这个只是软问题

发表评论

电子邮件地址不会被公开。 必填项已用*标注

发表评论前,先做个简单的数学题吧: * Time limit is exhausted. Please reload CAPTCHA.