持久故障是指产品或产品的一部分不能或将不能完成预定功能的事件或状态。对某些产品可称失效。它不包括产品在预防性维修中不能完成预定功能的情况。持久故障是指在完成修复性维护活动之前,产品(装备)一直持续存在的一种故障。
在通信中,故障是是指产品或产品的一部分不能或将不能完成预定功能的事件或状态。对某些产品(例如: 电子元器件、……)可称失效。它不包括产品在预防性维修中不能完成预定功能的情况。也不包括由于缺乏外部资源或其他计划好的措施而导致的不能完成预定功能的情况。持久故障是指在完成修复性维护活动之前,产品(装备)一直持续存在的一种故障。
简介
故障是系统不能执行规定功能的状态。通常而言,故障是指系统中部分元器件功能失效而导致整个系统功能恶化的事件。持久故障是指在完成修复性维护活动之前,产品(装备)一直持续存在的一种故障。与之相对应的临时性故障是指产品(装备)在很短时间内发生的丧失某些局部功能的故障。这种故障发生后不需要修复或更换零部件,只需对故障部位进行调整即可恢复器丧失的功能。
故障的分类及特征
分类
1.按故障的持续时间分类
按故障的持续时问可将故障分为永久故障、瞬时故障和间歇故障。永久故障由元器件的不可逆变化所引发,其永久地改变元器件的原有逻辑。直到采取措施消除故障为止;瞬时故障的持续时间不超过一个指定的值。并只引起元器件当前参数值的变化,而不会导致不可逆的变化;间歇故障是可重复出现的故障,主要由元件参数的变化、不正确的设计和工艺方面的原因所引发。
2.按故障的发生和发展进程分类
按故障的发生和发展过程可将故障分为突发性故障和渐发性故障。突发性故障出现前无明显的征兆,很难通过早期试验或测试来预测;渐发性故障是由于元器件老化等其他原因,导致设备性能逐渐下降并最终超出正确值而引发的故障。因此具有一定的规律性,可进行状态监测和故障预防。
3.按故障发生的原因分类
按故障发生的原因将故障分为外因故障和内因故障。外因故障是因人为操作不当或环境条件恶化等外部因素造成的故障;内因故障是因没计或生产方面存在的缺陷和隐患而导致的故障。
4.按故障的部件分类
按故障的部件可将故障分为硬件故障和软件故障。硬件故障是指故障因硬件系统失效。
5.按故障的严重程度分类
按故障的严重程度可将故障分为破坏性故障和非破坏性故障。破坏性故障既是突发性的又是永久性的.故障发生后往往危及设备和人身的安全:而非破坏性的故障一般是渐发性的又是局部的,故障发生后暂时不会危及设备和人身的安全。
6.按故障的相关性分类
按故障相关性可将故障分为相关故障和非相关故障。相关故障也称间接故障,因设备其他元器件而引发。比较难诊断;非相关故障也称直接故障,由元器件本身直接因素所引起。相对相关故障而言比较容易诊断。
除此之外。还可以按照故障的因果关系分成物理性故障和逻辑性故障,按故障的表征分为静态故障和动态故障。按故障变量的值分为确定值故障和非确定值故障等。
特征
设备的故障一般具有如下五个基本特征:
(1)层次性。复杂的设备,可划分为系统、子系统、部件、元件,表现一定的层次性,与之相关联,设备的故障也具有层次性的特征,即设备的故障可能出现在系统、子系统、部件、元件等不同的层次上。
(2)传播性。元件的故障会导致部件的故障,部件的故障会引起系统的故障,故障会沿着部件一子系统一系统的路径传播。
(3)放射性。某一部件的故障可能会引起与之相关联的部件发生故障。
(4)延时性。设备故障的发生、发展和传播有一定的时间过程,设备故障的这种延时性特征为故障的前期预测预报提供了条件。
(5)不确定性。设备故障的发生具有随机性、模糊性、不可确知性。
SAP DB 的持久性故障
定义持久性故障的标准
为了尽可能地降低由于资源中的瞬态故障引起的中断所带来的影响,故障监视器将重新启动资源以响应这类故障。 对于持久性故障,需要比重新启动资源更具破坏性的操作:
对于 SAP DB 资源,故障监视器将资源故障切换到其它节点。 SAP DB 资源是故障切换资源。
对于 SAP xserver 资源,故障监视器将使该资源脱机。 SAP xserver 是可伸缩资源。
如果在指定的重试间隔内尝试重新启动资源的次数超过了指定的阈值,则故障监视器将认为故障是持久性的。 为持久性故障定义标准使您能够根据群集的性能特点和可用性要求来设置阈值和重试间隔。
阈值和重试间隔与其它特性的相关性
重新启动一次出现故障的资源所需的最长时间是以下特性的值的总和:
Thorough_probe_interval 系统特性
Probe_timeout 扩展特性
为了确保在重试间隔内达到阈值之前您具有足够的时间,请使用以下表达式来计算重试间隔和阈值:
retry-interval ≥ threshold × (thorough-probe-interval + probe-timeout)
用来设置阈值和重试间隔的系统特性
要设置阈值和重试间隔,请设置以下系统特性:
要设置阈值,请将 Retry_count 系统特性设置为允许的最大重启次数。
要设置重试间隔,请将 Retry_interval 系统特性设置为所需的间隔(以秒为单位)。
为每个包含需要调节的 Sun Cluster HA for SAP DB 故障监视器的资源设置这些特性。表中显示了这些资源的资源类型。
重试间隔的其它影响
除了定义持久性故障标准以外,重试间隔还影响故障监视器对以下故障做出的响应:
SAP DB 故障监视器检测到 SAP xserver 不可用。 如果 SAP DB 故障监视器在重试间隔内两次检测到 SAP xserver 不可用,则 SAP DB 故障监视器将重新启动 SAP xserver。
持久性系统错误。持久性系统错误是指在重试间隔内发生四次的系统错误。 如果发生持久性系统错误,故障监视器将重新启动 SAP xserver。