视频信号数字化处理后所带来的信号损伤的种类及特点 2001
两个单元之间通过光纤和MIC卡相互连接。两台CE运行Marathon专利同步技术和执行应用程序。磁盘镜像是通过两边的IOP重复写磁盘实现RAID1,因此不需要专门的RAID控制器。当一台CE发生故障时,另一台CE马上在配置中移去故障的CE,并保持系统继续运行。故障的CE然后被物理上移走,修复,再连接,最后开机。这台CE使用高速连接的线路,通过同步另一台CE的状态而重新加入系统中。此外,当一台IOP发生故障时,另一台IOP能保持系统继续运行。故障的IOP然后被物理上移走,修复,再连接,最后开机。在E4000软件开始运行后,修复的IOP自动被加入系统。
◆ 硬件组成:
◆ 软件特点:
Marathon管理器是本系统的管理软件。它是一个能够使你监视和管理系统的标准Windows NT应用程序,具有标准的图形化界面的Marathon管理器主要能够实现以下功能:
·显示系统及其各个部件的状态,包括计算单元、输入/输出处理器、互连、键盘、鼠标、以太网连接等;
·发布管理系统及其各个部件的命令,包括启用或禁用系统部件;
·获取系统的统计信息,包括以太网计数器;
·确定镜像磁盘组的状态;
·可以启动Marathon配置工具和Windows NT管理工具;
·使用网络连接或微软远程访问服务器(RAS)可以通过一个远程工作站管理系统。
6、构建群集系统的原则
6.1群集与管理
所有关于群集的讨论必须包含对系统及管理网络的考虑。资源需求大,运行关键任务的企业级环境对群集很感兴趣,比如电视行业。因为它们不能承担意外停机造成的损失。服务器群集十分复杂,而复杂的技术又往往会引入许多人为的错误,因此系统应有网络资源管理、系统监测管理,并具有可以简化管理过程的工具。
把群集仅仅视为单一系统或把它仅仅视为分立的服务器,持这两种观点的系统和网络管理软件是不能胜任工作的。对服务器群集的有效管理需要集成上述两种观点,当我们观察群集上运行的一个应用程序时,需要单一系统观点;另一方面,当我们试图区分、定位一个出错部件时,又需要分立服务器观点。如果管理系统不能提供必须的监测及管理能力,那么服务器群集是不能在重要的应用环境中投入使用的。
6.2群集与成本
我们知道,并不是所有的服务器安装都需要或能支付得起群集提供的系统级冗余。因此我们需要对比一下是系统发生故障所造成的损失大,还是购买及管理一个群集系统的费用高,使配置从群集中获益。
图6-1: 服务器群集可用性等级
服务器系统用户对可用性有一系列要求:从最基本的每个服务器系统都具有一定级别的品质和可靠性,到最高级别------具有容错能力,即在任何情况下,服务器都能连续操作。(如图6-1所示)当一个服务器系统达到了最基本的品质与可靠性后,服务器制造商将会提供多种方法实现故障的自动恢复:其中包括数据备份,ECC内存,内存更新,不间断电源和服务器自动重启。如果想获得更高层次的可用性,就需要有一定的部件冗余,包括(UPS)磁盘(RAID),配置(ASR), 双控制器,热插拔冗余电源。可用性的这三个等级只涉及到单插拔服务器的可靠性。只有这些方法被有效使用的前提下,用户才能尝试系统或应用程序级的冗余策略。
值得注意的是,顾客对可用性的级别要求得越高,系统成本就会越高。(如图6-2所示)。
尽管容错系统性能非常好,但同时也非常昂贵的。顾客必须清楚为达到高可用性,自己必须付出的代价。
当系统发生故障时,企业会遭受直接和间接的双重损失。举例来说,直接损失包括因订购信息丢失而失掉的收益;间接损失也许得包括当系统最终恢复时为处理订购而必须付出的加班费。这两个例子正好也是另外一种区分标准下的两类损失:与内部人员相关的损失(服务器停机时无事可作);一类是与外界客户相关的损失(失去业务)。必须考虑两种类型的损失。
图6-2:系统可用性层次
高可用性群集涉及计划内与计划外停机。例如,当系统管理员要进行备份或其它系统服务时,他可以把这一活动定在某个时间进行,对最终用户的损害要小得多。有时,系统处于运行状态
《视频信号数字化处理后所带来的信号损伤的种类及特点 2001(第5页)》