服务器备份问题的探讨及在视频领域内的应用
备份系统的基本原理是在两台或多台服务器之间建立连接,利用软件控制服务器的主从关系,因此在不同的操作平台上可以安装不同的控制软件。例如Vinca公司提供的服务器备份解决方案Co-standby Server就是一个纯软件产品,可以分别建立基于Novell、Windows NT、OS/2等服务器平台上的备份解决方案。而其它很多厂商开发的解决方案如LifeKeeper、Cluster也有基于系统平台的多种版本。
在服务器之间建立连接的手段有很多种,一般可以采用RS-232 通信端口(Communications port )或者TCP/IP的连接。我们以运行在Active/Standby工作模式下的备份服务器系统进行说明。
如图-7所示。服务器一为主服务器,处于Active状态,服务器二位备份服务器,处于Standby状态。两个服务器都通过铜缆或者SCSI接口与大容量硬盘阵列连接,服务器之间通过RS232和TCP/IP进行连接。
在系统正常工作状态下,应用A运行于服务器一上,从硬盘阵列的区域a读取或写入数据。服务器二通过连接向服务器一发送周期性的检测信号并从服务器一接收应答信号。
服务器二如果能够接收到服务器一正常工作的响应信号,则认为服务器一工作正常,则服务器二仍处于Standby状态。
如果服务器二不能从服务器一收到应答信号或者收到错误的应答信号,则服务器二认为服务器一已经失去正常工作的能力。服务器二从Standby状态转为Active状态,从硬盘阵列中的区域a读取应用A的状态数据并开始运行应用A,同时禁止服务器一访问区域a。从而接替服务器一在系统中的主服务器地位。当服务器一恢复正常工作时,服务器二将工作交还给服务器一并恢复Standby状态。
交还应用的方法有两种:一种是手动交还,即管理员排除服务器一的故障后,手动将工作切换给主服务器,并将备份服务器恢复到Standby状态。另一种是自动恢复,即在备份服务器接替主服务器工作后继续向主服务器发送检测信号,一旦收到表示主服务器已经正常的应答信号,就采用与接替主服务器工作的相同方式将工作交还给主服务器并恢复为Standby状态。
在实际工作过程中,必须注意以下几个问题:
1. 检测的准确性
由于检测信号的出错或者服务器之间连接的故障可能会导致备份服务器接收不到主服务器发回的正常响应信号,从而备份服务器认为主服务器已经无法正常运行,就会导致系统进行不必要的切换。
为了防止这种情况的发生,我们可以采用两种手段:设置多种检测应答信号和服务器间的多路连接。我们可以设定不同的检测及应答信号,当所有的检测信号均无正常应答时,备份服务器才认定主服务器已经无法正常工作,从而接手主服务器的工作。我们也可以在服务器之间建立不同的硬件连接,如同时建立基于RS232和TCP/IP的连接,同时发送检测信号,当所有的通路都得不到正常的应答信号后,备份服务器才认为主服务器已经无法进行正常的工作,接替主服务器的工作。当然最合理的方式是同时采用这两种方法,在多路连接上同时传送不同的检测应答信号。不过采用这种方法时必须要考虑的系统的资源开销问题。
2. 检测信号的发送周期
检测信号发送周期的长短取决于用户对备份系统的启动响应速度的要求。如果用户认为数据完整的重要性要远大于备份系统开始运行的响应速度的重要性,那么就可以令检测信号的发送周期适当的长一些,从而保证备份系统启动时数据可以被完整的保存。如果用户认为整个系统的工作不能中断甚至不能出现一定量的延时,那么检测信号的发射周期及和从确认主服务器无法正常工作到启动备份服务器接替主服务器工作的响应周期一定要小于系统所能够忍受的最大时间。硬盘播出系统就是一个最简单的例子。硬盘播出服务器的备份启动时间一定要小于人眼的可察觉的最小范围,并由此确定检测信号的发送周期。
3. 检测主服务器系统失效的方法
利用检测应答信号来确定主服务器系统是否失效的方法有很多,大致可分为检测系统硬件和检测数据两种。我们可以通过发送检测信号检测主服务器的系统硬件,如总线或CPU的工作状态,从而确定主服务器是否正常工作。我们也可以通过检测主服务器内存的数据状态,I/O端口的数据流动情况来判断主服务器系统是否出现数据错误。我们可以在主服务器上安装检测软件,把检测结果直接发给备份服务器,也可以利用主服务器自身的系统检测来确定主服务器的工作状态是否正常。
4. 主从服务器的设置
&
《服务器备份问题的探讨及在视频领域内的应用(第4页)》