linux – 失败的通信线路……重新启动蠢货?

我在一家大公司工作,在那里我们使用许多遗留系统.要注意一些系统:HP-UX 10.20,Windows 2000,VMEBus系统,30年前设计的系统,不通过TCP / IP协议进行通信等等.

在整个工作周期间,我们一直困扰着这些传统系统失去彼此之间的沟通.通常,重新启动系统以尝试恢复通信是最后一种方法.人们普遍认为重新启动系统只是无知同事的“全部解决方案”.我想知道,如果有效率重新启动系统(传统与否)以恢复失败的通信线路?

我意识到在Windows中更新IP地址应该有效地恢复网络通信;但是底层操作系统中是否存在可能导致损坏并需要重启的更深层次问题的可能性?一个失败的套接字超时,不关闭,或者可能不尝试重新连接?

在我看来,当拥有如此复杂的不匹配系统网络时,重新启动将是一个可行的解决方案.但是(至少在我的工作场所)当一个系统重新启动时,一切都神奇地再次开始工作它总是一个“巧合”;永远不是解决方案思考?

解决方法

答案是“它取决于”.

重新启动可以通过提供更好的日志记录或容易发现的问题来解决问题或更轻松地检测问题. (嗯……重启不应该花10分钟)

然而,重新启动作为标准的故障排除技术是一种不好的做法.有人需要了解事情如何断开,以便您可以分类,隔离故障组件并开始解决问题.

我讨厌这样说,但看看像ITIL这样的东西可能会有用,特别是事件和问题管理.它可以帮助您或您的管理层重新组织您的支持系统,以便以合理的方式实际运作.

相关文章

Linux中的ARP防火墙主要用于防御ARP欺骗攻击,其效果取决于多...
insmod和modprobe加-f参数导致Invalid module format错误 这...
将ArchLinux安装到U盘 几个月前入门Arch的时候上网搜了不少安...
1、安装Apache。 1)执行如下命令,安装Apache服务及其扩展包...
一、先说一下用ansible批量采集机器信息的实现办法: 1、先把...
安装配置 1. 安装vsftpd 检查是否安装了vsftpd # rpm -qa | ...