网络平台的组成有很多的东西,其最本质的核心是直接对业务的保障。举例来说,我们的
IT管理人员始终关注的是什么呢?应用系统在上面走的好不好,我们是为业务系统提供支撑的,我们必须关注业务系统的好坏,业务系统怎么关注呢?很多人有个误区,认为关注服务器的状态就等于关注了整个业务运行情况。事实上,服务器的状态只是业务运行状态的一部分。
曾经有一个案例,用户遇到收费系统跨掉的情况,信息中心的主任当时很惊讶,为什么会跨掉?这是不可能的,系统有监控系统,跨掉会告警的。经过我们的调查和分析,发现最近发生了大量ARP的行为,我们通过运维管理系统进行了监视,发现这些ARP包都是从某个IP地址发出来的,把这个IP地址所对应的网络设备端口关掉,系统就好了,我们不用主动去找使用者,他上不了网自然会打电话过来,最终查出来就是这个IP地址的使用者导致了收费系统的瘫痪。
网络位置是不能有移动的,利用仿真技术,模拟员工的行为去访问它。这样就可以通过仿真模仿用户的访问来保证业务系统的正常运行。最后才是监控服务器内部的进程是不是正常,通过全面的监控才能保证整个业务系统是好的。我们的服务目的是保证业务的顺利进行,所以我们要进行全方位的监控。
层次化综合管理是大势所趋
各个管理员都有自己的权限和区域,整个大网络不可能用一套系统管理,一旦网络规模上去了,层次化的管理是非常重要的,目的是保证有问题的时候上级可以管到下级,在物理上分平台但是逻辑上是整体。我发现某一个地方的IP地址有病毒,层次化管理就是所查找的区域即使不是本地的网管平台,也可以很快定位到下边某个县、市的交换机平台端口上,否则我们无法实现综合管理。
以低成本易用性满足实际需求而不改变规则是首要考虑的
首先要考虑的问题是实施管理的代价。这个系统要花多少代价,并不是指购买产品多少代价,你还要考虑设备和人力的投资,这些都是非常重要的。我买了一个管理产品来,必须要请一个高管的人,必须要基础设施改过,这也是非常大的。必须要考虑管理代价,规则的制定也是非常重要的,我上了管理系统必须根据管理工具把整个企业的管理思路和规则重新制定一下,这是不行的。我们遇到过这方面的情况。PC桌面管理,早在2000年的时候,可以算是一个前卫的概念,在国内鲜有成功案例,但有一个企业敢为天下先,部署了一套美国产的的桌面管理系统,主要是进行PC行为管理和监控。当时,是台湾的一家公司负责实施的,施工长达两个月,结果用了多长时间呢?两个礼拜,原因是实在没有办法用了,他试图去改管理规则和控制人的行为,监控人家的桌面。上面的生产部门不愿意了,你凭什么看我的桌面和控制我的行为,我想炒股和玩游戏是正常的,最后有的人就把机器搞坏了,最后只能放弃。现在的PC桌面管理用户用的更多的是资产统计等,而不再强调控制人的行为,这不是信息部门做的事情,是企业整个规章制度制订了,总经理办公室下命令了才能做,不下命令是不能做的。不要试图改变游戏规则,否则是很难的。
减少对环境的依赖,不要对完成有太大的依赖
某个管理思路很好,但要在服务器上加一点东西,结果没有人敢做这件事。原因很简单,因为业务系统很重要,万一出了问题说不清楚。对国内的产品来说,你要用户把一本说明书读懂是不太可能的,兴趣就是15分钟上去看到的功能是有的,没有看到的就不能。另外不能依赖上门服务,你要养多少人上门呢?要提供远程技术支持,你在操作过程中碰到问题了,不会使用了,但只要能够上互联网,就可以在你的机器上操作,就可以看到了,你一年获得一百次服务都是没有问题的。优势简单说一下,就是易用性、主动性、实用性、扩展性、便捷性。
运维管理系统的发展思想是应该按照用户的需求来考虑的
给大家讲一个广交会的案例,大约有16000个布线点,每次开会的时候有13000台电脑接入,在03年前是无法用的,上网下订单、发传真,而03年1万多电脑接入不能保证是否有病毒,造成了网络瘫痪。每次开会传真排队非常长。03年的时候他们改造成线速交换机,三层架构。04年初开广交会,网络不瘫了,但是互联网端口堵塞,大家还是没有办法上。正好,运维管理系统给他们提供了一个解决方案,在端口放了一个探针,只要有异常的马上告诉用户,通过运维管理系统的IP定位功能,查看问题到底出现在什么地方的哪个交换机的几号端口,把那个端口关掉,然后像管理员报警,管理员再去杀毒。凭借拥有对病毒和异常访问的屏蔽功能,广交会最终选用了BTNM网络运维管理系统。以前的那种加带宽,增加硬件来扩充带宽试图做到防止问题的发生是不正确的,管理是预防为主,有几千台机器有问题在实际管理中是无法快速有效解决的,要把问题屏蔽在网络之外,达到我们服务的目的。
网络运维管理的那些事儿,说到底还是要从基础设施抓起,俗话说高楼平地起,基础设施完善的业务平台才可能为用户创造真正的价值。
本文出自 “老孙的网络管理” 博客,请务必保留此出处http://sunyongjie.blog.51cto.com/445592/110406
本文出自 51CTO.COM技术博客
posted on 2009-04-22 13:26
孙永杰 阅读(158)
评论(0) 编辑 收藏 引用