作为DBA这样的后台运维护人员, 需要监控很多东西, 除了数据库及主机的健康状况之外, 更重要的是一些业务信息的监控. 平台不是重要的, 最重要的是先有内容, 下面就是一个用WebChart画出来的业务数据图, 可以看到在早上2点前后的10分钟业务量有一个突然下降, 等会上班后就可以去问原因了.
很多网站应用都做成分布式的, 监控的内容还可以扩展到接口的调用, 及消息系统中消息的进入和处理量等.
监控的目的是为了帮助我们及时注意到发生的事情, 并为之找出合理的解释.
作为DBA这样的后台运维护人员, 需要监控很多东西, 除了数据库及主机的健康状况之外, 更重要的是一些业务信息的监控. 平台不是重要的, 最重要的是先有内容, 下面就是一个用WebChart画出来的业务数据图, 可以看到在早上2点前后的10分钟业务量有一个突然下降, 等会上班后就可以去问原因了.
很多网站应用都做成分布式的, 监控的内容还可以扩展到接口的调用, 及消息系统中消息的进入和处理量等.
监控的目的是为了帮助我们及时注意到发生的事情, 并为之找出合理的解释.
留言 (6)
不如用一些专业的监控软件然后写他们的插件啦,例如cacti,munin之类的
Posted by Sparkle | Aug 5, 2008 4:31 PM
博主,我在系统上配置了,但打不开页面?我的库为10g2
Posted by myfreeke | Aug 6, 2008 12:18 PM
打不开页面的话,应当是数据库连接信息没配对。
Posted by anysql | Aug 6, 2008 10:19 PM
Cacti是很不错的,但有一个缺点,显示图是方便,显示表格类的监控信息,却不方便。
为了一眼看到更多的信息,不一定用图来显示数据。
Posted by anysql | Aug 8, 2008 8:24 AM
http://192.168.0.1/webchart/sample3.wcml
我这样访问,有一个蓝色的框,中间说一个错误:
Query execute error!
还有是否可以实现一个功能,在比如你上面的图中,在某个时间段出现下降,可以调用一个链接来发MSN报警消息?
Posted by myfreeke | Aug 12, 2008 6:25 PM
那说明你写的SQL语句有错误了,对于一个图来说,除第一列外,其他的应当全部是数字类型。
不具备报警机制。
Posted by anysql | Aug 13, 2008 8:57 PM