Clunix Wiki

(버전 사이의 차이)

이동: 둘러보기, 찾기

2009년 2월 10일 (화) 10:55 판

개요

MON이 관리하는 노드들의 자원 상태 모니터링, 노드들에서 동작중인 서비스와 프로세스들을 모니터링하는 솔루션이다. 현재 SK C&C의 항공사진프로젝트를 위해 개발을 준비하고 있다.

요구사항 수집

현재 개발에 앞서 전체요구사항을 수집하는 중이다. 이번 프로젝트에서는 전체요구사항 중 SK C&C에 필요한 기능만 우선 개발한다. SK C&C의 요구사항은 아래와 같다.

windows version(연구소 개발)
linux version(기술부 GridCenter 활용 - 프로세스 모니터링 기능 추가)
부하 정도를 리턴해 주는 API개발
log남기는 기능 추가

Windows version은 연구소에서 개발할 예정이며, Linux version은 기술부가 개발한 GridCenter에 약간의 기능을 추가할 예정이다.

전체 요구사항

시스템, 서비스, 프로세스를 모니터링하는 솔루션
웹을 통해서 시스템 관리자가 손쉽게 상황을 파악할 수 있다.
API를 통해 프로그램이 자원의 상황을 확인할 수 있다.
제품이 사용하는 시스템 자원은 매우 작아야 한다.
- 1개 Core의 3%이내
- Memory 50MB 이내
log남기는 기능 추가
- 시스템 자원 사용 정보
- 프로세스 모니터링 정보
- 과거기록출력 기능
  - 기간 설정
  - 노드별, 프로세스별 과거 기록
- 그래프
매뉴얼

Version

for Linux

for Windows

SK C&C를 위해서 우선 개발되어질 예정이다. 모든 요구사항을 구현하지 않을 예정이며 SK C&C의 요구사항만 반영된 버전이 우선 출시된 예정이다.

모니터링 할 정보들

노드 정보

서버가 등록될 때 1회만 정보 업데이트
서버 정보가 변경되면 사용자가 강제로 업데이트 또는 자동 업데이트
모니터링 할 서버 등록/삭제/설정 변경
CPU, Memory, Disk 등 하드웨어 자원 모니터링
Network 자원 모니터링

서비스 정보

등록된 서비스가 노드에서 정상동작 하고 있는지 모니터링 함

서비스 등록/삭제/등록 정보 수정
EnCluster-HA 서비스 상태 모니터링
- IDC내의 모든 EnCluster-HA모니터링
  - CDNetworks경우 10 copy 이상의 EnCluster-HA 사용중
  - HOME Plus는 전체 POS 시스템에 사용하는 모든 EnCluster-HA를 한 눈에 모니터링 하고 싶어 함
타사 HA 솔루션 모니터링
Clunix 제품(MCS, UTS 등) 모니터링

프로세스 정보

등록된 프로세스가 노드에서 동작하고 있는지 모니터링 함

프로세스 등록/삭제/등록 정보 수정
PID, Owner, Name, CPU Usage, Memory Usage 등

SK C&C 요구사항

장애

장애 리스트

관리되는 시스템들에서 발생한 장애를 한 번에 확인 할 수 있어야 한다. 장애가 발생하면 장애 목록과 함께 장애에 대한 정보도 함께 보여주어야 한다.
장애 목록은 다음과 같다.

장애 등급 - 색깔로 장애 정도 표시
장애가 발생한 서버
장애 발생 시간
장애 복구 시간
장애 지속 시간
장애 코드
장애 발생 장치 또는 서비스
장애 상세 내용

시스템 장애

하드웨어 또는 운영체제에서 발생한 장애. 시스템에 접근 자체가 불가능한 경우가 대부분이다.

증상

관리 프로세스가 감지할 수 있는 장애 증상들이다. MON의 서버가 서버의 시스템 장애로 판단할 수 있는 증상들이다.

네트워크 접속 불가
ping 안됨

관리되는 서버들에 설치된 MON slave가 멈추면 모니터링된 값이 전달되지 않는다. 이 경우는 다른 시스템 툴(ping 등)로 노드의 상태를 확인할 수 있다. ping이 된다면 MON Slave가 죽었거나 응답시간이 길어진 경우일 수 있으므로 다른 종류의 장애가 된다.

시스템 장애 목록

물리적인 하드웨어 고장 또는 케이블 단선
하드웨어(부품, 케이블 등) 접속 불량
운영체제 문제로 발생한 장애
네트워크 문제

서비스 장애

모니터링하도록 등록된 서비스의 장애

서비스 장애 목록

서비스 다운
EnCluster-HA에 등록된 서비스의 장애 발생

장애등급

Log

Log의 종류

납품할 업체

SK C&C

경쟁사 제품

insoft의 OpenManager

참고

GridCenter MON Project on dP - dotProject에서 GridCenter MON의 개발진행 상황을 확인할 수 있다.

@@ 3번째 줄: / 3번째 줄: @@
 =요구사항 수집=
-현재 개발에 앞서 전체요구사항을 수집하는 중이다. 이번 프로젝트에서는 전체요구사항 중 SK C&C에 필요한 기능만 우선 개발한다. [[SK C&C]]의 요구사항은 아래와 같다.
+현재 개발에 앞서 전체요구사항을 수집하는 중이다. 이번 프로젝트에서는 전체요구사항 중 [[SK C&C]]에 필요한 기능만 우선 개발한다. [[SK C&C]]의 요구사항은 아래와 같다.
 *windows version([[연구소]] 개발)
 *linux version([[기술부]] [[GridCenter]] 활용 - 프로세스 모니터링 기능 추가)

GridCenter MON