GridCenter MON
(→요구사항 수집) |
|||
10번째 줄: | 10번째 줄: | ||
Windows version은 연구소에서 개발할 예정이며, Linux version은 기술부가 개발한 GridCenter에 약간의 기능을 추가할 예정이다. | Windows version은 연구소에서 개발할 예정이며, Linux version은 기술부가 개발한 GridCenter에 약간의 기능을 추가할 예정이다. | ||
− | + | =Version= | |
+ | ==for Linux== | ||
+ | ==for Windows== | ||
+ | [[SK C&C]]를 위해서 우선 개발되어질 예정이다. 모든 요구사항을 구현하지 않을 예정이며 [[SK C&C]]의 요구사항만 반영된 버전이 우선 출시된 예정이다. | ||
+ | =기능= | ||
+ | ==시스템 모니터링== | ||
+ | ==서비스 모니터링== | ||
+ | ===[[Clunix 제품]] 모니터링=== | ||
+ | ==프로세스 모니터링== | ||
+ | ==MON API== | ||
+ | ==장애판단== | ||
+ | ==로그저장== | ||
+ | ==사용자 인터페이스== | ||
=전체 요구사항= | =전체 요구사항= | ||
*시스템, 서비스, 프로세스를 모니터링하는 솔루션 | *시스템, 서비스, 프로세스를 모니터링하는 솔루션 | ||
26번째 줄: | 38번째 줄: | ||
**그래프 | **그래프 | ||
*매뉴얼 | *매뉴얼 | ||
− | |||
− | |||
− | |||
− | |||
=모니터링 할 정보들= | =모니터링 할 정보들= | ||
==노드 정보== | ==노드 정보== |
2009년 2월 10일 (화) 11:01 판
목차 |
개요
MON이 관리하는 노드들의 자원 상태 모니터링, 노드들에서 동작중인 서비스와 프로세스들을 모니터링하는 솔루션이다. 현재 SK C&C의 항공사진프로젝트를 위해 개발을 준비하고 있다.
요구사항 수집
현재 개발에 앞서 전체요구사항을 수집하는 중이다. 이번 프로젝트에서는 전체요구사항 중 SK C&C에 필요한 기능만 우선 개발한다. SK C&C의 요구사항은 아래와 같다.
- windows version(연구소 개발)
- linux version(기술부 GridCenter 활용 - 프로세스 모니터링 기능 추가)
- 부하 정도를 리턴해 주는 API개발
- log남기는 기능 추가
Windows version은 연구소에서 개발할 예정이며, Linux version은 기술부가 개발한 GridCenter에 약간의 기능을 추가할 예정이다.
Version
for Linux
for Windows
SK C&C를 위해서 우선 개발되어질 예정이다. 모든 요구사항을 구현하지 않을 예정이며 SK C&C의 요구사항만 반영된 버전이 우선 출시된 예정이다.
기능
시스템 모니터링
서비스 모니터링
Clunix 제품 모니터링
프로세스 모니터링
MON API
장애판단
로그저장
사용자 인터페이스
전체 요구사항
- 시스템, 서비스, 프로세스를 모니터링하는 솔루션
- 웹을 통해서 시스템 관리자가 손쉽게 상황을 파악할 수 있다.
- API를 통해 프로그램이 자원의 상황을 확인할 수 있다.
- 제품이 사용하는 시스템 자원은 매우 작아야 한다.
- 1개 Core의 3%이내
- Memory 50MB 이내
- log남기는 기능 추가
- 시스템 자원 사용 정보
- 프로세스 모니터링 정보
- 과거기록출력 기능
- 기간 설정
- 노드별, 프로세스별 과거 기록
- 그래프
- 매뉴얼
모니터링 할 정보들
노드 정보
- 서버가 등록될 때 1회만 정보 업데이트
- 서버 정보가 변경되면 사용자가 강제로 업데이트 또는 자동 업데이트
- 모니터링 할 서버 등록/삭제/설정 변경
- CPU, Memory, Disk 등 하드웨어 자원 모니터링
- Network 자원 모니터링
서비스 정보
등록된 서비스가 노드에서 정상동작 하고 있는지 모니터링 함
- 서비스 등록/삭제/등록 정보 수정
- EnCluster-HA 서비스 상태 모니터링
- IDC내의 모든 EnCluster-HA모니터링
- CDNetworks경우 10 copy 이상의 EnCluster-HA 사용중
- HOME Plus는 전체 POS 시스템에 사용하는 모든 EnCluster-HA를 한 눈에 모니터링 하고 싶어 함
- IDC내의 모든 EnCluster-HA모니터링
- 타사 HA 솔루션 모니터링
- Clunix 제품(MCS, UTS 등) 모니터링
프로세스 정보
등록된 프로세스가 노드에서 동작하고 있는지 모니터링 함
- 프로세스 등록/삭제/등록 정보 수정
- PID, Owner, Name, CPU Usage, Memory Usage 등
SK C&C 요구사항
장애
장애 리스트
관리되는 시스템들에서 발생한 장애를 한 번에 확인 할 수 있어야 한다. 장애가 발생하면 장애 목록과 함께 장애에 대한 정보도 함께 보여주어야 한다.
장애 목록은 다음과 같다.
- 장애 등급 - 색깔로 장애 정도 표시
- 장애가 발생한 서버
- 장애 발생 시간
- 장애 복구 시간
- 장애 지속 시간
- 장애 코드
- 장애 발생 장치 또는 서비스
- 장애 상세 내용
시스템 장애
하드웨어 또는 운영체제에서 발생한 장애. 시스템에 접근 자체가 불가능한 경우가 대부분이다.
증상
관리 프로세스가 감지할 수 있는 장애 증상들이다. MON의 서버가 서버의 시스템 장애로 판단할 수 있는 증상들이다.
- 네트워크 접속 불가
- ping 안됨
관리되는 서버들에 설치된 MON slave가 멈추면 모니터링된 값이 전달되지 않는다. 이 경우는 다른 시스템 툴(ping 등)로 노드의 상태를 확인할 수 있다. ping이 된다면 MON Slave가 죽었거나 응답시간이 길어진 경우일 수 있으므로 다른 종류의 장애가 된다.
시스템 장애 목록
- 물리적인 하드웨어 고장 또는 케이블 단선
- 하드웨어(부품, 케이블 등) 접속 불량
- 운영체제 문제로 발생한 장애
- 네트워크 문제
서비스 장애
모니터링하도록 등록된 서비스의 장애
서비스 장애 목록
- 서비스 다운
- EnCluster-HA에 등록된 서비스의 장애 발생
장애등급
Log
Log의 종류
납품할 업체
경쟁사 제품
참고
- GridCenter MON Project on dP - dotProject에서 GridCenter MON의 개발진행 상황을 확인할 수 있다.