데이터 모델링
- 현실세계의 업무와 사용자 요구사항을 데이터 실체로 도식화하는 작업
- 데이터 모델링 작업의 결과 = 데이터 모델
- 목적
1. 정해진 절차와 용어로 데이터 모델을 작성해서 표준화된 의사소통 도구로 활용하기 위함
2. 데이터 중심으로 분석해서 데이터 흐름을 제어하고 데이터 기반의 효율적인 시스템을 구축하기 위함이며 ERD로 표현
데이터 모델링 방법

데이터 모델링 효과
1. 데이터 구조의 정확한 표현
2. 데이터 간의 정합성 확보
3. 동일한 유형의 데이터를 통합 관리
4. 중복 데이터의 공유화
5. 조직 전체 시각의 데이터 구조 도출



데이터 모델링 기법
1. 주제영역
2. 엔티티타입
3. 관계
4. 속성
5. 식별자
6. 서브타입

엔티티 타입
- 업무에서 관리하고자 하는 데이터의 한 형태
- 사람, 사물, 장소, 사건, 개념 등
- 업무 프로세스와 대응
- 데이터베이스에서 테이블로 구현
- 공통적인 정의(속성)를 가지는 모든 엔티티의 집합
속성
- 정보를 구성하는 최소 단위의 데이터
- 엔티티 타입의 특징을 표현
- 데이터베이스에서 컬럼으로 구현

엔티티
- 기업에서 관리하는 실제 데이터의 건
- 엔티티타입의 개별 발생건

- 예시

관계
- 엔티티타입 간에 관련이 생기게 되는 업무적 이유
- 데이터의 양방향 업무 규칙을 표현
- 관계를 통하여 정보로서의 활용 가치 상승
- 외부키로 구현되어 참조무결성으로 데이터의 정합성 유지
페어링과 관계
- 두개의 엔티티 간에 맺어지는 관계
- 관계의 개별 발생 건 (instance)
카디낼리티(cardinality)
- 하나의 엔티티가 가질 수 있는 페어링의 수

선택성
- 페어링의 존재 여부

식별자
- 엔티티타입의 각 엔티티를 유일하게 식별해주는 구분자
- 속성, 관계 또는 이들의 조합으로 구성
- 유일성 보장을 위한 최소한의 속성 또는 관계로 구성
- 테이블의 유티브인덱스로 구현 (primary key), 다수의 식별자가 가능하나 pk는 하나만 가능
외부키
- 관계의 물리적인 구현
- 상위 엔티티타입의 식별자가 하위 엔티티타입의 속성으로 구현
- 상위/하위 엔티티타입: 관계에 의한 엔티티타입의 계층 참조
- 엔티티관계 모델을 구현 시 분석도구가 자동으로 생성
관계형식별자
- 외부키가 식별자의 구성요소로 정의
- 엔티티타입의 계층적 구조 표현
- 연속적인 키의 상속에 주의
- 카디낼리티는 1, 선택성은 필수
데이터 모델의 활용
1. 개념 모델링
2. 논리 모델링
3. 물리 모델링




데이터 아키텍처의 필요성

조직 전체의 데이터 아키텍처를 통한 데이터 관리

데이터 아키텍처의 역할

데이터 관리에 대한 접근 방향

데이터 아키텍처의 적용 효과

데이터 품질 진단
- 준수되어야 하는 데이터 값의 유효성, 정확성, 표준적용여부 등이 도메인 속성에 위배되어 잠재적으로 업무에 영향을 줄 수 있는 오류 데이터를 파악하기 위한 분석 기법
1. 도메인 진단: 컬럼의 고유한 특성을 진단
2. 업무규칙 진단: 업무요건 및 법령 진단
3. 참조무결성 진단: 자식/부모 테이블간 관계의 정합성을 진단
데이터 품질 점검 기준 선정 방법

유효성 진단(도메인 규칙) 품질점검 기준
1. 날짜 도메인
2. 번호 도메인
3. 여부 도메인
4. 코드 도메인
5. 금액 도메인
6. 수량 도메인
7. 율 도메인

정합성진단(업무규칙, 참조) 품질점검 기준
1. 시간순서 일관성
2. 선후관계 정확성
3. 컬럼 간 논리관계 일관성
4. 계산 및 집계 정확성
5. 참조 무결성

완결성진단 품질점검 기준
1. 글자 깨짐
2. 공백, 특수문자
3. 필수값
4. 중복 데이터

날짜 도메인

번호 도메인

여부 도메인

금액/수량/율 도메인

코드 도메인

명, 내용 도메인

참조 무결성

시간순서 일관성/선후관계

계산 및 집계 정확성

품질진단 기준설정 예시


데이터 품질진단 절차 기본
1. 진단대상 DB 선정
2. 품질진단 환경 준비
3. 품질진단수행
4. 오류원인 분석 및 개선
5. 개선항목진단 및 결과 확정





데이터 품질진단 절차 상세












- 업무규칙: 조직이 목표를 수행하는데 적용할 수 있는 운영/정의/제약사항의 기술 규칙에 대한 일반적인 표현





















오류사례 및 개선 방안


























'공공 데이터 교육' 카테고리의 다른 글
공공 데이터 15일 (0) | 2021.07.03 |
---|---|
공공 데이터 14일 (0) | 2021.07.03 |
공공 데이터 12일 (0) | 2021.07.02 |
공공 데이터 11일 (0) | 2021.07.01 |
공공 데이터 10일 (0) | 2021.07.01 |