DA(Data Architecture) 도구/데이터 표준점검 도구

데이터 표준점검 도구_2.3.표준사전 구성

ProDA 2021. 6. 13.

이 글은 새로운 블로그로 옮겼습니다. 5초후 자동으로 이동합니다.

▶ 새로운 블로그 주소: https://prodskill.com/

▶ 새로운 글 주소: https://prodskill.com/data-standard-checker-3-standard-dictionary/

목차

     


    이전 글에서 이어지는 내용이다.

    2021.06.06 - [엑셀&VBA/Tools] - 데이터 표준점검 도구_2.1.화면 구성, 2.2.표준 점검 기능

     

    데이터 표준점검 도구_2.1.화면 구성, 2.2.표준 점검 기능

    목차 2. 표준점검 기능과 표준사전 구성 2.1. 표준점검 도구 화면 구성 데이터 표준점검 도구는 엑셀VBA를 이용하여 개발하였고, 다음과 같은 화면 구성으로 되어 있다. 각 영역에 대한 간단한

    prodtool.tistory.com


     

    2.3. 표준사전 구성

    표준사전은 표준점검의 입력이며 기준이다. 표준사전은 표준단어, 표준용어, 표준도메인 세가지로 구성한다. 표준사전의 각 구성요소와 연관관계에 대해 살펴본다.

     

    2.3.1. 표준사전 구성 개요

    표준단어, 용어, 도메인 사전은 아래의 항목으로 구성된다. 컬럼제목이 노란색 바탕인 항목은 필수 입력, 회색 바탕은 선택 입력, 적색 바탕은 조건적 필수 입력, 녹색 바탕은 수식에 의해 자동으로 계산되고, 일부(길이, 중복CHK 등)는 조건부서식에 의해 배경색이 설정된다.

    그림1. 표준사전 구성 개요
    그림1. 표준사전 구성 개요

     

    여기에서 다음 사항이 핵심이다.

     

    ▼ 표준단어사전과 표준도메인사전 관계

    • 표준단어사전의 도메인 분류명은 표준도메인사전의 도메인 분류명에 연결된다. 속성 분류어 여부가 "Y"인 표준단어만 해당된다.
    • 위 이미지에서 예를 들면, 단어 "금액"은 속성 분류어 "Y"이고, 도메인 분류명이 "금액"이며, 연결된 표준도메인사전에 사용가능한 도메인은 3개(금액14_2, 금액20_5, 금액22_4)이다.

     

    ▼ 표준용어사전과 표준도메인사전 관계

    • 표준용어사전의 도메인 논리명은 표준도메인사전의 도메인 논리명에 연결된다.
    • 모든 표준용어는 반드시 도메인논리명을 지정해야 하고, 그 도메인논리명은 표준도메인사전에 정의되어 있어야 한다.

     

     

    2.3.2. 표준단어사전 구성 사례와 항목 설명

    표준단어사전은 다음과 같이 구성한다.

    그림2. 표준단어사전 구성 사례
    그림2. 표준단어사전 구성 사례

     

    각 항목에 대한 설명은 다음과 같다.

    그림3. 표준단어사전 구성 항목 설명
    그림3. 표준단어사전 구성 항목 설명

     

    • 단어 논리명: 표준용어 논리명의 구성요소로 사용될 수 있는 단위
    • 단어물리명: 단어영문명(Full name)에 대한 약어. 속성명(논리명)에 대한 컬럼명(물리명)을 생성시 사용된다
    • 단어영문명: 단어논리명의 의미에 해당하는 영문명 Full name
    • 단어설명: 단어논리명에 대한 의미. 사전적 의미보다는 해당 업무에서 사용되는 의미를 기술.
    • 표준여부: 표준단어는 ‘Y’, 비표준단어는 ‘N’ (비표준단어는 이음동의어를 관리할 경우 사용)
    • 속성분류어 여부: 아래 두가지 중 하나 (비어 있거나 Y가 아니면 N으로 간주함)
      • N=기본단어: 표준용어논리명의 구성단위로 사용할 수 있으나 분류단어로는 사용할 수 없음.
      • Y=분류단어: 표준용어논리명의 구성단위와 분류단어로 사용할 수 있음. 도메인 분류명을 반드시 지정해야 함.
    • 표준논리명: 표준여부가 ‘N’일 경우 필수. 비표준단어의 표준논리명을 지정 (비표준단어에 대한 표준점검시 연결된 표준단어로 대체됨)
    • 동의어: 해당 단어와 관련된 동의어의 목록 (참조 정보)
    • 도메인분류명: 속성 분류어 여부가 ‘Y’인 경우 필수. 속성분류단어인 경우, 해당 분류단어가 어떤 도메인분류명과 연결되는지 지정. 속성분류어가 아닌 경우는 비워두면 됨.
    • 단어논리명(원본): 원천 단어 논리명을 정제 또는 통합하는 등 변경이 있었을 경우 해당 단어의 원본 명칭 (참조정보)
    • 출처: 해당 단어를 수집한 시스템명, 자료 파일명, 테이블명, 컬럼명 등 출처를 확인할 수 있는 정보 기술 (참조정보)
    • 메모: 정제, 표준화 또는 삭제 검토 등에 필요한 메모 기술 (참조정보)
    • 물리명 길이: 단어물리명의 길이를 나타내며, “단어 물리명 최대길이” 를 초과하는 경우 cell의 배경색이 붉은색으로 설정됨. (조건부서식으로 자동 설정됨)
    • 논리명 중복CHK: 단어논리명의 중복여부를 확인하기 위하여 단어논리명의 개수를 표현함. 2 이상일 경우, 즉 중복되는 경우 해당 cell의 배경색이 붉은색으로 설정됨. (조건부서식으로 자동 설정됨)
    • 물리명 중복CHK: 단어물리명의 중복여부를 확인하기 위하여 단어물리명의 개수를 표현함. 2 이상일 경우, 즉 중복되는 경우 해당 cell의 배경색이 붉은색으로 설정됨. (조건부서식으로 자동 설정됨)
    • 단어 물리명 최대길이: 단어물리명의 최대길이를 설정하여 해당 값을 초과하는 물리명길이 cell의 배경색을 설정하는 조건부서식의 비교 기준값으로 사용됨. 지정한 길이를 초과하는 <물리명 길이> 컬럼에 붉은 배경색이 설정됨

     

    2.3.3. 표준용어사전 구성 사례와 항목 설명

    표준용어사전은 다음과 같이 구성한다.

    그림4. 표준용어사전 구성 사례
    그림4. 표준용어사전 구성 사례

     

    각 항목에 대한 설명은 다음과 같다.

    그림5. 표준용어사전 구성 항목 설명
    그림5. 표준용어사전 구성 항목 설명

     

    • 용어논리명: 표준단어로 구성되어 속성논리명으로 사용할 수 있는 단위
    • 단어논리명조합: 용어논리명을 구성하는 표준단어 논리명 조합(단어 논리명을 underscore(_) 문자로 연결)
    • 용어물리명: 용어논리명을 구성하는 표준단어 물리명(약어)의 조합 (단어 물리명을 underscore(_) 문자로 연결)
    • 용어설명: 용어논리명에 대한 의미. 사전적 의미보다는 해당 업무에서 사용되는 의미를 기술하되, 용어논리명 자체가 의미를 구체적으로 설명할 수 있는 경우에는 용어논리명으로 적어도 무방함
    • 도메인 논리명: 용어에 지정된 도메인의 논리명
    • 데이터타입명: 용어에 지정된 도메인의 데이터타입명 (예: NUMBER, VARCHAR2 등). 논리 데이터타입으로 사용할 수도 있으나 현재는 물리 데이터타입을 권장함.
    • 길이: 용어에 지정된 도메인의 데이터 길이. 문자열 타입인 경우 Length, 숫자 타입인경우 Precision, BLOB/DATE 등 길이 지정이 필요없는 경우 0
    • 정도: 용어에 지정된 도메인의 데이터 정도. 숫자 타입인 경우에만 의미가 있고, 다른 타입은 0을 기술.
    • 정의업무: 용어를 최초 등록할 때 해당 용어를 사용하는 업무명 (용어의 출처 업무 확인용)
    • TypeSize: 데이터타입명, 길이, 정도를 하나로 concatenate한 값
    • 물리명 길이: 용어물리명의 길이를 나타냄
    • _개수: 용어물리명에 포함된 underscore(_)의 개수 (단어 개수보다 1 적음)
    • 단어 개수: 용어물리명을 구성하는 단어의 개수. 너무 많은 단어(예: 6개 이상 등)로 구성되는 경우를 확인할 때 사용함
    • 논리명 중복CHK: 용어논리명의 중복여부를 확인하기 위하여 용어논리명의 개수를 표현함. 2 이상일 경우, 즉 중복되는 경우 해당 cell의 배경색이 붉은색으로 설정됨. (조건부서식으로 자동 설정됨)
    • 물리명 중복CHK: 용어물리명의 중복여부를 확인하기 위하여 용어물리명의 개수를 표현함. 2 이상일 경우, 즉 중복되는 경우 해당 cell의 배경색이 붉은색으로 설정됨. (조건부서식으로 자동 설정됨)

     

    2.3.4. 표준도메인사전 구성 사례와 항목 설명

    표준도메인사전은 다음과 같이 구성한다.

    그림6. 표준용어사전 구성 사례
    그림6. 표준용어사전 구성 사례

     

    각 항목에 대한 설명은 다음과 같다.

    그림7. 표준도메인사전 구성 항목 설명
    그림7. 표준도메인사전 구성 항목 설명

     

    • 도메인분류명: 개별 도메인을 그룹핑한 분류의 명침. 속성의 분류단어에 지정되어 연결됨.
    • 도메인논리명: 도메인의 논리명. 직접적으로 사용되는 명칭은 아니나 유의미하고 중복되지 않게 정의.
    • 도메인물리명: 도메인의 물리명. 직접적으로 사용되는 명칭은 아니나 유의미하고 중복되지 않게 정의.
    • 도메인설명: 도메인의 특이사항등에 대한 설명
    • 데이터타입명: 도메인의 데이터타입명 (예: NUMBER, VARCHAR2 등). 논리 데이터타입으로 사용할 수도 있으나 현재는 물리 데이터타입을 권장함.
    • 길이: 도메인의 데이터 길이. 문자열 타입인 경우 Length, 숫자 타입인경우 Precision, BLOB/DATE 등 길이 지정이 필요없는 경우 0
    • 정도: 도메인의 데이터 정도. 숫자 타입인 경우에만 의미가 있고, 다른 타입은 0을 기술.
    • TypeSize: 데이터타입명, 길이, 정도를 하나로 concatenate한 값

     

     

    2.3.5. 참고: 표준사전 sheet의 조건부 서식 설정

    각 sheet의 각 cell 배경색, 글꼴색은 조건부 서식을 이용하여 설정한다. (표준도메인사전 제외) 색상 설정을 변경하려는 경우 조건부 서식에서 규칙, 서식, 적용 대상을 변경하여 적용한다.

     

    속성 표준점검 sheet에서는 점검결과에 따라 글꼴색이나 배경색을 자동으로 설정하기 위하여 조건부 서식을 사용한다. 주황색이나 붉은색 계열은 보완작업을 해야할 대상, 푸른색 계열은 참조정보를 의미한다.

    그림8. 속성 표준점검 sheet의 조건부 서식
    그림8. 속성 표준점검 sheet의 조건부 서식

     

    표준단어사전 shee에서는 물리명길이가 지정한 최대길이를 초과하거나 단어의 논리명 중복인 경우 배경색을 설정하기 위하여 조건부 서식을 사용한다.

    그림9. 표준단어사전 sheet의 조건부 서식
    그림9. 표준단어사전 sheet의 조건부 서식

     

    표준용어사전 sheet에서는 용어의 단어조합 개수가 5개를 초과하거나 용어의 논리명 중복인 경우 배경색을 설정하기 위하여 조건부 서식을 사용한다.

    그림10. 표준용어사전 sheet의 조건부 서식
    그림10. 표준용어사전 sheet의 조건부 서식

     

     


    여기까지 표준점검 도구의 기능과 표준사전의 구성에 대하여 알아보았다. 다음에는 표준점검결과 예시를 살펴보겠다.

    댓글

    💲 추천 글