DA(Data Architecture) 도구/데이터 표준점검 도구

데이터 표준점검 도구_2.1.화면 구성, 2.2.표준 점검 기능

ProDA 2021. 6. 6.

이 글은 새로운 블로그로 옮겼습니다. 5초후 자동으로 이동합니다.

▶ 새로운 블로그 주소: https://prodskill.com/

▶ 새로운 글 주소: https://prodskill.com/data-standard-checker-2-ui-function-license/

목차

     

    2. 표준점검 기능과 표준사전 구성

    2.1. 표준점검 도구 화면 구성

    데이터 표준점검 도구는 엑셀VBA를 이용하여 개발하였고, 다음과 같은 화면 구성으로 되어 있다.

    데이터 표준점검 도구 화면 구성
    데이터 표준점검 도구 화면 구성

     

    각 영역에 대한 간단한 설명이다.

    1. 기능 & 옵션: 표준점검 옵션을 설정하고 실행
    2. 점검 대상 속성 목록: 표준점검 대상인 속성의 명칭, 데이터 유형, 길이 (입력)
    3. 점검 결과: 점검 대상 속성 각각에 대한 표준 논리명, 물리명, 데이터 유형, 길이, 종결어, 도메인, 추가 후보 단어 표시 (출력)
    4. 표준사전: 표준점검을 위한 기준 자료 (입력)

     

    다음 시트는 참고사항이다. (라이선스 내용은 꼭 읽어두기 바란다.)

    • Config: 표준사전을 데이터베이스로부터 갱신하기 위한 Connection, SQL 설정
    • #라이선스, History#: 이 도구의 저작자, 이메일, 블로그, 라이선스 고지 내용, 도구의 개발이력

     

    ※ 라이선스

    구분 내용
    저작자 이영민(Lee Young Min)
    이메일 leeyoungmin@gmail.com
    블로그 https://prodtool.tistory.com/
    Github https://github.com/DAToolset/ToolsForDataStandard
    라이선스 내용 기본적으로 github Repository에 명시된 BSD-2 라이선스를 따릅니다. 명시된 내용이 없는 경우 아래 내용에 따릅니다.
    -----------------------------------------------------------------------------
    1.
    저작권자 표기: 저작권자명, 이메일 주소, 블로그 주소, github repository 주소는 변경없이 그대로 사용해야 합니다. 소스코드를 변경하여 사용하는 경우 2차 저작자 관련 내용은 추가할 수 있습니다.

    2.
    보증 부인: 이 소스코드와 도구를 사용함으로 인해 어떠한 문제가 발생하더라도 저작권자에게 책임을 물을 수 없습니다
    -----------------------------------------------------------------------------
    위 조건을 만족한다면, 학습/활용 등 개인적인 용도, 회사에서 업무에 이 도구를 활용하거나 소스코드를 변경하여 상용 제품에 포함하는 용도 등 모든 용도에 허용됩니다.
    이 라이선스 내용은 제거할 수 없습니다.
    일러두기 2차 저작물의 소스코드를 공개하지 않아도 됩니다. 다만, 문제가 되지 않는다면 어떤 2차 저작물에 사용했는지 제게 알려주시면 좋겠네요. 이메일로 보내주시거나 블로그 댓글로 남겨 주시면 됩니다.
    도구의 기능상 오류 또는 개선요구사항, 가이드 문서의 오류 또는 개선 요구사항 등도 이메일 또는 블로그 댓글로 알려주시기 바랍니다.

     

     

    2.2. 표준 점검 기능과 옵션, 입력/출력 항목

    기능과 옵션, 입력/출력항목에 대해 상세히 알아보자.

    데이터 표준점검 도구 기능&옵션
    데이터 표준점검 도구 기능&옵션

     

     

    2.2.1. 표준 점검 기능

    다음과 같은 점검 기능을 제공한다.

    • 표준 점검: 표준단어사전, 표준용어사전, 표준도메인사전을 기준으로 하여 목록의 표준점검 대상 속성명과 데이터타입/길이의 표준점검을 실행
    • 선택속성 Only
      • 표준 점검 대상을 선택하는 옵션 (체크한 경우: 선택한 속성만 표준 점검 실행, 체크하지 않은 경우: 전체 속성 표준 점검 실행)
      • 체크하지 않은 경우라도 Shift 키를 누른 채로 “표준 점검” 버튼을 클릭하면 체크한 경우와 동일하게 동작함
    • Clear: 표준 점검결과 내용을 지움
    • 표준사전 새로고침
      • 표준사전 Repository로부터 단어/용어/도메인 사전을 내려받아 새로 고침
      • 표준 점검 실행시 “표준사전 새로고침” 체크 박스를 선택해도 되나, 표준 점검을 실행하지 않고 표준 사전만 새로 고칠때 사용
      • 표준사전을 새로고침할 때 이전 사전은 “_Bak” sheet로 백업되고, 새로운 표준사전의 기준일시와 백업사전의 기준일시가 우측상단에 표시됨
    • Config: 표준사전 Repository 접속을 위한 Connection String과 표준단어/용어/도메인 목록을 얻기 위한 SQL 설정을 위한 “Config” sheet로 이동
    • About…: 도구에 대한 설명과 라이선스 내용 표시
    • 단어사전에 추가: 추가후보 단어를 단어사전 목록에 추가

     

     

    2.2.2. 표준 점검 옵션

    다음과 같은 옵션으로 기능을 제어할 수 있다.

    • 단어조합방향: 속성명의 단어 구성을 찾는 방향 설정 (기본 설정: 좌->우, 우->좌 모두 체크)
      • 좌 -> 우
        • 속성명의 단어 구성을 좌에서 우로 찾음
      • 우 -> 좌
        • 속성명의 단어 구성을 우에서 좌로 찾음
        • 속성분류어(도메인 지정에 사용)를 먼저 찾으므로 좀 더 정확도가 높음
      • 참고사항
        • 조합방향은 기본적으로 둘 다 선택하기를 권장하고, 하나만 선택한다면 “우->좌”를 권장함
        • 한 방향에서도 조합되는 여러가지 경우의 수가 있으나, 매칭되는 가장 긴 단어를 선택하여 논리명/물리명 조합결과를 구성함
        • “좌->우”, “우->좌”를 모두 선택하여 표준 점검을 실행하면 단어의 조합이 서로 다른 경우가 발생할 수 있고, 이 경우의 결과는 cell의 배경색이 주황색으로 자동 설정(조건부 서식 사용)되어 식별할 수 있음
    • 표준사전찾기: 어떤 표준사전으로 단어를 조합할지 설정 (기본 설정: 단어&용어)
      • 단어 & 용어: 표준용어사전에서 일치하는 표준용어가 있는지 먼저 찾고, 있으면 해당 표준용어를 사용하고, 없으면 표준단어로 조합
      • 단어: 표준단어로만 조합 (표준용어가 있더라도 단어로만 조합됨)
      • 용어: 표준용어사전에서 일치하는 표준용어가 있는지만 찾음
    • 표준사전 새로고침: 표준점검시 표준단어/표준용어/표준도메인을 표준 Repository로부터 새로 갱신할지 설정
    • 표준단어 논리명 중복 (동음이의어) 허용
      • 동음이의어 즉, 표준단어의 논리명에 중복을 허용하는 경우 선택하고, 동음이의어를 허용하지 않는 경우 선택 해제
      • 선택 해제하고 실행시, 동음이의어가 있는 경우 해당 중복 내역을 보여주고 실행 중단함
    • 표준단어 물리명 중복 (이음동의어)허용
      • 이음동의어 즉, 표준단어의 물리명에 중복을 허용하는 경우 선택하고, 이음동의어를 허용하지 않는 경우 선택 해제
      • 선택 해제하고 실행시, 이음동의어가 있는 경우 해당 중복 내역을 보여주고 실행 중단함
      • 이음동의어는 표준단어 사전에 등록하지 않는 것이 표준품질 측면에서 좋으나, 어쩔 수 없는 경우에만 제한적으로 사용
    • 물리명 최대길이
      • 설정된 물리명의 최대길이를 초과하는 경우 조건부 서식으로 색상변경(붉은색 배경)
      • 표시 컬럼: 물리명 Length(M열)

     

     

    2.2.3. 표준 점검 입력 항목

    다음으로 입력항목과 출력(점검결과)항목에 대해 살펴보자.

    데이터 표준점검 도구 입력 항목, 점검결과 항목
    데이터 표준점검 도구 입력 항목, 점검결과 항목

     

    •  속성명
      • 표준점검 대상 속성명
      • 속성명은 띄어쓰기를 하지 않는 것이 기본이나, 띄어쓰기가 되어 있는 경우 띄어쓰기 단위로 하나의 단어로 인지하여 점검함
      • 예시: 국가코드
    • Data Type/Len
      • 속성에 지정하고자 하는 데이터 Type/Size
      • 입력하지 않은 경우(값이 비어있으면) 점검하지 않음
      • 예시: VARCHAR2(20)

     

     

     

    2.2.4. 표준 점검 출력(점검결과) 항목

    출력(점검결과) 항목은 다음과 같다.

    • 표준단어 논리명 조합
      • 속성명을 구성하는 표준단어의 논리명을 구분자 ‘_’로 조합한 결과
      • 단어조합방향 좌->우, 우->좌에 따라 다른 결과과 나오는 경우 2개 모두 표시됨
      • 예시: 국가_코드
    • 표준단어 물리명 조합
      • 속성명을 구성하는 표준단어의 물리명을 구분자 ‘_’로 조합한 결과
      • 단어조합방향 좌->우, 우->좌에 따라 다른 결과과 나오는 경우 2개 모두 표시됨
      • 예시: CNTRY_CD
    • 속성명 점검결과
      • 단어기준: 표준단어 조합, 표준단어 조합(사용자 지정), 표준단어 없음, 표준단어 없음(사용자 지정)
        (여기에서 ‘사용자 지정’은 속성명에 띄어쓰기가 되어 있어 단어 조합을 사용자가 의도하여 지정한 경우라는 의미임)
      • 용어기준: 표준용어 일치, 표준용어 없음
      • 예시: 표준용어 일치
    • 표준용어 Type/Size
      • 속성명 점검결과가 ‘표준용어 일치’인 경우 해당 표준용어의 데이터 Type/Size
      • 예시: VARCHAR2(20)
    • 속성명 종결어
      • 속성명의 마지막 단어(대부분 도메인에 사용되는 속성 분류어)
      • 예시: 코드
    • 속성명 종결어 점검결과
      • 분류단어:  종결어가 분류단어인 경우
      • 기본단어:  종결어가 기본단어인 경우 --> 종결어를 다른 분류단어로 변경하거나 해당 종결단어를 분류단어로 변경 처리 필요
      • 단어 없음: 종결어가 표준단어사전에 없는 경우 --> 해당 종결어를 표준사전에 등록 필요
      • 예시: 분류단어
    • 도메인, Data Type 점검결과
      • 입력한 속성명의 데이터 Type/Size가 표준용어와 일치하는지 또는 단어 종결어가 속성 분류어인 경우 도메인 분류로 연결되어 있는 도메인 목록중에 존재하는지, Type과 Size가 일치하는지 점검한 결과
      • 예시: 도메인 Type/Size 일치
    • 추가 후보 단어
      • 속성명을 구성하는 단어중 표준단어사전에 없는 단어
      • 표준 단어로 필요 없는 경우도 있으므로 확인 후 표준 단어로 등록

     

    2.2.5. 표준사전 Repository 설정

    표준사전 Repository 관련 설정은 다음과 같다.

    표준사전 Repository 설정
    표준사전 Repository 설정

     

    • Connection String
      • 표준사전 Repository 접속을 위한 문자열
      • “Make Connection String” 버튼을 클릭하여 생성
      • 버튼 클릭시 오류가 발생하는 경우는 Connection String 내용을 지우고 다시 클릭하여 실행
    • 표준단어사전 Query: 표준단어사전 목록을 가져오는 SQL
    • 표준용어사전 Query: 표준용어사전 목록을 가져오는 SQL
    • 표준도메인사전 Query: 표준도메인사전 목록을 가져오는 SQL

     

    Config 관련 참고사항이다.

    • 표준관리 시스템(메타데이터 관리 시스템)의 종류와 관계없이 DB접속과 SQL로 목록을 얻을 수 있다면 사용 가능하다.
    • 엑셀파일을 공유하여 표준사전으로 사용하는 경우라면 Provider를 "Microsoft.Jet.OLEDB.4.0"으로 선택하여 사용할 수 있다.  (권장하지 않음) 다만, "Microsoft.Jet.OLEDB.4.0"는 64bit provider를 제공하지 않아 32bit Excel에서만 사용할 수 있다.
    • “Make Connection String” 버튼 클릭시 오류(아래 참조)가 발생하는 경우 Connection String 값(위 이미지에서 B3셀)을 지우고 다시 시도하면 된다. (오류 메시지: IDataInitialize에서 초기화 문자열을 검색할 수 없습니다. 클래스가 등록되지 않았습니다.)

    ”Make Connection String” 버튼 클릭시 발생할 수 있는 오류
    ”Make Connection String” 버튼 클릭시 발생할 수 있는 오류

     


    여기까지 기능에 대해 살펴보았고, 다음 글에서는 표준단어/도메인/용어 사전의 구성에 대해 살펴본다.

    댓글

    💲 추천 글