[파워비아이] 데이터 모델링
데이터모델링의 정의 3가지
데이터 가져오기의 전처리가 완료되면 데이터를 모델링해서 사용합니다. Power BI Desktop 에서 테이블 간의 관계를 설정하여 시각적으로 분석할 수 있는 구조를 마련하는 중요한 과정입니다. 계산 열, 측정 값, 데이터 분류 등의 작업이 데이터 모델링 (Data modeling)에 속합니다.
그럼 시작에 앞서 데이터 모델링에 관한 정의 3가지에 대해 알아보겠습니다.
1.개념적 데이터 모델링
이 단계에서는 비즈니스 요구사항을 분석하여 고수준에서 데이터 구조를 정의합니다. 여기에는 엔터티(예: 고객, 직원, 제품)와 이들 간의 관계가 포함됩니다. 이 모델은 비즈니스 이해 관계자와 데이터 전문가가 함께 협업하여 설계합니다.
2.논리적 데이터 모델링
논리적 모델링 단계에서는 개념적 모델을 기반으로 각 엔터티의 속성(예: 고객 이름, 주소, 연락처)과 이들 속성 간의 상세한 관계를 정의합니다. 이 과정은 데이터 구조를 더욱 세분화하여 데이터베이스 구현에 적합하게 만듭니다.
3.물리적 데이터 모델링
물리적 모델링은 논리적 모델을 실제 데이터베이스 시스템에서 구현할 수 있도록 변환하는 과정입니다. 이 단계에서는 특정 데이터베이스의 기술적 요구사항을 반영하고, 성능 최적화와 같은 요소를 고려하여 모델을 조정합니다.
데이터 모델링 핵심 3가지
데이터모델링의 첫단계는 다양한 데이터를 하나로 연결하는 것 입니다. Power BI에서는 이를 '관계'를 사용하여 테이블 간의 연결을 정의합니다. 이 관계는 주로 테이블 간의 공통 필드 (예 : 사용자 ID, 상품 코드, 판매 코드)를 기반으로 설정합니다.
1. 관계 종류의 이해
Power BI에서 데이터 모델을 생성시 다대일 (Many to one), 일대다 (One to Many), 일대일 (One to One) 관계 등을 정의 할 수 있습니다. 이러한 관계는 데이터를 효과적으로 분석하고, 보고서에서 정확한 계산을 보장하는데 중요합니다.
그람 카디널리티(관계 종류)에 대해 알아보겠습니다.
- 다대일, 일대다 : 기장 일반적인 관계 형식으로 한 테이블의 열을 중복되는 값(레코드)를 가질 수 있고, 다른 관련 테이블은 하나의 값만 가질 수 있습니다.
- 일대일 : 두 테이블의 열에는 중복없이 하나의 값만 가질 수 있습니다.
- 다대다 : 두 테이블의 열이 중복된 값을 가질 수 있으며 복합 모델을 사용하여 테이블 간에 다대 관계를 설정할 수 있습니다.
2.DAX (Data Analysis Expressions)함수 사용
데이터 모델링에서는 DAX 수식을 사용하여 계산 열이나 측정값을 생성합니다. 이 수식들은 데이터에 대한 복잡한 계산을 가능하게 하여, 분석의 깊이의 정확도를 높일 수 있습니다.
즉, 로드된 데이터 모델에 DAX 구문을 이용해 수식을 작성할 수 있습니다. 수식 또는 식에서 하나 이상의 값을 계산하고 반환하는데 사용할 수 있는 함수, 연산자 및 상수 컬렉션입니다. 파워피벗이나 Analysis Services 테이블 형식 모델 등의 다른 Microsoft BI 도구에서 사용하는 수식으로 Power BI Desktop에서는 계산열과 측정값으로 수식을 작성 할 수있습니다.
DAX 함수에 관해서는 다음 시간에 보다 상세하게 포스팅을 하도록 하겠습니다.
3. 성능 최적화
데이터 모델을 구축 할 때는 성능 최적화를 고려해야 합니다. 잊는 적절한 인덱싱, 데이터 앞축, 데이터 형식 선택 등을 통해 이루어집니다. 효율적인 데이터 모델링은 응답시간을 단축하고 사용자 환경 경험을 개선해야 합니다.
데이터 모델링 이점
데이터 모델링은 비즈니스와 IT 팀 간의 효과적인 협업을 촉진하고 데이터 무결성을 보장합니다.
이를 통해 데이터 중복을 줄이고, 데이터 관리 비용을 절감할 수 있습니다. 그리고 데이터 검색 및 분석 속도를 향상시켜 의사 결정 과정을 지원합니다. 이를 통해 비즈니스 프로세스를 개선할 기회를 제공합니다.
데이터 모델링은 비즈니스 요구에 맞춘 효율적인 데이터 사용 방법을 명확하게 하여 전반적인 성과를 향상시키는 데 중요한 역할을 합니다.