본문 바로가기
Data Visualization/PowerBI

[PowerBI] 1일차 - Data Load, Power Query

by 베짱이28호 2024. 12. 30.

[PowerBI] 1일차

 

Superset SQL Lab 사용하면서 SQL 연습도 하고 대시보드 자유도가 낮긴 하지만 차트 생성도 쉬워서 사용했었는데, Tableau나 PowerBI처럼 제출 가능한 링크를 요구하는 곳도 있어서 배포 불편한 Superset 대신 PowerBI 강의 수강 시작.

 

대시보드를 만들 수 있지만, 외부에서 데이터를 정리하는 방식으로만 진행했기 때문에 데이터 변형이 필요한 경우에 항상PowerBI 외부에서 데이터를 편집했다. 내부 툴에 대해서 부족한거 같아서 수료증도 받을 겸 시작.

 

【한글자막】 15일 완성 코스 - Power BI 완벽 부트캠프 | Udemy

이 아저씨 딕션도 마음에 들고 수강 시간도 적당해서 선택.


1. Data Load

  1. 데이터 가져오기
    • data source 가져오기.
    • text/csv / database 등 데이터 연결이 가능하다.
    • 가져온 데이터는 불러올 때 power query에서 수정이 가능하다.
    • 설정에서 데이터를 불러올 때, 자동으로 헤더 찾고 테이블 매핑시켜주는 옵션이 있다. DB 사용하고 구조가 잘 짜여있으면 사용하는게 좋다.
  2. 데이터 변환
    • power query로 데이터 수정이 가능하다.

2. Power Query

 

  1. 행 제거
    • 결측치가 포함된 행, 에러가 발생한 행, 중복 행 제거 등 가능함.
    • 전체 row에 적용할 수 있고, 특정 columns에서 조건을 만족하는 것도 제거 가능함.
  2. 머리글 사용
    • csv나 xlxs에서 가져올 때, SQL처럼 데이터가 깔끔한 table식으로 나오지 않는 경우가 많기 때문에, 헤더 위의 행들을 제거하고 헤더를 설정한다.
  3. 값 채우기
    • error, NULL 데이터 등을 채울 수 있다.
  4. 컬럼 속성 변경
    • 컬럼 데이터 타입을 변경하거나, 이름 변경 등 작업 진행.
    • Data type이 맞지 않으면, 차트 생성 시 집계함수 사용 시 집계를 제대로 하지 못하는 문제가 발생한다.
  5. Power Query
    • 쿼리를 작동한 기록들을 남겨준다.
    • 특정 단계에서 진행한 쿼리를 수정가능하고, 이전 작업시점으로 돌아갈 수 있다.
    • 자동화에 사용

댓글