빅데이터 시각화

기타정보

빅데이터 시각화

쿠카곰돌이 2020. 1. 21. 23:58

토픽 이름	빅데이터 시각화
분류	데이터베이스 > Big Data > 빅데이터 시각화
키워드(암기)	(리드문) 빅데이터의 Visual 스토리텔링
키워드(암기)	시각화 방법) 시간(막대 그래프), 분포(트리맵), 관계(히스토그램, 스캐터 플롯), 비교(히트맵), 공간(지도매핑)
암기법

기출문제

번호	문제	회차
1	2. 빅데이터 분석을 위해서는 데이터 공학, 수학, 통계학, 컴퓨터 공학, 시각화, 업종 지식 등 종합한 학문이 필요하다. 다음에 대하여 설명하시오.가. 데이터사이언스의 영역, 요구역량(Soft Skill / Hard Skill)나. 데이터사이언스 발전 방안	119_관리_3
2	빅 데이터(Big Data)의 주요 요소 기술인 수집, 공유, 저장·관리, 처리, 분석 및 지식 시각화에 대하여 설명하시오.	102_컴시응_4
3	2. 범정부 데이터 플랫폼 개념을 설명하고 공공데이터를 시각화한 국가데이터맵에 서비스에 대해 설명하시오.	합숙_2019.08_공통_Day-5
4	1. 빅데이터 시각화(Bigdata Visualization)에 대하여 설명하시오.	합숙_2019.01_공통_Day-2
5	7. 빅데이터 분석방법 중 데이터 시각화(Data Visualization)에 대해 설명하시오.	합숙_2017.01_공통_Day-2
6	빅데이터를 시각화는 정보구조화, 정보시각화, 정보시각 표현의 3단계로 이루어진다. 다음질문에 대하여 설명하시오.가. DIKW 피라미드(Data Information Knowledge Wisdom Pyramid)나. 정보구조화의 절차다. 정보시각화의 유형	합숙_2016.01_응용_Day-1
7	1. 데이터탐색 및 분석기반 비즈니스 인사이트 도출기술인 빅데이터 시각화에 대해 다음을 설명하시오가. 시각화 인사이트 프로세스나. 빅데이터 시각화 프로세스 및 정보시각화 유형	모의_2019.06_공통_3
8	의료분야에서는 개인 유전자 정보(DNA) 분석 및 전염병 연구를 위해서 빅데이터 분석을 위한 플랫폼을 구축하고 있다. 빅데이터 플랫폼의 주요기술을 데이터 수집, 저장, 분석, 실시간 처리, 시각화 측면에서 설명하시오.	모의_2015.12_관리_3교시
9	빅데이터 플랫폼의 주요 기술을 데이터 수집, 저장, 분석, 실시간 처리, 시각화 측면에서 설명하시오.	모의_2015.05_관리_4교시
10	다음의 데이터 시각화 분석 방법을 예를 들어 설명하시오.가. 비교와 비율 분석나. 동향과 패턴 분석다. 관계와 연관 분석	모의_2015.05_응용_2교시
11	빅데이터 플랫폼의 주요 기술을 데이터 수집, 저장, 분석, 실시간 처리, 시각화 측면에서 설명하시오.	모의_2015.05_응용_4교시
12	빅데이터 분석을 위한 데이터 시각화(Data Visualization)에 대해서 설명하시오.	모의_2012.07_관리_1교시

I. Big Data의 Visual 스토리 텔링, Big Data의 시각화의 개요

가. 빅데이터 시각화(Big Data Visualization)의 정의

빅데이터의 분석 결과를 쉽게 이해할수 있도록 시간, 분포, 관계, 비교, 공간의 관점에서 시각적으로 표현하여

전달하는 빅데이터 분석 기술

나. 빅데이터 주요 시각화 방법

구분	주요 시각화 방법
시간 시각화	막대 그래프,. 누적 막대 그래프, 점 그래프
분포 시각화	파이 차트, 도우넛 차트, 트리맵, 누적 연속 그래프
관계 시각화	스캐터플롯, 버블차트, 히스토그램
비교 시각화	히트맵, 스타 차트, 평행 좌표계, 다차원 척도법
공간 시각화	지도 맵핑

II. 빅데이터 시각화(Big Data Visualization)의 방법 상세 설명

구분	방법	개념도	설명
시간 시각화	막대 그래프		막대 그래프를 표시하는 차트 또는 그래프 범주 형 데이터와 직사각형으로 바의 높이 또는 길이가 비례함
분포 시각화	트리맵		트리 맵은 계층 적 ( 트리 구조 ) 데이터를 중첩 된 사각형 세트로 표시 Tree의 각 가지에는 사각형이 주어지며, 그 다음에 작은 가지를 나타내는 작은 사각형으로 바둑판 식으로 배열 데이터의 개별 차원을 표시하기 위해 색상이 지정
관계 시각화	히스토그램		연속 변수 (CORAL) 의 확률 분포 의 추정치 bin(일련의 간격으로 전체 범위를 나눔) 연속 데이터에 사용됨 (히스토그램은 데이터의 범위 막대그래프는 데이터의 양)
관계 시각화	스캐터플롯		두 개 이상 변수의 동시분포에서 각 개체를 점으로 표시한. 산점도는 두 변수의 관계를 시각적으로 검토할 때 유용하며, 변수들 사이의 관계를 왜곡시키는 특이점(outlier)을 확인하는 경우에도 유용
비교 시각화	히트맵		히트 맵은 데이터 매트릭스의 값을 2D로 표시 더 큰 값은 작은 어두운 회색 또는 검은 색 사각형 (픽셀)으로 표시되고 작은 값은 밝은 사각형으로 표기
공간 시각화	지도 맵핑		위도와 경도 좌표 계산 거리간 시간 정보 추가 공간의 밀집도 확인 가능 영역을 활용한 데이터 표현

막대 그래프를 표시하는 차트 또는 그래프 범주 형 데이터와 직사각형으로 바의 높이 또는 길이가 비례함

트리 맵은 계층 적 ( 트리 구조 ) 데이터를 중첩 된 사각형 세트로 표시 Tree의 각 가지에는 사각형이 주어지며, 그 다음에 작은 가지를 나타내는 작은 사각형으로 바둑판 식으로 배열 데이터의 개별 차원을 표시하기 위해 색상이 지정

연속 변수 (CORAL) 의 확률 분포 의 추정치 bin(일련의 간격으로 전체 범위를 나눔) 연속 데이터에 사용됨 (히스토그램은 데이터의 범위 막대그래프는 데이터의 양)

두 개 이상 변수의 동시분포에서 각 개체를 점으로 표시한. 산점도는 두 변수의 관계를 시각적으로 검토할 때 유용하며, 변수들 사이의 관계를 왜곡시키는 특이점(outlier)을 확인하는 경우에도 유용

히트 맵은 데이터 매트릭스의 값을 2D로 표시 더 큰 값은 작은 어두운 회색 또는 검은 색 사각형 (픽셀)으로 표시되고 작은 값은 밝은 사각형으로 표기

위도와 경도 좌표 계산 거리간 시간 정보 추가 공간의 밀집도 확인 가능 영역을 활용한 데이터 표현

III. 빅데이터 시각화(Big Data Visualization)의 범위 및 절차

가. 빅데이터 시각화(Big Data Visualization)의 범위

나. 빅데이터 시각화(Big Data Visualization)의 절차

단계	설명
정보 조직화 단계	사용자의 정보 인지에 관여 혼돈의 상태로 존재하는 데이터를 분류하고 배열하고 조직화하여 질서를 부여
정보 시각화 단계	사용자의 정보 지각에 관여 보다 효율적으로 정보 전달을 위해 시각, 청각, 촉각, 미각, 후각의 감각 기관에 최적의 자극을 제시하는 방법 제시
상호작용 단계	정보와 사용자 간의 상호작용 측면의 사용자 경험을 디자인 정보의 인지적 요인뿐만 아니라 지각적 요인을 함께 활용 정보 시각화 단계와 밀접하게 연동되면서 동시에 입력 기술의 특성도 함께 고려

※ ETRI(Electronics and Telecommunications Research Institute, 한국전자통신연구원) 기준

다. 빅데이터 시각화(Big Data Visualization)의 도구

구분	도구	설명
Basic tools	Excel/CVS/json	기본적인 데이터 export/import 도구 최근 google OpenRefine 많이 사용
Basic tools	D3	HTML, CSS, JavaScript 기반의 오픈 소스 시각화 라이브러리(D3.js 라이브러리)
GUI Control	Crossfilter	D3 Highcharts 또는 Google Visualization API와 함께 사용하는 라이브러리
GUI Control	Tangle	JavaScript 기반의 컨텐츠 및 컨트롤, 차트 시각화 라이브러리
Mapping tools	Modest maps	10kb 크기로 가장 작은 용량의 빅데이터 시각화 라이브러리
Mapping tools	OpenLayers	빅데이터 시각화 도구 중 가장 정교하고 최적화된 라이브러리를 제공하는 도구
Professional tools	R	러닝 커브가 같지만 강력한 커뮤니티와 패키지 라이브러리를 제공하는 도구
Professional tools	Gephi	그래프 기반의 시각화 및 데이터 탐색 라이브러리를 제공하는 도구

- 시각화 도구로 보여지는 것도 중요하지만 분석된 데이터가 체계적으로 분류되고 분류된 정보가 오류없이 잘 활용되도록 시각화 도구와 상호작용 가능한 programming 필요

IV. 시각정보 효율화 고려사항

구분	내용
시각적 비교 강화	정보는 비교를 통해 사용자에게 더욱 가치 올라감
인과관계 활용	정보를 디자인할 때 원인과 결과를 명쾌하게 제시
다중변수 표시	여러 개의 연관된 변수를 활용해 정보를 표현
텍스트, 그래픽, 데이터 조화	라벨과 범례가 도표에 녹아 있는 다이어그램이 더욱 효과적
컨텐츠의 질과 연관성, 진실성 확보	보여주려는 정보가 사용자가 특정 목적을 달성하는데 도움이 되는지 고려
시간순이 아닌 공간순	시간보다는 공간에 따라 나열할 때 사용자의 이해가 쉬워짐
정량적 자료 활용	정량적인 정보는 한눈에 트랜드 파악 가능하도록 구성

- 시각화는 보는 이의 인지적인 과업과 디자인 원칙을 깊이 이해해야 양질의 결과 도출 가능

'기타정보' 카테고리의 다른 글

과잉 학습으로 인한 폐해, 과적합(Overfitting)의 개요 (0)	2020.01.21
기업의 차세대 생존전략, 빅 데이터의 개요 (0)	2020.01.21
공공정보의 민간개방을 통한 선순환 생태계 조성, 오픈데이터(Open Data) 개요 (0)	2020.01.21
RFP(Request For Proposal) (0)	2020.01.20
스마트팜 발전의 현주소 (0)	2020.01.10

현재글빅데이터 시각화

하루농원

보이스트롯, 황민우, 뷔, 박광현, RM(리더), 조문근, 방탄소년단, 제이홉, 정국, 추대엽, 슈가, 지민, 코로나19, 김다현, 홍경민, 운세, 박세욱, 슬리피, BTS, 박상우,

Today :
Yesterday :

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

하루농원