Machine Learning(23)
-
[번역] Fundamentals of Data Visualization - 9 Visualizing many distributions at once
9 Visualizing many distributions at once이 글에서는 여러 분포를 동시에 시각화하는 방법에 대해 설명하고 있습니다. 예를 들어, 날씨 데이터를 고려해 볼 때, 우리는 특정 달마다 온도가 어떻게 변하는지를 시각화하고, 각 달에 관측된 온도 분포도 보여주고 싶을 수 있습니다. 이 경우, 12개의 온도 분포를 한 번에 보여줘야 하는데, 이는 각 달에 하나씩 할당됩니다. 기존에 논의된 시각화 기법들은 이러한 상황에 적합하지 않으며, 이럴 때는 상자 그림(boxplots), 바이올린 그림(violin plots), 그리고 리지라인 그림(ridgeline plots)이 유효한 방법이 됩니다.9.1 Visualizing distributions along the vertical axis..
2024.08.23 -
[번역] Fundamentals of Data Visualization - 8 Visualizing distributions: Empirical cumulative distribution functions and q-q plots
8 Visualizing distributions: Empirical cumulative distribution functions and q-q plots히스토그램이나 밀도 그래프(density plot)와 같은 전통적인 방법들은 직관적이고 시각적으로 매력적이지만, 사용자가 선택해야 하는 매개변수(예: 히스토그램의 bin 폭이나 밀도 그래프의 대역폭)에 크게 의존합니다.대안으로, 모든 데이터 포인트를 개별적으로 점으로 표시하는 방법도 있지만, 데이터셋이 매우 큰 경우 이 방법은 다루기 어려워집니다. 또한 개별 데이터 포인트보다는 분포의 속성을 강조하는 집계 방법에 가치가 있습니다. 이 문제를 해결하기 위해 통계학자들은 경험적 누적 분포 함수(ecdf)와 분위수-분위수(q-q) 플롯을 고안했습니다. 이 시..
2024.08.22 -
[번역] Fundamentals of Data Visualization - 7 Visualizing distributions: Histograms and density plots
7 Visualizing distributions: Histograms and density plots7.1 Visualizing a single distribution승객들을 비슷한 나이대로 그룹화하고, 각 그룹에 속하는 승객 수를 계산하면 그 결과가 하나의 표로 나타날 수 있습니다.이 데이터를 시각화하기 위해, 각 나이 구간(연령대)의 승객 수를 나타내는 막대를 그립니다. 막대의 높이는 해당 구간에 속한 승객 수를 나타내고, 막대의 너비는 해당 나이 구간의 범위를 나타냅니다. 이러한 시각적 표현 방식을 히스토그램이라고 부릅니다.히스토그램의 시각적 표현이 데이터의 빈(bin) 너비 선택에 따라 달라질 수 있습니다.일반적으로, 빈 너비가 너무 작으면 히스토그램이 지나치게 세분화되어 시각적으로 복잡해지고,..
2024.08.22 -
[번역] Fundamentals of Data Visualization - 6 Visualizing amounts
6 Visualizing amounts많은 상황에서 우리는 특정 숫자 집합의 크기에 관심을 가집니다. 예를 들어, 다양한 자동차 브랜드의 총 판매량을 시각화하거나, 다양한 도시의 총 인구 수를 시각화하거나, 또는 다양한 스포츠에 참여하는 올림픽 선수들의 나이를 시각화할 수 있습니다. 이러한 경우를 "visualizing amounts"라고 부르며, 이러한 시각화에서 주요 초점은 정량적 값의 크기입니다. 이 시나리오에서 표준 시각화 도구는 막대 그래프이며, 여기에는 단순 막대뿐만 아니라 그룹화된 막대와 누적 막대와 같은 여러 변형이 있습니다. 막대 그래프의 대안으로는 점 그래프와 히트맵이 있습니다.6.1 Bar plots표는 2017년 크리스마스 주말에 가장 높은 티켓 판매량을 기록한 상위 다섯 편의 영화..
2024.08.22 -
[번역] Fundamentals of Data Visualization - 5 Directory of visualizations
원문 Fundamentals of Data Visualization5 Directory of visualizations이 챕터는 데이터를 시각화할 때 자주 사용되는 다양한 플롯과 차트들을 빠르게 시각적으로 살펴볼 수 있는 개요를 제공합니다.5.1 Amounts챕터 6 참조가장 일반적인 방법으로는 막대 그래프를 사용하여 특정 범주에 대한 수치 값(즉, 양)을 시각화합니다. 막대는 세로 또는 가로로 배열될 수 있습니다. 하지만 막대 대신, 해당 막대가 끝나는 위치에 점을 배치하는 방법도 있습니다.두 개 이상의 범주 집합에 대해 수치를 보여주고자 할 때는 막대를 그룹화하거나 쌓아 올리는 방법을 사용할 수 있습니다. 또한, 범주를 x축과 y축에 매핑하고, 색상을 통해 수치를 나타내는 히트맵을 사용할 수도 있습니..
2024.08.21 -
[번역] Fundamentals of Data Visualization - 4 Color scales
원문 Fundamentals of Data Visualization4 Color scales데이터 시각화에서 색상을 사용하는 세 가지 기본적인 용도가 있습니다. (i) 색상을 사용하여 데이터 그룹을 서로 구별할 수 있습니다; (ii) 색상을 사용하여 데이터 값을 표현할 수 있습니다; (iii) 색상을 사용하여 특정 요소를 강조할 수 있습니다. 이 세 가지 경우에서 사용하는 색상의 유형과 그 사용 방식은 서로 크게 다릅니다.4.1 Color as a tool to distinguish우리는 종종 색상을 사용하여 고유한 순서가 없는 개별 항목이나 그룹을 구분합니다. 예를 들어, 지도에서 서로 다른 국가를 구분하거나 특정 제품의 서로 다른 제조사를 구분할 때 색상을 사용할 수 있습니다. 이 경우, 우리는 정성..
2024.08.21