Machine Learning/Fundamentals of Data Visualization(14)
-
[번역] Fundamentals of Data Visualization - 8 Visualizing distributions: Empirical cumulative distribution functions and q-q plots
8 Visualizing distributions: Empirical cumulative distribution functions and q-q plots히스토그램이나 밀도 그래프(density plot)와 같은 전통적인 방법들은 직관적이고 시각적으로 매력적이지만, 사용자가 선택해야 하는 매개변수(예: 히스토그램의 bin 폭이나 밀도 그래프의 대역폭)에 크게 의존합니다.대안으로, 모든 데이터 포인트를 개별적으로 점으로 표시하는 방법도 있지만, 데이터셋이 매우 큰 경우 이 방법은 다루기 어려워집니다. 또한 개별 데이터 포인트보다는 분포의 속성을 강조하는 집계 방법에 가치가 있습니다. 이 문제를 해결하기 위해 통계학자들은 경험적 누적 분포 함수(ecdf)와 분위수-분위수(q-q) 플롯을 고안했습니다. 이 시..
2024.08.22 -
[번역] Fundamentals of Data Visualization - 7 Visualizing distributions: Histograms and density plots
7 Visualizing distributions: Histograms and density plots7.1 Visualizing a single distribution승객들을 비슷한 나이대로 그룹화하고, 각 그룹에 속하는 승객 수를 계산하면 그 결과가 하나의 표로 나타날 수 있습니다.이 데이터를 시각화하기 위해, 각 나이 구간(연령대)의 승객 수를 나타내는 막대를 그립니다. 막대의 높이는 해당 구간에 속한 승객 수를 나타내고, 막대의 너비는 해당 나이 구간의 범위를 나타냅니다. 이러한 시각적 표현 방식을 히스토그램이라고 부릅니다.히스토그램의 시각적 표현이 데이터의 빈(bin) 너비 선택에 따라 달라질 수 있습니다.일반적으로, 빈 너비가 너무 작으면 히스토그램이 지나치게 세분화되어 시각적으로 복잡해지고,..
2024.08.22 -
[번역] Fundamentals of Data Visualization - 6 Visualizing amounts
6 Visualizing amounts많은 상황에서 우리는 특정 숫자 집합의 크기에 관심을 가집니다. 예를 들어, 다양한 자동차 브랜드의 총 판매량을 시각화하거나, 다양한 도시의 총 인구 수를 시각화하거나, 또는 다양한 스포츠에 참여하는 올림픽 선수들의 나이를 시각화할 수 있습니다. 이러한 경우를 "visualizing amounts"라고 부르며, 이러한 시각화에서 주요 초점은 정량적 값의 크기입니다. 이 시나리오에서 표준 시각화 도구는 막대 그래프이며, 여기에는 단순 막대뿐만 아니라 그룹화된 막대와 누적 막대와 같은 여러 변형이 있습니다. 막대 그래프의 대안으로는 점 그래프와 히트맵이 있습니다.6.1 Bar plots표는 2017년 크리스마스 주말에 가장 높은 티켓 판매량을 기록한 상위 다섯 편의 영화..
2024.08.22 -
[번역] Fundamentals of Data Visualization - 5 Directory of visualizations
원문 Fundamentals of Data Visualization5 Directory of visualizations이 챕터는 데이터를 시각화할 때 자주 사용되는 다양한 플롯과 차트들을 빠르게 시각적으로 살펴볼 수 있는 개요를 제공합니다.5.1 Amounts챕터 6 참조가장 일반적인 방법으로는 막대 그래프를 사용하여 특정 범주에 대한 수치 값(즉, 양)을 시각화합니다. 막대는 세로 또는 가로로 배열될 수 있습니다. 하지만 막대 대신, 해당 막대가 끝나는 위치에 점을 배치하는 방법도 있습니다.두 개 이상의 범주 집합에 대해 수치를 보여주고자 할 때는 막대를 그룹화하거나 쌓아 올리는 방법을 사용할 수 있습니다. 또한, 범주를 x축과 y축에 매핑하고, 색상을 통해 수치를 나타내는 히트맵을 사용할 수도 있습니..
2024.08.21 -
[번역] Fundamentals of Data Visualization - 4 Color scales
원문 Fundamentals of Data Visualization4 Color scales데이터 시각화에서 색상을 사용하는 세 가지 기본적인 용도가 있습니다. (i) 색상을 사용하여 데이터 그룹을 서로 구별할 수 있습니다; (ii) 색상을 사용하여 데이터 값을 표현할 수 있습니다; (iii) 색상을 사용하여 특정 요소를 강조할 수 있습니다. 이 세 가지 경우에서 사용하는 색상의 유형과 그 사용 방식은 서로 크게 다릅니다.4.1 Color as a tool to distinguish우리는 종종 색상을 사용하여 고유한 순서가 없는 개별 항목이나 그룹을 구분합니다. 예를 들어, 지도에서 서로 다른 국가를 구분하거나 특정 제품의 서로 다른 제조사를 구분할 때 색상을 사용할 수 있습니다. 이 경우, 우리는 정성..
2024.08.21 -
[번역] Fundamentals of Data Visualization - 3 Coordinate systems and axes
원문 Fundamentals of Data Visualization3 Coordinate systems and axes어떤 형태의 데이터 시각화를 하려면 위치 스케일(position scales)을 정의해야 합니다. 위치 스케일은 그래프에서 다양한 데이터 값이 위치할 위치를 결정합니다.3.1 Cartesian coordinates데이터 시각화에서 가장 널리 사용되는 좌표 시스템은 2차원 데카르트 좌표계입니다. 이 좌표계에서는 각 위치가 x 값과 y 값에 의해 고유하게 지정됩니다. x축과 y축은 서로 직교하며, 데이터 값은 두 축 모두에서 일정한 간격으로 배치됩니다.3.2 Nonlinear axes데카르트 좌표계에서는 축을 따라 그리드 라인이 데이터 단위와 시각화된 결과에서 모두 균등하게 간격을 두고 있습..
2024.08.21