전체 글(82)
-
[번역] Fundamentals of Data Visualization - 9 Visualizing many distributions at once
9 Visualizing many distributions at once이 글에서는 여러 분포를 동시에 시각화하는 방법에 대해 설명하고 있습니다. 예를 들어, 날씨 데이터를 고려해 볼 때, 우리는 특정 달마다 온도가 어떻게 변하는지를 시각화하고, 각 달에 관측된 온도 분포도 보여주고 싶을 수 있습니다. 이 경우, 12개의 온도 분포를 한 번에 보여줘야 하는데, 이는 각 달에 하나씩 할당됩니다. 기존에 논의된 시각화 기법들은 이러한 상황에 적합하지 않으며, 이럴 때는 상자 그림(boxplots), 바이올린 그림(violin plots), 그리고 리지라인 그림(ridgeline plots)이 유효한 방법이 됩니다.9.1 Visualizing distributions along the vertical axis..
2024.08.23 -
[번역] Fundamentals of Data Visualization - 8 Visualizing distributions: Empirical cumulative distribution functions and q-q plots
8 Visualizing distributions: Empirical cumulative distribution functions and q-q plots히스토그램이나 밀도 그래프(density plot)와 같은 전통적인 방법들은 직관적이고 시각적으로 매력적이지만, 사용자가 선택해야 하는 매개변수(예: 히스토그램의 bin 폭이나 밀도 그래프의 대역폭)에 크게 의존합니다.대안으로, 모든 데이터 포인트를 개별적으로 점으로 표시하는 방법도 있지만, 데이터셋이 매우 큰 경우 이 방법은 다루기 어려워집니다. 또한 개별 데이터 포인트보다는 분포의 속성을 강조하는 집계 방법에 가치가 있습니다. 이 문제를 해결하기 위해 통계학자들은 경험적 누적 분포 함수(ecdf)와 분위수-분위수(q-q) 플롯을 고안했습니다. 이 시..
2024.08.22 -
[번역] Fundamentals of Data Visualization - 7 Visualizing distributions: Histograms and density plots
7 Visualizing distributions: Histograms and density plots7.1 Visualizing a single distribution승객들을 비슷한 나이대로 그룹화하고, 각 그룹에 속하는 승객 수를 계산하면 그 결과가 하나의 표로 나타날 수 있습니다.이 데이터를 시각화하기 위해, 각 나이 구간(연령대)의 승객 수를 나타내는 막대를 그립니다. 막대의 높이는 해당 구간에 속한 승객 수를 나타내고, 막대의 너비는 해당 나이 구간의 범위를 나타냅니다. 이러한 시각적 표현 방식을 히스토그램이라고 부릅니다.히스토그램의 시각적 표현이 데이터의 빈(bin) 너비 선택에 따라 달라질 수 있습니다.일반적으로, 빈 너비가 너무 작으면 히스토그램이 지나치게 세분화되어 시각적으로 복잡해지고,..
2024.08.22 -
[번역] Fundamentals of Data Visualization - 6 Visualizing amounts
6 Visualizing amounts많은 상황에서 우리는 특정 숫자 집합의 크기에 관심을 가집니다. 예를 들어, 다양한 자동차 브랜드의 총 판매량을 시각화하거나, 다양한 도시의 총 인구 수를 시각화하거나, 또는 다양한 스포츠에 참여하는 올림픽 선수들의 나이를 시각화할 수 있습니다. 이러한 경우를 "visualizing amounts"라고 부르며, 이러한 시각화에서 주요 초점은 정량적 값의 크기입니다. 이 시나리오에서 표준 시각화 도구는 막대 그래프이며, 여기에는 단순 막대뿐만 아니라 그룹화된 막대와 누적 막대와 같은 여러 변형이 있습니다. 막대 그래프의 대안으로는 점 그래프와 히트맵이 있습니다.6.1 Bar plots표는 2017년 크리스마스 주말에 가장 높은 티켓 판매량을 기록한 상위 다섯 편의 영화..
2024.08.22 -
백준, 중앙값 구하기, 2696
[유형]자료구조 [문제링크]https://www.acmicpc.net/problem/2696 [요약]각 테스트 케이스에 대해 첫째 줄에 출력하는 중앙값의 개수를 출력하고, 둘째 줄에는 홀수 번째 수를 읽을 때 마다 구한 중앙값을 차례대로 공백으로 구분하여 출력한다. 이때, 한 줄에 10개씩 출력해야 한다. [문제풀이]먼저, 특정 N번째 원소까지의 중앙 값을 AkAk라고 가정한다면, 우리는 다음과 같이 이분화를 할 수 있게 된다.A1 ... An = {Ak 보다 작은 원소들의 집합 } + { Ak 보다 크거나 같은 원소들의 집합 }이 때, n이 홀수 일 때 유일한(unique) 중앙값이 하나가 정의가 되고 이 때 이것을 출력하고자 한다. { Ak 보다 작은 원소들의 집합 } 과 { Ak 보다 크거나 같은 ..
2024.08.22 -
프로그래머스, 더 맵게
[유형]자료구조 [문제링크]https://school.programmers.co.kr/learn/courses/30/lessons/42626 [요약]Leo가 가진 음식의 스코빌 지수를 담은 배열 scoville과 원하는 스코빌 지수 K가 주어질 때, 모든 음식의 스코빌 지수를 K 이상으로 만들기 위해 섞어야 하는 최소 횟수를 return 하도록 solution 함수를 작성해주세요. 모든 음식의 스코빌 지수를 K 이상으로 만들 수 없는 경우에는 -1을 return 합니다.섞은 음식의 스코빌 지수 = 가장 맵지 않은 음식의 스코빌 지수 + (두 번째로 맵지 않은 음식의 스코빌 지수 * 2) [문제풀이]1. 배열 scoville을 힙으로 만든다.2. scoville[0]가 K와 크거나 같다면, return ..
2024.08.22