전체 글(82)
-
[번역] Fundamentals of Data Visualization - 1 Introduction
원문 Fundamentals of Data Visualization 1. introduction데이터 시각화는 예술과 과학이 결합된 분야입니다. 시각화에서 가장 중요한 점은 데이터를 정확하게 전달하는 것입니다. 시각화가 잘못되면, 예를 들어 어떤 숫자가 다른 숫자의 두 배 크기임에도 불구하고 시각화에서는 거의 비슷하게 보인다면, 그 시각화는 잘못된 것입니다. 동시에, 데이터 시각화는 미적으로도 보기 좋아야 합니다. 시각적 표현이 적절하면 메시지를 더욱 효과적으로 전달할 수 있습니다. 그러나 시각화에 너무 자극적인 색상이나 불균형한 요소가 포함되어 있으면, 보는 사람이 그 도표를 올바르게 해석하기가 어려워질 수 있습니다. 이 책은 세 부분으로 나누어져 있습니다. 첫 번째 부분인 “데이터에서 시각화로”는 막..
2024.08.21 -
백준, 생태학, 4358
[유형]자료구조 [문제링크]https://www.acmicpc.net/problem/4358 [요약]미국 전역의 나무들이 주어졌을 때, 각 종이 전체에서 몇 %를 차지하는지 구하는 프로그램을 만들어야 한다. [문제풀이]defaultdict: 인자로 주어진 객체의 기본값을 딕셔너리의 초기값으로 지정할 수 있다.몇 개의 종이 주어지는지 알 수 없기 때문에, while문과 break문을 추가한다.딕셔너리의 키를 통해 tree_name을 저장하고, 정렬을 한다.import sysfrom collections import defaultdictdef input(): return sys.stdin.readline().rstrip()tree_dict = defaultdict(int)n=0while True: ..
2024.08.20 -
백준, 나는야 포켓몬 마스터 이다솜,1620
[유형]자료구조 [문제링크]https://www.acmicpc.net/problem/1620 [요약]포켓몬의 이름이 N개 주어지며, 이후 M개의 줄에 숫자 또는 포켓몬 이름이 주어진다.숫자를 입력 받았다면 포켓몬의 이름을, 포켓몬의 이름을 입력받았다면 번호를 출력하는 프로그램을 작성하시오. [문제풀이]두개의 딕셔너리를 생성한다. 한개는 '번호-포켓몬이름', 나머지 한개는 '포켓몬 이름-번호'입력된 데이터(question)에 따라서 각각의 딕셔너리를 사용한다.import sysdef input(): return sys.stdin.readline().rstrip()by_id = {}by_name = {}n,p = map(int,input().split())for i in range(1,n+1): ..
2024.08.20 -
백준,문자열집합,14425
[유형]자료유형 [문제링크]https://www.acmicpc.net/problem/14425 [요약]총 N개의 문자열로 이루어진 집합 S가 주어진다.입력으로 주어지는 M개의 문자열 중에서 집합 S에 포함되어 있는 것이 총 몇 개인지 구하는 프로그램을 작성하시오. [문제풀이]import sysdef input(): return sys.stdin.readline().rstrip()list_n = []list_p = []ans = 0n,p = map(int,input().split())for _ in range(n): list_n.append(input())for _ in range(p): list_p.append(input())for lp in list_p: if lp in list_..
2024.08.20 -
[WEEK02-DAY2] weight initalization
what happens when $W=0$ init is used?대칭성 문제: 모든 가중치를 0으로 초기화하면, 같은 층의 모든 뉴런들이 동일한 그래디언트를 받게 된다. 그 결과, 모든 뉴런이 동일한 방식으로 업데이트되고, 동일한 출력을 생성하게 된다. 이렇게 되면 뉴런들이 서로 다른 특성을 학습할 수 없게 되며, 각 뉴런의 역할이 중복된다.그래디언트 전파 불가: 가중치가 0으로 초기화된 경우, 사용된 활성화 함수에 따라 역전파 과정에서 계산되는 그래디언트가 0이 될 수 있다.First idea: Small Gaussian Random (평균이 0이고, 표준편차가 0.01인 정규분포=대부분 0 근처에 분포한다는 의미) $W = 0.01 * np.random.randn(D,H)$ $tanh$함수의 입력값..
2024.08.19 -
[WEEK02-DAY2] 역전파의 전체 과정
하나의 은닉층과 하나의 출력층을 가지고 있다.입력 $x$는 은닉층으로 전달된다.은닉층에서 가중치 $W1$과 시그모이드 활성화 함수 $σ$를 통해 출력 $h = \sigma(W_1 \cdot x)$가 계산된다.은닉층 출력 $h$는 출력층에서 또 다른 가중치 W_2와 곱해져 최종 출력 $\hat{y}$가 계산된다.손실함수는 $L = (\hat{y}-y)^2$로 정의된다.우리는 이 손실을 최소화하기 위해 $W_1$의 가중치를 조정해야한다.chain-rule의 적용 $$ \frac{\partial \mathcal{L}}{\partial W_1} = \frac{\partial \mathcal{L}}{\partial \hat{y}} \cdot \frac{\partial \hat{y}}{\partial h} \cdo..
2024.08.19