Machine Learning(23)
-
[번역] Fundamentals of Data Visualization - 3 Coordinate systems and axes
원문 Fundamentals of Data Visualization3 Coordinate systems and axes어떤 형태의 데이터 시각화를 하려면 위치 스케일(position scales)을 정의해야 합니다. 위치 스케일은 그래프에서 다양한 데이터 값이 위치할 위치를 결정합니다.3.1 Cartesian coordinates데이터 시각화에서 가장 널리 사용되는 좌표 시스템은 2차원 데카르트 좌표계입니다. 이 좌표계에서는 각 위치가 x 값과 y 값에 의해 고유하게 지정됩니다. x축과 y축은 서로 직교하며, 데이터 값은 두 축 모두에서 일정한 간격으로 배치됩니다.3.2 Nonlinear axes데카르트 좌표계에서는 축을 따라 그리드 라인이 데이터 단위와 시각화된 결과에서 모두 균등하게 간격을 두고 있습..
2024.08.21 -
[번역] Fundamentals of Data Visualization - 2 Visualizing data: Mapping data onto aesthetics
원문 Fundamentals of Data Visualization2 Visualizing data: Mapping data onto aesthetics우리가 데이터를 시각화할 때, 데이터 값을 체계적이고 논리적인 방식으로 변환하여 최종 그래픽을 구성하는 시각적 요소로 만듭니다. 데이터 시각화는 위치, 크기, 색상, 모양, 선의 너비 등 미학적 요소를 사용하여 데이터를 시각적으로 표현하는 과정입니다.2.1 Aesthetics and types of data모든 그래픽 요소의 중요한 구성 요소는 그 위치입니다. 이는 요소가 어디에 위치하는지를 설명합니다. 다음으로, 모든 그래픽 요소는 모양, 크기, 색상을 가지고 있습니다. 마지막으로, 데이터를 시각화하기 위해 선을 사용할 경우, 이 선들은 다른 너비나 점..
2024.08.21 -
[번역] Fundamentals of Data Visualization - 1 Introduction
원문 Fundamentals of Data Visualization 1. introduction데이터 시각화는 예술과 과학이 결합된 분야입니다. 시각화에서 가장 중요한 점은 데이터를 정확하게 전달하는 것입니다. 시각화가 잘못되면, 예를 들어 어떤 숫자가 다른 숫자의 두 배 크기임에도 불구하고 시각화에서는 거의 비슷하게 보인다면, 그 시각화는 잘못된 것입니다. 동시에, 데이터 시각화는 미적으로도 보기 좋아야 합니다. 시각적 표현이 적절하면 메시지를 더욱 효과적으로 전달할 수 있습니다. 그러나 시각화에 너무 자극적인 색상이나 불균형한 요소가 포함되어 있으면, 보는 사람이 그 도표를 올바르게 해석하기가 어려워질 수 있습니다. 이 책은 세 부분으로 나누어져 있습니다. 첫 번째 부분인 “데이터에서 시각화로”는 막..
2024.08.21 -
[WEEK02-DAY2] weight initalization
what happens when $W=0$ init is used?대칭성 문제: 모든 가중치를 0으로 초기화하면, 같은 층의 모든 뉴런들이 동일한 그래디언트를 받게 된다. 그 결과, 모든 뉴런이 동일한 방식으로 업데이트되고, 동일한 출력을 생성하게 된다. 이렇게 되면 뉴런들이 서로 다른 특성을 학습할 수 없게 되며, 각 뉴런의 역할이 중복된다.그래디언트 전파 불가: 가중치가 0으로 초기화된 경우, 사용된 활성화 함수에 따라 역전파 과정에서 계산되는 그래디언트가 0이 될 수 있다.First idea: Small Gaussian Random (평균이 0이고, 표준편차가 0.01인 정규분포=대부분 0 근처에 분포한다는 의미) $W = 0.01 * np.random.randn(D,H)$ $tanh$함수의 입력값..
2024.08.19 -
[WEEK02-DAY2] 역전파의 전체 과정
하나의 은닉층과 하나의 출력층을 가지고 있다.입력 $x$는 은닉층으로 전달된다.은닉층에서 가중치 $W1$과 시그모이드 활성화 함수 $σ$를 통해 출력 $h = \sigma(W_1 \cdot x)$가 계산된다.은닉층 출력 $h$는 출력층에서 또 다른 가중치 W_2와 곱해져 최종 출력 $\hat{y}$가 계산된다.손실함수는 $L = (\hat{y}-y)^2$로 정의된다.우리는 이 손실을 최소화하기 위해 $W_1$의 가중치를 조정해야한다.chain-rule의 적용 $$ \frac{\partial \mathcal{L}}{\partial W_1} = \frac{\partial \mathcal{L}}{\partial \hat{y}} \cdot \frac{\partial \hat{y}}{\partial h} \cdo..
2024.08.19 -
[WEEK02-DAY2] Zero-Centered Output
Zero-Centered Output"Zero-centered"란 데이터의 평균이나 중간값이 0에 가까운 상태를 의미한다. 즉, 출력이 0을 기준으로 양쪽으로 대칭적으로 분포되는 경우이다. 예를 들어, 출력값이 -1과 1 사이에서 대칭적으로 분포한다면, 이는 zero-centered output이다.Not Zero-Centered Output반대로, "Not zero-centered"는 출력값이 0을 중심으로 대칭적이지 않은 경우를 말한다. 예를 들어, 모든 출력값이 0보다 크거나, 혹은 특정 범위에서만 존재하는 경우이다. 예를 들어, ReLU 활성화 함수의 출력은 0 또는 양수만을 반환하므로 not zero-centered output에 해당한다.딥러닝에서의 영향Gradient Descent:딥러닝 모..
2024.08.19