본문 바로가기
반응형

데이터 분석17

베이지안 통계, 우도 함수(Likelihood Function), 확률의 추정 빈도주의 통계와 베이즈 통계 통계의 관점에 따른 확률의 의미 - 빈도주의 통계(Frequentist) : 실험을 시행했을 때, 전체 횟수에 확률값을 곱한 숫자만큼 해당 사건이 발생한다고 보는 관점입니다. - 베이지안 통계(Bayesian) : 임의의 표본을 하나 선택했을 때, 해당 표본이 해당 사건이라는 주장의 신뢰도를 확률 값으로 보는 관점입니다. 베이즈 정리(Bayes' Rule) 베이즈 확률(Bayesian Probability)을 구하는 방법으로, 종속적인 관계에 있는 사건을 기반으로 확률을 계산합니다. A라는 사건이 발생했을 때, 이 정보를 반영(사전 확률)하여 더 정확한 확률을 계산하는 방법입니다. 예시) A= 감기, B= 기침 --> 베이즈 통계에서는 기침을 한 사람이 감기에 걸린 사람일 확.. 2022. 8. 18.
선형 대수학 - 벡터와 행렬 스칼라(Scalars), 벡터(vectors), 행렬(Matrix) 선형대수에서는 벡터, 행렬이 많이 사용됩니다. - 벡터 변수(vector variable) : 수학의 벡터를 나타내는 변수입니다. 특별한 언급이 없으면, 기본적으로 열벡터(column vector)입니다. 소문자 볼드체로 표현하거나, 소문자 볼드 이텔릭체로 표현합니다. - 행렬 변수(matrix variable) : 수학의 행렬을 나타내는 변수입니다. 대문자 이탤릭으로 표현합니다. 다변수 함수의 미분 변수가 여러 개인 함수를 미분하기 위해서 편미분을 사용합니다. 편미분하는 변수를 제외하고 나머지 변수를 상수 취급합니다. 여러 변수 중 특정 변수를 기준으로 미분을 계산하는 것입니다. 편미분의 의미를 찾아보자면, 나머지 축을 고정하고 특정 .. 2022. 8. 18.
변수, 다항식, 함수와 함수의 미분 변수(variables) 변수는 변하는 값을 나타내는 문자로, 미지수라고도 합니다. - 스칼라 변수(scalar variable) : 단일 숫자를 나타내는 변수입니다. 소문자로 보통 표현을 합니다. - 벡터 변수(vector variable) : 수하의 벡터를 나타내는 변수입니다. - 행렬 변수(matrix variable) : 수학의 행렬을 나타내는 변수입니다. 대문자 이탤릭으로 표현합니다. 다항식과 계수 다항식(Polynomials) - 여러 항의 합으로 이루어진 식을 다항식이라고 합니다. 각 항은 변수와 변수의 차수로 이루어집니다. 변수와 무관한 항을 상수항이라고도 합니다. 다항식의 종류 - 단변수(univariate) : 하나의 변수만으로 이루어진 다항식입니다. - 다변수(multivariate).. 2022. 8. 18.
seaborn 패키지 seaborn 패키지 matplotlib 기반의 데이터 시각화 라이브러리입니다. 데이터 통게를 시각화 하는 라이브러리이며, matplotlib을 손쉽게 사용할 수 있도록 돕는 wrapper 라이브러리입니다. 기능적인 부분을 넘어서, 아름다운 시각화까지 가능합니다. Histplot 히스토그램을 그리는 함수입니다. import seaborn as sns df= sns.load_dataset('penguins') #seaborn 에서 제공하는 dataset df.head() sns.histplot(df['bill_length_mm']) sns.histplot(df['bill_length_mm'],bins=25) #bins = 바의 갯수 sns.histplot(df,x='bill_length_mm',bins=2.. 2022. 8. 15.
반응형