Pandas 특징 Easy-to-use data structure and data analysis tools Relational 하거나 labeled data에 대한 쉬운 접근 및 data manipulation 관련 기능 제공 효율적인 연산이 가능한 다차원 array 자료형 제공 Pandas에서 주로 다루는 데이터 테이블 형태의 데이터(주로 SQL table, csv) Time series 데이터 주요기능 결측치(missing data) 처리 간편한 slicing 및 indexing 여러 개의 데이터를 하나로 병합하는 join/merge 그룹화 기능 Pandas vs Numpy Pandas는 Numpy의 기능을 확장한 패키지 1-d array, 2-d array를 각각 Series와 DataFrame이..
Numpy Numpy Array 한 array 객체에는 모두 동일한 타입의 elements들이 포함됨 dtype array 객체에 포함된 elements의 타입을 설명하는 객체 ndim 차원의 수, 축의 수 import numpy as np a = np.array([[0, 1], [5, 6]]) print(a.ndim) # 2 shape 각 차원의 크기를 나타내는 integer들의 tuple tuple 객체의 length는 ndim과 동일함 import numpy as np a = np.array([[0, 1], [5, 6]]) print(a.shape) size 행렬의 모든 원소 갯수 shape의 elements들을 모두 곱한 결과와 같음 import numpy as np a = np.array([[0..
경사하강법 그래디언트 (편)미분값이다. 최고 값, 최솟 값을 찾기 위해서 그래프의 증감방향으로 점진적으로 접근하는 방법이다. 경사하강법, 경사 상승법 경사 하강법은 Local(범위가 정해진) minimum을 찾는 방법이다. 반대로 경사 상승법은 Local maximum을 찾는 방법이다. 경사 하강법에서 부호만 반대로 하면 경사 상승법 적용이 가능하다. 경사하강법 현재 x 값의 미분값(기울기)에 따라 기울기가 음수이면 x 값을 양의 방향으로 이동하고, 기울기가 양수이면 x 값을 음의 방향으로 이동한다. 경사상승법 현재 x 값의 미분값(기울기)에 따라 기울기가 음수이면 x 값을 음의 방향으로 이동하고, 기울기가 양수이면 x 값을 양의 방향으로 이동한다. 그래디언트 계산하기 sum of squares 최저점 ..
선형대수 벡터 유한차원공간에 존재하는 점으로 표현한다. ex) (키, 몸무게, 나이), (국어점수, 수학점수, 영어점수) typing 모듈 타입에 대한 힌트(주석)를 IDE등의 써드파티 등에 주기 위한 용도이다. 단, 파이썬 인터프리터는 주어진 힌트를 강제하지 않는다. 함수주석 함수의 매개변수와 반환값에 주석작성이 가능하다 강제성이 없어 무시하고 사용도 가능하다. 콜론(:)을 사용해 매개변수에 할당되어야 하는 타입을 할당하고, 화살표를 사용해 반환값에 할당되어야 하는 형식을 할당한다. def func(a: str, b: float = 3.5) -> int: return a+b value = func(3) print(value) 벡터의 연산 [1,2] + [2,1] = [1+2, 2+1] = [3, 3] ..
simple line chart from matplotlib import pyplot as plt years = [1950, 1960, 1970, 1980, 1990, 2000, 2010] gdp = [300.2, 543.3, 1075.9, 2862.5, 5979.6, 10289.7, 14958.3] # fixme create a line chart, years on x-axis, gdp on plt.plot(years, gdp, color='green', marker='o', linestyle='solid') plt.title("Nominal GDP") # fixme add a label to the y-axis plt.ylabel("Billions of $") # fixme save the file ..