[디지털 문해력]Python으로 시작하는 데이터 분석_Pandas 기본 알아보기(210930)
Pandas란 구조화된 데이터를 효과적으로 처리하고 저장할 수 있는 파이썬 라이브러리. Array 계산에 특화된 numpy를 기반으로 만들어져서 다양한 기능들을 제공한다. ○ Series: numpy array가 보강된 형태 Data와 Index를 가지고 있다. - 인덱스를 가지고 있고 인덱스로 접근 가능하다. import pandas as pd data = pd.Series([1, 2, 3, 4]) data = pd.Series([1,2,3,4]), index=['a','b','c','d']) data['b'] → (출력) 2 - 딕셔너리로 만들 수 있다. population_dict = { 'korea' : 5180, 'japan' : 12718, 'china' : 141500, 'usa' : 326..
2021. 10. 2.
[디지털 문해력]Python으로 배우는 데이터 분석_확률과 통계 배우기 2일차(210928)
○ 베르누이 분포: 베르누이 시행 - 앞면/뒷면, 성공/실패 - 각 시행이 성공할 확률 p, 실패할 확률 1-p - 각 시행은 서로 독립으로 각 시행의 결과가 다른 시행의 결과에 영향을 미치지 않음 ○ 이항분포: 베르누이 시행을 반복했을 때, 성공하는 횟수의 확률분포 - 이항 실험 : 성공확률이 동일한 베르누이 시행을 독립적으로 반복하는 실험 - 이항 분포 : 이항 확률변수 X의 확률질량함수 ㄴ 동전 앞면(성공), 뒷면(실패) : 10번 던질 때, P(성공) = n, P(실패) = 1-P(성공) 3번 F, 7번 B 확률 : 10C3 (1/2)^3(1/2)^7 ㄴ 파스칼의 삼각형: (x+y)^0 = 1, (x+y)^1=x+y, (x+y)^2=x2+2xy+y2, (x+y)3=x3+3x~~ ㄴ X ~ B(n,..
2021. 9. 18.