본문 바로가기

공부한 것들..19

Pandas DataFrame 데이터 추가 및 삭제 코드 프레소 [파이썬으로 배우는 Pandas] 강의 내용 정리 # DataFrame 데이터 추가 및 삭제..?이전 포스팅에서 예시코드 중에 score_df['etc'] =0 을 통해 score_df에 존재하지 않는 column 인덱스인 'etc'에 0을 부여하였는데 그 결과 모든 요소가 0인 Series가 DataFrame에 추가된 것을 확인할 수 있었다. 이처럼, 데이터 추가의 방법은 아래와 같다.  [열 데이터 추가 방법] . 연산자와 인덱싱을 통해 새로운 Series를 추가하는 방식으로 접근할 수 있다. [행 데이터 추가 방법]df.loc()프로퍼티를 활용해  행 데이터에 접근하여 추가할 수 있다. 데이터를 삭제하는 방법은 df.drop()함수를 활용하여 DataFrame의 데이터를 삭제할 수 있다.. 2024. 9. 13.
Pandas 데이터 조회 및 변경 코드 프레소 [파이썬으로 배우는 Pandas] 강의 내용 정리# Pandas DataFrame 데이터 조회 방법..?이전 포스팅에서 Pandas의 DataFrame의 특징을 정리해보았는데 특징 중 하나는 2차원에 데이터를 저장한다는 것이다. 따라서, Pandas의 DataFrame의 데이터 조회는 행 데이터 조회와 열 데이터 조회로 나뉜다. [열 데이터 조회 방법]인덱싱.연산자 사용[행 데이터 조회 방법]df.loc 프로퍼티를 활용해 찾고자 하는 데이터의 인덱스를 입력 # 예시코드# DataFrame 열 데이터 조회 방법import pandas as pd # 실습 데이터 생성score = { 'name' : ['Jessi', 'Emma', 'Alex', 'Jessi', 'Tom'], 'a.. 2024. 9. 13.
Pandas 수치형 데이터 & 범주형 데이터 활용 코드 프레소 [Python으로 배우는 Pandas] 강의 내용 정리# 수치형 데이터 & 범주형 데이터..?수치형 데이터는 관측된 값이 수치로 측정되는 데이터이다. "연속형" 데이터라고도 한다.값의 평균, 중앙값, 표준편차 등과 같은 접근이 의미가 있는 데이터이다.(ex :: 키, 몸무계, 시험점수, 자동차 판매 건수 ..etc) 범주형 데이터는 데이터가 범주 또는, 항목으로 표현되는 것으로 숫자로 표현되기도 하나, 수치적인 의미가 없다.(ex:: 성별, 국적, 거주지역, 메달 순위, 설문조사 결과 ..etc) 범주형 데이터에 접근시 범주의 종류나 빈도수로 접근할 수 있다.(ex:: 요일별 커피 판매수 )  #예시 코드# 수치형 데이터 확인 및 데이터 정보 출력 import pandas as pd # 실습.. 2024. 9. 13.
Pandas 자료구조:: Series & DataFrame 코드 프레소 [파이썬으로 배우는 Pandas ] 강의 내용  정리 # Pandas...?Pandas는 데이터 분석을 위한 도구로 사용된다. Python 라이브러리이며, 2차원의 데이터로부터 의미를 도출하는 전과정에 필수적이다. Pandas의 자료구조로는 위의 그림과 같이 Series와 DataFrame이 있다. Series의 특징은 아래와 같다. 1차원의 배열구조이다.인덱스를 통한 데이터 조회 및 접근이 가능하다.동일한 데이터 타입의 값을 저장한다.  DataFrame의 특징을 정리하면 아래와 같다.행과 열을 가진 2차원이다.데이터와 행/열에 대한 인덱스가 저장된다.각 컬럼은 서로 다른 데이터 타입으로 구성될 수 있다.1개의 column은 Series객체로 구성된다. DataFrame은 다양한 형태의 d.. 2024. 9. 13.
Numpy 데이터 정렬 # 데이터 정렬...?데이터 분석에 있어 난잡하게 구성된 데이터를 사용하는 것보다 수치형 또는 범주형 데이터의 경우 오름차순으로 정렬하여 데이터를 나열하는 것이 데이터가 가진 의미를 파악하기에도 용이한 경우가 있다. numpy에서는 이를 위해 아래와 같은 함수를 제공한다. numpy.sort()numpy.argsort()이번 포스팅에서는 위의 함수의 API Refernce을 통해 parameter와 사용법을 이해하고 이를 활용하여 데이터를 오름차순, 내림차순으로 정렬하는 방법을 예시코드와 함께 정리하겠다.  # API Reference # numpy.sort()API Reference :: numpy.sort() numpy.sort()는 기본적으로 오름차순 정렬만 지원한다. 정렬된 결과를 return값으.. 2024. 9. 12.
Numpy 데이터 조회를 위한 인덱싱 및 슬라이싱 #인덱싱 & 슬라이싱..?배열에 존재하는 특정 데이터는 인덱스를 통해 접근할 수 있다. 인덱싱을 통해 배열에 존재하는 데이터를 조회하는 것은 "배열명"[인덱스] 형태로 접근할 수 있다.  슬라이싱은 범위를 지정하여 데이터를 조회하는 방식이다."배열명"[from index : to index] from index : 슬라이싱이 시작되는 인덱스 위치이다. 생략 가능하여 default값은 0이다.to index : 슬라이싱이 종료되는 인덱스 위치이다. to index -1 위치의 데이터까지 조회되며 생략 가능하다. default는 항상 해당 배열의 마지막 인덱스이다.  # 예시 코드# 인덱싱, 슬라이싱 예시import numpy as nparr_1d = np.arange(5,15)print("1D-array .. 2024. 9. 12.