[Python] 데이터 프레임 행 추가 쉽게 하기 여러가지 행 추가 방법이 있겠지만 import pandas as pd data = { '싱픔' : ['더위사냥','스크류바'], '가격' : [2000, 1000], '갯수' : [5, 2] } df = pd.DataFrame(data) 아랫 쪽에 행을 이어서 추가하고 싶다면 df.loc[len(df)] = ['비비빅',600,10] 짜잔~ for문 돌리기도 쉬움 Study/Python 2022.05.12
[Python] 이중 리스트 하나로 합치기 가끔 데이터 처리하다 이중리스트를 하나로 합쳐버리고 싶을 때 사용하면 좋다. a = [[1,2],[3,4],[5,6,7]] b = sum(a, []) print("a : ", a, "\n a의 타입 : ", type(a)) print("b : ", b, "\n b의 타입 : ", type(b)) a : [[1, 2], [3, 4], [5, 6, 7]] a의 타입 : b : [1, 2, 3, 4, 5, 6, 7] b의 타입 : Study/Python 2022.03.21
[Python]Sckit-Learn에 있는 데이터를 csv로 만들기 머신러닝 오픈소스 중 하나인 사이킷런에서는 여러가지 머신러닝용 데이터를 제공한다. 그런데 이런 데이터들을 하나의 csv파일로 정리해서 출력할 수는 없을까? 아주 간단한 방법으로 해당 작업을 진행하였다. pandas의 데이터처리 방법도 포함이 되어있기 때문에 일부분 필요한 것만 골라서 사용할 때도 유용할테니 참고 바랍니다. 우선, 이 작업에서 사용할 모듈들입니다. import pandas as pd from sklearn.datasets import load_iris # iris data불러오기 import numpy as np csv로 변환하고 데이터프레임으로 만들어줄 pandas, 사이킷런에서 제공하는 데이터를 받아올 load_iris, array형식으로 되어있는 데이터를 처리해줄 numpy 우선 ir.. Study/Python 2022.03.17
[Python]Pycaret을 이용해서 타이타닉 머신러닝하기 인터넷을 휘적거리다가 우연히 pycaret이라는 모듈을 발견했다. 아주 쉽고 간편하게 머신러닝을 돌릴 수 있도록 해준다. 소개란에도 뭐 대중화를 위해 만들었다고 한다~ https://pycaret.gitbook.io/docs/get-started/installation Installation - PyCaret Official With PyCaret, you can train models on GPU and speed up your workflow by 10x. To train models on GPU simply pass use_gpu = True in the setup function. There is no change in the use of the API, however, in some cases,.. Study/Python 2022.02.28
Python groupyby 두가지 변수로 묶어서 정렬하기 시군구와 계약년월을 행과 열로 같은 것끼지 묶고 싶다면? test = pd.DataFrame() test = df.groupby(['시군구', '계약년월'])['㎡당 가격(만원)'].mean() test = test.unstack() 이렇게 된다. Study/Python 2021.12.01
폴더 속 모든 csv파일 하나의 dataframe으로 합치기 import pandas as pd from glob import glob file_names = glob("서울시학원정보(2016~2021)/*.csv") #폴더 내의 모든 csv파일 목록을 불러온다 total = pd.DataFrame() #빈 데이터프레임 하나를 생성한다 for file_name in file_names: temp = pd.read_csv(file_name, encoding='cp949') #csv파일을 하나씩 열어 임시 데이터프레임으로 생성한다 total = pd.concat([total, temp]) #전체 데이터프레임에 추가하여 넣는다 Study/Python 2021.11.29
[Python]for문 돌리면서 루프마다 새로운 변수 선언하기 여러개를 포문돌려서 처리하려는데 매번 새로운 변수를 선언해버리는 방법은 없을까?????????????? 항상 이걸 몰랐다 근데 찾았다. 연도별 아파트매매, 상업업무용 매매에 대한 정보를 합쳐야한다..후 http://rtdown.molit.go.kr/ http://rtdown.molit.go.kr/ rtdown.molit.go.kr 여기서 다운받았다. 2016, 2017년 등등 데이터프레임으로 만들어야하는데 언제 노가다함.. import pandas as pd year = [2016,2017,2018,2019,2020,2021] for j in year: globals()['apart{}'.format(j)] = pd.read_csv(f'./gangseo/{j}아파트매매.csv', encoding='cp9.. Study/Python 2021.11.12
[Python]DataFrame 특정 행에서 원하는 정보만 골라내기 데이터 전처리를 하다보면 하나의 행에서 원하는 값만 뽑아내고 싶을 때가 있다. 대충 예시를 위해 만들어본 csv파일 여기서 1번컬럼에서 J가 들어가는 것들만 뽑아내고 싶다고 한다면? import pandas as pd df = pd.read_csv('test.csv', encoding='cp949') j_df = df[df['1번컬럼'].str.contains('J')] # j_df = df[df['1번컬럼'].str.contains('J', na=False)] Study/Python 2021.11.12