728x90

Study 29

[Python]Pycaret을 이용해서 타이타닉 머신러닝하기

인터넷을 휘적거리다가 우연히 pycaret이라는 모듈을 발견했다. 아주 쉽고 간편하게 머신러닝을 돌릴 수 있도록 해준다. 소개란에도 뭐 대중화를 위해 만들었다고 한다~ https://pycaret.gitbook.io/docs/get-started/installation Installation - PyCaret Official With PyCaret, you can train models on GPU and speed up your workflow by 10x. To train models on GPU simply pass use_gpu = True in the setup function. There is no change in the use of the API, however, in some cases,..

Study/Python 2022.02.28

자료구조 B-tree 기본 개념 파악 (2)

저번 시간에 이어서 시간복잡도 개념을 아주아주 간단하게 개념만 익히는 포스팅을 하고자 한다. 처음에 이게 뭐 어쩌라고 싶은 내용이었는데 깊게 들어가면 어려운데 가볍게 이해하는 정도는 어렵지 않았다. 시간복잡도는 간단하게 말하면 알고리즘이 한번 도는데 걸리는 시간을 나타낸다! 예를 들면 오늘 하루의 계획이라는 알고리즘이 있다고 하자 오늘의 계획 1. 광화문에서 점심 약속 2. 합정에서 쇼핑하기 3. 강남에서 저녁 약속 4. 헬스장 가기 여기서! 각 지점에 어떻게 도달할 지는 사람마다 다를 것이다! 누구는 버스를 타고 누구는 택시를 타고 누구는 걸어서 혹은 지하철을 타고 혹은 환승하고 다양한 계획을 가지고 각각 다를 것인데 이렇게 진행하는 과정에서 걸리는 시간을 시간복잡도라고 이해하면 좋다. 최상의 경우 :..

Study 2021.12.27

자료구조 B-tree 기본 개념 파악 (1)

한양대학교 연구실에 지원하면서 B-tree에 대해서 공부하였다. 컴퓨터 공학을 전공하지 않고 국비로 급하게 공부한 입장에서 자료구조의 중요성은 익히 들었지만 제대로 공부하진 않았었는데 이번 기회에 하나의 개념에 대해서는 꽤나 깊게 공부하였다. 1. 자료구조 B-tree 개념 파악 2. 시간복잡도(Time Complexity) 및 공간복잡도 개념 파악 3. 트리 종류 여러 개 파악하면 좋지만 그 중에서도 가장 관련성 높은 이진 트리(binary tree) 개념 파악 4. B-tree 개념 다시 숙지 5. 왜 B-tree인지 파악 B-tree는 Balanced Tree의 일종이다. 항상 밸런스를 유지해서 편향되지 않고 노드레벨이 편향된 것에 비해서 효율이 좋다. 이진트리 같은 경우 한쪽으로 편향될 경우 시간..

Study 2021.12.21

맥북 M1에 Homebrew 설치하는 방법

노트북이 필요해서 뭐 살까하다가 가성비 좋은 맥북에어를 샀다. 본격적으로 깃허브 사용법도 배워보고 이것저것 해볼라고 하니 homebrew라는 것을 설치해주는 것이 좋대서 다운 시도 근데 뭐가 안되서 한참 지웠다가 깔았다가 했다. 일단 사이트는 brew.sh Homebrew The Missing Package Manager for macOS (or Linux). brew.sh 이분 블로그보고 참고하였다. m1은 인텔맥과 다르게 brew가 /usr/local/에 설치되지 않고 homebrew 자체적으로 opt/homebrew/ 디렉토리를 생성해서 다른 패키지들고 그 안에서 관리한다고 하네요 homebrew는 맥OS용 패키지 관리 어플리케이션이다. 쉽게 말해 집사 같은 역할을 한다. 일단 이분이 있어야 다른 ..

Study/참고사항 2021.12.14

폴더 속 모든 csv파일 하나의 dataframe으로 합치기

import pandas as pd from glob import glob file_names = glob("서울시학원정보(2016~2021)/*.csv") #폴더 내의 모든 csv파일 목록을 불러온다 total = pd.DataFrame() #빈 데이터프레임 하나를 생성한다 for file_name in file_names: temp = pd.read_csv(file_name, encoding='cp949') #csv파일을 하나씩 열어 임시 데이터프레임으로 생성한다 total = pd.concat([total, temp]) #전체 데이터프레임에 추가하여 넣는다

Study/Python 2021.11.29

[Python]for문 돌리면서 루프마다 새로운 변수 선언하기

여러개를 포문돌려서 처리하려는데 매번 새로운 변수를 선언해버리는 방법은 없을까?????????????? 항상 이걸 몰랐다 근데 찾았다. 연도별 아파트매매, 상업업무용 매매에 대한 정보를 합쳐야한다..후 http://rtdown.molit.go.kr/ http://rtdown.molit.go.kr/ rtdown.molit.go.kr 여기서 다운받았다. 2016, 2017년 등등 데이터프레임으로 만들어야하는데 언제 노가다함.. import pandas as pd year = [2016,2017,2018,2019,2020,2021] for j in year: globals()['apart{}'.format(j)] = pd.read_csv(f'./gangseo/{j}아파트매매.csv', encoding='cp9..

Study/Python 2021.11.12

[Python]DataFrame 특정 행에서 원하는 정보만 골라내기

데이터 전처리를 하다보면 하나의 행에서 원하는 값만 뽑아내고 싶을 때가 있다. 대충 예시를 위해 만들어본 csv파일 여기서 1번컬럼에서 J가 들어가는 것들만 뽑아내고 싶다고 한다면? import pandas as pd df = pd.read_csv('test.csv', encoding='cp949') j_df = df[df['1번컬럼'].str.contains('J')] # j_df = df[df['1번컬럼'].str.contains('J', na=False)]

Study/Python 2021.11.12
728x90