728x90

Python 27

[Python] 패키지 목록 requirement.txt 만들기

보통 requirements.txt를 만들때, pip freeze > requirements.txt 이렇게 단순하게 진행한다. 그런데, 이런 경우 간혹 @가 붙으면서 잡스러운 내용이 나오고 파일만으로 설치하기 힘든 경우가 있다. 그래서 단순하게 패키지 버전만 출력할 수 있는 코드를 가지고 왔다. pip list --format=freeze > requirements.txt 이러면 패키지 이름과 버전만 저장되기 때문에 아주 범용적이고 개꿀이다.

Study/Python 2024.01.18

[Python] for문을 활용해서 list, dictionary를 만들 때, 사소한 꿀팁

python입문을 하고 list를 배우고 dictionary를 배우고 반복문을 배우면 반복문을 통해 데이터를 처리할 때가 많습니다. 그 중에선 반복문을 활용해서 list와 같은 데이터를 만들게 되죠 쉽게 생각하면 다음과 같이 만듭니다. %%time c = [] for i in range(10_000_000): c.append(i) %%time은 로직 수행시간을 측정하고자 입력한 값입니다. 꽤 빠르지만 수치가 높죠? 하나하나 append하면 오래걸린답니다. 이럴 때는 for문을 한줄로 쓰고 한번에 리스트로 넣어버리세요 %%time a = [ i for i in range(10_000_000)] 속도차이가 상당히 많이 난다. 반복문을 [ ] 로 묶으면 결과물이 리스트로 묶이고 { }로 묶으면 딕셔너리로 묶인..

Study/Python 2023.02.13

KoBERT를 이용한 한국어 7가지 감성 분석

작년에 이 분야를 배우기 시작하면서 진행했던 감성 분석은 기본 중의 기본 같은 느낌이었다. 당시에는 뭘 어떻게 해야하는 지? 데이터는 어떻게 다뤄야하는 지? 뭐가 어떻게 돌아가는 건지? 등등 개념이 제대로 잡히지 않은 상태에서 진행했던 프로젝트였다. (물론 지금도 제대로 잡혔다는 건 아니지만...적어도 1년동안 발전했으니까) 나는 당시 프로젝트를 되게 자랑스럽게 생각했지만 부족한 부분이 많았다. 이후로 더 공부하다보니 요즘 자연어처리는 Transformer계열이 대세라고 했다. 사실 대세가 된 지 좀 시간이 흘렀다. 어찌되었든 대학원에서도 자연어처리 수업을 들으며 그리고 개인적으로 공부하고 논문을 읽어보며 100% 이해는 못했지만 어느정도 이해는 했고 직접 써봐야겠다는 생각이 들었다. 그렇게 작년에 하지..

[Python] 시퀀스 자료형 (리스트, 튜플, 문자열)

시퀀스 자료형 종류 : 문자열, 리스트, 튜플 등 특징 : 1) 여러 객체를 저장 2) 순서 있음 3) 인덱스를 사용해 참조 가능 [시퀀스형의 공통 연산] 색인 : s[k] 슬라이싱 : s[start : end : step] 연결 : s1 + s2 반복 : s * number_of_repeat 멤버쉽 테스트 : member in sequence 길이 정보 len(sequence) [리스트] mutable : 요소의 치환이 가능 리스트는 가장 보편적인 시퀀스형 리스트에 요소를 추가하는 메소드 : append(), extend(), insert() 리스트에서 요소를 삭제하는 메소드 : remove(), pop() lst = [4,3,2.0,0,'text'] >>> [4, 3, 2.0, 0, 'text'] l..

Study/Python 2022.08.03

[Kaggle]Bike Sharing Demand 예측하기

저번 포스팅에서는 데이터를 전처리하여 시각화하여 직관적으로 바라보는 방법에 대해서 알아보았다. 이번 포스팅에서는 데이터를 실제로 적용하고 점수를 확인하려고 한다. import pandas as pd # 데이터 경로 data_path = '/kaggle/input/bike-sharing-demand/' train = pd.read_csv(data_path + 'train.csv') # train data test = pd.read_csv(data_path + 'test.csv') # test data submission = pd.read_csv(data_path + 'sampleSubmission.csv') # submission sample data point plot에서 weather값이 4인 경우 이..

[프로그래머스] 신고 결과 받기

https://school.programmers.co.kr/learn/courses/30/lessons/92334 프로그래머스 코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요. programmers.co.kr 더보기 문제 설명 문제 설명 신입사원 무지는 게시판 불량 이용자를 신고하고 처리 결과를 메일로 발송하는 시스템을 개발하려 합니다. 무지가 개발하려는 시스템은 다음과 같습니다. 각 유저는 한 번에 한 명의 유저를 신고할 수 있습니다. 신고 횟수에 제한은 없습니다. 서로 다른 유저를 계속해서 신고할 수 있습니다. 한 유저를 여러 번 신고할 수도 있지만, 동일한 유저에 대한 신고 횟수는 1회로 처리됩니..

코딩테스트 2022.07.11

[Python]Sckit-Learn에 있는 데이터를 csv로 만들기

머신러닝 오픈소스 중 하나인 사이킷런에서는 여러가지 머신러닝용 데이터를 제공한다. 그런데 이런 데이터들을 하나의 csv파일로 정리해서 출력할 수는 없을까? 아주 간단한 방법으로 해당 작업을 진행하였다. pandas의 데이터처리 방법도 포함이 되어있기 때문에 일부분 필요한 것만 골라서 사용할 때도 유용할테니 참고 바랍니다. 우선, 이 작업에서 사용할 모듈들입니다. import pandas as pd from sklearn.datasets import load_iris # iris data불러오기 import numpy as np csv로 변환하고 데이터프레임으로 만들어줄 pandas, 사이킷런에서 제공하는 데이터를 받아올 load_iris, array형식으로 되어있는 데이터를 처리해줄 numpy 우선 ir..

Study/Python 2022.03.17

[Python]Pycaret을 이용해서 타이타닉 머신러닝하기

인터넷을 휘적거리다가 우연히 pycaret이라는 모듈을 발견했다. 아주 쉽고 간편하게 머신러닝을 돌릴 수 있도록 해준다. 소개란에도 뭐 대중화를 위해 만들었다고 한다~ https://pycaret.gitbook.io/docs/get-started/installation Installation - PyCaret Official With PyCaret, you can train models on GPU and speed up your workflow by 10x. To train models on GPU simply pass use_gpu = True in the setup function. There is no change in the use of the API, however, in some cases,..

Study/Python 2022.02.28

[프로그래머스] 자릿수 더하기, 정수 내림차순으로 배치하기

문제링크 : https://programmers.co.kr/learn/courses/30/lessons/12931 코딩테스트 연습 - 자릿수 더하기 자연수 N이 주어지면, N의 각 자릿수의 합을 구해서 return 하는 solution 함수를 만들어 주세요. 예를들어 N = 123이면 1 + 2 + 3 = 6을 return 하면 됩니다. 제한사항 N의 범위 : 100,000,000 이하의 자연수 입출 programmers.co.kr 넘 쉬웠다. def solution(n): answer = 0 n = str(n) for i in n: answer += int(i) return answer 꼼수긴 한데 문자열로 바꿔주고 각 글자 하나씩 들여와서 int로 바꿔주고 더해준다. Simple 다른 사람들도 보니까..

코딩테스트 2021.12.07
728x90