728x90

Study 29

[Python] DataFrame에서 null이 들어있는 행만 보고 삭제하기

데이터를 다루다보면 null값이 들어있는 데이터가 상당히 많습니다. 이 값들을 어떻게 처리할 지에 대해서 항상 고민이 되는데요 이 포스팅에선 Row에 들어있는 null값들만 확인하고 그 행들만 삭제하는 방법을 알아보겠습니다. import pandas as pd import numpy as np dogs = np.random.choice(['labradoodle','beagle','mutt','Golden Retrievers', 'Greyhound','French Bulldog','Shih Tzu',None], size=50_000) smell = np.random.randint(0, 100, size = 50_000) location = np.random.choice(['Korea','China','Un..

Study/Python 2023.02.07

주피터 노트북 한글 깨짐 해결방법

맥 + 윈도우 모두 범용으로 쓸 수 있는 코드 걍 시작할때 이거 넣고 시작하면 편합니당 import matplotlib.pyplot as plt # 사용자 운영체제 확인 import platform platform.system() # 운영체제별 한글 폰트 설정 if platform.system() == 'Darwin': # Mac 환경 폰트 설정 plt.rc('font', family='AppleGothic') elif platform.system() == 'Windows': # Windows 환경 폰트 설정 plt.rc('font', family='Malgun Gothic') plt.rc('axes', unicode_minus=False) # 마이너스 폰트 설정 matplotlibrc 파일을 찾아서 메..

Study/Python 2022.11.21

docker Nvidia driver version dismatch

https://passwd.tistory.com/entry/nvidia-smi-Failed-to-initialize-NVML-Driverlibrary-version-mismatch [nvidia-smi] Failed to initialize NVML: Driver/library version mismatch Nvidia GPU를 사용하는 서버에서 nvidia-smi 명령어 수행 시 아래와 같이 에러 메시지가 출력되면서 동작하지 않는 경우가 있다. dmesg 명령을 사용하면 아래와 같은 NVRM: API mismatch 메세지를 볼 수 있는 passwd.tistory.com 위 포스팅 참고하기

Study/참고사항 2022.08.16

[Python] 시퀀스 자료형 (리스트, 튜플, 문자열)

시퀀스 자료형 종류 : 문자열, 리스트, 튜플 등 특징 : 1) 여러 객체를 저장 2) 순서 있음 3) 인덱스를 사용해 참조 가능 [시퀀스형의 공통 연산] 색인 : s[k] 슬라이싱 : s[start : end : step] 연결 : s1 + s2 반복 : s * number_of_repeat 멤버쉽 테스트 : member in sequence 길이 정보 len(sequence) [리스트] mutable : 요소의 치환이 가능 리스트는 가장 보편적인 시퀀스형 리스트에 요소를 추가하는 메소드 : append(), extend(), insert() 리스트에서 요소를 삭제하는 메소드 : remove(), pop() lst = [4,3,2.0,0,'text'] >>> [4, 3, 2.0, 0, 'text'] l..

Study/Python 2022.08.03

[요구사항 확인] 소프트웨어 개발 방법론 종류와 간단한 특징

​소프트웨어 개발 방법론 - 소프트웨어 개발 방법론은 스프트웨어 개발 전체 과정에 지속적으로 작용하는 절차이자 기법이다. 소프트웨어 개발 방법론 종류 구조적 방법론 : 기능에 따라 나누어 개발하고 이를 통합 정보공학 방법론 : 개발에 필요한 관리 절차와 작업 기법을 체계화한 방법론 객체 지향 방법론 : '객체'라는 기본 단위로 시스템을 분석하고 설계하는 방법론 컴포넌트 기반 방법론(CBD) : 소프트웨어를 구성하는 컴포넌트를 조립해서 하나의 새로운 프로그램을 작성하는 방법론 애자일 방법론 : 절차보다는 사람이 중심이 되어 유연하고 신속하면서도 효율적인 개발을 할 수 있는 방법론 제품 계열 방법론 : 특정 제품에 적용하고 싶은 공통의 기능을 정의하여 개발하는 방법

[요구사항 확인] 소프트웨어 생명주기 모델

소프트웨어 생명주기(SDLC ; Software Development Life Cycle) 모델 - 시스템의 요구분석부터 유지보수까지 모든 공정을 체계화한 절차 - 시스템 개발될 때부터 운용과 유지보수를 거쳐서 생애를 마칠 때까지 어떤 순서를 진행하는 지에 대한 작업 프로세스를 모델화한 것 [SDLC 프로세스] 요구사항 분석 → 설계 → 구현 → 테스트 → 유지보수 (1) 요구사항 분석 - 다양한 이해관계자의 요구사항을 고려하여 제품에 부합되는 요구와 조건을 결정하는 단계 - 개발할 소프트웨어의 기능과 제약 조건 그리고 목표 등을 소프트웨어 사용자와 함께 명확히 정의하는 단계 - 기능 요구사항, 비기능 요구사항이 있음 (2) 설계 - 시스템 명세 단계에서 정의한 기능을 수행할 방법을 논리적으로 결정 - ..

[Python]Sckit-Learn에 있는 데이터를 csv로 만들기

머신러닝 오픈소스 중 하나인 사이킷런에서는 여러가지 머신러닝용 데이터를 제공한다. 그런데 이런 데이터들을 하나의 csv파일로 정리해서 출력할 수는 없을까? 아주 간단한 방법으로 해당 작업을 진행하였다. pandas의 데이터처리 방법도 포함이 되어있기 때문에 일부분 필요한 것만 골라서 사용할 때도 유용할테니 참고 바랍니다. 우선, 이 작업에서 사용할 모듈들입니다. import pandas as pd from sklearn.datasets import load_iris # iris data불러오기 import numpy as np csv로 변환하고 데이터프레임으로 만들어줄 pandas, 사이킷런에서 제공하는 데이터를 받아올 load_iris, array형식으로 되어있는 데이터를 처리해줄 numpy 우선 ir..

Study/Python 2022.03.17
728x90