728x90
간혹 코딩을 하다보면 테스트를 하기 위해서 혹은 샘플이 필요해서 데이터프레임을 만들고 싶을 때가 있다.
그때마다
student_card = pd.DataFrame({'ID':[20190103, 20190222, 20190531],
'name':['Kim', 'Lee', 'Jeong'],
'class':['H', 'W', 'S']})
이런식으로 만드려고한다면 여간 머리가 지끈지끈해지는게 아니다.
게다가 한번에 대용량의 데이터를 만들 수가 없다.
하지만 아래의 방법을 쓴다면 누구나 쉽게 내가 원하는 크기의 데이터프레임을 만들 수 있다.
import pandas as pd
import numpy as np
size = 10_000
df = pd.DataFrame()
df['position'] = np.random.choice(["left", 'middle','right'], size)
df['age'] = np.random.randint(1, 50, size)
df['color'] = np.random.choice(["red", 'blue','yellow','green'], size)
df['win'] = np.random.choice(["yes", 'no'], size)
df['prob'] = np.random.uniform(0, 1, size)
random기능들은 알아서 확인해보시라
위 코드를 돌리면 아래와 같이 나온다.
쉽고 간단하게 아주 큰 데이터프레임을 만들었다.
728x90
'Study > Python' 카테고리의 다른 글
[Python] 패키지 목록 requirement.txt 만들기 (0) | 2024.01.18 |
---|---|
[Python]한글 깨짐 (0) | 2023.08.17 |
[Python] for문을 활용해서 list, dictionary를 만들 때, 사소한 꿀팁 (0) | 2023.02.13 |
[Python] DataFrame에서 null이 들어있는 행만 보고 삭제하기 (0) | 2023.02.07 |
주피터 노트북 한글 깨짐 해결방법 (0) | 2022.11.21 |