Study/Python

[Python]샘플용 데이터프레임 쉽게 생성하기

SigmoidFunction 2023. 11. 17. 07:48
728x90

간혹 코딩을 하다보면 테스트를 하기 위해서 혹은 샘플이 필요해서 데이터프레임을 만들고 싶을 때가 있다.

 

그때마다 

student_card = pd.DataFrame({'ID':[20190103, 20190222, 20190531],
                             'name':['Kim', 'Lee', 'Jeong'],
                             'class':['H', 'W', 'S']})

이런식으로 만드려고한다면 여간 머리가 지끈지끈해지는게 아니다.

 

게다가 한번에 대용량의 데이터를 만들 수가 없다.

 

하지만 아래의 방법을 쓴다면 누구나 쉽게 내가 원하는 크기의 데이터프레임을 만들 수 있다.

 

 

import pandas as pd
import numpy as np

size = 10_000
df = pd.DataFrame()
df['position'] = np.random.choice(["left", 'middle','right'], size)
df['age'] = np.random.randint(1, 50, size)
df['color'] = np.random.choice(["red", 'blue','yellow','green'], size)
df['win'] = np.random.choice(["yes", 'no'], size)
df['prob'] = np.random.uniform(0, 1, size)

random기능들은 알아서 확인해보시라

 

위 코드를 돌리면 아래와 같이 나온다.

 

 

쉽고 간단하게 아주 큰 데이터프레임을 만들었다.

728x90