๋ฐ์ํ
โ Data Load & ์ปฌ๋ผ ์ญ์ ๋ฐ ์์
# Data Load
# Indicator์ ์ญ์ ํ๊ณ First Tooltip ์ปฌ๋ผ์์ ์ ๋ขฐ๊ตฌ๊ฐ์ ํด๋นํ๋ ํํ์ ์ง์ฐ๊ธฐ
df = pd.read_csv(DataUrl)
df.drop('Indicator', axis=1, inplace=True)
df['First Tooltip'] = df['First Tooltip'].map(lambda x : float(x.split("[")[0]))
Ans = df
Ans.head(4)
โ ํน์ ์ผ์ด์ค ์ถ์ถ
# ๋
๋๊ฐ 2015๋
์ด์, Dim1์ด Both sexes์ธ ์ผ์ด์ค๋ง ์ถ์ถ
target = df[(df.Period >= 2015) & (df.Dim1 == 'Both sexes')]
Ans = target
Ans.head(3)
โ ํน์ ์กฐ๊ฑด ๋ฐ์ดํฐ ํ๋ ์ํ ํ๊ธฐ
# ๋๋ผ์ ๋ฐ๋ฅธ ๋
๋๋ณ ์ฌ๋ง๋ฅ ์ ๋ฐ์ดํฐ ํ๋ ์ํ ํ๊ธฐ
Ans = target.pivot(index='Location',columns='Period',values='First Tooltip')
Ans.head(3)
โ Data Load (์ฌ๋ฆผํฝ ๋ฉ๋ฌ๋ฆฌ์คํธ) & ํ๊ตญ ๋ฐ์ดํฐ๋ง ์ถ์ถ
# Data Load
df = pd.read_csv(DataUrl)
# ํ๊ตญ ๋ฐ์ดํฐ๋ง ์ถ์ถํ๊ธฐ
kr = df[df.Country == 'KOR']
Ans = kr
Ans.head(4)
โ ํ๊ตญ ์ฌ๋ฆผํฝ ๋ฉ๋ฌ๋ฆฌ์คํธ ๋ฐ์ดํฐ์์ ๋ ๋์ ๋ฐ๋ฅธ medal ๊ฐฏ์๋ฅผ ๋ฐ์ดํฐํ๋ ์ํ
# ํ๊ตญ ์ฌ๋ฆผํฝ ๋ฉ๋ฌ๋ฆฌ์คํธ ๋ฐ์ดํฐ์์ ๋
๋์ ๋ฐ๋ฅธ medal ๊ฐฏ์๋ฅผ ๋ฐ์ดํฐํ๋ ์ํ
Ans = kr.pivot_table(index='Year',columns='Medal',aggfunc='size').fillna(0)
Ans
โ ์ ์ฒด ๋ฐ์ดํฐ์์ Sport ์ข ๋ฅ์ ๋ฐ๋ฅธ ์ฑ๋ณ์๋ฅผ ๊ตฌํ๋ผ
# ์ ์ฒด ๋ฐ์ดํฐ์์ Sport ์ข
๋ฅ์ ๋ฐ๋ฅธ ์ฑ๋ณ์๋ฅผ ๊ตฌํ๋ผ
Ans = df.pivot_table(index='Sport',columns='Gender',aggfunc='size')
Ans
โ ์ ์ฒด ๋ฐ์ดํฐ์์ Discipline ์ข ๋ฅ์ ๋ฐ๋ฅธ ์ฑ๋ณ์๋ฅผ ๊ตฌํ๋ผ
# ์ ์ฒด ๋ฐ์ดํฐ์์ Discipline ์ข
๋ฅ์ ๋ฐ๋ฅธ Medal ์๋ฅผ ๊ตฌํ๋ผ
Ans = df.pivot_table(index='Discipline',columns='Medal',aggfunc='size')
Ans
๋ฐ์ํ
'Python' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[Python]Pandas _ Merge, Concat (0) | 2023.08.29 |
---|---|
[Python] Pandas _ Time Series (0) | 2023.08.24 |
[Python] Pandas _ Apply, Map (0) | 2023.08.24 |
[Python] Pandas data ์ฒ๋ฆฌ (0) | 2023.05.01 |
[Python] Pandas data: auto-mpg data ์๊ฐํ (0) | 2023.04.30 |