728x90
λ°μν
νλ‘κ·Έλλ° μΈκ³λ₯Ό νꡬν©μλ€.
2, 3νΈμ μ΄ν κ²μκΈ μ°Έκ³ λ°λλλ€.
< νκ΅μ λ ₯κ±°λμ μκ°λ³ μ λ ₯μμλ λ°μ΄ν° μμ§ >
[μμ§ μμΉ]
https://www.data.go.kr/data/15065266/fileData.do
[μμ§ νμΌ]
νκ΅μ λ ₯κ±°λμ_μκ°λ³ μ λ ₯μμλ_20211231.csv
μμ± μ½λ
"""
<νκ΅μ λ ₯κ±°λμ μκ°λ³ μ λ ₯μμλ λ°μ΄ν° μμ§>
- μμ§μμΉ : data.go.kr
"""
import pandas as pd
### λ°μ΄ν° λΆλ¬λ€μ΄κΈ°
# - λ°μ΄ν°νλ μ λ³μλͺ
: df
file_path = "./01_data/νκ΅μ λ ₯κ±°λμ_μκ°λ³ μ λ ₯μμλ_20211231.csv"
df = pd.read_csv(file_path, encoding="euc-kr")
df
κ²°μΈ‘λ°μ΄ν° νμΈ
### κ²°μΈ‘λ°μ΄ν° νμΈν΄λ³΄κΈ°
df.info()
μ΄μμΉ λ°μ΄ν° νμΈ
### μ΄μμΉ λ°μ΄ν° νμΈνκΈ°
df.describe()
컬λΌλͺ μΆμΆνκΈ°
### 컬λΌλͺ
μ μκ°μ λ°μ΄ν°ννκΈ° μνμ¬
# - 컬λΌλͺ
μΆμΆνκΈ°
col_list = df.columns
col_list
1. 3κ°μ μ΄(λ λ, μκ°, μ λ ₯λ)μ κ°μ§λ λ°μ΄ν°νλ μ μμ±νκΈ°
result_df = pd.DataFrame(columns = ["λ
λ", "μκ°", "μ λ ₯λ"])
result_df
col_list[0]
col_list[1:]
λ°μ΄ν°νλ μμ λ°μ΄ν° νλ¨μ μΆκ°νκΈ°
### λ°μ΄ν°νλ μμ λ°μ΄ν° νλ¨μ μΆκ°νκΈ°
for index, row in df.iterrows() :
# print(row)
### λ
λ λ°μ΄ν°
ymd = row[col_list[0]]
### μκ°κ³Ό μ λ ₯λ λ°μ΄ν°
data = row[col_list[1:]]
# print(data)
### μκ°κ³Ό μ λ ₯κ±μ κ°κ° μΆμΆνμ¬ λ°μ΄ν°νλ μμ λ£κΈ°
# - λ£μ κ° : λ μ§, μκ°, μ λ ₯λ
for time, value in data.items():
# print(ymd, "/", time, "/", value)
### νλ¨μλ‘ λ°μ΄ν°νλ μμ μΆκ°νκΈ° μν΄μ μμλ‘ λ°μ΄ν°νλ μ μμ±
df_temp = pd.DataFrame({"λ
λ":[ymd], "μκ°":[time], "μ λ ₯λ":[value]})
### λ°μ΄ν°νλ μμ νλ¨μλ‘ μΆκ°νκΈ°
# - concat() : λ°μ΄ν°νλ μκ³Ό λ°μ΄ν°νλ μμ νλ¨μ
# λλ 컬λΌλ¨μ(axis=1)λ‘ μΆκ°ν λ μ¬μ©
# - ignore_index=True : νμ΄ μΆκ°λ λ ν μΈλ±μ€ λ²νΈλ₯Ό μλμ¦κ° μν€κΈ°
# : κΈ°λ³Έκ° False
result_df = pd.concat([result_df, df_temp], axis=0, ignore_index=True)
### μ΅μ’
κ²°κ³Ό μΆλ ₯νκΈ°
result_df
μ μ λ λ°μ΄ν° νμΌλ‘ μ μ₯νκΈ°
### μ μ₯ν κ²½λ‘ μ§μ
save_path = "./01_data/new_data.csv"
### index=False : μΈλ±μ€ λ²νΈκ°μ μ μ₯νμ§ μκΈ°(κΈ°λ³Έκ° True)
result_df.to_csv(save_path, index=False)
728x90
λ°μν