ํ๋ก๊ทธ๋๋ฐ ์ธ๊ณ๋ฅผ ํ๊ตฌํฉ์๋ค.
2,3 ํธ์ ์๋ ๊ฒ์๊ธ ์ฐธ๊ณ ๋ฐ๋๋๋ค.
< 1. ํฌํญ์ BIS ๊ตํต์นด๋ ์ฌ์ฉ๋ด์ญ ๋ฐ์ดํฐ ์์ง >
< ๋ถ์ ์ฃผ์ >
- ๋์ฃผ์ : ํฌํญ์ ๋ฒ์ค ์ด์ฉ๋ ๋ถ์
- ์์ฃผ์
(๋ฒ์ค ์ด์ฉ๋ ๋ถ์)
* ๊ธฐ์ค์ ๋ฐ ๊ธฐ์ค์ผ์๋ณ ๋ฒ์ค ์ด์ฉ๋ ๋ถ์ ๋น๊ต
* ๊ธฐ์ค์ผ ๋ฐ ์๊ฐ๋๋ณ ๋ฒ์ค ์ด์ฉ๋ ๋ถ์ ๋น๊ต
* ๊ธฐ์ค์๊ฐ ๋ฐ ์๊ฐ(๋ถ)๋ณ ๋ฒ์ค ์ด์ฉ๋ ๋ถ์ ๋น๊ต
(๋ฒ์ค ๋ด ์ฒด๋ฅ์๊ฐ ๋ถ์)
* ๊ธฐ์ค์ ๋ฐ ๊ธฐ์ค์ผ์๋ณ ๋ฒ์ค ์ฒด๋ฅ์๊ฐ ๋ถ์ ๋น๊ต
* ๊ธฐ์ค์ผ ๋ฐ ๊ธฐ์ค์ผ์๋ณ ๋ฒ์ค ์ฒด๋ฅ์๊ฐ ๋ถ์ ๋น๊ต
* ๊ธฐ์ค์๊ฐ ๋ฐ ์๊ฐ(๋ถ)๋ณ ๋ฒ์ค ์ฒด๋ฅ์๊ฐ ๋ถ์ ๋น๊ต
* ์นํ์ฐจ์ ๋ฅ์ฅ ๊ตฌ๊ฐ๋ณ ๋ฒ์ค ๋ด ์ฒด๋ฅ์๊ฐ
- ์ฒด๋ฅ์๊ฐ(๋ถ) ์์ 30๊ฑด ๋ถ์ ๋น๊ต
- URL : ๊ตญ๊ฐ๊ตํต ๋ฐ์ดํฐ ์คํ๋ง์ผ
๊ตญ๊ฐ๊ตํต ๋ฐ์ดํฐ ์คํ๋ง์ผ (bigdata-transportation.kr)
ํ์ผ ์ด๋ฆ ๋ณ๊ฒฝ
๊ฐ๊ฐ ํ์ผ๋ก ์์ถ์ ํ๋๋ค.
๋ค์ด๋ก๋๋ฐ์ ํ์ผ ์ค ์ฒซ ๋ฒ์งธ ํ์ผ์ ์ด๋ฆ ๋ค์ (0)์ ๋ถ์ ๋๋ค.
๋ผ์ด๋ธ๋ฌ๋ฆฌ ์ ์
### ๋ผ์ด๋ธ๋ฌ๋ฆฌ ์ ์
import pandas as pd
< ํ ๊ฑด ์ํ๋งํ๊ธฐ >
- ์ฌ๋ฌ ๊ฐ์ ํ์ผ ๋ฐ์ดํฐ๋ฅผ ํตํฉํ๋ ๊ฒฝ์ฐ์๋
- ํ ๊ฐ ํ์ผ์ ๊ธฐ์ค์ผ๋ก ์ฌ์ฉํ ์ปฌ๋ผ์ ์ ์ํ์ฌ ๊ฐ๊ณต ํ
- ๋ฐ๋ณต ์ฒ๋ฆฌํ๋ฉด ํธํฉ๋๋ค.
0๋ฒ ํ์ผ์ csv ๋ฐ์ดํฐ ์ฝ์ด๋ค์ด๊ธฐ
### 0๋ฒ ํ์ผ์ csv ๋ฐ์ดํฐ ์ฝ์ด๋ค์ด๊ธฐ
# - ๋ฐ์ดํฐํ๋ ์ ์ด๋ฆ : df_bus_cart_org
file_path = "./01_data/org/trfcard(0)/trfcard.csv"
df_bus_card_org = pd.read_csv(file_path)
df_bus_card_org
๊ฒฐ์ธก์น๊ฐ ์๋์ง ์ ๋ณด ํ์ธํ๊ธฐ
### ๊ฒฐ์ธก์น๊ฐ ์๋์ง ์ ๋ณด ํ์ธํ๊ธฐ
df_bus_card_org.info()
๊ธฐ์ดํต๊ณํ์ธ : ์ด์์น ๋ฐ์ดํฐ ํ์ธํ๊ธฐ
### ๊ธฐ์ดํต๊ณํ์ธ : ์ด์์น ๋ฐ์ดํฐ ํ์ธํ๊ธฐ
df_bus_card_org.describe
< ์๋ฌธ ์ปฌ๋ผ๋ช ์ ํ๊ธ๋ก ์์ ํ๊ธฐ >
๋ฉํ์ ์์์ ์๋ฌธ๋ช , ํ๊ธ๋ช ์ปฌ๋ผ ์ฝ์ด๋ค์ด๊ธฐ
### ๋ฉํ์ ์์์ ์๋ฌธ๋ช
, ํ๊ธ๋ช
์ปฌ๋ผ ์ฝ์ด๋ค์ด๊ธฐ
# - ๋ฐ์ดํฐํ๋ ์ ์ด๋ฆ : df_bus_cart_col_org
file_path = "./01_data/org/trfcard(0)/trfcard_columns.xlsx"
df_bus_card_col_org = pd.read_excel(file_path,
header=2,
usecols="B:C")
df_bus_card_col_org.head(1)
df_bus_cart_col_org์ ๋ฐ์ดํฐ๋ฅผ ๋์ ๋๋ฆฌ๋ก ๋ณํํ๊ธฐ
### ์ปฌ๋ผ๋ช
์ ์ด๋ฆ์ ๋งคํํ์ฌ ๋ณ๊ฒฝํ๊ธฐ ์ํด์๋
# - ์ปฌ๋ผ๋ช
์ ๊ฐ์ key : value ๋์
๋๋ฆฌ ํ์
์ผ๋ก ์ ์ํด์ผ ํจ
# ์์ : {์๋ฌธ๋ช
: ํ๊ธ๋ช
, ์๋ฌธ๋ช
: ํ๊ธ๋ช
....}
### df_bus_cart_col_org์ ๋ฐ์ดํฐ๋ฅผ ๋์
๋๋ฆฌ๋ก ๋ณํํ๊ธฐ
# - iloc[ํ๋ฒํธ, ์ด๋ฒํธ] : ์ธ๋ฑ์ค ๋ฒํธ๋ฅผ ์ด์ฉํ๋ ๋ฐฉ์
print(df_bus_card_col_org.iloc[0, 0])
print(df_bus_card_col_org.iloc[0, 1])
print(df_bus_card_col_org.iloc[1, 0])
print(df_bus_card_col_org.iloc[1, 1])
print("-------------")
# - loc[ํ๊ฐ, ์ด๊ฐ] : ๋์ ๋ณด์ด๋ ์ธ๋ฑ์ค ๊ฐ์ ์ด์ฉํ๋ ๋ฐฉ์
print(df_bus_card_col_org.loc[0, "์ปฌ๋ผ๋ช
(์๋ฌธ)" ])
print(df_bus_card_col_org.loc[0, "์ปฌ๋ผ๋ช
(ํ๊ธ)" ])
df_bus_card_col_org ๋ฐ์ดํฐํ๋ ์์ ๋์ ๋๋ฆฌ๋ก ๋ณํ
### df_bus_card_col_org ๋ฐ์ดํฐํ๋ ์์ ๋์
๋๋ฆฌ๋ก ๋ณํ
# - ๋์
๋๋ฆฌ ๋ณ์๋ช
: df_bus_card_col_new_dict
# - ์๋ฌธ๋ช
์ key๋ก, ํ๊ธ๋ช
์ value๋ก ๋ง๋ค์ด ์ฃผ์ธ์.
# ์์ : {'on_date" : '์น์ฐจ์๊ฐ', 'off-date' : 'ํ์ฐจ์๊ฐ' ...}
# df_bus_cart_col_org ๋ฐ์ดํฐํ๋ ์์ ๋์
๋๋ฆฌ๋ก ๋ณํ
df_bus_card_col_new_dict = {}
for k, v in zip(df_bus_card_col_org.iloc[:, 0], df_bus_card_col_org.iloc[:, 1]) :
# print(k, v)
df_bus_card_col_new_dict[k] = v
df_bus_card_col_new_dict
์ปฌ๋ผ๋ช ๋ณ๊ฒฝํ๊ธฐ
### ์ปฌ๋ผ๋ช
๋ณ๊ฒฝํ๊ธฐ
# df_bus_card_org = df_bus_card_org.rename(columns = df_bus_card_col_new_dict)
df_bus_card_org.rename(columns = df_bus_card_col_new_dict, inplace=True)
< ๋ถ์ ์ฃผ์ >
- ๋์ฃผ์ : ํฌํญ์ ๋ฒ์ค ์ด์ฉ๋ ๋ถ์
- ์์ฃผ์
(๋ฒ์ค ์ด์ฉ๋ ๋ถ์)
* ๊ธฐ์ค์ ๋ฐ ๊ธฐ์ค์ผ์๋ณ ๋ฒ์ค ์ด์ฉ๋ ๋ถ์ ๋น๊ต
* ๊ธฐ์ค์ผ ๋ฐ ์๊ฐ๋๋ณ ๋ฒ์ค ์ด์ฉ๋ ๋ถ์ ๋น๊ต
* ๊ธฐ์ค์๊ฐ ๋ฐ ์๊ฐ(๋ถ)๋ณ ๋ฒ์ค ์ด์ฉ๋ ๋ถ์ ๋น๊ต
(๋ฒ์ค ๋ด ์ฒด๋ฅ์๊ฐ ๋ถ์)
* ๊ธฐ์ค์ ๋ฐ ๊ธฐ์ค์ผ์๋ณ ๋ฒ์ค ์ฒด๋ฅ์๊ฐ ๋ถ์ ๋น๊ต
* ๊ธฐ์ค์ผ ๋ฐ ๊ธฐ์ค์ผ์๋ณ ๋ฒ์ค ์ฒด๋ฅ์๊ฐ ๋ถ์ ๋น๊ต
* ๊ธฐ์ค์๊ฐ ๋ฐ ์๊ฐ(๋ถ)๋ณ ๋ฒ์ค ์ฒด๋ฅ์๊ฐ ๋ถ์ ๋น๊ต
* ์นํ์ฐจ์ ๋ฅ์ฅ ๊ตฌ๊ฐ๋ณ ๋ฒ์ค ๋ด ์ฒด๋ฅ์๊ฐ
- ์ฒด๋ฅ์๊ฐ(๋ถ) ์์ 30๊ฑด ๋ถ์ ๋น๊ต
< ๋ถ์์ ์ํ ๋ฐ์ดํฐ ๊ฐ๊ณตํ๊ธฐ >
์น์ฐจ์๊ฐ๊ณผ ํ์ฐจ์๊ฐ ๋ฐ์ดํฐ ํ์ ์ ๋ฌธ์์ด๋ก ๋ณํํ๊ธฐ
### ๋ฐ์ดํฐํ๋ ์ ๋ณต์ ํ๊ธฐ
df_bus_card_kor = df_bus_card_org.copy()
### ์น์ฐจ์๊ฐ๊ณผ ํ์ฐจ์๊ฐ ๋ฐ์ดํฐ ํ์
์ ๋ฌธ์์ด๋ก ๋ณํํ๊ธฐ
# - astype() : ๋ฐ์ดํฐ ํ๋ณํ ํจ์
df_bus_card_kor = df_bus_card_kor.astype({"์น์ฐจ์๊ฐ" : "str",
"ํ์ฐจ์๊ฐ" : "str"})
df_bus_card_kor.info()
๋ถ์์ ํ์ํ ์ปฌ๋ผ ์ถ์ถํ๊ธฐ
### ๋ถ์์ ํ์ํ ์ปฌ๋ผ ์ถ์ถํ๊ธฐ
df_bus_card = df_bus_card_kor[["์น์ฐจ์๊ฐ", "ํ์ฐจ์๊ฐ", "์น๊ฐ์ฐ๋ น", "ํ์น์ฌ๋ถ",
"์ถ๊ฐ์ด์์ฌ๋ถ", "์น์ฐจ์ ๋ฅ์ฅ", "ํ์ฐจ์ ๋ฅ์ฅ"]].copy()
df_bus_card.head()
์น์ฐจ์๊ฐ๊ณผ ํ์ฐจ์๊ฐ์ ๋ฐ์ดํฐํ์ ์ ๋ ์งํ์ ์ผ๋ก ๋ณ๊ฒฝํ๊ธฐ
### ์น์ฐจ์๊ฐ๊ณผ ํ์ฐจ์๊ฐ์ ๋ฐ์ดํฐํ์
์ ๋ ์งํ์
์ผ๋ก ๋ณ๊ฒฝํ๊ธฐ
df_bus_card["์น์ฐจ์๊ฐ"] = pd.to_datetime(df_bus_card_kor.loc[:, "์น์ฐจ์๊ฐ"])
df_bus_card["ํ์ฐจ์๊ฐ"] = pd.to_datetime(df_bus_card_kor.loc[:, "ํ์ฐจ์๊ฐ"])
df_bus_card.info()
๋ฒ์ค ๋ด ์ฒด๋ฅ์๊ฐ(๋ถ๋จ์) ์ปฌ๋ผ๋ง๋ค๊ธฐ
### ๋ฒ์ค ๋ด ์ฒด๋ฅ์๊ฐ(๋ถ๋จ์) ์ปฌ๋ผ๋ง๋ค๊ธฐ
# - ์ปฌ๋ผ๋ช
: ๋ฒ์ค๋ด์ฒด๋ฅ์๊ฐ(๋ถ)
round((df_bus_card.iloc[0, 1] - df_bus_card.iloc[0, 0]).total_seconds()/60,2)
์ฒด๋ฅ์๊ฐ(๋ถ) ๊ณ์ฐ ๋ฐ ์ปฌ๋ผ ์์ฑ
df_bus_card["๋ฒ์ค๋ด์ฒด๋ฅ์๊ฐ(๋ถ)"] = round((df_bus_card["ํ์ฐจ์๊ฐ"] - \
df_bus_card["์น์ฐจ์๊ฐ"]).dt.total_seconds()/60,2)
df_bus_card
๊ธฐ์ค๋ ๋, ๊ธฐ์ค์, ๊ธฐ์ค์ผ, ๊ธฐ์ค์๊ฐ, ๊ธฐ์ค์๊ฐ(๋ถ) ์ปฌ๋ผ ์์ฑํ๊ธฐ
### ๊ธฐ์ค๋
๋, ๊ธฐ์ค์, ๊ธฐ์ค์ผ, ๊ธฐ์ค์๊ฐ, ๊ธฐ์ค์๊ฐ(๋ถ) ์ปฌ๋ผ ์์ฑํ๊ธฐ
# - ๊ธฐ์ค๋
๋
df_bus_card["๊ธฐ์ค๋
๋"] = df_bus_card["์น์ฐจ์๊ฐ"].dt.year
# - ๊ธฐ์ค์
df_bus_card["๊ธฐ์ค์"] = df_bus_card["์น์ฐจ์๊ฐ"].dt.month
# - ๊ธฐ์ค์ผ
df_bus_card["๊ธฐ์ค์ผ"] = df_bus_card["์น์ฐจ์๊ฐ"].dt.day
# - ๊ธฐ์ค์๊ฐ
df_bus_card["๊ธฐ์ค์๊ฐ"] = df_bus_card["์น์ฐจ์๊ฐ"].dt.hour
# - ๊ธฐ์ค์๊ฐ(๋ถ)
df_bus_card["๊ธฐ์ค์๊ฐ(๋ถ)"] = df_bus_card["์น์ฐจ์๊ฐ"].dt.minute
< ํฌํญ์ BIS ๊ตํต์นด๋ ์ฌ์ฉ๋ด์ญ ๋ฐ์ดํฐ ์์ง >
๋ถ์ ์ฃผ์
- ๋์ฃผ์ : ํฌํญ์ ๋ฒ์ค ์ด์ฉ๋ ๋ถ์
- ์์ฃผ์
(๋ฒ์ค ์ด์ฉ๋ ๋ถ์)
* ๊ธฐ์ค์ ๋ฐ ๊ธฐ์ค์ผ์๋ณ ๋ฒ์ค ์ด์ฉ๋ ๋ถ์ ๋น๊ต
* ๊ธฐ์ค์ผ ๋ฐ ์๊ฐ๋๋ณ ๋ฒ์ค ์ด์ฉ๋ ๋ถ์ ๋น๊ต
* ๊ธฐ์ค์๊ฐ ๋ฐ ์๊ฐ(๋ถ)๋ณ ๋ฒ์ค ์ด์ฉ๋ ๋ถ์ ๋น๊ต
(๋ฒ์ค ๋ด ์ฒด๋ฅ์๊ฐ ๋ถ์)
* ๊ธฐ์ค์ ๋ฐ ๊ธฐ์ค์ผ์๋ณ ๋ฒ์ค ์ฒด๋ฅ์๊ฐ ๋ถ์ ๋น๊ต
* ๊ธฐ์ค์ผ ๋ฐ ๊ธฐ์ค์ผ์๋ณ ๋ฒ์ค ์ฒด๋ฅ์๊ฐ ๋ถ์ ๋น๊ต
* ๊ธฐ์ค์๊ฐ ๋ฐ ์๊ฐ(๋ถ)๋ณ ๋ฒ์ค ์ฒด๋ฅ์๊ฐ ๋ถ์ ๋น๊ต
* ์นํ์ฐจ์ ๋ฅ์ฅ ๊ตฌ๊ฐ๋ณ ๋ฒ์ค ๋ด ์ฒด๋ฅ์๊ฐ
- ์ฒด๋ฅ์๊ฐ(๋ถ) ์์ 30๊ฑด ๋ถ์ ๋น๊ต
- URL : ๊ตญ๊ฐ๊ตํต ๋ฐ์ดํฐ ์คํ๋ง์ผ
๊ตญ๊ฐ๊ตํต ๋ฐ์ดํฐ ์คํ๋ง์ผ (bigdata-transportation.kr)
์ ์ฒด ํ์ผ ํตํฉํ๊ธฐ
[ ์ด์ ๊ฒ์๊ธ ํ ๊ฑด ์ํ ํ๋ก์ธ์ค๋ฅผ ํ์ฉํ์ฌ ์ ์ฒด ํ์ผ ํตํฉํ๊ธฐ ]
### ์ต์ข
ํตํฉ ๋ฐ์ดํฐํ๋ ์ ์ด๋ฆ : df_bus_card_tot
from datetime import datetime
### ํตํฉ ์์ ์๊ฐ
start_date = datetime.today().strftime("%Y-%m-%d %H:%M:%S")
# Initialize an empty DataFrame to store the concatenated data
df_bus_card_tot = pd.DataFrame()
# 0~79๊น์ง ํด๋์ ์ ๊ทผํ๊ธฐ ์ํ ๋ฐ๋ณต ์ํ
for i in range(0, 80, 1) :
### 0๋ฒ ํ์ผ์ csv ๋ฐ์ดํฐ ์ฝ์ด๋ค์ด๊ธฐ
# - ๋ฐ์ดํฐํ๋ ์ ์ด๋ฆ : df_bus_cart_org
file_path = f"./01_data/org/trfcard({i})/trfcard.csv"
df_bus_card_org = pd.read_csv(file_path)
# print(i, " / ", len(df_bus_card_org))
### ๋ฉํ์ ์์์ ์๋ฌธ๋ช
, ํ๊ธ๋ช
์ปฌ๋ผ ์ฝ์ด๋ค์ด๊ธฐ
# - ๋ฐ์ดํฐํ๋ ์ ์ด๋ฆ : df_bus_cart_col_org
file_path = f"./01_data/org/trfcard({i})/trfcard_columns.xlsx"
df_bus_card_col_org = pd.read_excel(file_path,
header=2,
usecols="B:C")
# print(i, "/", len(df_bus_card_col_org))
### df_bus_card_col_org ๋ฐ์ดํฐํ๋ ์์ ๋์
๋๋ฆฌ๋ก ๋ณํ
# - ๋์
๋๋ฆฌ ๋ณ์๋ช
: df_bus_card_col_new_dict
# - ์๋ฌธ๋ช
์ key๋ก, ํ๊ธ๋ช
์ value๋ก ๋ง๋ค์ด ์ฃผ์ธ์.
# ์์ : {'on_date" : '์น์ฐจ์๊ฐ', 'off-date' : 'ํ์ฐจ์๊ฐ' ...}
# df_bus_cart_col_org ๋ฐ์ดํฐํ๋ ์์ ๋์
๋๋ฆฌ๋ก ๋ณํ
df_bus_card_col_new_dict = {}
for k, v in zip(df_bus_card_col_org.iloc[:, 0], df_bus_card_col_org.iloc[:, 1]) :
# print(k, v)
df_bus_card_col_new_dict[k] = v
### ์ปฌ๋ผ๋ช
๋ณ๊ฒฝํ๊ธฐ
# df_bus_card_org = df_bus_card_org.rename(columns = df_bus_card_col_new_dict)
df_bus_card_org.rename(columns = df_bus_card_col_new_dict, inplace=True)
### ๋ฐ์ดํฐํ๋ ์ ๋ณต์ ํ๊ธฐ
df_bus_card_kor = df_bus_card_org.copy()
### ์น์ฐจ์๊ฐ๊ณผ ํ์ฐจ์๊ฐ ๋ฐ์ดํฐ ํ์
์ ๋ฌธ์์ด๋ก ๋ณํํ๊ธฐ
# - astype() : ๋ฐ์ดํฐ ํ๋ณํ ํจ์
df_bus_card_kor = df_bus_card_kor.astype({"์น์ฐจ์๊ฐ" : "str",
"ํ์ฐจ์๊ฐ" : "str"})
### ๋ถ์์ ํ์ํ ์ปฌ๋ผ ์ถ์ถํ๊ธฐ
df_bus_card = df_bus_card_kor[["์น์ฐจ์๊ฐ", "ํ์ฐจ์๊ฐ", "์น๊ฐ์ฐ๋ น", "ํ์น์ฌ๋ถ",
"์ถ๊ฐ์ด์์ฌ๋ถ", "์น์ฐจ์ ๋ฅ์ฅ", "ํ์ฐจ์ ๋ฅ์ฅ"]].copy()
### ์น์ฐจ์๊ฐ๊ณผ ํ์ฐจ์๊ฐ์ ๋ฐ์ดํฐํ์
์ ๋ ์งํ์
์ผ๋ก ๋ณ๊ฒฝํ๊ธฐ
df_bus_card["์น์ฐจ์๊ฐ"] = pd.to_datetime(df_bus_card_kor.loc[:, "์น์ฐจ์๊ฐ"])
df_bus_card["ํ์ฐจ์๊ฐ"] = pd.to_datetime(df_bus_card_kor.loc[:, "ํ์ฐจ์๊ฐ"])
### ์ฒด๋ฅ์๊ฐ(๋ถ) ๊ณ์ฐ ๋ฐ ์ปฌ๋ผ ์์ฑ
df_bus_card["๋ฒ์ค๋ด์ฒด๋ฅ์๊ฐ(๋ถ)"] = round((df_bus_card["ํ์ฐจ์๊ฐ"] - \
df_bus_card["์น์ฐจ์๊ฐ"]).dt.total_seconds()/60,2)
### ๊ธฐ์ค๋
๋, ๊ธฐ์ค์, ๊ธฐ์ค์ผ, ๊ธฐ์ค์๊ฐ, ๊ธฐ์ค์๊ฐ(๋ถ) ์ปฌ๋ผ ์์ฑํ๊ธฐ
# - ๊ธฐ์ค๋
๋
df_bus_card["๊ธฐ์ค๋
๋"] = df_bus_card["์น์ฐจ์๊ฐ"].dt.year
# - ๊ธฐ์ค์
df_bus_card["๊ธฐ์ค์"] = df_bus_card["์น์ฐจ์๊ฐ"].dt.month
# - ๊ธฐ์ค์ผ
df_bus_card["๊ธฐ์ค์ผ"] = df_bus_card["์น์ฐจ์๊ฐ"].dt.day
# - ๊ธฐ์ค์๊ฐ
df_bus_card["๊ธฐ์ค์๊ฐ"] = df_bus_card["์น์ฐจ์๊ฐ"].dt.hour
# - ๊ธฐ์ค์๊ฐ(๋ถ)
df_bus_card["๊ธฐ์ค์๊ฐ(๋ถ)"] = df_bus_card["์น์ฐจ์๊ฐ"].dt.minute
# print(f"{i} / {len(df_bus_card)}")
df_bus_card_tot = pd.concat([df_bus_card_tot, df_bus_card],
axis=0, ignore_index=True)
### ํตํฉ ์ข
๋ฃ ์๊ฐ
end_date = datetime.today().strftime("%Y-%m-%d %H:%M:%S")
print(f"์ ์ฒด ์คํ ์๊ฐ ==> {start_date} ~ {end_date}")
print(f"df_bus_card_tot ==? {len(df_bus_card_tot)}")
### ์ต์ข
๊ฒฐ๊ณผ ํ์ธํ๊ธฐ : ์ธ๋ฑ์ค ๋ฒํธ ํ์ธ
df_bus_card_tot
ํตํฉ ๋ฐ์ดํฐํ๋ ์ ์ ์ฅ์ํค๊ธฐ
์ ์ฅ ํ์ผ ์์น : all ํด๋
์ ์ฅ ํ์ผ ๋ช
: ๋ฐ์ดํฐํ๋ ์ ๋ณ์๋ช
๊ณผ ๋์ผํ๊ฒ
ํ์ฅ์ : csv
# ์ ์ฅ ํ์ผ ์์น ๋ฐ ํ์ผ๋ช
์ค์
save_path = "./01_data/all/df_bus_card_tot.csv"
# df_bus_card_tot ๋ฐ์ดํฐํ๋ ์์ CSV ํ์ผ๋ก ์ ์ฅ
df_bus_card_tot.to_csv(save_path, index=False)
print(f"๋ฐ์ดํฐํ๋ ์์ด ์ฑ๊ณต์ ์ผ๋ก ์ ์ฅ๋์์ต๋๋ค. ํ์ผ ๊ฒฝ๋ก: {save_path}")