中僅保留年份(年份處理技巧詳解)
1. 日期和時間數據類型
2. 提取年份的方法
3. 處理不同格式的日期數據
4. 案例分析統計數據中的年份分布
日期和時間數據類型
eeee三個類,分別用于表示日期、時間和日期時間。
onth和day。einutedicrosecond。eonthinutedicrosecond。
提取年份的方法
如果我們只需要提取日期數據中的年份,可以使用date類的year屬性來實現。例如
porte
e.date(2021, 11, 11)
year = d.yeart(year) 2021
處理不同格式的日期數據
有些情況下,我們需要處理不同格式的日期數據。例如,有些數據中的日期格式可能是“2021/11/11”,而有些數據中的日期格式可能是“11-11-2021”。
e函數將字符串轉換成日期對象,然后再提取年份。
例如,將字符串“2021/11/11”轉換成日期對象,并提取年份
porte
s = '2021/11/11'eee/%d')
year = d.yeart(year) 2021
同樣地,將字符串“11-11-2021”轉換成日期對象,并提取年份
porte
s = '11-11-2021'eee-%Y')
year = d.yeart(year) 2021
e函數中的格式字符串需要與日期字符串的格式一致。
案例分析統計數據中的年份分布
假設我們有一份包含日期數據的CSV文件,文件名為data.csv,數據格式如下
2020-01-01
2020-02-01
2021-03-01
2021-04-01
2021-05-01
2022-06-01
現在我們需要統計數據中每年的數據量。
e模塊將字符串轉換成日期對象,提取年份,并使用字典統計每年的數據量。
port csvporte
t = {}
('data.csv', 'r') as f
reader = csv.reader(f)ext(reader) 跳過表頭 reader
date_str = row[0]eee-%d')
year = date_obj.yeartt[year] += 1
elset[year] = 1
輸出結果為
{2020 2, 2021 3, 2022 1}
可以看到,數據中2020年有2條,2021年有3條,2022年有1條。