當(dāng)涉及到數(shù)據(jù)清洗時(shí),Python有許多強(qiáng)大的庫可以幫助你。以下是一個(gè)使用pandas庫進(jìn)行數(shù)據(jù)清洗的示例代碼: import pandas as pd # 讀取CSV文件 data = pd.read_csv('data.csv') # 刪除重復(fù)行 data = data.drop_duplicates() # 刪除缺失值 data = data.dropna() # 去除空格 data['column_name'] = data['column_name'].str.strip() # 更改列名 data = data.rename(columns={'old_column_name': 'new_column_name'}) # 更改數(shù)據(jù)類型 data['column_name'] = data['column_name'].astype('int') # 過濾數(shù)據(jù) data = data[data['column_name'] > 10] # 排序數(shù)據(jù) data = data.sort_values(by='column_name', ascending=False) # 重置索引 data = data.reset_index(drop=True) # 保存清洗后的數(shù)據(jù) data.to_csv('cleaned_data.csv', index=False) 這只是一個(gè)簡(jiǎn)單的示例,你可以根據(jù)你的具體需求進(jìn)行相應(yīng)的修改和擴(kuò)展。記得先安裝pandas庫,可以使用`pip install pandas`命令來安裝。 |
|