《数据处理与可视化》实验报告
目录
一、 实验内容
二、 数据读取
1. import pandas as pd
三、 数据清洗
四、 数据可视化
这是清洗前的数据,可以看到订阅用户占比为86.15%
五、 相关性分析
1. import pandas as pd
六、 感想总结
一、 实验内容
Ø 数据读取
Ø 数据清洗
Ø 数据可视化
Ø 相关性分析
二、 数据读取
首先,需要进行导包操作:
1. import pandas as pd
2. import numpy as np
接着,用pandas来进行对csv中数据的读取:
1. df = pd.read_csv("201506-citibike-tripdata.csv")
2. print(df.head())
输出前五行,得到如下结果:
可以看到,读取成功。
三、 数据清洗
首先,先看是否有空值:
1. print(df.isnull().sum())
发现有空值,删除空值所在行并保存数据到cleanedDate.csv:
1. df = df.dropna()
2. df.to_csv("cleanedData.csv")