一、实验目的
二、实验环境金希澈李菲儿
本次实验使用的是Python语言及相关库:结婚纪念日发朋友圈
- Python 3.7.7
- Pandas 1.3.3
三、实验步骤
1.数据准备
首先,我们需要获取数据。本实验使用的数据是从IOC上获取的。将数据下载到本地后,
使用Pandas读取数据,并进行清洗和处理。
2.数据清洗
本次数据清洗过程主要针对缺失值和异常值的处理。首先,我们查看数据中是否存在缺失值和重复值:
```
data.isnull().sum() #查看每列中有多少缺失值
data.duplicated().sum() #查看是否存在重复数据
```
经过查看,我们发现数据中不存在缺失值和重复值。
接下来,我们需要对数据进行异常值的处理。在这里,我们发现有些国家在某些年份并未参加比赛,这部分数据的运动员数量均为0。为了后续数据分析的准确性,我们设置这些数据的金牌数量为0。
李素妍个人资料
交强险保什么内容```
place({0: pd.np.nan}, inplace=True) #将0替换为缺失值
data.fillna(0, inplace=True) #将缺失值替换为0
```
3.数据统计
接下来,我们需要根据国家进行分组,并计算每个国家在所有年份内的金牌总数。为了方便分析,我们将数据按照金牌总数进行降序排列。
```
grouped_data = upby(['country']).sum().sort_values(by=['gold'], ascending=False)
```胡沈员介绍
最后,我们将得到一个DataFrame,其中包含了所有国家的金牌总数。
四、实验结果
经过数据处理和统计,我们得到了以下结果:
```
country gold
sugizo 徐若瑄RUS 44.0
发布评论