<address id="zhpbl"></address>
<noframes id="zhpbl">
<address id="zhpbl"><form id="zhpbl"><th id="zhpbl"></th></form></address>

    <em id="zhpbl"></em>

      <address id="zhpbl"><th id="zhpbl"><progress id="zhpbl"></progress></th></address>
      更多精彩內容,歡迎關注:

      視頻號
      視頻號

      抖音
      抖音

      快手
      快手

      微博
      微博

      Python數據分析處理(三)--運動員信息的分組與聚合

      導讀這篇文章主要介紹了根據Python數據清洗與處理的相關資料,展開運動員信息的分組與聚合的文章內容。首先使用pd.read_csv(f,skiprows=0,header=0)進行數據的讀取,并且將數據轉換成為dataframe的格式給對象,做初始化,方便后面進行數據的分析。
      1、 數據的爬取

      代碼:

      import?pandas?as?pd
      f?=?open('運動員信息表.csv')
      data=pd.read_csv(f,skiprows=0,header=0)
      print(data)

      運行結果:

      首先使用pd.read_csv(f,skiprows=0,header=0)進行數據的讀取,并且將數據轉換成為dataframe的格式給對象,做初始化,方便后面進行數據的分析。

      2、統計男籃、女籃運動員的平均年齡、身高、體重

      代碼:

      sex=data[["年齡(歲)","身高(cm)","體重(kg)"]].groupby(data["性別"])
      
      print(sex.mean())

      運行結果:

      首先我們先把數據提取出來做個分組,先把"年齡(歲)",“身高(cm)”,"體重(kg)"這三行數據提取出來再根據性別進行分組。

      sex=data[["年齡(歲)","身高(cm)","體重(kg)"]].groupby(data["性別"])

      然后再調用mean()求平均值,求出男籃、女籃運動員的平均年齡、身高、體重。

      3、統計男籃運動員年齡、身高、體重的極差值

      代碼:

      sex=data[["年齡(歲)","身高(cm)","體重(kg)"]].groupby(data["性別"])
      basketball_male=dict([x?for?x?in?sex])['男']
      basketball_male
      #求極差
      def?range_data_group(arr):
      ????return?arr.max()-arr.min()
      #進行每列不同的聚合
      basketball_male.agg({
      "年齡(歲)":range_data_group,"身高(cm)":range_data_group,"體重(kg)":range_data_group
      })

      運行結果:

      首先提取數據:

      單行循環提取數據,dict([x for x in sex])在循環體內的語句只有一行的情況的下,可以簡化for循環的書寫。定義一個函數def range_data_group(arr):求極差;

      極差的求法:使用最大值減去最小值。就得到極差。

      agg()函數:DataFrame.agg(*func*,*axis = 0*,* args*,*** kwargs* )*

      func : 函數,函數名稱,函數列表,字典{‘行名/列名’,‘函數名’}

      使用指定軸上的一個或多個操作進行聚合。

      需要注意聚合函數操作始終是在軸(默認是列軸,也可設置行軸)上執行,不同于 numpy聚合函數

      最后我們可以得到三列數據:分別對應"年齡(歲)",“身高(cm)”,“體重(kg)”。

      4 、統計男籃運動員的體質指數4.1添加體重指數

      代碼:

      data["體質指數"]=0
      data

      運行結果:

      添加一行體重指數:data[“體質指數”]=0

      4.2計算bmi值并添加數據

      代碼:

      #?計算bmi數值
      def?outer(num):
      ????def?bminum(sumbim):
      ????????weight=data["身高(cm)"]
      ????????height=data["體重(kg)"]
      ????????sumbim=weight/(height/100)**2
      ????????return?num+sumbim
      ????return?bminum

      將該行數據添加上去:

      代碼:

      #?調用函數
      bimdata=data["體質指數"]
      data["體質指數"]=data[["體質指數"]].apply(outer(bimdata))
      data

      運行結果:

      編寫函數計算bmi數值 outer(num);然后再使用apply的方法將自定義的函數應用到"體質指數"這一列。然后計算出該列的值之后進行賦值。

      data[“體質指數”]=data[[“體質指數”]].apply(outer(bimdata))97622)]

      編寫函數計算bmi數值 outer(num) ;然后再使用apply的方法將自定義的函數應用到"體質指數"這一列。然后計算出該列的值之后進行賦值。

      data[“體質指數”]=data[[“體質指數”]].apply(outer(bimdata))

      到此這篇關于Python數據分析處理,運動員信息的分組與聚合的文章就介紹到這了。更多相關Python數據分析處理內容請搜索好二三四,希望大家以后多多支持好二三四!

      為你推薦
      資訊專欄
      熱門視頻
      相關推薦
      基于Python實現PDF區域文本提取工具 詳解python的循環 python實現新年倒計時實例代碼 Python實現消消樂小游戲 學習python的while循環嵌套 提升Python運行速度的5個小技巧 Python按鍵或值對字典進行排序 圖像檢索之基于vlfeat實現SIFT特征 python繪圖中的四個繪圖技巧 js中toString方法3個作用 信息系統項目管理師報考條件 信息系統項目管理師報考時間 信息系統項目管理師報名時間 信息系統項目管理師考試時間 pmp與信息系統項目管理師 信息系統項目管理師報考要求 信息系統項目管理師有效期 信息系統項目管理師考什么論文 信息系統項目管理師是什么類別 軟考信息系統項目管理師怎么備考 備考流程有哪些 Python實現城市公交網絡分析與可視化 Python&nbsp;垃圾回收機制詳解 python正則表達式語法學習筆記 一文秒懂python正則表達式常用函數 Python常用的正則表達式處理函數詳解 JS截取字符串的三種方法詳解 PHP遍歷數組的6種方式總結 php兩種基本的輸出方及實例詳解 php生成唯一uid的解決方法詳解 PHP7中對十六進制字符串處理的問題詳解 PHP對接抖音開發平臺接口的詳細教程 php7安裝mysqli實例講解 php去掉一維數組的鍵值的實例方法 PHP中empty()和isset()的區別介紹 PHP實現JWT的Token登錄認證 php判斷時間戳是否為今天實例講解 PHP7 preg_replace出錯及解決辦法 五年班的學習計劃怎么寫 五年級的學習計劃 初中新學期學習計劃怎么寫 關于英語的學習計劃怎么寫
      Top 少妇高潮太爽了在线视频