データを数値の羅列として眺めるだけではなく、グラフ表示したり、平均や分散などの統計量を抽出することによってデータの分布や広がりを理解できるようになります。右表に示した「性別」、「身長」、「体重」のデータをもとに説明します。以下に掲載されているデータの身長、体重の単位をそれぞれcm, kgに変換しました。https://www.kaggle.com/mustafaali96/weight-height 元データのデータ件数は10000件ありますが、ここでは一部のみを表示しています。 身長や体重の値を小区分(ビン: bin)に分けて、その区分内にあるデータの件数を数えることでデータの分布を視覚的に表現することができます。このようなグラフをヒストグラムと言います。図1.2 に身長と体重のヒストグラムを示します。身長と体重のようにデータ間の関係を示すには散布図が便利です。図1.3では横軸に身長、縦軸に体重をとって各人の位置を男性は青点、女性は赤点で表示しています。データをその属性によってグループ分けしたとき、各グループの割合を示すには円グラフが便利です。図1.4に千葉大学の2021年度入学者数の学部別の割合を示します。データの視覚的表現方法データからの情報抽出第1部性別身長(cm)体重(kg) Male187.57109.72Male174.7173.62Male188.2496.50Male182.2099.81Male177.5093.60Male170.8269.04Male174.7183.43Male173.6176.19Male170.2379.80Male161.1870.94表1:身長と体重のデータ図1.2:身長(左)と体重(右)のヒストグラム図1.3:身長と体重の男女別散布図図1.4:千葉大学入学者数(2021年)の学部別割合看護学部教育学部理学部工学部園芸学部医学部薬学部国際教養学部文学部法政経学部6
元のページ ../index.html#6