平均・中央値・標準偏差・四分位数を計算——まずデータをクリーニング
記述統計はデータセットをいくつかの数値に要約します:中心 (平均、中央値)、散らばり(標準偏差、IQR)、極端な値(最小値、最大値)。しかし 実世界のデータはほとんど清潔ではありません——-999・N/A・ その他のセンチネルコードとしてエンコードされた欠損値が含まれ、すべての計算を歪めます。
このツールには名前・年齢・給与・部門を持つ30人の従業員のサンプルデータセットが 読み込まれています——給与列に-999センチネル値が数件含まれています。 データをリンクをクリックして悪い値が平均にどう影響するか確認し、 AIにクリーニングして再計算するよう依頼してください。差は劇的なはずです。
独自のCSVを貼り付けてデータの統計を計算できます。