Categoricals and groupby

Submitted by tinhxleev2 on Tue, 06/02/2020 - 01:42

Sử dụng pivot để lọc và định hình lại dataframe.

Trong mục này mình giới thiệu cách sử dụng groupby

Tìm hiểu dữ liệu bán hàng của các sản phẩm sau đây, trong đó có sales của muối và bơ.

sales = pd.DataFrame(

   {

'ngaytrongtuan': ['Chunhat', 'Chunhat', 'Thuhai', 'Thuhai'],

'thanhpho': ['Hochiminh', 'Danang', 'Hochiminh', 'Danang'],

'banhmy': [312, 510, 560, 750], 'bo': [30, 60, 75, 113]

   }

    )

# Kết quả

 ngaytrongtuan   thanhpho  banhmy   bo
0       Chunhat  Hochiminh     312   30
1       Chunhat     Danang     510   60
2        Thuhai  Hochiminh     560   75
3        Thuhai     Danang     750  113

Mình có thể dùng 

sales.loc[sales['ngaytrongtuan'] == 'Chunhat'].count()

Để tổng hợp sales điển hình, kết quả này đểm tổng các con số điển hình của sale các ngày trong tuần ở các thành phố. Trường hợp này sử dụng được khi biết Chunhat là thành phần trong ngaytrongtuan.

ngaytrongtuan    2
thanhpho         2
banhmy           2
bo               2

Nếu sử dụng groupby

sales.groupby('ngaytrongtuan').count()

#kết quả

    thanhpho  banhmy  bo
ngaytrongtuan
Chunhat               2       2   2
Thuhai                2       2   2