Pivoting DataFrames

Submitted by tinhxleev2 on Thu, 05/14/2020 - 07:31

Thông thường DataFrames thiết lập có dạng không giống phù hợp với cái chúng ta đang cần. Một ví dụ dataframe dưới đây thiết lập từ file dieutri.csv

import pandas as pd

df = pd.read_csv('dieutri.csv')

    id  điều trị  giới tính  phản ứng
0   1         A      Nữ         5
1   2         A      Nam        3
2   3         B      Nữ         8
3   4         B      Nam        9

Dataframe df này bao gồm 4 hàng, và 4 cột id, điều trị, giới tínhphản ứng

Nhiều khi mình quan tâm tới liên hệ liệu trình điều trị, giới tính và phản ứng, thì mình cần định hình lại dataframe. 

Sau khi .pivot 

df.pivot(index = 'điều trị',

         columns = 'giới tính',            

         values = 'phản ưng')

Kết quả

giới tính  Nữ Nam
điều trị      
A          5  3
B          8  9

Từ bảng này bạn có thể so sánh phản ứng của giới tính đối với phương pháp điều trị A của Nữ nhiều hơn Nam và phương pháp điều trị B hiệu quả hơn so với A.

Nếu không chỉ rõ values khi dùng .pivot thì Python sẽ tự động chia cột.