Lọc dữ liệu sử dụng csvkit

Submitted by tinhxleev2 on Tue, 09/21/2021 - 09:01

Vì dữ liệu csv được lưu ở dạng bảng nên có thể lọc dữ liệu theo cột hoặc hàng bằng các tạo một bảng con từ bảng chính. Lưu ý khi lọc dữ liệu đó là lọc cột trước xong mới tới hàng. 

csvcut lọc dữ liệu theo cột, bằng tên hoặc vị trí

csvcut -h

Xem hướng dẫn. 

Sử dụng 

csvcut --name ten_file.csv hoặc csvcut -n ten_file.csv để in tên cột

Sử dụng 

csvcut -c 1 ten_file.csv

để lấy cột có thứ tự thứ nhất, thay vì lấy theo thứ tự thì có thể lấy theo tên

csvcut -c "ten_cot" ten_file.csv

Nếu muốn lấy nhiều cột theo thứ tự ví dụ 3, 4 thì 

csvcut -c 3,4 ten_file.csv

tương tự 

csvcut -c "ten_cot_3","ten_cot_4" ten_file.csv

csvgrep lọc dữ liệu theo hàng, chính xác khớp từ, pattern hoặc regex, tương ứng với -m, -r, -f.

csvgrep -c "ten_cot" -m GIA_TRI ten_file.csv, lệnh này sẽ trả hàng có ten cột chứa giá trị GIA_TRI

 

Tags

Learing