Unit Testing for Data Science in Python

Submitted by tinhxleev2 on Thu, 11/04/2021 - 04:02

Hầu hết các dự án về khoa học dữ liệu sẽ cần một unit testing. Việc này bảo đảm tiết kiệm thời gian phát triển và bảo trì cho hệ thống. 

Giả sử có một hàm python

def my_function(argument): 

     ...

Nếu muốn thử hàm này đúng chuẩn chưa bạn chỉ cần đưa một vài arg vào để xem kết quả. Nhưng thực ra cách này không thực sự hiệu quả, nếu bạn nhìn tổng thể vào một dữ án khoa học dữ liệu, vòng đời của của hàm. 

Xem qua vòng đời của một hàm python trong một dự án dữ liệu, nhìn vào sơ đồ này nếu bạn có dự án trong vòng 2, 3 năm thì có thể bạn sẽ phải test hàm vài trăm lần có thể hơn. 

life cycle of func

Việc test thủ công có thể thay thế bằng tự động unit test.

 

Learing