Side Project - Tỉ lệ tử vong trong các tai nạn giao thông ở Mỹ 2020

Submitted by tinhxleev2 on Mon, 11/15/2021 - 04:25

Đọc file lưu ở csv (có thế áp dụng vào vụ tại nạn giao thông ở VIET NAM)

import pandas as pd
accidents = pd.read_csv(r'./data/accident-data.csv')
accidents.head()

Giờ bạn sẽ làm việc với đội an toàn đường bộ ở bộ giao thông, đội này đang tìm cách giảm số vụ tai nạn giao thông. Đôi này sẽ phân loai nhựng vụ tải nạn nghiêm trọng liên quan tới hơn 3 người tử vong. Và họ sẽ xem sét kỹ những đặc thù của những tai nạn này và tìm cách can thiệp để giảm số lượng tử vong. Và bạn sẽ là người cung cấp các thông tin cho đội này. 

Đọc kết quả báo cáo unit testing

Submitted by tinhxleev2 on Thu, 11/04/2021 - 18:04

Có 3 phần chính ở unit testing. 

Phần một giới thiệu về các phiên bản

Phần 2 chỉ ra các unit test có đạt hay không, nếu không đạt thì trả F còn đạt thì là dấu. Giả sử bạn có 3 units test, cái đầu failure, 2 cái sau đạt thì sẽ trả lại kết quả là F..

Phần 3 chi tiết assert thể hiện lỗi nào. 

 

Viết một unit testing đơn giản sử dụng pytest

Submitted by tinhxleev2 on Thu, 11/04/2021 - 17:49

Có mấy thư viện cho unit testing như pytest, unittest, nosetest, doctests, bài này tập trung vào pytest. 

pytest là unit testing phổ biến, dễ sử dụng và có tất cả các tính năng thiết yếu. 

Bước 1:Tạo unit testing bạn sẽ tạo một file .py

test_ten_file.py ở đây ten file bắt đầu với test_ chỉ ra đây là unit testing. File unit testing cũng gọi là modules. 

import pytest

import row_to_list

def test_for_clea_row():

     assert row_to_list("argument_to_pass_1") == "given values 1"

     ...

Unit Testing for Data Science in Python

Submitted by tinhxleev2 on Thu, 11/04/2021 - 04:02

Hầu hết các dự án về khoa học dữ liệu sẽ cần một unit testing. Việc này bảo đảm tiết kiệm thời gian phát triển và bảo trì cho hệ thống. 

Giả sử có một hàm python

def my_function(argument): 

     ...

Nếu muốn thử hàm này đúng chuẩn chưa bạn chỉ cần đưa một vài arg vào để xem kết quả. Nhưng thực ra cách này không thực sự hiệu quả, nếu bạn nhìn tổng thể vào một dữ án khoa học dữ liệu, vòng đời của của hàm. 

Lên lịch cho script với Cron

Submitted by tinhxleev2 on Thu, 11/04/2021 - 03:29

Việc lên lịch chạy bạn sẽ không phải chạy một cách thủ công cùng một script hàng ngày hay hàng giờ, hàng tuần hay hàng tháng.

Từ những năm 70s Cron là một phần của các hệ thống tương tự như Unix, từ Cron bắt nguồn từ Chronos trong tiếng hy lạp. 

crontab là file chứa cronjobs - cronjobs chỉ ra cho crontab - code nào chạy ở thời điểm nào.

Kiểm tra lịch chạy của cronjobs bằng lệnh: crontab -l

Cấu trúc crontab và cronjobs

Arguments, return values, and scope

Submitted by tinhxleev2 on Sun, 10/31/2021 - 05:07

Đem một arguments biến vào một hàm trong bash, trả lại gái trị và tầm (scope).

Đem arguments vào trong hàm tương tự như đem argument vào bash script

Scope (tầm) xác định biến được truy cập với tầm nào, tầm global thì biến có thể truy cập ở tất cả mọi nơi trong chương trình. 

Tầm local thì biển chỉ được truy cập ở một phần nào đó ở trong chương trình. 

Không giống như các ngôn ngữ lập trình khác, bash khi có biên thì nó mặc định là ở tầm global, và sẽ có rủi ro nếu có sự cố ngoài ý muốn. 

Một số hàm bash cơ bản

Submitted by tinhxleev2 on Fri, 10/29/2021 - 07:50

Cấu trúc 

ten_ham () {

        #code

       return #something

}

Cấu trúc thay thế

function ten_ham {

        #code

       return #something

}

Sau ten_ham có thể để () hoặc bỏ () tùy thói quen. 

Giờ gọi hàm bằng viết tên hàm ra 

Ví dụ:

function in_ten () {

     echo "LE TINH"

}

Gọi bằng cách 

in_ten

Learing