Tải dữ liệu sử dụng Wget

Submitted by tinhxleev2 on Mon, 09/13/2021 - 09:18

Wget đến từ World Wide Web và get.

Wget đến từ Linux nhưng sử dụng được cho tất cả các OS. 

Wget sử dụng để tải dữ liệu HTTPS hoặc FTP.

Wget có ưu điểm hơn curl trong việc tải nhiều file lặp lại nhiều lần.

Kiểm tra wget đã cài chưa bằng lệnh

which wget 

Nếu chưa được cài thì dùng lệnh

Linux:

sudo apt-get install wget

Mac OS thì dùng homebrew

brew install wget

Với window thì cài qua gnuwin32

Tags

Tải Dữ Liệu Sử Dụng Curl

Submitted by tinhxleev2 on Mon, 09/13/2021 - 08:41

curl à viết tắt của Client for URLs và là Unix comand line tool, dùng để truyền dữ liệu đến và đi từ một server (máy chủ).

curl sử dụng để tải dữ liệu từ hppts sites và FTP servers. 

Để kiểm tra xem curl đã được cài chưa sử dụng

man curl

Nếu chưa cài curl màn hình thì sẽ hiện thị

curl command not found.

Bạn tải curl theo đườngl link: https://curl.se/download.html

Một số syntax cơ bản cho curl. 

curl [option flags] url

Sử dụng HTMLsession để cào nội dụng trên trang infinite scroll

Submitted by tinhxleev2 on Tue, 08/17/2021 - 17:08

Đầu tiên mình sẽ nhập gói HTMLSession

from requests_html import HTMLSession

session = HTMLSession()

r = session.get('duong_dan_toi_trang')

Ở đây scrolldown được tính bằng số lần bạn gõ vào phím mũi tên đi xuống để tải toàn bộ trang web.

r.html.render(scrolldown=90, sleep=2)

Mình cần lấy title của sản phẩm nằm trong tag span, nên mình tạo một list trống:

titles = []

for title in r.html.find('span'):

Tags

Nhập các file excel lấy từ dữ liệu bán hàng

Submitted by tinhxleev2 on Mon, 08/09/2021 - 03:57

Thường vào quý 3 hoặc 4 các sales sẽ làm kế hoạch, bạn sẽ lấy dữ liệu từ phần mềm bán hàng theo tháng. Giả sử có tổng cộng dữ liệu cho 8 tháng. 

# Import pandas and functools/Mình nhập các gói cần thiết
import pandas as pd
from functools import reduce

# Ở đây có 8 file excel 

Viết vòng lặp (loop) hay hơn trong Python

Submitted by tinhxleev2 on Fri, 07/23/2021 - 11:50

Dưới đây là các vòng lặp có thể loại bỏ. 

  • Trước hết bạn phải bảo đảm loop duyệt đc gì.
  • Chuyển những tĩnh toán một lần ra khỏi loop
  • Sử dụng chuyển đổi toàn diện bên ngoài loop
  • Tất cả mọi thứ được thực hiện một lần đều di chuyển ra ngoài loop

Ví dụ:

ten = ['Hung', 'Lac', 'Viet', 'Anh', 'Hong', 'Vu'] tương ứng có điểm số

diem = np.array([5, 6, 7, 5, 8, 6])

Giờ mình cần tìm những người có điểm cao hơn 6. 

for t, d in zip(ten, diem):

Bốn kết hợp selector trong CSS

Submitted by tinhxleev2 on Fri, 07/23/2021 - 05:47

Kết hợp một phân cách bằng một dấu cách, ở đây .block có style từ .header, và thêm vertical-align: middle;

.header {
    margin-bottom: 0;
    border: none;
    border-radius: 0;
    position: relative;
}

.header .block {
    vertical-align: middle;
}

Kết hợp bằng dấu > ở đây div chỉ có style khi xuất hiện trong .profile

.profile > div {
    padding-right: 5px;
    display: inline-block;
    vertical-align: top;
}

Kết hợp bằng dấu +

Kết hợp bằng dấu .

Layout Rules - SMACSS

Submitted by tinhxleev2 on Wed, 07/21/2021 - 06:10

CSS dùng để đặt các elements (trứng) vào rổ (trang), nếu đặt mạnh thì trứng vỡ, trang web của bạn sẽ toang. Đây là mình dịch vui thế. 

Còn có một sự khác biệt giữa các thành phần (component) của trang đó là chính và phụ.

Thành phần chính được hiểu là phong cách bố cục (Layout styles), nó chưa các thành phần phụ (gọi là Modules), các mudules bao gồm mẫu đăng nhập, hoặc các mục ở phần menu.

Base Rules - SMACSS

Submitted by tinhxleev2 on Wed, 07/21/2021 - 04:09

Base rules

Base rule được áp dụng cho một element selector, a descendent selector, hoặc child selector, và cùng với các pseudo-classes.

Base rule không áp dụng cho các class hoặc ID selectors. 

Base rule xác định kiểu mặc định của element lặp lại trên tất cả các trang. 

Ví dụ: ở đây có element selector là body, và pseudo-classesa:link, và a:visited (Một pseudo-class dùng để định nghĩa trạng thái đặc biệt của element, trong trường hợp này để xác định link khi có người dùng bấm vào.

Learing