Lịch sử trực quan của những người đoạt giải Nobel Prize
Đây là một dự án trong khóa học phân tích dữ liệu khoa học.
Đây là một dự án trong khóa học phân tích dữ liệu khoa học.
Để dễ cho bạn hình dung dưới đây là quá trình phân tích một bộ dữ liệu
Một trong những điểm mạnh của Matplotlib đó là tự động ứng biến với dữ liệu mà nó nhận vào. Ví dụ bạn có một bộ dữ liệu với một số lượng các hạng mục chưa biết bạn vẫn có thể tạo một bar plot cho từng hạng mục một.
import matplotlib.pyplot as plt
fig, ax = plt.subplots()
# Loop qua từng hạng mục
for thanh_phan in cac_thanh_phan:
# Tách những hàng trong cac_thanh_phan
df2 = df[df["cac_hang_muc"] == thanh_phan]
Bạn đã có một phương pháp nào đó để phân tích bộ dữ liệu rồi, bước tiếp theo cũng vô cùng quan trọng đó là hiện thị plot - thể hiện kết quả trực quan một các dễ hiểu và logic nhất.
Và sau đây là một số hướng dẫn, có thể gọi là nguyên tắc chọn kiểu cách cho plot trong Python
Sử dụng errorbar
Sử dụng boxplot
Thông thường khi làm việc với bộ dữ liệu đặc biệt dữ liệu bán hàng, bạn sẽ tiếp cận với dữ liệu thời gian, đây là một kiểu dữ liệu được định nghĩa trong Python.
Định dạng dữ liệu thời gian - date, time, year.
to_datetime
1. Chuyển dữ liệu ngày tháng sáng chuẩn ISO utc - vị dụ dưới đây mình chuyển cột 'Date' lưu dữ liệu thời gian, chuyển sang chuẩn ISO.
df['Date'] = pd.to_datetime(df['Date'], utc=True)
SELECT
FROM
WHERE
GROUP BY
HAVING COUNT
ORDER BY
SQL còn sử dụng JOIN để lấy dữ liệu từ 2 bảng khác nhau, thông thường bạn sẽ không làm việc với một bảng và sẽ phải lấy dữ liệu từ nhiều bảng khác nhau
# ở đây bạn chọn 2 cột từ 2 bảng khác nhau, title từ bảng films và imbd_score từ bảng reviews, mình muốn xem tên bộ phim To Kill a Mockingbird có điểm đánh giá bao nhiêu, ở đâyy bảng fimls không có điểm đánh giá imdb.
SELECT title, imdb_score
# Chọn từ films
Mình sẽ dùng Beautiful Soup để lấy dữ liệu về từ URL này https://www.aptx.com/product-listing?product_category=431
Có tổng cộng 73 sản phẩm, mình chỉ cần lấy tiêu đề của từng sản phẩm một.
# Mình sẽ tạo một function
def get_data(pageNo):
Bài viết sau giới thiệu cách cơ bản để thiết lập một Web Drupal nếu bạn đang phát triển nhiều Web và khi cần có thể chuyển từ web này sang web khác.
Sử dụng Lando để thiết lập một local site cho việc phát triển sau đó đẩy lên GitLab từ đó nếu bạn có một Live Site có thể pull về từ GitLab.
Bước 1: Tải Drupal
Mình cài python trên server để cài script SSL cho website
https://phoenixnap.com/kb/how-to-install-python-3-ubuntu