Skip to main content

[Intro Python] - Python Basic: Hello Python


Không giống như những khóa hướng dẫn khác về Python, khóa này tập trung vào việc sử dụng Python trong khoa học dữ liệu. Đến cuối khóa, bạn sẽ biết về cách thức lưu trữ và vận dụng dữ liệu một cách hiệu quả, biết cách triển khai các công cụ dữ liệu trong việc phân tích. Mỗi bài học sẽ có phần lý thuyết và có các bài thực hành. Chúng ta sẽ vừa học vừa thực hành trên nguồn là trang web datacamp.com, trang web sẽ cung cấp cho ta một môi trường tương tác trực tiếp là IPythonShell và một vùng để viết code là Script.py, bạn có thể thử nghiệm và tìm ra những lỗi code để chỉnh sửa.

Python được tạo ra bởi Guido Van Rossum, nó được bắt đầu như là một dự án sở thích, sau đó nhanh chóng trở thành ngôn ngữ lập trình có mục đích chung (general purpose programming language), ngày nay, chúng ta có thể sử dụng Python để xây dựng và thực hành bất cứ phần mềm nào. Python là một phần mềm nguồn mở, sử dụng miễn phí và dễ dàng tạo các package trong Python, bạn dễ dàng chia sẻ mã nguồn (source code) với người khác để giải quyết các vấn đề đặc biệt. Qua thời gian, nhiều và nhiều những packages chuyên biệt được tạo ra và xuất bản cho lĩnh vực data science. Giả sử, bạn muốn tạo một vài hình ảnh cho việc mua bán của công ty, sure.. có một package dành riêng cho việc này. Hoặc, việc kết nối database để phân tích các cảm biến cũng có package cho việc này. Hiện tại có 2 phiên bản Python, version 2.7 và 3.5  

BÀI  TẬP
Bài 1:
Bạn có thể gõ mã code Python để giải quyết các bài tập. 
- Bây giờ hãy gõ ví dụ: 5/8
- Tiếp theo xuống dòng và gõ print(7+10) và quan sát kết quả

Bài 2: When to use Python?
Python là một ngôn ngữ linh hoạt, những ứng dụng nào sau đây mà có thể sử dụng Python?
A) Bạn muốn tính toán nhanh chóng
B) Cho những doanh nghiệp mới, bạn muốn phát triển một trang web dựa trên cơ sở dữ liệu
C) Sếp bạn yêu cầu bạn làm sạch và phân tích dữ liệu khảo sát về mức độ hài lòng của khách hàng
D) Tất cả các ý kiến trên


Bài 3: Any comments?
Bạn có thể thêm chú thích trong đoạn code Python, các chú thích này quan trọng để người khác có thể hiểu được đoạn code thực hiện vấn đề gì. Để thêm chú thích, ta sử dụng dấu #, những chú thích này Python sẽ không thực thi và không làm ảnh hưởng đến kết quả của bạn. Ta có đoạn code sau:
# Just testing division
print(5 / 8)
....
print(7 + 10)
Hãy thêm một chú thích #Addition works too vào phía trên dòng print(7+10)


Bài 4: Python as a calculator
Python cung cấp các phép tính cơ bản như +, -, *, / Python cũng cung cấp thêm một vài phép toán như:
  • Lũy thừa ** (2 dấu * viết liền nhau). Ví dụ 4^2 ta sẽ viết là 4**2 và kết quả là 16
  • Lấy phần dư (modulo) % phép toàn này sẽ lấy phần dư khi chia 2 số. Ví dụ 18 % 7 = 4
Tình huống dành cho bạn như sau: bạn có $100 để đầu tư và lãi suất mỗi năm là 10%, có nghĩa là sau 1 năm thì số tiền là 100 x 1.1 = 110 đô la, và sau 2 năm thì số tiền là 100 x 1.1 x 1.1 = 121. Nhiệm vụ của bạn là tính số tiền chính xác sau 7 năm.


BÀI GIẢI
Bài 1:
# Put code below here
5/8
print(7+10)

Bài 2:
Đáp án D

Bài 3:
# Just testing division
print(5 / 8)
#Addition works too
print(7 + 10)

Bài 4:
# How much is your $100 worth after 7 years?
print(100 * 1.1**7)

Popular posts from this blog

[Intermediate Python] - Matplotlib: Histogram

Bài viết này giới thiệu về histogram, histogram là cách nhìn rất hữu ích để khám phá dữ liệu LÝ THUYẾT Hãy tưởng tượng có 12 giá trị giữa 0 và 6 và tôi đặt nó trên 1 đường thẳng, để xây dựng một biểu đồ histogram cho những giá trị này, tôi sẽ chia đường thẳng thành những đoạn bằng nhau, được gọi là những ngăn (bins). Giả sử bạn có 3 ngăn, mỗi ngăn có độ rộng là 2, tiếp theo bạn đếm xem có bao nhiêu điểm dữ liệu bên trong mỗi ngăn, ở đây ta có 4 điểm trong ngăn 1, 6 điểm trong ngăn 2 và 2 điểm trong ngăn 3, cuối cùng, ta sẽ vẽ 1 thanh biểu trưng cho mỗi ngăn, chiều cao của thanh tương ứng với số lượng điểm dữ liệu trong ngăn đó. Kết quả của biểu đồ cho ta một cái nhìn tổng quan về cách mà 12 giá trị được phân phối, một vài giá trị ở ngăn giữa, nhưng có nhiều giá trị nhỏ hơn 2 và lớn hơn 4.  Tất nhiên, matplotlib cũng có khả năng tạo biểu đồ histograms, như bài học trước thì ta cũng cần phải import gói pyplot bên trong matplotlib, tiếp theo ta có thể sử dụng hàm hist() ...

[Intermediate Python] - Matplotlib: Basic plots with matplotlib

Trong bài này, bạn sẽ được học cách hình dung dữ liệu thực tế, cách lưu trữ dữ liệu trong các cấu trúc dữ liệu mới; khi đã thành thạo các cấu trúc điều khiển, bạn cần điều chỉnh các đoạn scripts và các thuật toán, chúng ta sẽ  kết thúc chương này với một bài tập nhỏ và chúng ta sẽ phải kết hợp mọi thứ đã  học để giải quyết bài toán.  LÝ THUYẾT Phần đầu tiên của chương là về cách hình dung dữ liệu (data visualization), nó rất quan trọng trong việc phân tích dữ liệu. Đầu tiên, bạn sẽ sử dụng nó để khám phá tập dữ liệu (dataset) để hiểu dữ liệu của bạn một cách rõ nhất, từ đó bạn mới có một cái nhìn sâu sắc về nó, và chia sẻ cái mà bạn đã nhận thức được từ dữ liệu với người khác   Ví dụ: ta nhìn vào biểu đồ xinh đẹp bên trên, nó được tạo bởi giáo sư người Thụy Sĩ Hans Rosling, giáo sư nói về sự phát triển dân số toàn cầu được xem hàng triệu lần và sắp xếp chúng tạo nên 1 biểu đồ, giáo sư đã để dữ liệu nói lên lịch sử của chính nó. Ở đây, chúng ta thấy ...

[DFP] - 6: How to create Ad tags in DoubleClick ad Exchange

Chúng ta sẽ học một vài thủ thuật và mẹo để quản lý quảng cáo một cách hiệu quả. Tạo các tags từ network chẳng hạn như Google Ad Exchange là phần trọng tâm của bất kỳ thiết lập DFP nào, bài hướng dẫn này trình bày ngữ trường hợp sử dụng cao hơn DFP ở mức Order. B1 : Lên kế hoạch các kiểu của tags mà bạn muốn tổ chức thực hiện trên spreadsheet hoặc notepad Bước đầu tiên là lên kế hoạch các kiểu của ad tags mà bạn muốn thực hiện và ghi chúng lại vào spreadsheet hoặc notepad. Tên của tags cũng rất quan trọng, nó vừa thể hiện được ý nghĩa của tags đồng thời là yếu tố nhận dạng để chúng ta theo dõi nó. Bạn sẽ muốn quy định một hệ thống danh pháp cho những tags này. Chúng tôi đề nghị chia tags thành "components" và gắn nó với một hệ thống cho tất cả các thẻ. Ví dụ: chúng ta đã từng xây dựng những tên tags như "ch1_AdX_MonetizeMore_top_728x90", ghi chú là chúng ta sử dụng dấu gạch chân để phân tách các thành phần trong nhãn, không thể ngăn cách bằng khoảng trắn...