1. GIỚI THIỆU
Python là một ngôn ngữ lập trình bậc cao, được tạo ra bởi lập trình viên người Hà Lan là Guido van Rossum ra mắt lần đầu vào năm 1991. Python được thiết kế cho mục đích lập trình đa chức năng, với ưu điểm dễ học, dễ đọc, và dễ nhớ. Được cho là ngôn ngữ lập trình gần với ngôn ngữ tự nhiên nhất, python tăng cường sử dụng các từ khóa Tiếng Anh và hạn chế các ký hiệu, cấu trúc và cú pháp của python đặc biệt đơn giản, ngắn gọn, và dễ tiếp cận so với nhiều ngôn ngữ lập trình khác.

2. ĐẶC ĐIỂM NỔI BẬT
– Dễ code: Cấu trúc python vốn đơn giản, ngắn gọn so với nhiều ngôn ngữ khác như Java hay C/C++. Một chương trình python có thể ngắn hơn 4-6 lần so với khi viết bằng Java hay C/C++. Ví dụ như, python không cần khai báo biến, vốn là một đặc trưng quan trọng của những ngôn ngữ khác, cùng với cú pháp phong phú được tích hợp thẳng vào ngôn ngữ, python trở nên dễ dàng và tiết kiệm thời gian hơn của các lập trình viên.
– Mã nguồn mở và miễn phí: Python là ngôn ngữ lập trình hoàn toàn miễn phí. bạn có thể tải nó từ chính trang chủ Download Python | Python.org. Bên cạnh đó, mã nguồn của python là mã nguồn mở, hoàn toàn công khai, bạn có thể xem, thay đổi, và sử dụng nó một cách dễ dàng.
– Sửa lỗi nhanh và dễ dàng: Đây là một đặc điểm cực kỳ được yêu thích của python đối với các lập trình viên. Đối với nhiều ngôn ngữ lập trình khác, khi chạy chương trình đều trải qua một bước gọi là compilation (biên dịch: dịch một chuỗi các câu lệnh từ ngôn ngữ lập trình sang ngôn ngữ máy tính), nhưng python đã được lược bớt bước này, khiến cho quy trình sửa – kiểm tra – gỡ lỗi là cực kỳ nhanh. Mặc dù, ưu điểm này lại khiến python có phần chậm hơn java, nhưng đó sẽ không là vấn đề so với lợi ích mà python mang lại.
– Thư viện đa dạng: Vì python là một ngôn ngữ lập trình phục vụ đa mục đích, hệ thống thư viện của python rất phong phú và đa dạng.
- Lập trình web; Django, Flask, …
- Game: Pygame
- Apps : Tkinter
- Data Science: Sklearn, Tensorflow,…
- …
3. ỨNG DỤNG
Với mã nguồn mở và hệ thống các thư viện đa dạng, Python được sử dụng cho nhiều mục đích như thống kê, tính toán, xử lý các vấn đề kinh doanh, ngân hàng, … ngoài ra python còn được dùng để lập trình web, lập trình ứng dụng máy tính, viết game,… Nhờ vào những ưu điểm của mình, python đang ngày một phổ biến và được sử dụng rộng rãi trong nhiều ứng dụng nổi tiếng như Instagram, Netflix, Spotify,…
Bên cạnh đó, một trong những điểm nổi bật của Python chính là lĩnh vực Khoa học và phân tích dữ liệu, nhờ vào tính chất và hệ thống các thư viện đa dạng của mình, cung cấp khả năng trực quan hóa dữ liệu vượt trội hay chạy các mô hình thuật toán phức tạp, Python là ngôn ngữ được sử dụng chủ yếu cho những dự án AI, Machine Learning, Deep Learning, …
Trong bối cảnh chứng kiến sự phát triển chóng mặt của thời đại công nghệ số, đặc biệt là trong lĩnh vực Fintech, những dự báo tài chính hay đánh giá mức độ tín dụng không còn được làm thủ công, thay vào đó là sự thay thế của công nghệ, những mô hình AI hay Machine Learning đang dần phổ biến và được áp dụng, Python đang từng bước cho thấy tầm quan trọng và vị thế của mình.

4. NHỮNG THƯ VIỆN PHỔ BIẾN (THƯỜNG ĐƯỢC DÙNG TRONG DATA SCIENCE)
Numpy: Viết tắt từ cụm từ Numeric Python, được phát triển bởi Jim Hugunin, là một thư viện toán học hỗ trợ cho việc tính toán ma trận, các mảng đơn hay đa chiều, tốc độ xử lý nhanh và đặc biệt hữu ích trong đại số tuyến tính.
Pandas: Được phát triển bởi Wes McKinney, xây dựng trên cơ sở là Numpy Array, pandas là một thư viện hỗ trợ đắc lực trong Data Science, giúp xử lý, tổ chức, thao tác, phân tích và làm việc dễ dàng trên dataframe hay series, có hỗ trợ, phù hợp nhiều tập tin như csv, json, excel,… thích hợp với nhiều loại dữ liệu như dữ liệu định lượng, chuỗi thời gian, …
Matplotlib hay Seaborn: Là những thư viện cung cấp các công cụ vẽ, tùy chỉnh các dạng đồ thị, trực quan hóa dữ liệu đa dạng như đồ thị đường, phân tán, kết hợp,… giúp quan sát, đánh giá tính chất, đặc điểm dữ liệu.
Scikit-learn: Hay còn gọi là Sklearn, được đề xuất lần đầu bởi David Cournapeau trong một dự án của Google, là một thư viện mạnh mẽ cung cấp các công cụ xử lý các bài toán máy học hay thống kê bao gồm classification, regression, clustering, và dimensionality reduction.
TensorFlow: Là một thư viện khác dành cho máy học cũng được phát triển bởi Google. Nhưng TensorFlow cho phép triển khai, xây dựng, truy cập sâu hơn các thuật toán trong khi Sklearn cung cấp các thuật toán có sẵn.
Nguồn tham khảo: