Tổng hợp nguồn tự học data miễn phí
Tổng hợp nguồn tự học data miễn phí
Khó khăn nhất đối với người mới tiếp cận đó là chưa hiểu các thuật ngữ ban đầu, khi đã có 1 chút nền tảng thì việc tự tìm tài liệu và tự học tiếp sẽ rất nhanh và chủ động. Việc học các trên các nền tảng full online nó có lợi thế không cần phải setup môi trường ban đầu mà đi thẳng vào thực hành, đỡ nản hơn khi tự mày mò và không có người hướng dẫn.
Tôi tổng hợp lại các nguồn trước đây tự học ban đầu (hiện tại vẫn tiếp tục học các khóa mới), đây đều là các nguồn miễn phí và rất giá trị.
Trang này tương tự Datacamp nhưng tiếng Việt, mới học về các cú pháp code rất hiệu quả. Không cần phải cài cắm gì.
Hiện tại có nhiều khóa yêu cầu trả phí, nhưng 2 khóa cực kỳ giá trị khi bắt đầu học vẫn free. Trước đây tôi đã cày nát full 2 khóa này:
Sau khi có nền tảng 1 chút về các cú pháp sử dụng của SQL và Python thì sẽ hướng tới học các công cụ thực tế trong doanh nghiệp và cần có lộ trình hướng tới các role cụ thể : Data Analyst, Data Science, Data Engineer,...
Các khóa của Google cũng oke nhưng tôi đánh giá nó mang tính chất giới thiệu lộ trình và hướng dẫn sử dụng đồ nhà Google nhiều hơn, không đa dạng và nặng thực hành như các khóa của Microsoft hay IBM.
Trang này hàng của IBM, các khóa lộ trình dài thì nó chính là các khóa trên Coursera thôi nhưng còn rất nhiều các khóa và chủ đề khác.
Nên học theo Learning Path rồi sau đó mở rộng các Course project nhỏ sau, các khóa của IBM thì thực hành nhiều, vọc trên máy ảo của hãng luôn. Học xong có cả cert luôn (mặc dù ko quan trọng lắm)
Khi muốn học cơ bản 1 chủ đề mới, tôi đều tìm học 1 khóa cơ bản trên này, đầy đủ lộ trình học cho Data Analyst, Data Science, Data Engineer, Machine Learning, AI, ...
Với 1 người bắt đầu tiếp cận 1 lĩnh vực mới thì cực kỳ đáng học.
Việc trình bày khóa học trên Microsoft Learn thực sự khá khó chịu vì họ thiết kế tìm kiếm theo dạng Module bên trong các bài thi chứng chỉ.
Khi quen rồi thì thấy bình thường và sẽ nên học theo Learning Path bên trong các chứng chỉ được thiết kế sẵn, sau này có tiền thích thi thì thi. Các chứng chỉ của Microsoft khá cần thiết trong các công ty Outsource vì cần nhân viên có chứng chỉ để làm hồ sơ thầu. Nên thường cho nhân viên tiền để đi thi.
Hệ sinh thái của Microsoft khá phổ biến nên dùng quen hàng của Microsoft sẽ tương đối sát với các ứng dụng của doanh nghiệp đang dùng. Chương trình cũng rất đa dạng đầy đủ thể loại cho Data Analyst, Data Science, Data Engineer, Machine Learning, AI, ...
Hệ thống chứng chỉ chia ra 2 loại :
Microsoft Certifications: Dạng bỏ tiền thi
Microsoft Applied Skills: Dạng thi thực hành trên máy ảo
Khám phá hết đồ của Microsoft cực kì mất thời gian và rộng, 1 số chứng chỉ nên học ban đầu (chọn 1 hướng):
Data Engineer: Fabric Data Engineer Associate DP-700
Data Analyst: Power BI Data Analyst Associate PL-300
Data Science: Azure Data Scientist Associate DP-100
Analytics Engineer: Fabric Analytics Engineer Associate DP-600
Khóa học của mấy hãng IBM hay Microsoft có 1 tí quảng cáo đồ hệ sinh thái của hãng, nhưng nền tảng learn trên Kaggle nói không với seeding, tập trung thẳng vào vấn đề cốt lõi của Python, Pandas, SQL và Machine Learning.
Các khóa ngắn khoảng 3-5 tiếng thực hành ngay trên Jupyter Notebook với các bộ dữ liệu thực của Kaggle. Xong khóa học là có thể bắt tay ngay vào việc thi đấu trên Kaggle hoặc tự xây dựng Portfolio cho riêng mình.
Khóa trên Kaggle nó thiên về sử dụng công cụ và cung cấp 1 file bài giảng dài trong 1 chủ đề, khá ngợp với người mới. Nên biết sử dụng công cụ 1 chút rồi thì vào học sẽ hiệu quả hơn.
Nguồn học về dữ liệu hiện nay cực kỳ nhiều và đa dạng, trên thực tế cả các khóa học miễn phí hoặc trả phí nó đều có 1 giá trị riêng nên nếu có thể cứ học hết, lâu dần sẽ chắt lọc được 1 vài điểm hay ho của nhiều khóa học khác nhau.
Tuy nhiên cũng vì số lượng quá nhiều nên để tiết kiệm thời gian chỉ nên tập trung học 1 vài khóa tiêu biểu, lưu ý là nên học hết trọn vẹn 1 khóa để thấm chứ đừng đang học dở lại nhảy sang khóa khác.