Khóa học xử lý dữ liệu big data

Kỷ nguyên của dữ liệu lớn đang mở ra, nhưng sức mạnh của dữ liệu không nằm ở khối lượng, mà ở cách chúng ta khai phá và sử dụng nguồn tài nguyên này. Đây chính xác là một trong những lý do ngành Khoa học dữ liệu xuất hiện. Khoa học dữ liệu là sự kết hợp của các thuật toán, công cụ và nguyên tắc học máy khác nhau, để xác định được giá trị và ý nghĩa từ các tập dữ liệu thô.

Thế giới càng phát triển, nhu cầu khai thác dữ liệu lại càng cấp thiết. Vì vậy nguồn nhân lực trong lĩnh vực Khoa học dữ liệu đang trở nên quan trọng hơn bao giờ hết. Nếu bạn mong muốn phát triển trong lĩnh vực này, dưới đây là 10 khóa học online hoàn toàn miễn phí về khoa học dữ liệu dành cho bạn. 

Machine learning Course for Beginners – FreeCodecamp

Chắc chắn bất kỳ ai cũng sẽ ngạc nhiên vì khóa học này được phát triển bởi 1 đứa trẻ. Tuy nhiên, nội dung và khả năng diễn đạt của khóa học này cực kỳ gần gũi, dễ hiểu. Khóa học này có sẵn miễn phí trên YouTube tại kênh của FreeCodecamp, có nhiều chủ đề như nguyên tắc cơ bản về học máy, hồi quy tuyến tính và logistic, mô hình quyết định, tăng cường, phân cụm phân cấp… đều được đề cập một cách chi tiết.

Python for Data Science

Được giảng dạy và trình bày bởi Đại học California, San Diego, khóa học này giới thiệu cho người học một loạt các công cụ mã nguồn mở mạnh mẽ như Python, Git, Pandas… Sau khi kết thúc khóa học, người học có thể sử dụng thành thạo các công cụ python trong việc nhập dữ liệu, khám phá, học hỏi, xử lý, phân tích, hình dung và ra quyết định từ các tập dữ liệu. 

Data-driven Decision making – Coursera

Khóa học được cung cấp bởi PwC, bao gồm nhiều công cụ và kỹ thuật được sử dụng để giải quyết các thách thức về dữ liệu trong hoạt động kinh doanh. Khóa học này kéo dài 4 tuần. Kết thúc khóa học, người học cần thực hành triển khai xử lý dữ liệu và đưa ra giải pháp cho doanh nghiệp trong môi trường kinh doanh mô phỏng. 

Introduction to Data Science

Đúng như tên gọi, khóa học này cung cấp hệ thống toàn bộ kiến thức cơ bản của khoa học dữ liệu: Từ xác định khoa học dữ liệu là gì và sử dụng vì mục đích gì, giới thiệu về hồi quy, R và Python, đến việc ứng dụng khai thác dữ liệu như thế nào trong các lĩnh vực. 

Data Science Tools

Chúng ta chỉ có thể khai phá được tối đa sức mạnh của dữ liệu khi sử dụng các công cụ đủ mạnh. Khóa học “Data science Tools” được thiết kế để cung cấp cho người học kiến thức đầy đủ về các công cụ Khoa học dữ liệu như Jupyter Notebooks, RStudio IDE và Watson Studio.

Data Science Methodology

Một trong những thách thức lớn mà các tổ chức, doanh nghiệp phải đối mặt là chưa hiểu rõ phương thức tận dụng dữ liệu để giải quyết chính xác các vấn đề đang xảy ra. Khóa học “Data science Methodology” được xây dựng để thực hiện mục tiêu này. Khóa học sẽ giúp người học tìm hiểu các bước chính liên quan đến việc giải quyết một vấn đề ứng dụng khoa học dữ liệu.

Become a Data Scientist

“Become a data scientist” là một khóa học được cung cấp bởi Dataquest, một tổ chức nổi tiếng chuyên cung cấp các khóa học trực tuyến trong lĩnh vực khoa học công nghệ. Trong khóa học này tập trung vào việc đưa ra định hướng để lên ý tưởng, cũng như sử dụng thành thạo các kỹ năng liên quan đến Python trong lĩnh vực Khoa học dữ liệu. 

Hadoop Platform and Application Framework

Nếu bạn muốn tìm hiểu các công cụ cơ bản được sử dụng trong việc xử lý và phân tích dữ liệu lớn, thì khóa học này là dành cho bạn. Tại đây, bạn sẽ có cơ hội được tham khảo các mẫu thực hành với các khung Spark và Hadoop. Khóa học kéo dài 5 tuần này sẽ cung cấp các quy trình cơ bản của kiến ​​trúc Hadoop, môi trường thực thi và các ứng dụng liên quan.

Data Science: R Basics

Khóa học này tập trung giới thiệu những kiến ​​thức cơ bản về lập trình R, bao gồm các chức năng và kiểu dữ liệu của R, cách hoạt động trên vectơ và khi nào sử dụng các chức năng nâng cao như sắp xếp. Ngoài ra khóa học này cũng cung cấp các kỹ thuật trực quan hóa dữ liệu và xử lý dữ liệu.

High-dimensional Data Analysis

Khóa học bắt đầu với phần giới thiệu ngắn gọn về học máy và cách áp dụng các thuật toán học máy cho dữ liệu quy mô lớn, thông qua các chủ đề như phân tích nhân tố, biểu đồ tỷ lệ đa chiều….

Trên đây là 10 khóa học về khoa học dữ liệu hoàn toàn miễn phí và được nhiều chuyên gia trong ngành gợi ý. Nếu bạn mong muốn trở thành một nhà khoa học dữ liệu trong tương lai, hãy tập trung tìm hiểu về lĩnh vực tiềm năng này ngay từ bây giờ nhé. 

Tư liệu tham khảo: Analytics Insight

Danh sách môn học

Thông tin chi tiết về chứng chỉ

Vì sao nên học Data Science?

Data Science là gì?

Data Science là thu thập, khai thác và phân tích các giá trị từ khối dữ liệu data khổng lồ theo cấu trúc. Data Science = Advanced Mathematics (Statistics, Linear Algebra, Calculus) + Programming (Python, Database, Data Structure and Algorithm) + Kiến thức về lĩnh vực kinh tế xã hội cụ thể.

Chương trình Data Science trang bị các kiến thức cơ bản về data modelling/analysis techniques cũng như life cycle của một dự án Data Science để sinh viên có được hiểu biết cơ bản về Data Science và ứng dụng.

Data Science giúp phân tích, đưa ra các xu hướng, mô hình phát triển và dự báo cho tương lai. Căn cứ vào đó, các ngành hàng, dịch vụ có thể đưa ra đánh giá, quyết định cho việc đầu tư, thu hồi hoặc phát triển các giá trị hữu ích.   

TÌM HIỂU KHOÁ HỌC DATA SCIENCE

Nhà Khoa học dữ liệu (Data Scientist) làm gì?

Data Scientist là những người tạo ra giá trị từ data, với 2 nhiệm vụ chính là:

  • Thu thập, xử lý dữ liệu để tìm ra/phát hiện ra những giá trị ẩn chứa trong nó.
  • Chuyển hóa những giá trị đó thành các giải pháp/hành động, từ đó tạo ra các giá trị và lợi ích thực cho tổ chức/công ty.

Ai thích hợp làm việc trong lĩnh vực Data Science? 

Data Science phù hợp với tất cả mọi người muốn tìm hiểu và làm việc với dữ liệu, đặc biệt đối với một số đối tượng sau:

  • Các bạn sinh viên chuyên ngành CNTT/toán tin ứng dụng có kiến thức lập trình cơ bản.
  • Các bạn sinh viên chuyên ngành kinh tế/sư phạm tự nhiên có kiến thức nền tảng về toán và xác suất thống kê.
  • Các bạn kỹ sư CNTT muốn chuyển đổi nghề nghiệp
  • Các bạn chuyên viên làm việc trong các mảng về kinh tế, ngân hàng, fintech có mong muốn làm việc sâu hơn với dữ liệu.

Chương trình đào tạo Data Science của xSeries FUNIX

Chương trình Data Science bao gồm đầy đủ các môn học giúp trang bị các kiến thức cơ bản về data modelling/analysis techniques cũng như life cycle của một dự án Data Science để học viên có được hiểu biết cơ bản về Data Science và ứng dụng.

Học xong khoá Data Science sẽ có những kỹ năng gì?

  • Hiểu được các khái niệm cơ bản và phương pháp luận trong khoa học dữ liệu, các bước trong một dự án Data Science.
  • Nắm được kiến thức cơ bản về xác suất thống kê ứng dụng trong Data Science
  • Sử dụng thành thạo ngôn ngữ lập trình Python trong việc thống kê dữ liệu, cài đặt các thuật toán học máy và hiển thị hóa dữ liệu (Data Visualization)
  • Hiểu được xu hướng, sự phân bố và sự tương quan giữa các đặc tính của dữ liệu và thực hành được về Data Visualization.
  • Biết được các thuật toán cơ bản trong học máy: Regression, Classification, Clustering.
  • Hiểu được các khái niệm cơ bản trong Deep Learning và sử dụng thuật toán vào các bài toán thực tế.
  • Thực hiện trọn vẹn được dự án cuối khóa  tương đương một nhân viên làm được việc về Data Science tại doanh nghiệp hàng đầu Việt Nam

Sau khi kết thúc khoá học sẽ làm việc ở đâu? 

  • Gia nhập các công ty sản xuất phần mềm ở lĩnh vực Data Science/AI của Việt Nam như FPT AI – FPT Software, Tinh Vân, CMC.
  • Đảm nhiệm vị trí phân tích dữ liệu trong lĩnh vực tài chính, ngân hàng, marketing như Vietcombank, Techcombank, VP Bank, …
  • Tham gia các vị trí trong dự án phát triển hệ thống AI/Data Science cho các doanh nghiệp có lượng data rất lớn và dồi dào như Viettel, VNPT AI, Lazada …
  • Làm việc như một data scientist/data analyst tại các công ty cần thu thập, lưu trữ và xử lý dữ liệu, công ty khởi nghiệp như ELSA, Cinnamon AI, Trusting Social, …

Người học Data Science cần chuẩn bị những kiến thức đầu vào nào?

Ai cũng có thể học Data Science, đặc biệt với đối với một số các bạn học viên sau:

  • Học viên có kiến thức nền tảng về toán cao cấp: xác suất thống kê, đại số tuyến tính và giải tích.
  • Học viên đã có kiến thức về CNTT gồm: kỹ thuật lập trình cơ bản về Python, cấu trúc dữ liệu và giải thuật, cơ sở dữ liệu.

Học viên có thể tự trang bị, củng cố lại với các khóa học miễn phí trên mạng, hoặc có thể đăng ký học các môn nền tảng này tại FUNIX. Để được hướng dẫn chi tiết, bạn chọn đăng ký học để cán bộ tuyển sinh hướng dẫn cụ thể.

ĐĂNG KÝ KHOÁ HỌC DATA SCIENCE

Môn 1: Introduction to Data science – Nhập môn về Khoa học dữ liệu

Môn học này giới thiệu cho người học các khái niệm cơ bản trong khoa học dữ liệu (Data Science) bao gồm data science là gì, các chủ đề và thuật toán trong Data Science và ứng dụng trong thực tế. Ngoài ra môn học giới thiệu phương pháp luận sử dụng trong khoa học dữ liệu, vòng đời dự án Data Science. Học viên cũng được dạy về lập trình Python cơ bản và ôn tập lại về xác suất thống kê.

  • Biết cách lập trình Python cơ bản, các cấu trúc dữ liệu trong Python, làm việc với Pandas và Numpy
  • Nắm được các kiến thức kỹ năng cần thiết cho Data Science trong xác suất thông kê
  • Hiểu được các khái niệm cơ bản, các chủ đề, các ứng dụng của Data Science
  • Hiểu được phương pháp luận sử dụng trong data science, các bước để giải quyết các vấn đề data science từ nêu được bài toán, thu thập và phân tích dữ liệu, xây dựng thuật toán và hiểu được phản hồi sau khi thuật toán được cài đặt và sử dụng

Môn 2: Data analysis with Python – Phân tích dữ liệu với ngôn ngữ Python

Rất nhiều dữ liệu trên thế giới hiện nay được lưu trên cơ sở dữ liệu, kiến thức về cơ sở dữ liệu và ngôn ngữ SQL rất cần thiết để trở thành nhà khoa học dữ liệu. Môn học cung cấp kiến thức về các khái niệm cơ sở dữ liệu quan hệ, thực hành các câu lệnh query sử dụng ngôn ngữ SQL và Python. Học viên học làm việc sâu với Pandas, Numpy để khám phá nhiều dạng dữ liệu, làm sạch dữ liệu, xử lý dữ liệu bị thiếu. Môn học dạy cách biểu diễn dữ liệu để hiểu sâu hơn về dữ liệu, giúp đưa ra các quyết định hiệu quả.

  • Viết được các câu lệnh SQL cơ bản: CREATE, DROP, SELECT, INSERT, UPDATE, DELETE
  • Biết vận dụng các câu lệnh truy vấn nâng cao như filter, sort, group
  • Sử dụng Python để truy cập vào cơ sở dữ liệu
  • Biết import và export data
  • Nắm được cách tiền xử lý dữ liệu, xử lý dữ liệu bị thiếu, chuẩn hóa dữ liệu
  • Thực hiện được thống kê dữ liệu, tìm độ tương quan trong dữ liệu
  • Biết cách biểu diễn dữ liệu theo dạng biểu đồ sử dụng các thư viện Matplotlib
  • Học được cách biểu diễn dữ liệu dạng nâng cao qua thư viện Seaborn và Folium

Môn 3: Machine Learning – Học máy cho khoa học dữ liệu

Học viên được dạy mục đích của học máy và các ứng dụng trong thực tế. Môn học trang bị các thuật toán trong học máy: regression, classification, clustering, recommender system.

  • Nắm được tổng quan về các topic trong machine learning: supervised learning, unsupervised learning
  • Hiểu và thực hành các thuật toán về Regression
  • Hiểu và thực hành các thuật toán về Classification
  • Hiểu và thực hành các thuật toán về Clustering
  • Hiểu về Recommender Systems
  • Thực hành cách thuật toán vào bài toán thực tế
  • Biết cách biểu diễn dữ liệu theo dạng biểu đồ sử dụng các thư viện Matplotlib

Môn 4: Introduction to Deep Learning – Nhập môn về kỹ thuật học sâu

Mục đích của môn học trang bị cho người học kiến thức cơ bản về các mạng nơ ron hiện này và ứng dụng trong thị giác máy tính và xử lý ngôn ngữ tự nhiên. Môn học bao gồm chủ đề về stochastic optimization, các thủ thuật khi huấn luyện mạng nơ ron, cách xây dựng mạng nơ ron. Học viên còn được học về các kiến trúc mạng nơ ron phức tạp trên các framework Tensorflow và Keras. Người học sẽ biết cách sử dụng các thuật toán về deep learning để giải quyết các bài toán AI.

  • Nắm được kiến thức về gradient descent, stochastic gradient descent, regularization, overfitting
  • Biết được khái niệm về deep neural network
  • Giới thiệu về deep learning sử dụng trong thị giác máy tính. Hiểu được kiến trúc mạng CNN và biết cách sử dụng pre-train model cho các vấn đề mới
  • Cung cấp kiến thức unsupervised part trong deep learning như autoencoder, word embedding, GAN
  • Học viên học được cách sử dụng deep learning cho các dữ liệu dạng chuỗi như texts, video, audio. Nắm được kiến thức về RNN, LSTM, GRU, Backpropagation và được thực hành.

Môn 5: Đồ án cuối khóa

Đồ án cuối khóa mô phỏng một dự án trọn vẹn mà cá nhân học viên cần thực hiện, đáp ứng yêu cầu quy trình làm việc và đảm bảo ứng dụng các kiến thức, kỹ năng về Data Science được học để giải quyết một bài toán thực tiễn ở doanh nghiệp. Học viên hoàn thành đồ án sẽ sẵn sàng là một nhân viên bắt đầu làm được việc về data science tại doanh nghiệp. Dự án cuối khóa này sẽ cho học viên kinh nghiệm xử lý dự án trong thực tế và giúp bạn thể hiện khả năng chuyên môn trong lĩnh vực data science với nhà tuyển dụng. Bạn sẽ áp dụng các kỹ năng của mình vào data visualization, data analysis, data wrangling, data organization, data modeling và machine learning để giải quyết nhu cầu khách hàng. 

Đội ngũ xây dựng khoá học

Khóa học được xây dựng và thẩm định bởi các chuyên gia hàng đầu về giảng dạy và làm việc trong lĩnh vực Data Science tại Việt Nam, bao gồm:

Đội ngũ xây dựng chương trình:

Trưởng nhóm VŨ THƯƠNG HUYỀN Data Scientist tại FPT Software – Thạc sĩ ngành Công nghệ phần mềm, ĐHCN, ĐHQG HN
TS. TRẦN HỒNG VIỆT Tiến sỹ Khoa học máy tính,
Bảo vệ luận án Tiến sỹ về AI tại ĐHCN, ĐHQG HN
NGUYỄN HẢI NAM Trưởng nhóm R&D tại công ty Asilla Jp.
Thạc sĩ ngành Khoa học Máy tính,
Đại học Cassino, Itally.

Đội ngũ đánh giá và thẩm định chương trình: 

PGS. TS. TỪ MINH PHƯƠNG Trưởng khoa CNTT, Học viện CNBCVT

TS. NGUYỄN VĂN VINH Chuyên gia về Trí Tuệ Nhân Tạo,
Giảng viên ĐHCN, ĐHQG HN

TS. ĐẶNG HOÀNG VŨ Tiến sỹ Toán Đại học Cambridge, Anh
Giám đốc Khoa học FPT
TS. TRẦN THẾ TRUNG Viện trưởng Viện   CNTT, Đại học FPT

Mọi thông tin về Khóa học, vui lòng xem thêm TẠI ĐÂY hoặc liên hệ:

Hotline/ Zalo: 078.231.3602

    Cơ hội nghề nghiệp

    Sau khi hoàn thành chứng chỉ, học viên sẽ có cơ hội:

    ● Gia nhập các công việc liên quan đến Data Science tại các công ty công nghệ của Việt Nam như FPT Software, FPT AI, các start-up công nghệ AI, …
    ● Đảm nhiệm vị trí phân tích dữ liệu (Data Analyst) trong lĩnh vực tài chính, ngân hàng, marketing….
    ● Tham gia các vị trí trong dự án phát triển hệ thống AI cho các doanh nghiệp lớn.
    ● Học viên có thể làm vị trí Kỹ sư dữ liệu tại các công ty cần thu thập, lưu trữ và xử lý dữ liệu.

    Chủ đề