Start a career in data science

Xin chào cả nhà, data science đang là một ngành khá hot. Mình từng chuyển việc từ Singapore sang châu Âu trong các công ty công nghệ lớn như Microsoft và Facebook càng thấy được tiềm năng của ngành này. Đây là bài viết được chia sẻ đọc quyền với HannahEd từ bạn Việt Linh. Linh từng được học bổng toàn phần châu Âu và có kinh nghiệm làm về lĩnh vực Data Science từ Singapore tới UK và Ý. Những bạn nào đã, đang và sẽ có ý định theo đuổi con đường này có thể tham khảo thêm hi vọng có ích cho các bạn nhé.

  1. Bổ sung các kiến thức cần thiết

Khi bắt đầu, chúng ta cần các kiến thức cần thiết về giải tích, đại số và Python. Ma trận, và các tính toán giải tích rất quan trọng cho các khía niệm trong học máy (machine learning). Chúng ta cũng cần một số nền tảng lập trình để bắt đầu, tốt nhất là bằng Python (hoặc R). Trong khi ngôn ngữ R rất hữu ích cho các nhiệm vụ thống kê chuyên dụng, Python linh hoạt hơn vì nó sẽ kết nối đầu cuối của sản phẩm (từ việc tiền xử lý dữ liệu, mô hình hóa đến 1 phần mềm hoàn chỉnh – production level). Nếu chúng ta vẫn còn ngồi trên ghế nhà trường, chúng ta hoàn toàn có thể có thời gian học các môn thống kê học và khoa học máy tính:

  • Time-series analysis, Statistical software, Bayesian data analysis
  • Data structures and algorithms, Software engineering, Parallel programming, Network analysis
  • Convex optimization

Hãy chắc chắn lúc học chúng ta sử dụng nhiều R hoặc Python. Kiến thức xác suất và thống kê sẽ chỉ thực sự hữu ích nếu chúng ta có thể thực hành những gì được học.

  1. Kết nối với cộng đồng DS

Tìm hiểu các meetup, tham dự các buổi nói chuyện, và gặp gỡ các bạn khác theo ngành khoa học dữ liệu. Tìm đọc blog và theo dõi các nhà khoa học dữ liệu nổi tiếng (Andrew Ng, Ian Goodfellow …)

  1. Tìm 1 vấn đề thú vị mà mình thực sự quan tâm, lấy dữ liệu và thử nghiệm

Tốt nhất tại thời điểm chúng ta chưa nên tham gia bất kỳ cuộc thi Hackathon/Kaggle có giải thưởng nào. Thông thường các cuộc thi sẽ có bộ dữ liệu quá lớn, quá nhiễu và không tốt cho việc thực hành, làm bài tập.

Chúng ta có thể bắt đầu bằng cách học các gói, các thư viện như scikit-learn, pandas … và lấy các dữ liệu có sẵn trong thư viện (như dữ liệu Iris, hay Titanic) để tìm hiểu.

Sau đó, khi đã thuần thục với các dữ liệu nhỏ, sạch, chúng ta có thể chuyển qua các vấn đề phức tạp hơn 1 chút như mô hình hồi quy giá nhà hay hãy thử xử lý ngôn ngữ tự nhiên với 1 đoạn văn bản bất kỳ.

  1. Tìm hiểu 1 số lĩnh vực sử dụng khoa học dữ liệu

Khoa học dữ liệu là một lĩnh vực vô cùng lớn và liên ngành, và các công việc khác nhau sẽ đòi hỏi các kỹ năng khác nhau. Đây là 1 vài ví dụ:

  • A/B Testing: Nghiên cứu trải nghiệm người dùng, so sánh tính năng giữa các phiên bản, giúp đưa ra các quyết định sản phẩm.
  • Data Visualization: Trực quan hóa dữ liệu qua các đồ thị, hình ảnh cho mục đích giao tiếp, báo cáo
  • Big Data: Phát triển các công cụ để xử lý dữ liệu khổng lồ
  • Optimization: Tối ưu hóa, thiên về thiết kế các thuật toán học máy
  • Natural Language Processing : Xử lý ngôn ngữ tự nhiên mục đích, tiến hành phân tích, số hóa các dữ liệu văn bản.
  • Time Series Analysis: Phân tích các dữ liệu chuỗi thời gian (như cổ phiếu, thời tiết …)
  • Computer Vision: Xử lý các dữ liệu hình ảnh và video, mô hình hóa hệ thống thị giác của con người
  1. Tự tạo ra các sản phẩm nhỏ

Có thể tạo tài khoản github, hay blog và đăng các dự án, các sản phẩm đã được hoàn thành! Điều này giúp chúng ta xây dựng sẵn 1 bộ hồ sơ hay thậm chí là thương hiệu, và dễ dàng kết nối với người khác.

  1. Tìm kiếm cơ hội thực tập, chia sẻ kiến thức với cộng đồng và phát triển tư duy phân tích

Các nhà khoa học dữ liệu tự nhiên luôn có sự tò mò về dữ liệu. Phần lớn họ ko phải phân tích dữ liệu, mà là tò mò nhìn vào dữ liệu, phản biện, khám phá ra một câu hỏi thú vị và tìm ra cách trả lời nó.

Và điều quan trọng, khoa học dữ liệu dù phức tạp đến đâu cũng chỉ là 1 trong những công cụ để giải quyết vấn đề. Và kỹ năng thiết yếu trên hết vẫn là kỹ năng giải quyết vấn đề.

Tham gia nhóm thảo luận về công việc và nghề nghiệp HannahEdJob
Các bạn muốn được tư vấn miễn phí về học bổng nghề nghiệp có thể gửi câu hỏi và CV về hannahed.co@gmail.com

Post Author: HannahEd Co

Leave a Reply

Your email address will not be published. Required fields are marked *