Overview
Kỹ sư khoa học dữ liệu (data science) là một trong những ngành nghề phát triển nhất thế kỷ 21. Mọi lĩnh vực trong xã hội đều có lượng dữ liệu gần như vô tận cần được lọc, diễn giải và áp dụng cho nhiều mục đích khác nhau, từ doanh nghiệp đến tổ chức phi chính phủ đến các cơ quan, đoàn viện chính phủ.
Thường kỹ sư khoa học dữ liệu yêu cầu nhiều hơn trong việc sử dụng máy tính và các công nghệ.
What does this job do?
Kỹ sư khoa học dữ liệu là người thu thập, phân tích dữ liệu với mục đích đi đến một kết luận nào đó thông qua nhiều kỹ thuật khác nhau.
Kỹ sư khoa học có thể được phân thành 2 dạng chính, gồm phân tích - Analysis và xây dựng - Building. Analysis là các thinker với nhiệm vụ là tìm ra các góc nhìn có giá trị (insight) thông qua việc sử dụng các công cụ để phân tích dữ liệu. Building thường làm việc nhiều về phần mềm (software) và kỹ thuật (engineering) hơn. Họ chịu trách nhiệm xây dựng các sản phẩm data cho công ty dựa trên cơ sở dữ liệu.
Cụ thể, họ sẽ thực hiện các công việc sau đây:
Xác định nhiệm vụ/mục tiêu doanh nghiệp/khách hàng cần
Hiểu mô hình phù hợp nhất đối với dữ liệu họ sẽ phân tích
Làm việc với các phòng ban khác để hiểu nhu cầu doanh nghiệp nhằm thực hiện nhiệm vụ(mức độ khả thi của nhiệm vụ, loại dữ liệu yêu cầu, nguồn lực,…)
Gom dữ liệu, làm sạch dữ liệu và đồng bộ hóa dữ liệu
Vận dụng các phương pháp thống kê để xây dựng các mô hình dự đoán
Áp dụng các kỹ thuật định lượng từ kiến thức về thống kê, kinh tế lượng và machine learning / deep learning về giải pháp cho doanh nghiệp từ nhiều lĩnh vực
Truyền tải insight và các phân tích với dàn lãnh đạo, các stakeholder cũng như các phòng ban liên quan để tiến hành thay đổi/cập nhật