Hành trình trở thành Data Scientist (tiếp theo)

Data Science là gì ?

Mục đích của bộ phận Data Science là làm sao để Doanh nghiệp đưa ra các quyết định dựa trên dữ liệu tối ưu nhất.  Vậy nên Data Science giữ vai trò support cho phép công ty hoạt động tốt hơn

Chu trình Data Science có 3 giai đoạn:

  • Chuẩn bị 

Tổng hợp dữ liệu và làm sạch. Việc này sẽ mất rất nhiều thời gian vì dữ liệu khổng lồ, nói dễ hiểu là cần thực hiện các bước để đạt chất lượng và chuyển nó sang thành định dạng mà máy đọc và hiểu được.

  • Thử nghiệm 

Ta sẽ đưa ra cá opiton, dữ liệu được trực quan hóa và các mô hình được thiết lập.

  • Phân phối 

Lập kết quả có được thành tài liệu, slideshow trình bày cho quản lý và khi quản lý thông qua, thì kết quả chúng ta show sẽ được thay đổi và thực hiện.

Phân biệt Data Scientist vs Data Engineer vs Data Analyst

Data Scientist

Các nhà khoa học dữ liệu thường có 4 nhiệm vụ chính trong một công ty: Phân tích, kiểm tra, tạo và trình bày chúng cho nhóm.

Data Engineers 

Khác biệt giữa Data Scientist và Data Engineer

Tìm kiếm các dữ liệu liên quan. Họ sử dụng các ngôn ngữ lập trình như Java, Scala, C++ hoặc Python tùy theo nhiệm vụ của họ.

Data Analysts 

Tham gia tìm kiếm dữ liệu liên quan từ các nơi khác nhau và chuẩn bị nó để phân tích kĩ hơn. Dựa theo phân tích, một nhà phân tích dữ liệu phải đưa ra kết luận, hoàn thành các báo cáo cùng hình ảnh minh hoạ. 

Workload của một Data Scientist

Công việc của sẽ được phân chia như sau:

Tiếp xúc và giao tiếp với lãnh đạo cũng như khách hàng (15%)

Lọc sạch dữ liệu, Học data, Visual hoá, Xử lý, Chuyển đổi, và Thấu hiểu (70%)

Báo cáo, Soạn Slide Decking, và Build nên Công cụ ra quyết định tự động) (15%)

Leave a comment

Your email address will not be published. Required fields are marked *