Tue. Oct 22nd, 2024

Vậy hiểu Data Centralization như thế nào là đúng? Ví dụ dữ liệu doanh nghiệp bạn đang ở dạng excel hoặc ở các hệ thống khác nhau như hệ thống ERP, CRM, bạn muốn gom tất cả dữ liệu ở các hệ thống, file này về tập trung 1 nguồn để có thể tối đa hóa việc sử dụng cũng như ra báo cáo “on-demand” tức là sếp muốn nửa đêm thì cũng có thể tự động có cho sếp chứ không phải ngồi làm báo cáo mất 5-7 ngày. Tức là mình muốn có 1 database đã được centralized. Phần này mình sẽ nói rõ hơn trong lớp DA30. Rồi khi data được chuẩn hóa chúng ta có thể move lên bước cao hơn là lập model dự đoán.
Và để làm được như thế thì cần 1 team gồm 2 người: 1 bạn Data Engineer và 1 bạn Data Analyst. Vì sao cần 2 người vì 1 người sẽ chịu trách nhiệm tích hợp các hệ thống, đảm bảo luồng chạy thông suốt, không drop chính là bạn Data Engineer, còn bạn Data Analyst sẽ chịu trách nhiệm Data model, làm ra các báo cáo bằng tool Visualization.
Qúa trình Data Centralization thường mất bao nhiêu lâu? Thường để Data Centralization mình sẽ chia nhỏ các giai đoạn dựa vào độ ưu tiên, độ dễ của dữ liệu hoặc dựa vào nguồn dữ liệu nào cần centralized trước.
Và thường ít nhất sẽ tầm từ 6 tháng đến 1 năm đó là việc của 2 người làm.
Bởi vì 1 team Data mới thì cũng phải để họ thấu hiểu được công ty về business về domain và cộng luôn các việc setup kĩ thuật thì tầm 6 tháng mới có thể ra 1 sản phẩm thành hình nào đó cho business sử dụng.
Trên đây là “kinh nghiệm” đã triển khai rất nhiều hệ thống và ở công việc hiện tại thì Cô giáo dạy data Mai Ngân cum luôn việc của DE và DA và trong 6 tháng hoàn tất hết mọi thứ. Đây cũng là 1 tốc độ khá nhanh và tại sao có thể nhanh được như thế cũng sẽ bật mí cho các bạn trong lớp DA30 nhé.
Những kinh nghiệm này không có trong sách vở đâu các bạn vì đó là xương máu.
𝐓𝐢̀𝐦 𝐭𝐡𝐚̂̀𝐲 𝐩𝐡𝐮̀ 𝐡𝐨̛̣𝐩 𝐜𝐚́𝐜 𝐛𝐚̣𝐧 𝐧𝐞̂𝐧 𝐡𝐨̉𝐢 𝐧𝐠𝐮̛𝐨̛̀𝐢 đ𝐨́ đ𝐚̃ 𝐭𝐮̛̀𝐧𝐠 𝐜𝐨́ 𝐤𝐢𝐧𝐡 𝐧𝐠𝐡𝐢𝐞̣̂𝐦 𝐠𝐢̀ đ𝐚̃ 𝐥𝐚̀𝐦 𝐪𝐮𝐚 𝐜𝐚́𝐜 𝐯𝐢̣ 𝐭𝐫𝐢́ 𝐠𝐢̀, 𝐛𝐚𝐨 𝐧𝐡𝐢𝐞̂𝐮 𝐧𝐚̆𝐦 𝐤𝐢𝐧𝐡 𝐧𝐠𝐡𝐢𝐞̣̂𝐦, đ𝐮̛̀𝐧𝐠 𝐭𝐢𝐧 𝐧𝐡𝐮̛̃𝐧𝐠 𝐠𝐢̀ 𝐡𝐨̣ 𝐧𝐨́𝐢, 𝐡𝐚̃𝐲 𝐭𝐡𝐚̂́𝐲 𝐧𝐡𝐮̛̃𝐧𝐠 𝐠𝐢̀ 𝐡𝐨̣ 𝐥𝐚̀𝐦.

By admin

Leave a Reply

Your email address will not be published. Required fields are marked *