Thu thập và lưu trữ dữ liệu thủ công một cách thô sơ đã khiến bạn tốn thời gian, chi phí bao lâu nay. Đến với bài viết thứ 2 trong series “Câu chuyện học viên”. Smart Data sẽ chia sẻ về giải pháp giúp bạn “xóa sổ” những pain point kia mãi mãi. Đó là cách xây dựng hệ thống tự động thu thập và lưu trữ dữ liệu trên các sàn thương mại điện tử (eCommerce) bằng giao thức API.
Thông qua bài viết này, bạn sẽ:
Với những ai đã và đang kinh doanh trên chuỗi các sàn thương mại điện tử thì đều gặp phải bài toán:
Học viên của Smart Data quản lý một chuỗi cửa hàng trên 3 sàn thương mại điện tử. Đó là: Lazada, Shopee, TikTok Shop. Anh sử dụng một phần mềm quản lý bán hàng trực tuyến của bên thứ 3 là nhanh.vn. Mục đích để tập trung dữ liệu từ 3 sàn trên. Sau đó, bộ phận kế toán sẽ xuất thủ công những file excel từ nhanh.vn và đưa lên Google Sheet để lưu trữ.
Dựa vào thực trạng trên, Smart Data đã bóc tách và xác định được 2 vấn đề chính:
Dựa vào việc nhận diện 2 nhu cầu trên, Smart Data đã đưa ra giải pháp cho bài toán này với ưu điểm như sau:
Trước khi tìm hiểu giải pháp, bạn cần làm quen với một số thuật ngữ quan trọng để có thể hiểu được nội dung chúng tôi chia sẻ bên dưới:
Sàn thương mại điện tử (TMĐT): Nơi diễn ra các hoạt động mua bán trực tuyến. Tại Việt Nam có các sàn TMĐT lớn và quen thuộc với người tiêu dùng như Shopee, TikTok Shop, Lazada,…
Hệ thống thu thập và lưu trữ dữ liệu: Một tập hợp các đường dẫn dữ liệu (data pipeline) từ các sàn TMĐT đến hệ thống lưu trữ dữ liệu của doanh nghiệp (data-warehouse). Với các data analyst làm việc nhiều với dữ liệu thì sẽ thường xuyên đề cập tới thuật ngữ này.
API: Phương thức giao tiếp giữa 2 ứng dụng. Mục đích nhằm trao đổi, cập nhật hoặc đơn giản là truy xuất các loại thông tin. Giống như một phương thức giao tiếp, trao đổi thông tin chúng ta thường thực hiện hàng ngày là gọi điện thoại đến một người khác.
Kết hợp 2 nhu cầu đã nhận diện được bên trên, Smart Data đã đưa ra giải pháp: Xây dựng hệ thống tự động thu thập và lưu trữ dữ liệu bằng giao thức API.
Để xây dựng được hệ thống này, bạn cần thực hiện các bước như sau:
Sau khi tạo được tài khoản ta sẽ điền vào các thông tin cần thiết và đợi sàn xét duyệt. Thời gian là từ 1-2 tuần làm việc tùy vào chính sách mỗi sàn.
Để đẩy nhanh tiến độ, trong thời gian đợi tài khoản được cấp phép, bạn nên tham khảo trước bộ tài liệu đặc tả API để tìm ra những API cần thiết cho mục đích của mình
Postman là 1 phần mềm hỗ trợ chúng ta gọi thử và xem dữ liệu trả về từ API.
Sau khi đã tham khảo xong tài liệu đặc tả, ta sẽ dùng phần mềm Postman để gọi thử và xem dữ liệu đầu ra được sàn trả về. Đây là cơ sở để bạn phân tích và tìm hiểu sâu hơn về các chỉ số.
Pentaho là 1 phần mềm hỗ trợ ta tự động hóa các công việc có tính hệ thống và có thể lặp lại theo chu kỳ
Sau khi đã có được thông tin của từng API cần thiết, ta sẽ tiến hành dựng đường dẫn dữ liệu (data pipeline) tự động bằng phần mềm Pentaho. Mỗi đường dẫn thế này sẽ ứng với 1 API. Khi tập hợp lại, bạn sẽ có các đường dẫn như hình.
Sau khi đã đã xây dựng xong đường dẫn, ta sẽ thu được sản phẩm là hệ thống file excel. Tiếp theo, bạn cần đẩy các file này lên phần mềm Google Drive. Hệ thống khi này sẽ luôn trực tuyến, tập trung và dễ dàng hơn trong việc tiếp cận.
Đọc thêm: Câu chuyện học viên: Automation Dashboard theo dõi dòng tiền thu chi
Hệ thống thu thập và lưu trữ dữ liệu thô sơ chắc chắn là một “nỗi đau” chung của nhiều doanh nghiệp. Đặc biệt với các doanh nghiệp muốn mở rộng quy mô kinh doanh thì hệ thống thiếu bài bản sẽ là rào cản lớn.
Hy vọng bài viết này sẽ mang tới cho bạn những thông tin hữu ích. Giúp bạn giải phóng thời gian và công sức bằng giải pháp tự động tối ưu, linh hoạt và hiệu quả.
Đây là khóa học giúp bạn thu thập & Chuẩn hóa dữ liệu không cần code. Vì vậy dù không có background IT, bạn vẫn có thể giải quyết được ngay các bài toán thu thập, chuẩn hóa toàn bộ dữ liệu cho công việc của mình.
Khóa học phù hợp với những bạn đang:
Và dữ liệu thu thập bằng “cơm” một cách thủ công thì đang trong tình trạng là:
👉 Thì giải pháp cho bài toán của bạn nằm ở đây! Đăng ký học thử miễn phí ngay!