Sự tiến hóa trong quản lý dữ liệu

Trong các tổ chức ở mọi quy mô và lĩnh vực hoạt động, việc quản lý và phân tích dữ liệu luôn đóng vai trò quan trọng nhất và luôn gặp nhiều thách thức nhất. Các công ty luôn phải vật lộn với việc phải tìm ra 1 hướng tiếp cận hiểu quả để thu được thông tin về khách hàng, sản phẩm và dịch vụ của họ. Với 1 công ty có ít khách hàng, phương thức kinh doanh đơn giản, thì mọi thứ khá đơn giản. Nhưng qua thời gian, các công ty và các thị trường họ tham gia đã phát triển phức tạp hơn. Để tồn tại hay để có được lợi thế cạnh tranh, các công ty đã thêm nhiều dòng sản phẩm hơn và đa dạng cách thức cung cấp sản phẩm của họ. Và việc này dẫn đến việc khối lượng thông tin và dữ liệu mà các công ty phải quản lý và phân tích ngày càng nhiều hơn.

Chúng ta đang đối mặt với nhiều vấn đề phức tạp khi nói đến dữ liệu. 1 vài dữ liệu có cấu trúc được lưu trữ trong 1 CSDL quan hệ truyền thống, trong khi những dữ liệu khác, bao gồm tài liệu, bản ghi dịch vụ khách hàng, và thậm chí là hình ảnh và video, là những dữ liệu phi cấu trúc. Ngoài ra, còn có các nguồn dữ liệu mới được tạo ra bởi máy móc như các sensor trong các thiết bị chẳng hạn …

Nhiều nguồn thông tin mới đã được con người tạo ra, như là các dữ liệu media trên mạng xã hội (social media), dữ liệu click-stream được tạo ra từ việc tương tác website. Thêm nữa, việc có măt của những thiết bị di động mới hơn, mạnh hơn cùng với sự phát triển và phổ biến của mạng Internet đang dẫn đến việc tạo ra các nguồn dữ liệu mới.

Mặc dù mỗi nguồn dữ liệu có thể được quản lý và tìm kiếm độc lập, thách thức hiện nay là làm sao các công ty có thể tạo ra sự giao nhau của tất cả các loại dữ liệu khác nhau này. Khi chúng ta làm việc với quá nhiều thông tin ở nhiều hình thức khác nhau, không thể nghĩ về việc quản lý dữ liệu theo những cách truyền thống. Mặc dù chúng ta có nhiều dữ liệu, nhưng khác biệt ngày nay là chúng nhiều hơn, và đa dạng hơn theo thời gian. Để khai thác các dữ liệu này hiệu quả hơn, chúng ta phải nghĩ về quản lý dữ liệu theo 1 cách khác. Đó là cơ hội và cũng là thách thức của Big Data.

Đổi mới trong quản lý dữ liệu không có nghĩa là chúng ta sẽ bắt đầu với 1 cái hoàn toàn mới và cắt đứt với quá khứ. Vì cũng như bất kỳ sự đổi mới hay tăng trưởng nào, hầu hết các giai đoạn mới hay các làn sóng mới trong quản lý dự liệu được xây dựng trên những nền tảng và phương thức tiền nhiệm trước đó. Mặc dù quản lý dữ liệu thường được nhìn qua lăng kính của phần mềm, nhưng chúng ta cần phải nhìn nhận nó từ 1 quan điểm toàn diện.

Quản lý dữ liệu phải bao gồm các tiến bộ công nghệ trong phần cứng, lưu trữ, mạng, và các mô hình tính toán như ảo hóa (virtualization) và điện toán đám mây (cloud computing). Sự hội tụ của các công nghệ mới nổi và việc giảm chi phí trong việc lưu trữ và tính toán đã biến đổi bối cảnh dữ liệu và tạo ra nhiều cơ hội mới. Khi tất cả các yếu tố công nghệ này hội tụ, nó đang biến đổi cách chúng ta quản lý và tận dụng dữ liệu.

Big data là xu hướng mới nhất xuất hiện dựa trên những yếu tố này. Big data được định nghĩa là bất cứ nguồn dữ liệu nào mà có ít nhất 3 đặc trưng sau:

  • Qui mô dữ liệu rất lớn.
  • Tốc độ phát sinh và thao tác dữ liệu rất cao.
  • Các loại dữ liệu rất đa dạng.

Big data quan trọng vì nó cho phép các tổ chức thu thập, lưu trữ, quản lý, và thao tác lượng lớn dữ liệu với tốc độ phù hợp, tại đúng thời điểm, để có được đúng những thông tin cần thiết. Big data không phải là 1 công nghệ riêng lẻ; thay vào đó, nó là sự kết hợp của các cách mạng công nghệ trong 50 năm gần đây. Sự bùng nổ dữ liệu đang đặt ra cho các công ty, tổ chức và chúng ta nhiều cơ hội, và cũng nhiều thách thức hơn.

Leave a Reply