06/10/2024 | 00:40 GMT+7 | Điện thoại: 034 39429756 | Email: hososukien@gmail.com

Giới hạn của sử dụng dữ liệu lớn

Phạm Nhẫn
Giới hạn của sử dụng dữ liệu lớn Bảo mật dữ liệu là một trong những thách thức lớn nhất của việc sử dụng dữ liệu lớn_Ảnh minh họa
Việc sử dụng dữ liệu lớn đem lại lợi ích rất to lớn trên nhiều phương diện. Bản thân dữ liệu lớn có thể không có giới hạn, nhưng việc sử dụng nó trên thực tế cả ở hiện tại lẫn trong tương lai lại không thể tránh khỏi những hạn chế không hề nhỏ, mà việc khắc phục không hề đơn giản và dễ dàng.

Những giới hạn không nhỏ

   Giới hạn trước hết nằm ở ngay trong đặc thù chung của dữ liệu lớn là chất lượng của dữ liệu không phải khi nào, ở đâu cũng đều có thể được bảo đảm và đáng được tin cậy. Hai khía cạnh chất lượng của dữ liệu ở đây là tính chuẩn xác của dữ liệu và hàm lượng giá trị thật của dữ liệu. Dữ liệu được thu thập về không theo quy trình và tiêu chí được chuẩn hóa; không tương thích với nhau về cấu trúc; không chính xác, không đầy đủ, không có hàm lượng giá trị cao thì không thể bảo đảm quyết định xử lý dữ liệu không mắc sai lầm, tránh được những kết luận lệch lạc và không thể bảo đảm cho hệ thống hoạt động luôn với hiệu quả cao. Giới hạn về độ tin cậy vào chất lượng dữ liệu lớn này khiến các mô hình dự đoán dựa trên cơ sở là xử lý dữ liệu lớn có thể không luôn luôn được chính xác và đáng tin cậy. Cho nên, việc đánh giá, xác minh mức độ chất lượng thật của dữ liệu lớn là rất cần thiết để có được kết luận chính xác nhất về kết quả cuối cùng của việc xử lý dữ liệu lớn. Giới hạn về chất lượng thật sự của dữ liệu lớn đưa đến giới hạn hiệu quả thiết thực của việc xử lý dữ liệu lớn.

   Giới hạn lớn khác nữa của việc sử dụng dữ liệu lớn là năng lực của con người và khả năng của khoa học, kỹ thuật và công nghệ về xử lý, sử dụng dữ liệu lớn không phải là vô hạn mà cũng bị giới hạn. Con người phụ thuộc vào khoa học, kỹ thuật và công nghệ trong việc sử dụng dữ liệu lớn, cho dù quyết định có sử dụng hay không sử dụng kết quả của việc xử lý dữ liệu lớn. Trong quá trình này, năng lực phân tích, hiểu dữ liệu của con người không phải vô hạn. Con người cần có đủ năng lực chuyên môn, kinh nghiệm thực tiễn cho việc sử dụng các công nghệ, phần mềm phân tích dữ liệu. Trong khi đó, để đáp ứng được những yêu cầu, đòi hỏi đó cần có sự đầu tư lớn về tiền của, thời gian, nhân lực để đào tạo, bồi dưỡng, phát triển nguồn nhân lực cần thiết. Kết quả của việc xử lý dữ liệu lớn không thể hoàn toàn thay thế khả năng suy luận, quyết định của con người, bởi chỉ con người mới có đủ khả năng hiểu biết đầy đủ nhất về tình hình khi đưa ra quyết định hay lựa chọn cuối cùng.

Để xử lý, sử dụng dữ liệu lớn, con người cần công cụ khoa học, thiết bị kỹ thuật hiện đại và công nghệ cao. Chẳng hạn như máy chủ công suất lớn, thiết bị lưu trữ dữ liệu, công nghệ phần mềm rất phát triển,... đòi hỏi đầu tư rất tốn kém để có được và chi phí lớn để duy trì hoạt động hiệu quả. Kỹ thuật và công nghệ, thiết bị và máy móc, công nghệ phần mềm và quy trình quản lý thiết yếu cho việc xử lý, sử dụng dữ liệu lớn lại luôn cần được không ngừng phát triển, cập nhật tiến bộ hiện đại mới, tức là không ngừng tiêu tốn mọi nguồn nhân lực, vật lực, tài lực và thời gian của con người.

Việc xử lý, sử dụng dữ liệu lớn còn bị hạn chế bởi những giới hạn về luật pháp, đạo đức và xã hội. Dữ liệu lớn chứa đựng cả thông tin về cá nhân và thông tin nhạy cảm liên quan đến bí mật cá nhân, bí mật quốc gia. Vì thế, vấn đề bảo vệ bí mật dữ liệu, bảo đảm an ninh dữ liệu làm cho không thể tùy tiện xử lý dữ liệu lớn và sử dụng dữ liệu lớn bất chấp mọi quy định của luật pháp, của đạo lý và của xã hội. Nguy cơ về quyền riêng tư bị xâm hại và an ninh không được bảo đảm đặc biệt nghiêm trọng trong lĩnh vực y tế và tài chính. Vì thế, các chế tài cần thiết liên quan phải đặc biệt chặt chẽ và nghiêm khắc.

Giải pháp khắc phục

Để khắc phục những giới hạn nói trên, trước hết cần không ngừng nâng cao chất lượng dữ liệu bằng cách đầu tư đúng mức, kịp thời vào các công cụ, kỹ thuật, công nghệ hiện đại và thích hợp nhất; luôn coi trọng việc xác thực, chuẩn hóa và tiêu chuẩn hóa dữ liệu. Qua đó nâng cao tính chính xác, độ tin cậy của dữ liệu, giảm sai sót và gia tăng tính khả thi trên thực tế của các quyết định dựa trên xử lý dữ liệu lớn.

Bảo mật dữ liệu là một trong những thách thức lớn nhất của việc sử dụng dữ liệu lớn. Vì thế, cần thật sự coi trọng việc đầu tư đúng mức vào các giải pháp bảo mật dữ liệu hiệu quả như mã hóa dữ liệu, giám sát an ninh và kiểm soát truy cập.

Việc xây dựng và không ngừng tăng cường năng lực phân tích, xử lý dữ liệu đóng vai trò rất quyết định đối với công cuộc vượt qua những giới hạn nói trên trong xử lý, sử dụng dữ liệu lớn. Cho nên rất cần coi trọng, dành ưu tiên hàng đầu cho việc phát triển nguồn nhân lực; tập trung vào đào tạo và phát triển nhân tài; tạo dựng môi trường làm việc sáng tạo, đổi mới; cung cấp các công cụ, nguồn lực phân tích dữ liệu phù hợp.

Giới hạn đối với việc xử lý, sử dụng dữ liệu lớn có thể được vượt qua khi con người ngay từ đầu đề ra chiến lược rõ ràng, nhất quán cho việc xử lý, quản lý và sử dụng dữ liệu lớn. Trong các chiến lược này, cần phải xác định rõ ràng và cụ thể những mục tiêu muốn đạt được với việc sử dụng dữ liệu lớn.

Dữ liệu lớn vốn không bị bó hẹp trong phạm vi khuôn khổ ranh giới quốc gia hay vùng lãnh thổ. Toàn cầu hóa và hội nhập quốc tế lại tiến triển rất mạnh mẽ trong thế giới hiện đại. Vì vậy, để vượt qua những giới hạn đối với việc xử lý, sử dụng dữ liệu lớn, các quốc gia và vùng lãnh thổ trên thế giới buộc phải hợp tác với nhau trên tất cả những phương diện liên quan đến dữ liệu lớn; phải đồng hành với nhau để giải quyết mọi vấn đề đặt ra; phải hỗ trợ và tương tác lẫn nhau. Không phải là lĩnh vực duy nhất nhưng ở việc bảo vệ bí mật dữ liệu, chống thao túng và làm giả dữ liệu, đối phó tội phạm có tổ chức xuyên quốc gia liên quan đến dữ liệu lớn thể hiện rõ nhất sự cần thiết phải hợp tác quốc tế để đạt được hiệu quả cao nhất trong việc sử dụng dữ liệu lớn. Từ giác độ hợp tác quốc tế này mà suy xét, sẽ thấy dữ liệu lớn là một dạng sản phẩm tổng hợp của kỹ thuật, công nghệ số, của toàn cầu hóa và của thế giới hiện đại. Vì vậy, việc khắc phục những giới hạn đối với xử lý, sử dụng dữ liệu lớn vừa là chuyện chung của cả thế giới, vừa là chuyện riêng của từng quốc gia và vùng lãnh thổ. Các quốc gia và vùng lãnh thổ phải đặt cả việc sử dụng dữ liệu lớn và việc tháo gỡ những giới hạn nêu trên trong mối liên hệ mật thiết, tương tác qua lại giữa thế giới với quốc gia và vùng lãnh thổ.

Giới hạn đối với việc xử lý và sử dụng dữ liệu lớn còn biến đổi theo thời gian, sẽ còn xuất hiện giới hạn mới. Cũng vì thế mà con người cần phải dùng cả chính việc xử lý và sử dụng dữ liệu lớn để phá bỏ những giới hạn nêu trên./.