Metadata – Dữ liệu của dữ liệu, siêu dữ liệu – là một khái niệm không hề mới. Tuy nhiên, việc ứng dụng nó vào công tác quản lý trong lĩnh vực tài nguyên nước lại là một cách làm đầy sáng tạo và mang tính đột phá, giúp cho các nhà quản lý có cái nhìn tổng thể để có thể hỗ trợ việc ra quyết định một cách nhanh chóng và chính xác.
Trước mắt, chúng ta cần phải hiểu Metadata có nghĩa là gì? Có thể hiểu metadata là dữ liệu về dữ liệu hoặc thông tin về thông tin hoặc một cách dịch khác được nhiều người sử dụng là: Siêu dữ liệu. Tuy nhiên, trong một vài tính huống, cách dịch nghĩa vẫn không truyền tải hết được nội dung đích thực của từ Metadata mà người sử dụng muốn hướng đến, khi đó từ gốc “metadata” được sử dụng.
Thuật ngữ “Metadata” được đặt ra vào năm 1968 bởi Philip Bagley, trong cuốn sách của ông “Extension of programming language concepts” (Mở rộng các khái niệm ngôn ngữ lập trình) trong đó ông đã sử dụng thuật ngữ trong tiêu chuẩn ISO 11179 – “siêu dữ liệu cấu trúc” có thể hiểu là “dữ liệu có cấu trúc về dữ liệu” hoặc “metacontent” như các loại dữ liệu thường được tìm thấy trong thư mục thư viện. Kể từ đó các lĩnh vực quản lý thông tin, thông tin khoa học, công nghệ thông tin, thư viện và GIS đã áp dụng rộng rãi thuật ngữ. Trong các lĩnh vực đều thống nhất chung: Từ “Metadata” được định nghĩa là “dữ liệu về dữ liệu”. Trong khi định nghĩa được chấp nhận chung, có nhiều ngành khác nhau đã chấp nhận lời giải thích của riêng cụ thể của họ hoặc sử dụng nguyên gốc của thuật ngữ này – Metadata
Bản chất hoạt động thông tin lưu trữ truyền thống, từ lâu đã có những khái niệm liên quan đến metadata. Các bản thư mục chứa các dữ liệu mô tả đối tượng như bộ thẻ phông, các bộ thẻ về hồ sơ theo chuyên đề, theo tác giả,… cũng được coi như là một dạng metadata. Với việc tự động hóa công tác biên mục, các bộ thẻ được thay thế bằng biểu ghi thư mục. Như vậy thành phần metadata còn có thể được trình bày trong biểu ghi gọi tắt là là biểu ghi siêu dữ liệu (metadata record) của đối tượng được cơ sở dữ liệu quản lý. Với tài nguyên truyền thống trên giấy, thông tin mô tả được bố trí nằm ngoài đối tượng mà nó mô tả (Ví dụ, trên phiếu nhập tin trong biểu ghi của CSDL). Nhờ những yếu tố mô tả như vậy, người ta có thể xác định và tìm kiếm lại được tài liệu một cách chính xác theo một vài yếu tố.
Bằng những luận giải kể trên, có thể thấy metadata là một khái niệm hết sức mềm dẻo và mang tính chất đặc thù theo ngành hay đặc trưng của lĩnh vực ứng dụng. Metadata được sử dụng từ mức đơn giản nhất như một bộ chỉ mục về nơi lưu trữ tài liệu đến mức phức tạp hơn khi kết hợp thêm nhiều thông tin thuộc tính dữ liệu phục vụ công tác tìm kiếm theo nhiều tiêu chí đối với cả các hệ thống quản lý dữ liệu giấy (thư viện, kho lưu trữ…) hoặc hệ thống dữ liệu số phức tạp (thư viện số, cơ sở dữ liệu…)
Trong phạm vi nghiên cứu và ứng dụng của metadata trong lĩnh vực quản lý tài nguyên nước, thuật ngữ metadata được sử dụng ở đây được hiểu là: “dữ liệu mô tả các thuộc tính cũng như tóm tắt những nội dung cơ bản của đối tượng thông tin quản lý”. Trong đó, đối tượng thông tin quản lý cụ thể là các dự án, đề án, đề tài lĩnh vực tài nguyên nước đã và đang thực hiện.
Như vậy, chúng ta có thể thấy, việc ứng dụng Metadata trong công tác quản lý dữ liệu là vô cùng cần thiết, đặc biệt đối với lĩnh vực quản lý tài nguyên nước. Khi áp dụng metadata vào công tác quản lý thông tin, sẽ tạo thành một công cụ hỗ trợ đắc lực cho các cấp quản lý ra quyết định trong vấn đề mở mới, bổ sung và hoàn thiện các đề tài, các nghiên cứu khoa học cũng như các công trình, dự án trong phạm vi quản lý của mình.
Đến đây, chúng ta cần phải hiểu quy chế hoạt động của metadata trong lĩnh vực quản lý tài nguyên nước được thực hiện như thế nào?
Công tác nghiên cứu, điều tra tài nguyên nước đã được tiến hành từ những năm 60 của thế kỷ trước tại Việt Nam. Qua hơn 50 năm, hàng trăm đề tài, dự án lớn nhỏ khác nhau về tài nguyên nước, từ điều tra dạng diện mang tính lãnh thổ đến đánh giá các điểm cụ thể đã được hoàn thành. Các dạng công tác này đã để lại một khối lượng khổng lồ tài liệu rất giá trị cho việc khai thác sử dụng một cách lâu dài. Hiện có hai hình thức lưu trữ đối với các tài liệu kết quả này:
+Thứ nhất: Lưu trữ các tài liệu kết quả (thuyết minh, báo cáo, bản đồ) dưới dạng giấy (bản cứng) trước đây do Tổng cục Địa chất nay do Cục quản lý tài nguyên nước quản lý.
+Thứ hai: Xây dựng cơ sở dữ liệu lĩnh vực tài nguyên nước (Cụ thể ở đây là Dự án “Xây dựng cơ sở dữ liệu tích hợp Tài nguyên và Môi trường quốc gia” – lĩnh vực tài nguyên nước đang được triển khai do Cục Công nghệ và Thông tin – Bộ Tài nguyên và Môi trường chủ trì) nhằm số hóa, biên tập, lưu trữ và tra cứu dữ liệu tài nguyên nước.
Trong cả hai hình thức đều tồn tại vấn đề cần giải quyết sau:
Thông tin phục vụ quản lý công tác lưu trữ ở hình thức thứ nhất cùng với kết quả công tác kiểm kê, đánh giá hiện trạng, hiệu quả, tài liệu các đề tài dự án lĩnh vực tài nguyên nước đã và đang thực hiện xem như là một dạng metadata về các đề tài, dự án tuy nhiên còn đơn giản, thiếu tính thống nhất. Quan trọng hơn nữa là các “metadata” này tồn tại riêng lẻ (sổ lưu trữ, file lưu trữ đơn lẻ) mà không có hệ thống lưu trữ, quản lý cũng như các công cụ tìm kiếm, khai thác các thông tin này.
Đối với hình thức thứ 2: Dự án “Xây dựng cơ sở dữ liệu tích hợp Tài nguyên và Môi trường quốc gia” – lĩnh vực tài nguyên nước sử dụng metadata để mô tả các thông tin về kiến trúc dữ liệu lưu trữ. Metadata được sử dụng trong trường hợp này là các thông tin về kiểu, định dạng, kích thước, ràng buộc… các trường và đối tượng dữ liệu và không có ý nghĩa trong quản lý nhà nước về các dự án lĩnh vực tài nguyên nước. Bản chất và kết quả quan trọng nhất dự án là cơ sở dữ liệu chuyên môn chứa toàn bộ các kết quả, sản phẩm của đề tài, dự án lĩnh vực tài nguyên nước đã tiến hành. Tuy nhiên, để tập trung đúng và có cái nhìn tổng quan về các dữ liệu bên trong bằng cách sử dụng các chức năng tìm kiếm, thống kê theo nhiều tiêu chí trước khi đi vào khai thác dữ liệu chuyên môn thì cần thiết phải có “công cụ trợ giúp khác”.
“Công cụ trợ giúp khác” ở đây chính là hệ thống thông tin trực tuyến cung cấp thông tin cơ bản (metadata) các dự án lĩnh vực tài nguyên nước với nhiều chức năng hỗ trợ tìm kiếm, truy vấn thông tin thuộc tính cũng như qua bản đồ công nghệ WebGIS mà đề tài tập trung nghiên cứu xây dựng.
Như vậy, có thể khẳng định đối tượng quản lý của cơ sở dữ liệu tài nguyên nước thuộc dự án “Xây dựng cơ sở dữ liệu tích hợp Tài nguyên và Môi trường quốc gia” khác với hệ thống thông tin mà đề tài xây dựng. Phần “Metadata” của cơ sở dữ liệu tích hợp Tài nguyên và Môi trường là Metadata của đối tượng, bảng, trường dữ liệu lưu trữ trong khi đề tài tập trung nghiên cứu khung metadata hay rõ ràng hơn là thông tin cơ bản các dự án lĩnh vực tài nguyên nước. Kết quả của đề tài là công cụ hỗ trợ việc khai thác cơ sở dữ liệu trên một cách hiệu quả và nhanh chóng.
Trong công tác lập kế hoạch, giao nhiệm vụ hàng năm cần thiết quản lý giảm thiểu tình trạng chồng lấn các nhiệm vụ, nội dung, các vùng và phạm vi nghiên cứu… hay rà soát tránh sai sót, trùng lặp nhiệm vụ; Trong công tác triển khai thực hiện các dự án, đề tài việc tìm kiếm từ đó kế thừa lại các kết quả nghiên cứu trước nhằm tiết kiệm chi phí, nâng cao khả năng chia sẻ thông tin; Trong công tác cấp phép khai thác tài nguyên nước là việc tìm kiếm thông tin về đề tài, dự án nghiên cứu trước đây tại khu vực xin phép đều là các vấn đề cần phải được nghiên cứu giải quyết.
Có được hệ thống thông tin trực tuyến cung cấp metadata các dự án tài nguyên nước sẽ giúp giải quyết các vấn đề trên. Ngoài ra, hệ thống thông tin này cũng giúp tổ chức, lưu trữ tài liệu kết quả dự án thêm chặt chẽ, khoa học và hỗ trợ truyền tải thông tin đến người sử dụng hoặc các đối tượng khách hàng có nhu cầu khai thác thông tin – phục vụ thiết thực định hướng kinh tế hóa ngành tài nguyên môi trường lĩnh vực tư liệu, thông tin tài nguyên nước.
(Thanh Sơn – TTDLQH&ĐTTNN)