Metadata là gì?

Metadata đã được đề cập, bắt đầu nghiên cứu từ năm 1968 bởi Philip Bagley, trong cuốn sách của ông “Extension of programming language concepts” (Mở rộng các khái niệm ngôn ngữ lập trình) và ngày càng được ứng dụng rộng rãi. Trên thế giới đã có nhiều tiêu chuẩn quốc tế, lược đồ, giao thức hướng trực tiếp hoặc có liên quan nhằm chuẩn hóa Metadata ví dụ như ISO19115/ISO19119/ISO19110 (International Standard 2003), Dublin Core, METS… Những tiêu chuẩn, lược đồ này không nằm ngoài mục tiêu thống nhất và ứng dụng Metadata vào các hệ thống thư viện – danh bạ dữ liệu.

Trên cơ sở các tiêu chuẩn đã thiết lập ở trên, các công cụ tạo lập Metadata thường bao gồm các nhóm chức năng sau (Brand 2003, p. 6):

Hỗ trợ khuôn mẫu Metadata: Cho phép người dùng nhập các giá trị Metadata vào một tập các trường được thiết lập sẵn. Chức năng này sau đó sẽ định dạng và tạo lập các đối tượng thuộc tính và giá trị tương ứng của chúng theo chuẩn.

Các công cụ đánh dấu (Mark-up tools): Hỗ trợ cấu trúc hóa các thuộc tính và giá trị của chúng theo một ngôn ngữ cấu trúc được xác định. Đa phần các công cụ này tạo các tài liệu XML hoặc SGML

Các công cụ trích xuất Metadata: Hỗ trợ tự động tạo các Metadata từ việc phân tích dữ liệu số. Tuy vậy, khả năng tự động tạo lập thông tin cũng như chất lượng Metadata được tạo ra phụ thuộc rất nhiều vào mức độ số hóa, thuật toán phân tích cũng như nội dung và cấu trúc nguồn dữ liệu số. Đa phần Metadata được tạo thành phải được kiểm tra lại thủ công trước khi đưa vào hệ thống hoặc sử dụng.