Metadaten sind im Wesentlichen nur Daten, die Informationen über andere Daten enthalten. Sie sind äußerst vielseitig und werden für verschiedene Zwecke genutzt, wie zum Beispiel zur Indexierung oder Durchsuchung von Datenbeständen. Suchmaschinen verwenden Metainformationen aus HTML-Seiten, um Inhalte zu indizieren. Diese Metadaten können manuell oder automatisch erstellt werden und entweder direkt in den Hauptdaten gespeichert oder als separate Datensammlung angelegt werden. Metadaten werden oft verwendet, um umfangreiche Datensammlungen wie Dokumente, Bücher, Datenbanken oder Dateien zu beschreiben. Sie können auch Details über einzelne Objekte enthalten, wie beispielsweise den Zeitpunkt und die Dauer eines Anrufs, den Aufnahmeort eines Fotos oder den Autor eines Dokuments.
Metadaten zeichnen sich dadurch aus, dass sie nicht integraler Bestandteil der verarbeiteten Datei sind und daher separat von den Hauptdaten aufbewahrt werden können. Dies ist vergleichbar mit dem Stichwortkatalog in einer Bibliothek, wo man nach einem Buch suchen kann, Informationen über den Titel und den Autor erhält und das Buch dann aus dem Regal holen kann. In der der elektronischen Datenwelt funktioniert dies ähnlich. Die meisten Dateisysteme verwenden vordefinierte Metadaten, wie zum Beispiel die Meta-Information des Dateityps, die Teil des Dateinamens ist, wie die Erweiterung „.docx“ für Word-Dokumente oder „.dotx“ für Word-Vorlagen. Dabei fällt auf, dass viele Metadaten in Bezug auf Datenschutz und Informationssicherheit unbedenklich sind. Einige Metadaten können jedoch sensibel sein. Manchmal beinhalten Metadaten sensible personenbezogene Daten, wie zum Beispiel eine E-Mail Adresse mit vollem Vornamen und Nachnamen. Um Rückschlüsse, die zu einer Identifizierung führen, verhindern zu können, können E-Mail-Adressen oder Benutzernamen pseudonymisiert werden. Metadaten, die in allgemeiner Form verfasst sind, bergen tendenziell geringere Datenschutzrisiken. In der Regel werden Metadaten nicht streng geschützt, sind grundsätzlich einsehbar und könnten potenziell von Unbefugten genutzt werden.