02.09.2021|Non classifié(e)

Avec l‘analyse des métadonnées pour l’exploration de données

GRAU DATA Metadata-Hub extrait les balises de métadonnées de plus de 320 formats de fichiers de grands pools de données

Schwäbisch Gmünd 2 septembre 2021 – Avec son hub de métadonnées, GRAU DATA présente une nouvelle solution pour lire et capturer les métadonnées. Cela donne aux entreprises la possibilité de rechercher leurs données non structurées en détail, de les analyser, de les intégrer dans des projets de Big Data et d’utiliser le potentiel de grands volumes de données non structurées de manière durable et à long terme.

« Plus de 80 % de toutes les données des entreprises sont sous une forme non structurée et la plupart des entreprises n’ont pas encore eu la possibilité d’utiliser les données, leur contenu et, surtout, leur valeur de manière durable. Sans une analyse détaillée des métadonnées, les données sont sans valeur après un court laps de temps car le contenu ne peut plus être tracé. Avec le hub de métadonnées, le potentiel de grandes quantités de données peut être exploité rapidement et facilement », explique Herbert Grau, directeur général de GRAU DATA GmbH.

Le hub de métadonnées reconnaît, analyse et traite les métadonnées « intégrées » à partir de données non structurées sur des systèmes de fichiers de toute taille, peut traiter plus de 320 formats de fichiers et lire plus de 50 000 balises de métadonnées différentes en très peu de temps. Les métadonnées « intégrées » contiennent des informations beaucoup plus complètes que les métadonnées standard du système de fichiers. Le Metadata Hub est bien plus puissant que les solutions, qui se limitent pour la plupart à certains formats de fichiers et ne permettent pas une analyse inter-entreprises et inter-services de tous les formats de fichiers.

Universellement applicable et évolutif selon les besoins

Le hub de métadonnées est indépendant de la plate-forme et peut être facilement et rapidement intégré dans presque toutes les structures informatiques. Il est contrôlé via une interface Web basée sur un navigateur. Le hub de métadonnées peut être mis à l’échelle selon les besoins en installant plusieurs hubs en parallèle et en les administrant via l’interface utilisateur Web centrale. Cela signifie que le hub de métadonnées peut être utilisé dans des entreprises de toutes tailles et avec n’importe quelle quantité de fichiers – des moyennes entreprises classiques aux entreprises ou aux grands organismes de recherche avec des milliards de fichiers.

Le composant central du concentrateur de métadonnées est le robot d’exploration et la moissonneuse de système de fichiers intelligents (collecteur de métadonnées). Cela extrait en continu les métadonnées intégrées des fichiers. Le Crawler & Harvester accède à toutes les métadonnées « intégrées » via NFS ou SMB et extrait des millions de balises en très peu de temps. Les balises sont stockées dans une base de données spécialement conçue immédiatement après l’extraction. Les méta-informations sont alors disponibles sous une forme structurée, par exemple pour les évaluations et les requêtes. Une API basée sur GraphQL, un SDK Python natif et une interface de ligne de commande complète offrent également une intégration transparente dans des solutions tierces pour le traitement automatisé du Big Data.