Programmer Hadoop en Java : Approfondissement
Wat zijn de doelstellingen van de opleiding?
Opleidingsprogramma
Bien-fondé des données distribuées
Optimiser les performances du débit des données
Utiliser la redondance pour récupérer les données
Interfacer avec le système de fichiers distribué Hadoop
Analyser la structure et l'organisation du HDFS
Charger des données brutes et récupérer le résultat
Lire et écrire des données avec un programme
Manipuler les types SequenceFile d'Hadoop
Partager des données de référence avec DistributedCache
Structurer les données avec HBase
Passer du stockage structuré au stockage non structuré
Appliquer les principes NoSQL avec une application de modèle à la lecture, se connecter à HBase à partir des tâches MapReduce, comparer HBase avec d'autres types de magasins de données NoSQL
Exploiter la puissance de SQL avec Hive
Structurer bases de données, les tables, les vues et les partitions
Intégrer des travaux MapReduce avec des requêtes Hive
Lancer des requêtes avec HiveQL
Accéder aux servers Hive via IDBC, ajouter des fonctionnalités à HiveQL avec les fonctions définies par l'utilisateur
Tester et déboguer le code Hadoop
Enregistrer des événements importants à auditer et à déboguer
Valider les spécifications avec MRUnit
Déboguer en mode local
Déployer, surveiller et affiner les performances
Déployer la solution sur un cluster de production
Uutiliser des outils d'administration pour optimiser les performances
Surveiller l'exécution des tâches via les interfaces utilisateur web



Een ogenblik, aub...