Le Big Data
Accueil » Big Data
La croissance future de DSO SERVICES reposera sur sa capacité à croître de manière organique sur son périmètre actuel ou à aller chercher de la croissance externe par voie d’acquisition.
Qu’est ce que le Big Data?
Big Data désigne des ensembles de données devenus si volumineux qu’ils dépassent l’intuition et les capacités humaines d’analyse et même celles des outils informatiques classiques de gestion de base de données ou de l’information.
Que recouvre la notion du Big Data ?
Le Big Data fait référence à l’explosion du volume des données dans l’entreprise et des nouveaux moyens technologiques proposés par les éditeurs, en particulier de la Business Intelligence, pour y répondre.
Sur quelles technologies reposent les solutions Big Data ?
Pour optimiser les temps de traitement sur des bases de données géantes, plusieurs solutions peuvent entrer en jeu :
- Des bases de données NoSQL (comme MongoDB, Cassandra ou Redis) qui implémentent des systèmes de stockage considérés comme plus performants que le traditionnel SQL pour l’analyse de données en masse (orienté clé/valeur, document, colonne ou graphe).
- Des infrastructures de serveurs pour distribuer les traitements sur des dizaines, centaines, voire milliers de nœuds. C’est ce qu’on appelle le traitement massivement parallèle. Le framework Hadoop est sans doute le plus connu d’entre eux. Il combine le système de fichiers distribué HDFS, la base NoSQL HBase et l’algorithme MapReduce. D’autres technologies visant à tendre vers des traitements plus “temps réel” ont émergé dans la foulée (c’est le cas d’Apache Spark).
- Le stockage des données en mémoire (Memtables) permet d’accélérer les temps de traitement des requêtes.