Big Data / Panama Papers : déduplication et OCR pour donner du sens à l'énorme masse de données
Indexer et analyser 2,6 To de données non structurées n'a pas été une mince affaire. C'était pourtant le sous-jacent technique des révélations du Panama Papers. Le point sur les techniques utilisées.
from ZDNet - Business et Solutions IT http://ift.tt/1MQ6MDY
via IFTTT
from ZDNet - Business et Solutions IT http://ift.tt/1MQ6MDY
via IFTTT
Commentaires
Enregistrer un commentaire