Big Data / Panama Papers : déduplication et OCR pour donner du sens à l'énorme masse de données

Indexer et analyser 2,6 To de données non structurées n'a pas été une mince affaire. C'était pourtant le sous-jacent technique des révélations du Panama Papers. Le point sur les techniques utilisées.

from ZDNet - Business et Solutions IT http://ift.tt/1MQ6MDY
via IFTTT

Commentaires

Articles les plus consultés