22 av. de l'Observatoire - 75014 PARIS Tél. 01 46 72 37 80
Big Data et indemnisation du préjudice corporel
Le Big Data va permettre aux avocats spécialistes en indemnisation de victimes de dommage corporel (erreurs médicales et accidents de la route par exemple) d'avoir accès à un très grand nombre de décisions de justice permettant de développer des algorithmes notamment ceux d'une justice prédictive d'indemnisations de victimes rendant obsolètes des barèmes et référentiels actuels. Mais la démarche n'est pas sans risque.
Le "Big Data" ou données massives désigne des ensembles de données tellement volumineux qu'ils en deviennent difficiles à analyser avec des outils classiques de gestion de base de données ou de gestion de l'information.
Le Big data permet des analyses pouvant mettre en évidence des tendances et ainsi prendre de meilleures décisions.
Le Big Data à usage juridique s'est développé ces dernières années depuis 2005 mais un véritable coup d'accélérateur vient de l'article 21 de la loi n° 2016-1321 du 7 octobre 2016 pour une République numérique. Aux termes de cet article, « les décisions rendues par les juridictions judiciaires sont mise à la disposition du public à titre gratuit dans le respect de la vie privée des personnes concernées ».
On peut avoir accès à différentes bases de données (JADE, CASS, CAPP, INCA) par des fournisseurs ou directement par exemple à http://rip.journal-officiel.gouv.fr/index.php/pages/juridiques.
Sur Linux Ubuntu, vous pouvez télécharger et extraire le volumineux fichier Freemium de la base CAPP sur votre Bureau avec ces trois commandes :
tar xzf Freemium_capp_global_20160212-152529.tar.gz
Avec le Big Data l'idée est venue de développer une justice prédictive afin de d'estimer en amont le montant de l'indemnisation ou les chances de succès d'une action. Néanmoins, il s'agit d'une démarche où les chiffres prédits devraient impérativement être entourés d'intervalles de confiance qui peuvent être larges. En outre, les pièges sont nombreux notamment ceux des facteurs de confusion qui peuvent expliquer les résultats observés et nécessitent donc un contrôle statistique adéquat dans le modèle.