L’intelligence artificielle (« IA »), en particulier les grands modèles de langage (« LLM ») tels que ChatGPT d’Open AI, Bing Chat et Google Bard, présentent des risques évidents lorsque les avocats les utilisent sans comprendre leurs limites. Il ne faut pas chercher plus loin que les nouvelles récentes, où un avocat a encouru la colère d’un juge fédéral de New York pour avoir soumis un dossier avec des cas inventés par ChatGPT.
Mais la technologie ne doit pas être rejetée simplement parce qu’elle peut être utilisée à mauvais escient. Ces types d’outils pourraient révolutionner la profession juridique, et une pléthore de start-ups de technologie juridique et de contributions universitaires ont vu le jour à leur sujet.
Le potentiel des LLM reste largement inexploité en droit pénal international (ICL). La façon dont ces outils refaçonneront ICL dépendra de leur capacité à naviguer dans ses fonctionnalités uniques.
Particularités de l’ICL
Le contentieux pénal international est largement guidé par des documents complexes. Les enquêtes monumentales nécessaires pour déterminer la survenance de crimes internationaux se traduisent souvent par un afflux massif de documents documentaires. Les LLM sont conçus pour comprendre de gros volumes de données, mais leur efficacité peut être entravée par des numérisations et des documents de mauvaise qualité dans des langues peu utilisées dans leur formation.
De plus, la jurisprudence de la LCI est diverse. Chaque institution ICL représente une juridiction avec ses référentiels uniques pour stocker sa jurisprudence. Malgré l’existence de compilations centralisées comme la base de données des outils juridiques de la CPI, aucun outil d’IA accessible au public n’a été spécifiquement formé sur ces compilations. En revanche, les avocats américains peuvent plus facilement intégrer l’IA dans leur pratique nationale par le biais de diverses voies telles que Westlaw Edge, Lexis + et Casetext.
ICL fait également face à des risques importants en matière de sécurité des données. En raison de la nouveauté des LLM, leurs implications en matière de sécurité restent largement indéfinies, ce qui pose des menaces potentielles. Toute violation de données dans la poursuite de crimes de guerre ou de crimes contre l’humanité pourrait avoir des conséquences catastrophiques, telles que l’identification et le ciblage des victimes, des témoins et d’autres personnes à risque.
Le présent et l’avenir des LLM en ICL
Néanmoins, les LLM offrent d’immenses avantages aux avocats d’ICL, même maintenant, et pas seulement dans un avenir lointain. Ces modèles peuvent transformer le fonctionnement des avocats s’ils sont correctement compris et appliqués (voir ici pour une enquête générale sur la longueur du livre).
L’utilisation de LLM exige un changement de paradigme par rapport aux requêtes traditionnelles des moteurs de recherche et aux termes de recherche booléens. Les avocats doivent engager un dialogue avec ces modèles, et l’élaboration habile d’invites peut améliorer considérablement la qualité des réponses. Un article à venir de Daniel Schwartz et Jonathan H. Choi donne un excellent aperçu de la façon d’inciter les LLM dans des contextes juridiques.
Il faut également souligner ici que je suis un avocat formé par ICL et non un expert en technologie juridique. Pour le moment, je suis plus un passionné qu’un utilisateur expérimenté de ces outils. Il est très probable que ma description des LLM et de leur potentiel puisse être affinée par des personnes plus averties en technologie. Les personnes intéressées par les aspects techniques du développement des LLM devraient consulter cette présentation vidéo de mai 2023 par Andrej Karpathy d’OpenAI.
Applications des LLM en ICL
- Jurisprudence/résumés de dépôt
L’application la plus immédiate des LLM en droit pénal international est peut-être sa capacité à résumer la jurisprudence, ou des parties de celle-ci. La qualité du résumé dépend de la façon dont les questions incitatives sont posées. Demander à n’importe quel LLM en vigueur de «résumer l’arrêt d’appel Ongwen sur le crime de mariage forcé» donne un résumé générique et inutile. Mais copier et coller les parties pertinentes de l’arrêt de la Chambre d’appel sur le mariage forcé et demander au LLM de « résumer le passage suivant de l’arrêt d’appel Ongwen : »[insert paragraphs]”’ donne un résumé de bien meilleure qualité. Mettre des guillemets autour du texte permet de meilleurs suivis significatifs avec le LLM, car d’autres invites peuvent demander des réponses à donner avec des citations directes du passage fourni.
Obstacles à la poursuite de la croissance ? limites de caractères. À l’heure actuelle, un utilisateur d’abonnement ChatGPT4 a une limite de caractères de 4000 caractères. Pour Bing Chat, la limite de caractères est de 2 000 caractères seulement. Le récent Stanisic et Simatovic Le jugement de la Chambre d’appel de l’IRMCT compte 280 pages et plus de 700 000 caractères… et les jugements de la LCI peuvent être beaucoup plus longs que cela. Des modules complémentaires GPT sont en cours de développement pour contourner ces limites, et il existe des lecteurs de pdf disponibles – ChatPdf, par exemple – qui peuvent prendre des pdf entiers et permettre ensuite aux utilisateurs de « discuter » avec eux via ChatGPT.
- Recherche légale
Les LLM sont en mesure de répondre à des questions de recherche juridique qui vont au-delà du résumé d’un dossier spécifique et connu. Ces invites ont tendance à fournir des informations plus précises sur des sujets plus simples et largement débattus (« quels sont les éléments d’une entreprise criminelle commune ? ») que sur des sujets plus obscurs (« quand est-il nécessaire de divulguer les dépenses des témoins au TPIY ? »). Le dialogue est souvent essentiel pour obtenir une réponse significative, car il peut être nécessaire de demander au LLM de « développer la partie de votre réponse sur [discrete topic]’ pour obtenir plus d’informations sur ce qui vous intéresse réellement.
Obstacles à la poursuite de la croissance ? hallucinations Les LLM ont actuellement tendance à cracher avec confiance des citations inexactes et même de faux cas. Ne pas vérifier les résultats peut avoir des conséquences désastreuses. Il est essentiel de considérer les LLM comme un complément à la pratique assidue, et non comme un substitut à celle-ci. Un autre domaine de croissance plus petit dans le domaine de la recherche juridique est que ChatGPT n’est formé sur les données d’Internet qu’à partir de fin 2021, il n’a donc pas actuellement accès à la jurisprudence la plus récente (notez que Bing Chat n’a pas le même questions).
- Rédaction et édition
Lorsqu’ils sont correctement informés des modèles de faits et de la loi applicable, les LLM peuvent en fait générer des projets de paragraphes qui pourraient servir de point de départ pour la rédaction de la LCI. Ils peuvent également aider à affiner le texte déjà rédigé pour améliorer la clarté et la lisibilité. Une spécificité délibérée quant au style peut aider à cet égard – demander au LLM d’écrire une partie d’un mémoire juridique dans le style de « William Schabas » ou « un juge de la CPI » peut donner de meilleurs résultats que de demander que quelque chose soit rédigé de manière plus générale.
Obstacles à la poursuite de la croissance ? L’étendue des révisions. Les LLM en vigueur actuellement disponibles ne peuvent pas générer de passages avec des références qui pourraient être placées dans un brouillon sans autre modification. Les changements proposés dans le choix des mots peuvent provoquer des erreurs involontaires lorsqu’une précision particulière est requise, et les LLM peuvent ne pas toujours être en mesure de fournir une citation claire de la raison pour laquelle ils ont écrit les phrases qu’ils ont écrites (cela peut en soi être un signal que le LLM hallucine dans sa réponse ).
Dans les limites de la confidentialité et des procédures institutionnelles spécifiques, il peut être plus avantageux pour les avocats d’ICL d’utiliser les capacités de rédaction actuelles des LLM comme source d’inspiration avant de rédiger un document initial, ou comme outil pour affiner un document largement terminé. Quelle que soit la façon dont les LLM sont incorporés dans le travail écrit, les passages générés ne peuvent pas simplement être copiés/collés dans un travail plus large sans vérification supplémentaire.
- Recherche de divulgation et de collecte de preuves
Les LLM formés sur de grandes collections de preuves peuvent fournir une mine d’informations sur la collection. Les LLM pourraient être invités à fournir des informations sur les demandes de divulgation en attente ou des faits spécifiques pertinents pour les procès ICL. Ils pourraient également faciliter la saisie des éléments de preuve au cours du procès, par exemple en résumant les dépositions des témoins ou en isolant des détails clés.
Obstacles à la poursuite de la croissance ? confidentialité. Le risque d’erreurs dans la technologie actuelle rend impossible de mettre des informations sensibles dans les LLM accessibles au public. Cela signifie que des solutions doivent être développées pour les collectes de données ICL confidentielles qui inspirent suffisamment de confiance pour permettre leur utilisation effective. Il existe de nombreuses startups technologiques qui développent de tels outils – le nouvel outil Co-Counsel de Casetext en est un exemple (et peut faire beaucoup de choses en plus de la découverte électronique) – mais les institutions ICL peuvent avoir besoin de solutions sur mesure pour obtenir une adoption généralisée. La nouvelle initiative de soumission de preuves du nouveau Bureau du Procureur de la CPI – qui s’appuie sur l’IA et l’apprentissage automatique – est une évolution bienvenue à cet égard.
- Analyse juridique
La capacité des LLM à répondre à des questions très spécifiques face à des données massives pourrait produire des « rapports de reconnaissance » très intéressants sur la façon dont les plaideurs ICL pourraient réagir à certaines stratégies de litige. Les décisions d’un juge en particulier sur les violations de la divulgation, la manière dont un avocat de la défense en particulier a contre-interrogé des témoins privilégiés lors de procès antérieurs, les fourchettes de peines qu’une chambre de première instance serait disposée à accepter pour une infraction donnée – tous ces types de projections de données sont techniquement possibles avec le droit ensembles de données et invites.
Obstacle à la poursuite de la croissance ? Petits échantillons. Il n’y a tout simplement pas beaucoup d’essais ICL, ce qui peut limiter considérablement la capacité de l’analyse juridique à faire des prédictions significatives. Il y a aussi une rotation fréquente – les juges de la CPI sont élus pour des mandats non renouvelables de neuf ans, par exemple, ce qui rend très probable que les juges qui entendent un procès donné entendent leur premier procès pour l’institution. L’analyse juridique de l’ICL peut finir par être plus utile pour les éléments répétitifs des procès qui peuvent conduire à des ensembles de données plus volumineux plus rapidement – comme un dossier d’un juge président sur l’interrogation des objections, par exemple – que des événements plus rares pour lesquels l’ensemble de données sera intrinsèquement petit.
Conclusion
Quelles que soient les limites de leur utilisation actuelle, le potentiel des LLM pour l’ICL est incontestable. Ils évoluent également rapidement, prédisant quand et comment ils seront largement adoptés dans le domaine difficile. Mais ICL serait bien servi pour explorer comment maximiser ces outils et assurer leur utilisation responsable.
Photo : Mécanisme international résiduel des Nations Unies pour les tribunaux pénaux, Arusha, Tanzanie (Roman Boed, 2019)