Enquêter avec des agents IA

Le Temps

01 — Fondamentaux

Ce qu’il faut comprendre avant les exercices

Comment l’agent lit un dossier, applique une méthode, transforme des sources et relie une affirmation à une preuve.

Modèle, agent, skill

Modèle Le moteur qui raisonne, rédige, classe ou extrait.

Seul, il ne lit pas votre dossier et n’agit pas.

Agent Un modèle avec des instructions, des outils et un espace de travail.

Il peut planifier, lire des fichiers, appeler un outil, utiliser un navigateur et vérifier une sortie.

Skill Une méthode réutilisable dans un skill.

Le skill contient les consignes, ressources et parfois scripts qui disent à l’agent comment faire une tâche précise.

Pourquoi utiliser des skills ?

01Stable
Mêmes étapes, à chaque essai.

Fact-checking, OSINT ou nettoyage de données suivent une procédure identique d’une session à l’autre.

02Partageable
Un collègue ouvre le dossier et comprend.

La méthode vit avec le dossier. Pas besoin de réexpliquer comment l’agent a travaillé.

03Corrigeable
On corrige le skill, pas la conversation.

Si la méthode est mauvaise, on l’édite une fois. Plus besoin de la réécrire dans chaque chat.

04Auditable
La méthode entre dans le dossier de preuve.

Sources, sorties et procédure rangées ensemble. Un tiers peut refaire le chemin.

Scraping, parsing, OCR, grounding

Obtenir le texte
01Scraping
Le web → un fichier local.

Un programme charge une page (HTML rendu) et en sort un texte propre. Source: le web public, pas les fichiers locaux.

02Parsing
Lire la structure d’un fichier numérique.

HTML, PDF avec couche texte, JSON, tableau: le texte est déjà encodé. On en extrait le contenu sans reconnaissance visuelle.

03OCR
Reconstituer du texte depuis une image.

Quand le fichier est un scan ou une photo, pas de couche texte. Plus fragile: chiffres, noms et unités doivent être vérifiés.

Faire tenir le texte comme preuve
04Grounding
Une phrase → un passage exact.

Chaque phrase du rapport renvoie au passage précis d’une source précise. Citer un document sur le sujet ne suffit pas: il faut le fragment qui soutient l’affirmation.

Firecrawl: moteur de scraping

Transformer le web en fichiers que l’agent peut relire.

01Pages
Une page web → Markdown propre.

L’URL d’origine est conservée. Le texte est lisible par un humain et par l’agent.

02PDF publics
Un PDF distant devient un document de travail.

Téléchargé puis parsé. Range-le dans le dossier pour le citer comme source.

03Lots
Plusieurs URLs en une fois.

Une liste d’URLs est traitée ensemble, puis rangée dans le dossier de sources.

Pourquoi utiliser l’IA dans un dossier local ?

  1. 1
    Le dossier garde la mémoire du travail. Sources, PDF, CSV, prompts, tableaux et rapports restent ensemble. Une nouvelle session peut relire le dossier au lieu de repartir d’un chat vide.
  2. 2
    Le plan devient une étape de contrôle. Avant de scraper, parser ou produire un rapport, l’agent peut proposer un plan. Le journaliste corrige la méthode avant que le travail parte dans la mauvaise direction.
  3. 3
    Le multi-agent permet de séparer les tâches. Un agent rassemble les sources pendant qu’un autre vérifie une affirmation ou nettoie un tableau. Le journaliste orchestre et tranche.
  4. 4
    Les skills rendent la méthode réutilisable. Un skill décrit comment faire un fact-check, une recherche OSINT ou une extraction. Dans le navigateur, on peut joindre des instructions; en local, elles vivent avec le dossier.
  5. 5
    Les sorties deviennent relisibles. Plans, listes de tâches, captures, enregistrements navigateur, CSV et rapports HTML permettent de vérifier le chemin, pas seulement la réponse finale.

Télécharger le dossier de cours

3 gestes
  1. Téléchargez le ZIP.
  2. Décompressez-le sur votre ordinateur.
  3. Dans Antigravity: Open Folder → choisissez le dossier investigations.
Télécharger le dossier
02 — Exercices

Une chaîne de travail

Source → document → lieu → claim → preuve → donnée → rapport.

01 · Sauvegarder les sources

EXERCICE 01Cas: triazole dans le Léman

Ce que nous faisons: partir d’une liste d’URLs et créer un dossier de sources locales. Pourquoi: aucune vérification sérieuse ne commence par un résumé sans sources.

  • ouvrir 01-scrape/urls.txt
  • sauvegarder pages et PDF
  • noter ce qui marche ou échoue
  • sortie: evidence-log.csv
Ouvre 01-scrape/prompt.md et suis les instructions. Crée les sources Markdown, télécharge les PDF et remplis evidence-log.csv.

02 · Trouver le document utile

EXERCICE 02OSINT: document + lieu

Ce que nous faisons: chercher une carte officielle et extraire les lieux. Pourquoi: les lieux deviennent des pistes de reportage, pas seulement des données.

  • trouver le PDF officiel
  • extraire stations et valeurs
  • repérer ce qui mérite une relance
  • sortie: osint-place-pivot.html
Ouvre 02-osint-map/prompt.md et applique la méthode. Crée le Markdown et le tableau HTML demandés. Ouvre le HTML dans le navigateur.

03 · Vérifier une affirmation

EXERCICE 03Claim → citation → verdict

Ce que nous faisons: tester des phrases précises. Pourquoi: “unverified” veut dire preuve insuffisante, pas “faux”.

  • copier l’affirmation exacte
  • trouver une citation exacte
  • noter la limite de preuve
  • sortie: claims-table.html
Ouvre 03-fact-check/prompt.md et suis la méthode. Crée claims.csv et claims-table.html. Ouvre le HTML dans le navigateur.

04 · Lire un PDF technique

EXERCICE 04Parser, extraire, expliquer

Ce que nous faisons: extraire les passages importants et vérifier les unités. Pourquoi: une erreur d’OCR ou d’unité peut changer le sens d’un dossier.

  • identifier seuil, risque, concentration
  • expliquer les passages en français clair
  • signaler les erreurs possibles
  • sortie: translated-extracts.md
Ouvre 04-parse-extract/prompt.md. Utilise les documents collectés dans 01-scrape/documents/. Extrait les passages utiles et explique-les en français clair.

05 · Nettoyer les données

EXERCICE 05Carte PDF → CSV

Ce que nous faisons: transformer une carte officielle en tableau. Pourquoi: un CSV propre permet de trier, comparer et publier sans perdre la source.

  • une ligne par station
  • conserver les valeurs <0.010
  • classer les valeurs en trois groupes
  • sortie: vaud-river-results.html
Ouvre 05-data-cleaning/prompt.md et crée vaud-river-results.csv puis vaud-river-results.html. Ouvre le HTML dans le navigateur.

Spotlight automatise cette chaîne

À la fin, on ne change pas de méthode. On orchestre la méthode.

Sources Investigator Fact-checker Gate 1 report.html
Classecycles, sous-agents, grounding, fact-check, rapport HTML local
Dossierscope limité au dossier de cours, avec sources et sorties relisibles par les étudiants

Prompt final

Version simplifiée: uniquement le dossier de cours et le rapport local.

Ouvre 06-spotlight/prompt.md et suis les instructions. La skill Spotlight est déjà dans le dossier. Utilise la version simplifiée de Spotlight. Scope: ce dossier seulement. Garde un passage investigator et un passage fact-checker. Génère 06-spotlight/report.html. Réponds en français.

Ce que vous devez garder

Un dossier vaut mieux qu’un chat
Il garde les sources, les prompts, les données et les sorties.
Une preuve doit soutenir une phrase
Pas le sujet en général. La phrase exacte.
L’agent accélère le travail, pas le jugement
Le journaliste choisit les questions, les limites et les conclusions.