Agora : j'ai construit un réseau social de débats

Mai 2026

En regardant Le Crayon, j’ai réalisé que les débats structurés m’avaient appris plus en quelques heures que des mois de newsletters et de réseaux sociaux. Alors je me suis demandé pourquoi on n’avait pas d’espace pour ça en ligne. Et si personne ne le construisait, ce serait nous.

Le Crayon et une question qui ne me lâchait pas

Le Crayon, c’est une chaîne YouTube qui met en scène des débats : deux personnes, une question, des arguments. Le format est simple. Une personne pour, une personne contre. Des questions précises, pas des monologues.

J’avais passé des mois à essayer de me forger des opinions sérieuses sur des sujets qui comptaient : politique étrangère, énergie, économie. J’avais lu du Monde, je suivais Hugo Décrypte, je m’abonnais à des newsletters. Je consommais de l’information en permanence. Mais je restais sur ma faim : après tout ça, j’avais des faits, pas des avis construits. Je savais ce qui s’était passé, mais pas vraiment pourquoi raisonner dans un sens plutôt qu’un autre.

Puis j’ai regardé quelques épisodes du Crayon. Et là, quelque chose de différent s’est produit. Entendre deux personnes défendre des positions opposées, se répondre, anticiper les contre-arguments, m’a forcé à prendre position. À arbitrer. À comprendre les concessions que chaque camp doit faire. En deux heures, j’avais appris plus qu’en un mois de scroll.

La question s’est posée naturellement : pourquoi cet espace-là n’existe pas en ligne ?

Twitter, l’évidence, et son problème

L’endroit le plus proche d’un débat structuré en ligne, c’est Twitter. J’utilise la plateforme depuis plus de trois ans. Et ce que j’y préfère, c’est effectivement ces moments où les gens commencent à s’argumenter, à creuser, à vraiment échanger.

Sauf que ces moments représentent peut-être 5 à 10% du contenu qu’on y voit. Le reste, ce sont des mèmes, des trolls, des signaux d’appartenance. Pas grand-chose de réellement pertinent pour qui cherche à comprendre une question.

L’architecture même de Twitter travaille contre le débat. Une conversation sur un sujet complexe explose rapidement en dizaines de fils parallèles, non connectés entre eux. Les opinions divergentes sont noyées dans le flux général. Il n’y a pas de structure qui incite à répondre aux arguments. Juste un bouton “répondre” qui s’utilise pour confirmer ou pour insulter.

L’autre solution, et pourquoi elle ne convainc pas

Quand j’ai une question précise sur un sujet, j’ai pris l’habitude d’aller directement sur ChatGPT. Ça fonctionne. La réponse est documentée, neutre, organisée.

Mais une IA entraînée pour être utile et non-conflictuelle ne me donne pas d’avis argumenté. Elle me donne une synthèse. C’est différent. Et surtout, elle est une boîte noire : Google, OpenAI, Meta ont leurs propres intérêts dans la façon dont les questions sont traitées. Je ne sais pas ce qui a été inclus dans l’entraînement, ce qui a été modéré, ce qui est resté dehors.

L’esprit critique ne se développe pas en consommant des synthèses. Il se développe en confrontant des positions contraires, en étant forcé de choisir, en comprenant ce qu’on sacrifie quand on penche d’un côté.

Il n’y avait pas de produit qui proposait ça. Alors j’ai commencé à imaginer à quoi ça pourrait ressembler.

Ce que j’ai imaginé : le topic, le take, la position

Le produit s’articule autour d’une notion centrale : le topic.

Un topic, c’est une question. Pas une affirmation, pas un sujet vague : une question précise, formulée de façon à appeler une prise de position. L’Union européenne doit-elle se doter d’une armée commune pour faire face à la menace russe ? Le revenu universel est-il une réponse crédible à l’automatisation ? Des questions qui ont deux côtés, avec un milieu pour ceux qui refusent de trancher.

À partir d’un topic, les utilisateurs peuvent prendre position : pour, contre, ou neutre. Et rédiger un take, une prise de position. Quelques mots, ou quelques paragraphes. Documentée, sourcée, ou pas. L’idée est de laisser de la place au fond sans l’exiger.

Les takes alimentent des fils de discussion, proches de Twitter dans leur forme. La différence, c’est la structure : on peut filtrer pour ne voir que les takes des gens qui sont pour, ou uniquement ceux qui sont contre. On peut avoir une vision agrégée de l’opinion sur un topic : quelle est la répartition entre les trois positions ? Est-ce que l’opinion évolue dans le temps ?

L’objectif double est là : un espace d’échange, et une expérience qui reste agréable à utiliser. Pas un forum universitaire. Pas un réseau de plus où les gens crient dans le vide. Quelque chose d’entre deux.

Valider l’intuition : Figma, des amis, et le Mom Test

Avant d’écrire une ligne de code, j’ai fait des prototypes sur Figma.

D’abord des wireframes abstraits puis des maquettes assez complètes pour qu’on puisse naviguer dedans, voir à quoi ressemblerait un topic, comment on prendrait position, ce qu’on verrait dans le fil. Quelque chose qu’on peut mettre entre les mains de quelqu’un et regarder ce qui se passe.

Je les ai montrées à des amis. Et j’ai posé des questions. Des vraies, pas des questions qui cherchent à entendre “oui c’est une super idée”. Je m’étais inspiré du livre The Mom Test, dont le principe central est qu’on ne doit pas poser des questions sur le produit qu’on a construit, mais sur le problème qu’on cherche à résoudre. Comment tu te forges un avis sur un sujet qui te touche ? Est-ce que ça t’arrive de chercher l’avis de quelqu’un avec qui tu n’es pas d’accord ? Qu’est-ce qui t’en empêche ?

Ce que j’ai appris : le besoin existait au-delà de moi. Plusieurs personnes décrivaient la même frustration avec Twitter : trop de bruit, pas assez de fond. Et la forme du débat structuré résonnait. Personne n’avait l’air d’avoir besoin qu’on leur explique à quoi ça servait.

Ce qui a aussi émergé : la crainte du troll. La peur que l’espace devienne ce que j’essayais précisément d’éviter. Ça a confirmé qu’il fallait penser sérieusement au produit d’un bout à l’autre. Pas uniquement l’interface, mais la façon dont les opinions circulent.

La partie où je me suis distingué : casser les bulles d’opinion

La plupart des réseaux sociaux optimisent pour l’engagement. L’algorithme de Facebook, TikTok ou YouTube cherche à maximiser le temps passé sur la plateforme. Le moyen le plus efficace pour ça : montrer à chaque utilisateur du contenu qu’il va approuver, avec lequel il va s’identifier, qui va confirmer ce qu’il pense déjà.

Le résultat, c’est ce qu’Eli Pariser a documenté en 2011 dans The Filter Bubble : des chambres d’écho. Chacun dans sa bulle, convaincu que sa vision du monde est la normale. Des études récentes confirment que l’exposition répétée à des opinions homogènes renforce les biais de confirmation plutôt que de les corriger.

J’ai décidé de faire l’inverse.

J’avais lu des papiers de recherche publiés par Google, Meta et d’autres sur leurs algorithmes de recommandation. Les mécanismes sont bien documentés : on comprend comment ils pondèrent l’engagement récent, la similarité de contenu, les signaux implicites du comportement utilisateur. Je m’en suis servi pour construire quelque chose d’antagoniste.

Mon algorithme de recommandation maximise délibérément la diversité des opinions. Au lieu de montrer à un utilisateur du contenu qui ressemble à ce qu’il a déjà approuvé, on lui montre des takes qui défendent des positions auxquelles il n’adhère pas nécessairement. Pas pour le choquer, mais pour qu’il soit exposé à des arguments qu’il n’aurait pas formulés lui-même.

L’idée derrière : collectivement, plus on s’expose à des raisonnements contraires, plus on se rapproche de quelque chose qui ressemble à la vérité.

La technique, pour finir

L’app est sur mobile avec Expo, SDK 55, New Architecture activée, Expo Router pour le routing. React Native 0.83 avec React 19. Pour le state, Jotai côté atomes, TanStack Query pour les données serveur.

Le backend tourne sur Cloudflare Workers. Hono pour le HTTP, tRPC pour une API entièrement type-safe côté client comme serveur. La base est D1 (SQLite managé par Cloudflare), avec Drizzle ORM 1.0. Les assets passent par R2, le cache et les sessions par KV.

L’architecture est hexagonale : la logique métier ne touche pas la base de données. Elle vit dans un package domain isolé, testable sans infrastructure. Les repositories font l’accès aux données, les services assemblent, les routers tRPC exposent. Chaque couche a une responsabilité.

Le système de recommandation est le morceau le plus travaillé. Il fonctionne en trois passes.

Trouver les candidats.

D’abord, je cherche les topics susceptibles d’intéresser l’utilisateur. Pas seulement les plus récents, mais ceux qui lui correspondent vraiment.

Pour ça, j’utilise la similarité sémantique : chaque utilisateur et chaque topic est représenté par un vecteur numérique qui capture ce qu’il “signifie”. Comparer deux vecteurs dit si deux choses sont proches dans le sens, pas juste dans les mots. C’est le même principe que Google utilise quand il comprend qu’une recherche sur “voiture électrique” est pertinente pour un article sur “Tesla” sans que le mot soit présent.

Je repère aussi les topics qui s’activent soudainement (beaucoup de réponses en peu de temps) et ceux où la position dominante est contraire à ce que l’utilisateur a voté récemment. Cette dernière source, c’est le cœur de l’anti-bulle.

Classer ce qu’on a trouvé

Ensuite, je score chaque topic candidat sur une dizaine de critères pondérés. Deux méritent une explication.

Le bandit de Thompson est un algorithme qu’on emprunte au monde des jeux et de l’exploration. Il résout le problème suivant : quand un utilisateur est nouveau sur une catégorie, comment l’explorer sans le noyer dedans ? L’algorithme maintient une estimation de l’intérêt probable de l’utilisateur pour chaque catégorie, et la met à jour à chaque interaction. Spotify l’utilise pour décider quelle nouvelle musique glisser dans une playlist sans prendre de risque excessif.

Le signal de temps de lecture mesure combien de secondes l’utilisateur a vraiment passé sur un topic. Pas s’il a cliqué, mais s’il a lu. YouTube et TikTok utilisent ce signal depuis des années parce qu’il est bien plus honnête qu’un like.

Diversifier le résultat

Une fois le classement fait, je passe par une dernière étape pour éviter que le feed ne devienne un tunnel : la MMR (Maximal Marginal Relevance), un algorithme de diversification qui pénalise les topics trop similaires entre eux. L’idée est née dans les années 90 pour améliorer les moteurs de recherche : si les dix premiers résultats disent tous la même chose, on a un problème. Netflix et Amazon l’ont repris pour leurs systèmes de recommandation. J’y ajoute des règles explicites : au moins un topic dissonant par tranche de feed, et jamais plus de 30% du feed issu d’une même catégorie.

Chaque utilisateur a aussi un score de dissonance entre 0 et 1, recalculé chaque jour. C’est une estimation de son rapport à l’opinion contraire : est-ce qu’il a tendance à rester sur les contenus qui lui ressemblent, ou est-ce qu’il s’attarde sur ceux avec lesquels il n’est pas d’accord ? Ce score règle l’intensité de la source anti-bulle dans son feed. Il ne s’annule jamais, mais il s’adapte à ses habitudes réelles.

Pour savoir si tout ça fonctionne, je mesure la qualité du classement avec le NDCG, un score standard dans le monde de la recherche d’information qui évalue si les meilleurs résultats arrivent bien en tête, et pas au milieu. Je garde aussi un groupe d’utilisateurs à qui je ne montre qu’un feed chronologique simple, sans recommandation. C’est mon point de comparaison : si l’algorithme ne fait pas mieux que l’ordre d’arrivée, j’ai un problème.

Ce que j’ai appris, et où j’en suis

Le produit est en private beta en ce moment. Un cercle restreint de proches fait des tests, ce que j’appelle des tests singes : explorer les coins les moins évidents, remonter les bugs simples avant d’ouvrir à plus de monde. Dans la semaine qui suit, j’ouvre TestFlight sur Apple pour accueillir une première vague d’utilisateurs extérieurs.

Il y a un apprentissage personnel que je retiens autant que le reste. Je viens du technique. J’ai toujours su écrire du code, choisir une architecture, déboguer. Ce projet est le premier où je me suis vraiment imposé une rigueur produit : des interviews utilisateurs construites pour ne pas biaiser les réponses, un guide d’entretien inspiré du Mom Test, une démarche pour extraire des besoins réels plutôt que de valider une idée que j’avais déjà. C’est une discipline différente, et honnêtement plus difficile pour moi que d’écrire un algorithme de recommandation.

Et côté développement, c’est aussi le premier projet où j’ai vraiment délégué des morceaux de code à l’IA, principalement Claude Code. Pas l’architecture, pas les grandes décisions, pas les choix de stack. Ça m’a permis d’avancer à une vitesse que je n’aurais pas eue seul, tout en gardant la main sur ce qui compte.

Pew Research — Twitter Political Discourse, 2022 · Eli Pariser — The Filter Bubble (2011) · The Mom Test — Rob Fitzpatrick · Cloudflare Workers — plateforme · Drizzle ORM · tRPC · Expo