Bondon, Marine, Charrance, Géraldine, Cochet, Paul, Merly-Alpa, Thomas, Santos, Aurélie, Institut national d'études démographiques (INED), INSEE, Maison méditerranéenne des sciences de l'Homme (MMSH), Aix Marseille Université (AMU)-Centre National de la Recherche Scientifique (CNRS), TGIR PROGEDO (PROGEDO), École des hautes études en sciences sociales (EHESS)-Centre National de la Recherche Scientifique (CNRS), ANR-18-CE41-0001,ChIPRe,Immigrés chinois à Paris et en région parisienne(2018), Sohler, Karin, and APPEL À PROJETS GÉNÉRIQUE 2018 - Immigrés chinois à Paris et en région parisienne - - ChIPRe2018 - ANR-18-CE41-0001 - AAPG2018 - VALID
Network Sampling with Memory (NSM) is an innovative method in the field of respondent driving sampling (RDS) methods due to the implementation of a particular sampling algorithm. Among other things, this algorithm makes it possible to create a sampling frame from which respondents are evenly drawn. The NSM method is supposed to prevent the strong selection bias that characterises RDS surveys while obtaining estimators with a precision similar to what we could get with a simple random sampling design. Experimented for the first time in France by the French Institute for demographic studies (Ined) in the context of a survey on Chinese migrants in the Île-de-France region, this work is a restitution of the difficulties encountered during data collection, which can sometimes be contextual and due to the pandemic, but for the most part inherent to the method., La méthode d’échantillonnage « Network sampling with memory » (NSM) constitue une nouvelle variante de sondage par chaînage (boule de neige, Respondent Driven Sampling (RDS), etc.). Ces méthodes consistent à enquêter au sein de réseaux en sélectionnant au départ quelques individus appelés « graines ». Seuls ces individus sont désignés par le sondeur. Par la suite, ce sont les enquêtés eux-mêmes qui recrutent/désignent leurs pairs qui seront sollicités à leur tour pour participer à l’enquête. Les méthodes par chaînage permettent en théorie d’atteindre des pans de la population non directement accessibles à des enquêteur·rice·s, mais souffrent d’un biais de sélection très fort. Dans le but de pallier ce défaut, une équipe de l’université de Caroline du Nord a développé la méthode NSM qui présente des avantages théoriques notamment sur la précision des estimations, au prix d’une complexité plus importante. La particularité de NSM est de recréer, au fur et à mesure du terrain, une base de sondage de la population cible composée des personnes citées par les répondants et de tirer aléatoirement les futur·e·s enquêté·e·s dans cette base. Contrairement à la méthode RDS, elle ne cherche pas à enquêter tous les contacts cités mais vise à intégrer une dimension aléatoire dans une méthode de sondage empirique. L’algorithme comprend une première phase exploratoire dite « Search », à la recherche de nouveaux pans du réseau, puis une seconde phase de tirages aléatoires au sein du réseau dévoilé. Selon ses concepteurs, la méthode NSM devrait permettre d’obtenir des estimations d’une précision équivalente à celle d’un sondage aléatoire simple. Après deux expériences à l’étranger (en Tanzanie et en Caroline du Nord), la méthode a été utilisée pour la première fois en France entre septembre 2020 et juin 2021 dans le cadre d’une enquête menée auprès des immigrés chinois en Ile-de-France (ChIPRe). À l’issue du terrain, 500 questionnaires et quelque 1700 citations ont été collectés. Cette enquête s’est avérée extrêmement délicate à mettre en œuvre. Sa dimension aléatoire, et notamment la nécessité de réaliser des tirages hebdomadaires, a engendré de nombreuses difficultés sur le terrain. La charge de travail individuelle des enquêteur·rice·s s’est révélée difficile à anticiper, puisqu’une forme de filiation citant/cités (conserver le·la même enquêteur·rice pour un·e enquêté·e et les personnes citées dans son « roster » puis échantillonnées) a été privilégiée afin de faciliter les négociations des enquêteur·rice·s sur le terrain. De plus, un paradoxe inhérent à la logique de l’algorithme de tirage dans sa phase « exploratoire » conduisait les enquêteur·rice·s qui collectaient le plus de citations (les plus grands « rosters ») à se voir attribuer parfois moins d’échantillonnés que d’autres enquêteur·rice·s moins performants. En effet, les petits rosters (contenant un petit nombre de citations) étaient plus exposés à l’échantillonnage car interprétés par l’algorithme comme une opportunité d’aller vers des pans inexplorés du réseau, à l’inverse des plus grands rosters, plus souvent délaissés par l’algorithme car associés à la découverte de personnes citées plusieurs fois (doublons), synonymes d’un niveau d’exploration avancé du réseau. Ainsi les « bon·ne·s » enquêteur·rice·s ne voyaient pas toujours leurs efforts récompensés par le tirage des rosters qu’il·elle·s avaient collectés. Cette impossibilité d’anticiper les tirages s’est aussi concrétisée dans le travail de communication auprès des enquêtés, car les enquêteur·rice·s étaient incapables de prédire dans leurs argumentaires si les personnes citées par leurs enquêté·e·s seraient finalement tirées au sort ou non, ni à quelle échéance.À ces difficultés se sont ajoutées celles de la pandémie. La crise sanitaire et la suspension de la collecte en face-à-face induite par le second confinement ont eu des impacts conséquents sur la collecte. Initialement pensée pour être conduite en face-à-face, nous avons été contraints de mener au moins une partie de l’enquête par téléphone. Les méthodes d’échantillonnage par chainage reposant sur un lien de confiance entre enquêteur·rice et enquêté·e et contribuant à une réelle implication des enquêté·e·s dans le processus de recrutement, la prise de contact et la passation des questionnaires à distance (par téléphone ou en visio) a rendu la tâche plus ardue. Le distanciel a également rendu plus complexe et moins efficace la gestion des incitations financières (remise de chèques cadeaux).