Mis à jour le 23 sept. 2025
8 min
Vous êtes un analyste de données. Effectuez une EDA rapide sur les données suivantes.Contexte :- Format : [CSV/JSON/table/text]- Domaine : [ecommerce/marketing/finance/ops]- Objectif : [comprendre les facteurs de X]Tâches :1) Schéma : liste des colonnes, types inférés, données manquantes.2) Qualité : doublons, valeurs aberrantes (par [méthode le cas échéant]), anomalies.3) Univariée : principales statistiques pour les colonnes numériques clés (moyenne, p50, p95, min/max).4) Bivariée : 3 corrélations les plus fortes avec [target] + mises en garde.5) Aperçus rapides : 5 observations sous forme de puces et 3 questions de suivi.Sortie :- Utilisez un tableau compact pour les statistiques.- Limitez-vous à <200 mots + le tableau.Données :[Collez des exemples de lignes ou joignez un fichier]Rôle : Vous êtes un analyste produit.Scénario : [KPI] a changé de [±X%] sur [période]. Champs du jeu de données : [liste des colonnes].Objectif : Trouver des facteurs plausibles et recommander des étapes de vérification.Tâches :1) Décomposer le KPI par [segment, canal, zone géographique, appareil, cohorte]. Afficher les 5 principaux moteurs.2) Attribuer les facteurs : volume vs. conversion vs. AOV (ou ventilation pertinente).3) Émettre des hypothèses sur les causes (internes vs. externes) avec des preuves tirées des données.4) Suggérer 3 expériences ou analyses pour valider (par exemple, groupe témoin, diff-in-diff).5) Produire un résumé exécutif de 5 points.Format de sortie :- Tableau : segment → delta, contribution, confiance (faible/moyenne/élevée).- Puis puces : hypothèses, validations, risques.Données :[Joindre/décrire les données ; ou coller les agrégats]Tâche : Nettoyer et normaliser le jeu de données suivant pour l'analyse.Règles :- Gérer les valeurs manquantes : [imputer avec la médiane/le mode/supprimer] par colonne.- Normaliser les étiquettes catégorielles : mapper à l'ensemble canonique [liste].- Analyser les dates au format ISO 8601 ; extraire [semaine, mois, trimestre].- Valeurs aberrantes : Winsoriser aux percentiles [1, 99] pour [colonnes].- Sortir un schéma propre + les étapes de transformation.Livrables :1) Table(s) de mappage.2) Pseudocode pour le pipeline (Python/pandas).3) Un diff compact d'avant → après.Exemple de données :[Coller 30 à 50 lignes représentatives]Rôle : Ingénieur analytique senior.Entrepôt : [BigQuery/Snowflake/Postgres].Tables : [table_name(col1, col2, ...)], [table2].Requête :“[Décrivez la question, la fenêtre temporelle, les filtres et la granularité]”Contraintes :- Utilisez des CTE avec des noms clairs.- Annotez les hypothèses sous forme de commentaires SQL.- Incluez une requête de validation pour repérer les discordances dans le nombre de lignes.- Retournez à la fois le SQL et une justification de 3 lignes.WITH sample AS si nécessaire » pour rendre la requête auto-vérifiable.Vous êtes mon assistant de formule de feuille de calcul.Objectif : Créer des formules pour calculer [metric] à partir des colonnes [A, B, C].Contexte : [Excel/Google Sheets] ; locale : [US/EU decimal].Tâches :- Fournir des formules exactes avec des références absolues/relatives.- Inclure une version arrayformula pour Sheets si pertinent.- Ajouter un exemple de ligne de test pour vérifier l'exactitude.En-tête de données + 3 exemples de lignes :[Coller]Rôle : Concepteur de visualisation de données.Public : [execs/PMs/ops] ; décision à soutenir : [indiquez-la].Créer un plan de création de graphiques :1) Recommander 2 à 3 types de graphiques avec les avantages/inconvénients pour ce jeu de données et cet objectif.2) Fournir une spécification Vega-Lite (ou code matplotlib/Plotly) pour le premier choix.3) Notes d'accessibilité (palette adaptée aux daltoniens, annotations).4) Une légende narrative d'une phrase pour chaque graphique.Description des données :[colonnes, unités, plage de temps, échantillon]Contexte : Nous avons observé [pattern] dans [metric] depuis [date].Objectif : Concevoir une expérience minimale et valide.Livrables :1) Hypothèses (H1/H0) avec la direction attendue et une estimation de la taille de l'effet.2) Unité expérimentale, randomisation et métriques de garde-fou.3) Hypothèses de taille d'échantillon et de durée ; noter les compromis de puissance.4) Plan d'analyse : test(s), segments, liste de contrôle de pré-enregistrement.5) Risques et atténuation.Rôle : Analyste de séries chronologiques.Données : [timestamp, metric, optional regressors].Tâches :1) Vérifier la stationnarité et la saisonnalité ; suggérer des transformations.2) Produire une prévision à court terme (point + PI) en utilisant [model preference or "auto"].3) Signaler les anomalies dans les [N] dernières périodes avec la gravité.4) Recommander des seuils d'alerte pour réduire les faux positifs.Sortie :- Tableau : date, actual, forecast, PI_low, PI_high, anomaly_flag, severity.- Résumé de 5 lignes pour les parties prenantes non techniques.Tâche : Analyser les commentaires des clients pour extraire des informations exploitables.Entrées : [N] commentaires avec les champs [comment, rating, product, date].Étapes :1) Regrouper les thèmes ; étiqueter les 5 principaux.2) Citer 1 à 2 commentaires représentatifs par thème.3) Quantifier la prévalence et le sentiment par thème.4) Recommander 3 actions avec l'impact attendu.Sortie : Un tableau + un résumé en puces. Restez en dessous de 180 mots.Données :[Coller un échantillon ou joindre]Rôle : Chef de cabinet produisant un exposé pour la direction.Contenu à résumer : [coller l'analyse, les graphiques ou les métriques].Produire :- (3 puces, verbes d'action).- Principales conclusions (5 puces, avec des chiffres).- Risques/inconnues (3 puces), prochaines étapes (3 puces, propriétaires).- Une phrase narrative pour le jeu de diapositives du conseil d'administration.Style : Clair, non technique, <160 mots.Vous êtes un copilote d'analyse.Objectif : Résoudre [analysis goal] en utilisant les artefacts suivants.Artefacts :- Fichier(s) de données : [lien ou exemple collé]- Contexte commercial : [bref résumé]- Contraintes : [time, cost, accuracy]Planifiez d'abord (10 à 12 puces) :- Identifier les entrées, les hypothèses, les risques.- Proposer des étapes (EDA → transformer → model/test → résumer), chacune avec un livrable.- Poser 3 questions de clarification à la fin.Attendez ensuite ma confirmation avant d'exécuter les étapes.Ajoutez ces garde-fous à toute analyse :- Citez explicitement les hypothèses.- Si un calcul manque de données suffisantes, retournez « preuves insuffisantes » avec ce qui manque.- Fournissez une vérification simple : recalculez [metric] de deux manières et comparez.- Lors de la synthèse, incluez un lien/une référence aux champs de données source utilisés.- Demandez : « Qu'est-ce qui réfuterait cette conclusion ? » et répondez brièvement.
Comment maîtriser ChatPDF : Obtenez des insights plus rapidement à partir de documents denses

La meilleure alternative à X Auto-Translation pour des documents rapides et précis

Traduction IA Samsung indisponible en Iran ? Solutions pratiques

Outils de traduction persan : un guide pratique pour un travail plus rapide et précis

La meilleure alternative à Grok pour une recherche approfondie et référencée

Les 15 principales fonctionnalités d'un générateur d'images IA que vous utiliserez réellement