更新於 2025年9月23日
8 分鐘
您是一位資料分析師。請對以下資料執行快速 EDA。背景:- 格式:[CSV/JSON/表格/文字]- 領域:[電子商務/行銷/金融/營運]- 目標:[了解 X 的驅動因素]任務:1) 結構描述:列出欄位、推斷類型、缺失值。2) 品質:重複項、離群值(如果有的話,依 [方法])、異常值。3) 單變量:主要數值欄位的頂級統計數據(平均值、p50、p95、最小值/最大值)。4) 雙變量:與 [目標] 的 3 個最強相關性 + 注意事項。5) 快速見解:5 個要點觀察和 3 個後續問題。輸出:- 使用緊湊的表格來呈現統計數據。- 保持在 <200 字 + 表格內。資料:[貼上範例列或附加檔案]角色:您是一位產品分析師。情境:[KPI] 在 [期間] 內變動了 [±X%]。資料集欄位:[列出欄位]。目標:找出合理的驅動因素並建議驗證步驟。任務:1) 按 [區隔、管道、地理位置、裝置、群組] 分解 KPI。顯示前 5 名變動者。2) 歸因驅動因素:數量 vs. 轉換率 vs. AOV(或相關細分)。3) 假設原因(內部 vs. 外部),並提供來自資料的證據。4) 建議 3 個實驗或分析來驗證(例如,holdout、diff-in-diff)。5) 產生 5 點的執行摘要。輸出格式:- 表格:區隔 → 增量、貢獻、信賴度(低/中/高)。- 然後是要點:假設、驗證、風險。資料:[附加/描述資料;或貼上聚合資料]任務:清理並正規化以下資料集以進行分析。規則:- 處理缺失值:依欄位 [以中位數/眾數/刪除] 填補。- 正規化類別標籤:對應到標準集合 [清單]。- 將日期解析為 ISO 8601;提取 [週、月、季]。- 離群值:在 [欄位] 的 [1, 99] 百分位數進行 Winsorize 處理。- 輸出乾淨的結構描述 + 轉換步驟。交付項目:1) 對應表格。2) 管道的虛擬碼 (Python/pandas)。3) 之前 → 之後的精簡差異。資料範例:[貼上 30–50 個代表性列]角色:資深分析工程師。資料倉儲:[BigQuery/Snowflake/Postgres]。表格:[table_name(col1, col2, ...)]、[table2]。請求:“[描述問題、時間範圍、篩選器和粒度]”限制:- 使用具有清晰名稱的 CTE。- 將假設註解為 SQL 註解。- 包含驗證查詢以發現列計數不符。- 傳回 SQL 和 3 行理由。WITH sample AS 傳回最小測試資料集」以使查詢自我檢查。您是我的試算表公式助手。目標:建立公式以從欄位 [A, B, C] 計算 [指標]。背景:[Excel/Google Sheets];地區設定:[US/EU 小數點符號]。任務:- 提供具有絕對/相對參照的精確公式。- 如果相關,包含 Sheets 的 arrayformula 版本。- 新增測試列範例以驗證正確性。資料標頭 + 3 個範例列:[貼上]角色:資料可視化設計師。受眾:[主管/PM/營運];要支援的決策:[說明]。建立圖表規劃:1) 推薦 2–3 種圖表類型,並說明此資料集和目標的優缺點。2) 為首選提供 Vega-Lite 規格(或 matplotlib/Plotly 程式碼)。3) 無障礙注意事項(對色盲友善的調色盤、註解)。4) 每個圖表的一句話敘述性標題。資料描述:[欄位、單位、時間範圍、範例]背景:自 [日期] 以來,我們在 [指標] 中觀察到 [模式]。目標:設計一個最小、有效的實驗。交付項目:1) 假設 (H1/H0),包括預期方向和效應量猜測。2) 實驗單位、隨機化和防護欄指標。3) 樣本大小和持續時間假設;請注意功效權衡。4) 分析計劃:測試、區隔、預先註冊清單。5) 風險和緩解。角色:時間序列分析師。資料:[時間戳記、指標、可選迴歸變數]。任務:1) 檢查平穩性和季節性;建議轉換。2) 使用 [模型偏好或「自動」] 產生短期預測(點 + PI)。3) 標記最近 [N] 個期間的異常值,並標註嚴重性。4) 建議警報閾值以減少誤報。輸出:- 表格:日期、實際值、預測值、PI_low、PI_high、anomaly_flag、severity。- 5 行摘要,供非技術利益相關者使用。任務:分析客戶回饋以提取可操作的見解。輸入:[N] 條評論,欄位包括 [comment, rating, product, date]。步驟:1) 群集主題;標記前 5 名。2) 引用每個主題的 1–2 條代表性評論。3) 量化每個主題的普遍性和情感。4) 建議 3 個行動,並說明預期影響。輸出:表格 + 要點摘要。保持在 180 字以下。資料:[貼上範例或附加檔案]角色:幕僚長,負責製作主管簡報。要總結的內容:[貼上分析、圖表或指標]。產生:- (3 個要點,行動動詞)。- 主要發現(5 個要點,帶數字)。- 風險/未知數(3 個要點)、後續步驟(3 個要點,負責人)。- 董事會簡報的一句話敘述。風格:清晰、非技術性、<160 字。您是一位分析副駕駛。目標:使用以下工件解決 [分析目標]。工件:- 資料檔案:[連結或貼上的範例]- 業務背景:[簡短說明]- 限制:[時間、成本、準確性]首先規劃(10–12 個要點):- 識別輸入、假設、風險。- 提出步驟(EDA → 轉換 → 模型/測試 → 摘要),每個步驟都有交付項目。- 最後提出 3 個澄清問題。然後等待我的確認才能執行步驟。將這些防護欄新增到任何分析:- 明確引用假設。- 如果計算缺少足夠的資料,則傳回「證據不足」,並說明缺少什麼。- 提供一個簡單的檢查:以兩種方式重新計算 [指標] 並進行比較。- 總結時,包含指向所使用來源資料欄位的連結/參照。- 詢問:「什麼會證偽這個結論?」並簡要回答。