업데이트 날짜: 2025년 9월 23일
8 분
당신은 데이터 분석가입니다. 다음 데이터에 대해 빠른 EDA를 수행하십시오.컨텍스트:- 형식: [CSV/JSON/테이블/텍스트]- 도메인: [전자상거래/마케팅/금융/운영]- 목표: [X의 동인 이해]작업:1) 스키마: 열, 추론된 유형, 결측값 목록.2) 품질: 중복, 이상치 (있는 경우 [방법]별), 이상.3) 단변량: 주요 숫자 열에 대한 상위 통계 (평균, p50, p95, 최소/최대).4) 이변량: [대상]과의 3가지 가장 강력한 상관 관계 + 주의 사항.5) 빠른 통찰력: 5가지 요점 관찰 및 3가지 후속 질문.출력:- 통계에 대한 간결한 테이블을 사용하십시오.- 테이블을 포함하여 200단어 미만으로 유지하십시오.데이터:[샘플 행을 붙여넣거나 파일을 첨부하십시오]역할: 당신은 제품 분석가입니다.시나리오: [KPI]가 [기간] 동안 [±X%] 변경되었습니다. 데이터 세트 필드: [열 목록].목표: 가능한 동인을 찾고 검증 단계를 권장합니다.작업:1) [세그먼트, 채널, 지역, 장치, 코호트]별로 KPI를 분해합니다. 상위 5개 이동자를 표시합니다.2) 속성 동인: 볼륨 대 전환 대 AOV (또는 관련 분석).3) 데이터에서 증거를 사용하여 원인 (내부 대 외부)을 가설화합니다.4) 검증하기 위해 3가지 실험 또는 분석을 제안합니다 (예: 홀드아웃, 차분).5) 5가지 요점 실행 요약을 생성합니다.출력 형식:- 테이블: 세그먼트 → 델타, 기여도, 신뢰도 (낮음/중간/높음).- 그런 다음 요점: 가설, 검증, 위험.데이터:[데이터를 첨부/설명하거나 집계를 붙여넣습니다]작업: 분석을 위해 다음 데이터 세트를 정리하고 정규화합니다.규칙:- 결측값 처리: 열별로 [중앙값/최빈값/삭제]으로 대체합니다.- 범주형 레이블 정규화: 표준 집합 [목록]에 매핑합니다.- 날짜를 ISO 8601로 구문 분석합니다. [주, 월, 분기]를 추출합니다.- 이상치: [열]에 대해 [1, 99] 백분위수에서 Winsorize합니다.- 정리된 스키마 + 변환 단계를 출력합니다.결과물:1) 매핑 테이블.2) 파이프라인에 대한 의사 코드 (Python/pandas).3) 이전 → 이후의 간결한 차이.데이터 샘플:[30–50개의 대표 행을 붙여넣습니다]역할: 수석 분석 엔지니어.웨어하우스: [BigQuery/Snowflake/Postgres].테이블: [table_name(col1, col2, ...)], [table2].요청:“[질문, 시간 창, 필터 및 세분성을 설명하십시오]”제약 조건:- 명확한 이름으로 CTE를 사용하십시오.- 가정을 SQL 주석으로 주석 처리합니다.- 행 수 불일치를 발견하기 위한 유효성 검사 쿼리를 포함합니다.- SQL과 3줄 논리를 모두 반환합니다.WITH sample AS 를 사용하여 최소 테스트 데이터 세트를 반환하십시오”를 추가하십시오.당신은 내 스프레드시트 수식 도우미입니다.목표: 열 [A, B, C]에서 [메트릭]을 계산하는 수식을 만듭니다.컨텍스트: [Excel/Google Sheets]; 로케일: [US/EU 소수점].작업:- 절대/상대 참조를 사용하여 정확한 수식을 제공합니다.- 관련성이 있는 경우 Sheets에 대한 arrayformula 버전을 포함합니다.- 정확성을 확인하기 위해 테스트 행 예제를 추가합니다.데이터 헤더 + 3개의 샘플 행:[붙여넣기]역할: 데이터 시각화 디자이너.대상: [임원/PM/운영]; 지원할 결정: [상태].차트 작성 계획:1) 이 데이터 세트와 목표에 대한 장단점이 있는 2–3개의 차트 유형을 권장합니다.2) 상위 선택 항목에 대한 Vega-Lite 사양 (또는 matplotlib/Plotly 코드)을 제공합니다.3) 접근성 참고 사항 (색맹 안전 팔레트, 주석).4) 각 차트에 대한 한 문장 내러티브 캡션.데이터 설명:[열, 단위, 시간 범위, 샘플]컨텍스트: [날짜] 이후 [메트릭]에서 [패턴]을 관찰했습니다.목표: 최소한의 유효한 실험을 설계합니다.결과물:1) 예상 방향 및 효과 크기 추측이 있는 가설 (H1/H0).2) 실험 단위, 무작위화 및 안전 장치 메트릭.3) 표본 크기 및 기간 가정; 전력 절충을 참고하십시오.4) 분석 계획: 테스트, 세그먼트, 사전 등록 체크리스트.5) 위험 및 완화.역할: 시계열 분석가.데이터: [타임스탬프, 메트릭, 선택적 회귀 변수].작업:1) 정상성 및 계절성을 확인합니다. 변환을 제안합니다.2) [모델 기본 설정 또는 "자동"]을 사용하여 단기 예측 (지점 + PI)을 생성합니다. 3) 심각도와 함께 마지막 [N] 기간의 이상 징후를 플래그합니다.4) 오탐을 줄이기 위해 경고 임계값을 권장합니다.출력:- 테이블: 날짜, 실제, 예측, PI_low, PI_high, anomaly_flag, 심각도.- 비기술적 이해 관계자를 위한 5줄 요약.작업: 실행 가능한 통찰력을 추출하기 위해 고객 피드백을 분석합니다.입력: 필드 [댓글, 등급, 제품, 날짜]가 있는 [N] 댓글.단계:1) 테마를 클러스터링합니다. 상위 5개에 레이블을 지정합니다.2) 테마별로 1–2개의 대표적인 댓글을 인용합니다.3) 테마별로 보급률과 감정을 정량화합니다.4) 예상되는 영향과 함께 3가지 작업을 권장합니다.출력: 테이블 + 요점 요약. 180단어 미만으로 유지하십시오.데이터:[샘플을 붙여넣거나 첨부하십시오]역할: 임원 브리핑을 제작하는 참모장.요약할 내용: [분석, 차트 또는 메트릭을 붙여넣습니다].생산:- (3개의 요점, 행동 동사).- 주요 결과 (숫자가 있는 5개의 요점).- 위험/알 수 없는 사항 (3개의 요점), 다음 단계 (3개의 요점, 소유자).- 이사회 데크에 대한 한 문장 내러티브.스타일: 명확하고 비기술적이며 160단어 미만입니다.당신은 분석 코파일럿입니다.목표: 다음 아티팩트를 사용하여 [분석 목표]를 해결합니다.아티팩트:- 데이터 파일: [링크 또는 붙여넣은 샘플]- 비즈니스 컨텍스트: [짧은 브리프]- 제약 조건: [시간, 비용, 정확성]먼저 계획 (10–12개의 요점):- 입력, 가정, 위험을 식별합니다.- 각 결과물과 함께 단계 (EDA → 변환 → 모델/테스트 → 요약)를 제안합니다.- 마지막에 3가지 명확한 질문을 합니다.그런 다음 단계를 실행하기 전에 내 확인을 기다립니다.모든 분석에 이러한 안전 장치를 추가하십시오:- 가정을 명시적으로 인용합니다.- 계산에 충분한 데이터가 없으면 누락된 내용과 함께 “증거 불충분”을 반환합니다.- 간단한 검사를 제공합니다. [메트릭]을 두 가지 방법으로 다시 계산하고 비교합니다.- 요약할 때 사용된 소스 데이터 필드에 대한 링크/참조를 포함합니다.- “이 결론을 반증하는 것은 무엇입니까?”라고 묻고 간단히 대답합니다.