อัปเดตเมื่อ 23 ก.ย. 2025
8 นาที
คุณคือนักวิเคราะห์ข้อมูล ทำการ EDA อย่างรวดเร็วกับข้อมูลต่อไปนี้บริบท:- รูปแบบ: [CSV/JSON/table/text]- โดเมน: [ecommerce/marketing/finance/ops]- เป้าหมาย: [ทำความเข้าใจปัจจัยขับเคลื่อนของ X]งาน:1) Schema: แสดงรายการคอลัมน์ ประเภทที่อนุมานได้ ค่าที่หายไป2) คุณภาพ: รายการที่ซ้ำกัน ค่าผิดปกติ (ตาม [วิธี ถ้ามี]) ความผิดปกติ3) Univariate: สถิติสูงสุดสำหรับคอลัมน์ตัวเลขหลัก (ค่าเฉลี่ย, p50, p95, min/max)4) Bivariate: 3 ความสัมพันธ์ที่แข็งแกร่งที่สุดกับ [เป้าหมาย] + ข้อควรระวัง5) ข้อมูลเชิงลึกอย่างรวดเร็ว: 5 ข้อสังเกตแบบย่อหน้าและ 3 คำถามติดตามผลเอาต์พุต:- ใช้ตารางขนาดกะทัดรัดสำหรับสถิติ- จำกัดให้อยู่ที่ <200 คำ + ตารางข้อมูล:[วางตัวอย่างแถวหรือแนบไฟล์]บทบาท: คุณคือนักวิเคราะห์ผลิตภัณฑ์สถานการณ์: [KPI] เปลี่ยนแปลงโดย [±X%] ในช่วง [ระยะเวลา] ฟิลด์ชุดข้อมูล: [แสดงรายการคอลัมน์]เป้าหมาย: ค้นหาปัจจัยขับเคลื่อนที่เป็นไปได้และแนะนำขั้นตอนการตรวจสอบงาน:1) แยกย่อย KPI ตาม [ส่วน, ช่องทาง, ภูมิศาสตร์, อุปกรณ์, กลุ่ม] แสดงผู้เคลื่อนไหว 5 อันดับแรก2) ปัจจัยขับเคลื่อนแอตทริบิวต์: ปริมาณเทียบกับการแปลงเทียบกับ AOV (หรือการแบ่งย่อยที่เกี่ยวข้อง)3) ตั้งสมมติฐานสาเหตุ (ภายในเทียบกับภายนอก) พร้อมหลักฐานจากข้อมูล4) แนะนำ 3 การทดลองหรือการวิเคราะห์เพื่อตรวจสอบ (เช่น holdout, diff-in-diff)5) สร้างบทสรุปสำหรับผู้บริหาร 5 ข้อรูปแบบเอาต์พุต:- ตาราง: ส่วน → เดลต้า, การมีส่วนร่วม, ความเชื่อมั่น (ต่ำ/ปานกลาง/สูง)- จากนั้นเป็นข้อย่อย: สมมติฐาน, การตรวจสอบ, ความเสี่ยงข้อมูล:[แนบ/อธิบายข้อมูล หรือวางค่ารวม]งาน: ล้างและทำให้ชุดข้อมูลต่อไปนี้เป็นมาตรฐานสำหรับการวิเคราะห์กฎ:- จัดการค่าที่หายไป: [ใส่ค่ากลาง/โหมด/ละทิ้ง] ต่อคอลัมน์- ทำให้ป้ายกำกับตามหมวดหมู่เป็นมาตรฐาน: แมปไปยังชุด canonical [รายการ]- แยกวิเคราะห์วันที่เป็น ISO 8601; แยก [สัปดาห์, เดือน, ไตรมาส]- ค่าผิดปกติ: Winsorize ที่เปอร์เซ็นไทล์ [1, 99] สำหรับ [คอลัมน์]- ส่งออก schema ที่สะอาด + ขั้นตอนการแปลงสิ่งที่ส่งมอบ:1) ตารางการแมป2) Pseudocode สำหรับไปป์ไลน์ (Python/pandas)3) ส่วนต่างขนาดกะทัดรัดของก่อน → หลังตัวอย่างข้อมูล:[วาง 30–50 แถวที่เป็นตัวแทน]บทบาท: วิศวกรวิเคราะห์อาวุโสWarehouse: [BigQuery/Snowflake/Postgres]ตาราง: [table_name(col1, col2, ...)], [table2]คำขอ:“[อธิบายคำถาม ช่วงเวลา ตัวกรอง และ grain]”ข้อจำกัด:- ใช้ CTE ที่มีชื่อที่ชัดเจน- ใส่คำอธิบายประกอบสมมติฐานเป็นความคิดเห็น SQL- รวมการสืบค้นการตรวจสอบเพื่อตรวจจับความไม่ตรงกันของจำนวนแถว- ส่งคืนทั้ง SQL และเหตุผล 3 บรรทัดWITH sample AS หากจำเป็น” เพื่อทำให้การสืบค้นตรวจสอบตัวเองได้คุณคือผู้ช่วยสูตรสเปรดชีตของฉันเป้าหมาย: สร้างสูตรเพื่อคำนวณ [เมตริก] จากคอลัมน์ [A, B, C]บริบท: [Excel/Google Sheets]; locale: [US/EU decimal]งาน:- ระบุสูตรที่แน่นอนพร้อมการอ้างอิงแบบสัมบูรณ์/สัมพัทธ์<a7>- รวมเวอร์ชัน arrayformula สำหรับ Sheets หากเกี่ยวข้อง</a6>- เพิ่มตัวอย่างแถวทดสอบเพื่อตรวจสอบความถูกต้องส่วนหัวของข้อมูล + 3 ตัวอย่างแถว:[วาง]บทบาท: นักออกแบบการแสดงภาพข้อมูลผู้ชม: [ผู้บริหาร/PM/ops]; การตัดสินใจที่จะสนับสนุน: [ระบุ]สร้างแผนผัง:1) แนะนำประเภทแผนภูมิ 2–3 ประเภทพร้อมข้อดี/ข้อเสียสำหรับชุดข้อมูลและเป้าหมายนี้2) ระบุ Vega-Lite spec (หรือโค้ด matplotlib/Plotly) สำหรับตัวเลือกอันดับต้นๆ3) บันทึกการเข้าถึง (จานสีที่ปลอดภัยสำหรับคนตาบอดสี คำอธิบายประกอบ)4) คำบรรยายแบบเล่าเรื่องหนึ่งประโยคสำหรับแต่ละแผนภูมิคำอธิบายข้อมูล:[คอลัมน์, หน่วย, ช่วงเวลา, ตัวอย่าง]บริบท: เราสังเกต [รูปแบบ] ใน [เมตริก] ตั้งแต่ [วันที่]เป้าหมาย: ออกแบบการทดลองที่น้อยที่สุดและถูกต้องสิ่งที่ส่งมอบ:1) สมมติฐาน (H1/H0) พร้อมทิศทางที่คาดหวังและการคาดเดาขนาดเอฟเฟกต์2) หน่วยทดลอง การสุ่ม และเมตริก guardrail3) ขนาดตัวอย่างและข้อสันนิษฐานระยะเวลา; สังเกตการแลกเปลี่ยนพลังงาน4) แผนการวิเคราะห์: การทดสอบ, ส่วน, รายการตรวจสอบการลงทะเบียนล่วงหน้า5) ความเสี่ยงและการบรรเทาผลกระทบบทบาท: นักวิเคราะห์อนุกรมเวลาข้อมูล: [timestamp, metric, regressors ที่เป็นตัวเลือก]งาน:1) ตรวจสอบความคงที่และความเป็นฤดูกาล; แนะนำการแปลง2) สร้างการพยากรณ์ระยะสั้น (point + PI) โดยใช้ [การตั้งค่าโมเดลหรือ "auto"]3) ติดธงความผิดปกติในช่วง [N] ที่ผ่านมาด้วยความรุนแรง4) แนะนำเกณฑ์การแจ้งเตือนเพื่อลดผลบวกลวงเอาต์พุต:- ตาราง: วันที่, ค่าจริง, การพยากรณ์, PI_low, PI_high, anomaly_flag, severity- สรุป 5 บรรทัดสำหรับผู้มีส่วนได้ส่วนเสียที่ไม่ใช่ด้านเทคนิคงาน: วิเคราะห์ข้อเสนอแนะของลูกค้าเพื่อดึงข้อมูลเชิงลึกที่นำไปปฏิบัติได้อินพุต: [N] ความคิดเห็นพร้อมฟิลด์ [ความคิดเห็น, การให้คะแนน, ผลิตภัณฑ์, วันที่]ขั้นตอน:1) คลัสเตอร์ธีม; ติดป้ายกำกับ 5 อันดับแรก2) อ้างอิงความคิดเห็นที่เป็นตัวแทน 1–2 รายการต่อธีม<a7>3) วัดปริมาณความชุกและความรู้สึกต่อธีม</a6>4) แนะนำ 3 การดำเนินการที่มีผลกระทบที่คาดหวังเอาต์พุต: ตาราง + สรุปแบบย่อหน้า จำกัดไว้ที่ 180 คำข้อมูล:[วางตัวอย่างหรือแนบ]บทบาท: หัวหน้าเจ้าหน้าที่ผลิตบทสรุปสำหรับผู้บริหารเนื้อหาที่จะสรุป: [วางการวิเคราะห์ แผนภูมิ หรือเมตริก]ผลิต:- (3 ข้อย่อย, กริยาแสดงการกระทำ)- ผลการวิจัยที่สำคัญ (5 ข้อย่อย พร้อมตัวเลข)- ความเสี่ยง/สิ่งที่ไม่รู้ (3 ข้อย่อย), ขั้นตอนต่อไป (3 ข้อย่อย, เจ้าของ)- คำบรรยายหนึ่งประโยคสำหรับสไลด์บอร์ดสไตล์: ชัดเจน ไม่ใช่ด้านเทคนิค <160 คำคุณคือผู้ช่วยนักวิเคราะห์เป้าหมาย: แก้ไข [เป้าหมายการวิเคราะห์] โดยใช้สิ่งประดิษฐ์ต่อไปนี้สิ่งประดิษฐ์:- ไฟล์ข้อมูล: [ลิงก์หรือตัวอย่างที่วาง]- บริบททางธุรกิจ: [บทสรุปสั้นๆ]- ข้อจำกัด: [เวลา, ค่าใช้จ่าย, ความแม่นยำ]วางแผนก่อน (10–12 ข้อย่อย):- ระบุอินพุต ข้อสันนิษฐาน ความเสี่ยง- เสนอขั้นตอน (EDA → แปลง → โมเดล/ทดสอบ → สรุป) แต่ละขั้นตอนมีสิ่งที่ส่งมอบ- ถามคำถามเพื่อความกระจ่าง 3 ข้อในตอนท้ายจากนั้นรอการยืนยันจากฉันก่อนดำเนินการตามขั้นตอนเพิ่ม guardrail เหล่านี้ในการวิเคราะห์ใดๆ:- อ้างถึงข้อสันนิษฐานอย่างชัดเจน- หากการคำนวณขาดข้อมูลเพียงพอ ให้ส่งคืน “หลักฐานไม่เพียงพอ” พร้อมสิ่งที่ขาดหายไป- ระบุการตรวจสอบอย่างง่าย: คำนวณ [เมตริก] สองวิธีและเปรียบเทียบใหม่- เมื่อสรุป ให้รวมลิงก์/การอ้างอิงไปยังฟิลด์ข้อมูลต้นทางที่ใช้- ถาม: “อะไรที่จะทำให้ข้อสรุปนี้เป็นเท็จ” และตอบสั้นๆ
วิธีเชี่ยวชาญการใช้ ChatPDF: ได้ข้อมูลเชิงลึกเร็วขึ้นจากเอกสารหนาแน่น

ทางเลือกที่ดีที่สุดสำหรับ X Auto-Translation เพื่อเอกสารที่รวดเร็วและแม่นยำ

ไม่สามารถใช้ฟีเจอร์แปลภาษา AI ของ Samsung ในอิหร่านได้? วิธีแก้ไขที่ใช้งานได้จริง

เครื่องมือแปลภาษาเปอร์เซีย: คู่มือใช้งานจริงเพื่อการทำงานที่รวดเร็วและแม่นยำ

ทางเลือกที่ดีที่สุดแทน Grok สำหรับการวิจัยเชิงลึกที่มีการอ้างอิง

15 ฟีเจอร์เด่นของ AI Image Generator ที่คุณจะได้ใช้จริง