How do I use Magistral 1.2 for Visual Q&A on invoices?

Use a layout-aware prompt that specifies target fields (invoice number, total, due date), normalization rules (ISO-8601 dates, currency), and evidence like bounding boxes. Magistral 1.2 performs best when you include alternative candidates and confidence scores.

What are the best prompt templates for Magistral 1.2 Visual Q&A?

Start with structured templates: object and attribute extraction, document Q&A, multi-image comparison, and step-by-step reasoning. Each template should include role priming, exclusions, normalization, and a strict JSON output schema.

How can I reduce hallucinations in Visual Q&A with Magistral 1.2?

Constrain the model to answer only from the image, require uncertainty when visibility is low, and add explicit exclusions. Use confidence thresholds and request evidence such as region coordinates when available.

Can Magistral 1.2 handle multiple images for comparison?

Yes. Label images (A/B), focus on visible changes, and force a structured diff with impact ratings. This improves consistency for UI regression, before/after inspections, and defect detection.

What tools help me iterate prompts for Visual Q&A faster?

You can prototype Magistral 1.2 prompts directly, and it’s worth noting that [Sider.ai](https://sider.ai?source=seo&p1=blog&p2=leo) lets you test and refine prompts alongside images and web content. This shortens review cycles and standardizes templates across teams.

ವಿಜುವಲ್ Q&Aಿಗಾಗಿ ಮ್ಯಾಜಿಸ್ಟ್ರಲ್ 1.2 ಅನ್ನು ಹೇಗೆ ಬಳಸುವುದು: ಪ್ರಾಂಪ್ಟ್ ಟೆಂಪ್ಲೇಟ್ಸ್ ಮತ್ತು ಪ್ರಕರಣ ಅಧ್ಯಯನಗಳು

ವಿಜುವಲ್ ಪ್ರಶ್ನೋತ್ತರ (VQA) ವಿಶೇಷ ಅಧ್ಯಯನದಿಂದ ಉತ್ಪನ್ನ ತಂಡಗಳು, ಕಾರ್ಯಚಟುವಟಿಕೆಗಳು ಮತ್ತು ಸೃಜನಾತ್ಮಕ ಕೆಲಸಪ್ರವಾಹಗಳಲ್ಲಿ ನೈಜ ಶಕ್ತಿಯಾಗಿ ಪರಿವರ್ತನೆಯಾಗಿತು. ಧೈರ್ಯವಂತಿಕೆಯ ಭಾಗ ಎಂದರೆ: ಸರಿಯಾದ ಪ್ರಾಂಪ್ಟ್ ಟೆಂಪ್ಲೇಟ್ಗಳೊಂದಿಗೆ, ಮ್ಯಾಜಿಸ್ಟ್ರಲ್ 1.2 ಚಿತ್ರದಲ್ಲಿ ಏನಿದೆ ಎಂಬುದನ್ನು ನಂಬಿಕೆಯಾಗುವಂತೆ ವಿವರಿಸಬಹುದು, ಅನೇಕ ದೃಶ್ಯಗಳನ್ನು ಪರಿಗಣಿಸಿ ತರ್ಕ ಮಾಡಬಹುದು ಮತ್ತು ಉತ್ತರಗಳಿಗೆ ನಂಬಿಕೆ ನೀಡಲು ಭಾಗಗಳನ್ನು ಉಲ್ಲೇಖಿಸಬಹುದು. ನೀವು ಎಂದಾದರೂ “ನಾನು ನೋಡುತ್ತಿದ್ದುದನ್ನು ಮಾದರಿ ಅರ್ಥಮಾಡಿಕೊಳ್ಳಲಿದೆ ಎಂದು ನಂಬಬಹುದೇ?” ಎಂದು ಯೋಚಿಸಿದ್ದರೆ—ಈ ಮಾರ್ಗದರ್ಶನ ಅದಕ್ಕೆ “ಹೌದು, ಗಟ್ಟಿ ರಚನೆಯೊಂದಿಗೆ” ಎಂದು ಉತ್ತರ ನೀಡುವಂತೆ ಕಲಿಸುತ್ತದೆ.

ಈ ಬಳಕೆದ್ದೇಶಾತ್ಮಕ, ಪರಿಹಾರಗಾಮಿ ಹೆಜ್ಜೆಹಟ್ಟಿ ವಿವರಣೆಯಲ್ಲಿ, ನಾವು ಮ್ಯಾಜಿಸ್ಟ್ರಲ್ 1.2 ಅನ್ನು visual Q&Aಗಾಗಿ ಹೇಗೆ ಬಳಸಬೇಕು ಎಂಬುದನ್ನು, ಪುನಃಬಳಕೆಗೊಳ್ಳಬಹುದಾದ ಪ್ರಾಂಪ್ಟ್ ಟೆಂಪ್ಲೇಟ್ಸ್, ಮೌಲ್ಯಮಾಪನ ಸಲಹೆಗಳು ಮತ್ತು ನಿಜಜೀವನದ ನೋಡುವಿಕೆಗಳನ್ನು ಮೊದಲಿಗೆ ಹೇಳುತ್ತೇವೆ. ಹಾಲುಸಿನೇಷನ್ ಕಡಿಮೆಮಾಡಲು, ಆಧಾರವನ್ನು ಸುಧಾರಿಸಲು ಮತ್ತು ವೇಗವಾಗಿ ಕಾರ್ಯಗತಿಗೊಳಿಸಲು ಉತ್ತಮ ಅಭ್ಯಾಸಗಳನ್ನು ಸಹ ಸೇರಿಸುತ್ತೇವೆ.

ಮ್ಯಾಜಿಸ್ಟ್ರಲ್ 1.2 ಏನು ಮತ್ತು visual Q&Aಗಾಗಿ ಇದನ್ನು ಯಾಕೆ ಬಳಸಬೇಕು?

ಮ್ಯಾಜಿಸ್ಟ್ರಲ್ 1.2 ಎಂಬುದು ಚಿತ್ರ ಅರ್ಥಮಾಡಿಕೆ ಮತ್ತು ತರ್ಕಕ್ಕೆ ಕೇಂದ್ರೀಕೃತ ಬಹುಮಾಧ್ಯಮ ಮಾದರಿ. ಸರಳ ಶಬ್ದಗಳಲ್ಲಿ, ಇದು ಚಿತ್ರಗಳನ್ನು ಓದಿ, ಅದರೊಳಗಿನ ಪಠ್ಯವನ್ನು ವಿಶ್ಲೇಷಿಸಿ, ಬಣ್ಣವನ್ನು ಅರ್ಥಮಾಡಿ, ಪ್ರದರ್ಶಿಸಿದ ವಿಷಯಗಳ ಬಗ್ಗೆ ಪ್ರಶ್ನೆಗಳಿಗೆ ಉತ್ತರ ನೀಡಲು ಸಮರ್ಥವಾಗಿದೆ. Visual Q&A ಕಾರ್ಯಪ್ರವಾಹಗಳಿಗೆ — ಗ್ರಾಹಕ ಬೆಂಬಲ, ದಸ್ತಾವೇಜು ಅರ್ಥಮಾಡಿಕೆ, ಗುಣದ ಖಾತರಿ, ಸೃಜನಾತ್ಮಕ ಮಾರ್ಗದರ್ಶನ — ಮ್ಯಾಜಿಸ್ಟ್ರಲ್ 1.2 ಈ ಸೇವೆಗಳನ್ನು ಒದಗಿಸುತ್ತದೆ:

ಆಧಾರಿತ ಉತ್ತರಗಳು: ಚಿತ್ರದಲ್ಲಿನ ಪ್ರದೇಶಗಳು, ವಸ್ತುಗಳು ಅಥವಾ ಪಠ್ಯವನ್ನು ಸೂಚಿಸುತ್ತದೆ.

ಮೂಲರೇಖೆಯ ಅರಿವು: ಫಾರ್ಮ್‌ಗಳು, ರಶೀದಿ, ಡ್ಯಾಶ್‌ಬೋರ್ಡ್‌ಗಳು ಮತ್ತು ಬಳಕೆದಾರ ಪಾತ್ರಗಳಿಗಾಗಿ ಉಪಯುಕ್ತ.

ಬಹುಚಿತ್ರ ಸಂಪ್ರದಾಯ: ಚಿತ್ರಗಳನ್ನು ಹೋಲಿಕೆ, ವ್ಯತ್ಯಾಸ ಅಥವಾ ಸರಪಳಿ ತರ್ಕಕ್ಕೆ.

ಸೂಚನೆ ಅನುಸರಣೆ: ನಿಯಂತ್ರಿತ ಸ್ವರೂಪದಲ್ಲಿ ಪ್ರತಿಕ್ರಿಯಿಸು (JSON, ಗುಂಡಿ ಪಟ್ಟಿ, ಹಂತ-ನೀಡಿಕೆ).

ಇದನ್ನು ನೆರವೇರಿಸಲು, ನೀವು ಬ್ರೌಸಿಂಗ್ ಅಥವಾ ಆಸ್ತಿ ಪರಿಶೀಲಿಸುವ ಸಂದರ್ಭದಲ್ಲಿ ತುರ್ತು ಪ್ರಮೋದಗಳನ್ನು ಮೇಲ್ಮುಖ್ಯನ್ಮುಖವಾಗಿ ನಿಯಂತ್ರಿಸುವ ಬಗೆಗೆ ಇಚ್ಛಿಸುವಿರಾದರೆ, Sider.aiವು ವೆಬ್‌ ಪುಟಗಳು ಮತ್ತು ಚಿತ್ರಗಳ ಮೇಲೆ ಮಾದರಿ ಪ್ರಾಂಪ್ಟ್‌ಗಳನ್ನು ಜೋಡಿಸಬಹುದು, ಇದರಿಂದ ನೀವು ಮ್ಯಾಜಿಸ್ಟ್ರಲ್ ಶೈಲಿಯ ಪ್ರಾಂಪ್ಟ್‌ಗಳನ್ನು ನಿಜದ ಸ್ಕ್ರೀನ್‌ಶಾಟ್‌ಗಳು, ಮಾಕಪ್‌ಗಳು ಮತ್ತು ದಸ್ತಾವೇಜುಗಳಲ್ಲಿ ಪರೀಕ್ಷಿಸಬಹುದು, ಪೃಥಕೀಕರಣ ಇಲ್ಲದೆ.

ಮೂಲಭೂತ ಆಲೋಚನೆ: ನಿಮ್ಮ ಪ್ರಾಂಪ್ಟ್‌ಗಳನ್ನು ರಚಿಸಿ, ನಿಮ್ಮ ಔಟ್‌ಪುಟ್ ಅನ್ನು ನಿಯಂತ್ರಿಸಿ

ಅತಿ ಹೆಚ್ಚು VQA ವಿಫಲತೆಗಳು ಅಸ್ಪಷ್ಟ ಆದೇಶಗಳಿಂದ ಉಂಟಾಗುತ್ತವೆ. ಮ್ಯಾಜಿಸ್ಟ್ರಲ್ 1.2 ಈ ಕೆಳಗಿನಾಗಿರುವಾಗ ನಗೆ ನಿಲ್ಲುತ್ತದೆ:

ಕಾರ್ಯ ಮತ್ತು ಡೊಮೈನ್ مشخص ಮಾಡಿ: ಉದಾ., “ನೀವು ದಸ್ತಾವೇಜು ವಿಶ್ಲೇಷಕ” ಅಥವಾ “ಸಾಮಾನ್ಯ ಸಹಾಯಕ” ಎಂದು ಹೇಳಿ.

ಗುರಿ ಸ್ವರೂಪ ಪರಿಗಣನೆ: JSON schema, ಕ್ರಮಬದ್ಧ ಹಂತಗಳು, ಅಥವಾ ಸಣ್ಣ ವಾಸ್ತವಗಳನ್ನು ನಿಗದಿಪಡಿಸಿ.

ವ್ಯಾಪ್ತಿಯನ್ನು ನಿಯಂತ್ರಿಸಿ: ಏನು ನಿರ್ಲಕ್ಷಿಸಿ (ಹಿನ್ನೆಲೆ ಗೊಂದಲ, ವಾಟರ್ಮಾರ್ಕ್), ಏನು ಪ್ರಾಧಾನ್ಯತೆ ನೀಡಬೇಕು (ಪಠ್ಯ ಕ್ಷೇತ್ರಗಳು, ಸ್ಥಿತಿ ಲೈಟ್ಸ್).

ದೃಶ್ಯ ಆಧಾರವನ್ನು ಕೇಳಿ: ಭಾಗ ಉಲ್ಲೇಖಗಳು, ಬೌಂಡಿಂಗ್ ಬಾಕ್ಸ್‌ಗಳು ಅಥವಾ ಸಾಪ್ಲಭ್ಯ relative ಸ್ಥಾನಗಳು.

ಈ ಅರ್ಥ ಹೊಸ ತಂಡದ ಸದಸ್ಯರಿಗೆ ಪರಿಶೀಲನಾ ಪಟ್ಟಿಯನ್ನು ನೀಡುವಂತೆವಾಗಿದೆ. ರಚನೆ ಶಬ್ದವನ್ನು ಕಡಿಮೆ ಮಾಡಿ ಹರಡುವಿಕೆಯನ್ನು ಹೆಚ್ಚಿಸುತ್ತದೆ.

ತ್ವರಿತ ಪ್ರಾರಂಭ: Visual Q&Aಗಾಗಿ ಕನಿಷ್ಠ ಕಾರ್ಯನಿರ್ವಹಿಸುವ ಪ್ರಾಂಪ್ಟ್

ನೀವು ಶುದ್ಧ ಉತ್ತರ ಮಾತ್ರ ಬೇಕಾದಾಗ ಇದನ್ನು ಉಪಯೋಗಿಸಿ.

SYSTEM: ನೀವು ನಿಖರವಾದ visual ಪ್ರಶ್ನೆ ಉತ್ತರವಿನ ಸಹಾಯಕ. ಕೇವಲ ನೀಡಲಾದ ಚಿತ್ರ(ಗಳು)ನಿಂದ ಸಂಕ್ಷಿಪ್ತವಾಗಿ ಉತ್ತರಿಸಿ. ಅನಿಶ್ಚಿತ ಇದ್ದರೆ, "ನिश्चितವಿಲ್ಲ" ಎಂದು ಹೇಳಿ ಮತ್ತು ಏನು ಇಲ್ಲ ಎಂದು ವಿವರಿಸಿ.
USER:
ಚಿತ್ರ: <attach image>
ಪ್ರಶ್ನೆ: ಸಾಧನದ ಸ್ಥಿತಿ LED ಬಣ್ಣ ಯಾವುದು?
ಔಟ್‌ಪುಟ್ ಸ್ವರೂಪ: ಕೇವಲ ಸಂಕ್ಷಿಪ್ತ ವಾಕ್ಯ.

ಇದಕ್ಕಾಗಿ ಕಾರಣಗಳು:

ವ್ಯಾಪ್ತಿ ಚಿತ್ರಕ್ಕೆ ಮಾತ್ರ ಮರೆತು ಇರುತ್ತದೆ.

ನಿರ್ಧರಿತ ಅನುಮಾನಗಳನ್ನು ಉತ್ತೇಜಿಸುತ್ತದೆ.

ಔಟ್‌ಪುಟ್ ಸ್ವರೂಪವನ್ನು ಮೆಷಿನ್-ಹಿತರಾಗುವಂತೆ ನಿಗದಿಪಡಿಸುತ್ತದೆ.

ಮ್ಯಾಜಿಸ್ಟ್ರಲ್ 1.2ಗಾಗಿ ಪುನಃಬಳಕೆಗೊಳ್ಳಬಹುದಾದ ಪ್ರಾಂಪ್ಟ್ ಟೆಂಪ್ಲೇಟ್ಗಳು

ಕೆಳಗೆ ನೀವು ಹೊಂದಿಕೊಳ್ಳಬಹುದಾದ ಸಾಬೀತಾದ ಟೆಂಪ್ಲೇಟ್ಗಳು ನೀಡಲಾಗಿದೆ. ಪ್ರತಿಯೊಂದು ಇಲ್ಲಿ ಉದ್ದೇಶ, ರಚನೆ ಮತ್ತು ತಯಾರಾದ ಪ್ರಾಂಪ್ಟ್ ಒದಗಿಸಲಾಗಿದೆ.

1) ವಸ್ತು ಮತ್ತು ಗುಣಲಕ್ಷಣಗಳ ಹೊರತೆಗೆಯುವುದು (ಏಕದೃಶ್ಯ)

ಬಳಸದಾಗ: ವಸ್ತುಗಳು, ಬಣ್ಣಗಳು, ಎಣಿಕೆಗಳು ಅಥವಾ ಸರಳ ಸಂಬಂಧಗಳ ಮಾಹಿತಿಗೆ.

ಸಲಹೆ: ವಸ್ತುಗಳ ಪರ್ಯಾಯಪದಗಳನ್ನು ಸೇರಿಸಿ ತಿಳುವಳಿಕೆಯಿಂದ ಹೆಚ್ಚಿಸಲು.

SYSTEM: ನೀವು ಒಂದು ಆಧಾರಿತ ದೃಶ್ಯ ತಪಾಸಕ. ಕೇವಲ ದೃಶ್ಯದಲ್ಲಿ ಕಾಣುವದರ ಮೇಲೆ ನಂಬಿಕೊಳ್ಳಿ.
USER:
ಕಾರ್ಯದಕ್ಷತೆ: ಚಿತ್ರದಿಂದ ಪ್ರಮುಖ ವಸ್ತುಗಳು ಮತ್ತು ಗುಣಲಕ್ಷಣಗಳನ್ನು ಗುರುತಿಸಿ.
ಪ್ರಾಧಾನ್ಯತೆಗಳು:
1) ಮುಖ್ಯ ವಸ್ತುಗಳ ಪಟ್ಟಿ ರಚಿಸಿ.
2) ಪ್ರತಿ ಒಂದು ವಿಷಯಕ್ಕೆ ಗುಣಲಕ್ಷಣಗಳನ್ನು (ಬಣ್ಣ, ಎಣಿಕೆ, ಸ್ಥಾನ, ಪಾಠ್ಯ ಲೇಬಲ್‌ಗಳು ಇದ್ದಲ್ಲಿ) ಸೇರಿಸಿ.
3) ಅನುಮಾನವಾದರೆ, ಗುಣಲಕ್ಷಣವನ್ನು null ಎಂದು ಗುರುತಿಸಿ.
ಚಿತ್ರ: <image>
ಔಟ್‌ಪುಟ್ JSON schema:
{
"objects": [{
"name": "string",
"attributes": {"color": "string|null", "count": "int|null", "position": "top-left|top-right|bottom-left|bottom-right|center", "text": "string|null"}
}
],
"notes": "string (ಅಸ್ಪಷ್ಟತೆಗಳು ಅಥವಾ ಅಡ್ಡಬಂದಿದ್ದವುಗಳು)"
}

2) ಮಡುವಿನ ಸಂಘಟನೆ ಜ್ಞಾನದಿಂದ ದಸ್ತಾವೇಜು ಪ್ರಶ್ನೋತ್ತರ

ಬಳಸದಾಗ: ಇನ್ವಾಯಿಸುಗಳು, ರಶೀದಿ, ಫಾರ್ಮ್‌ಗಳು, ಡ್ಯಾಶ್‌ಬೋರ್ಡ್ ಅಥವಾ PDFಗಳನ್ನು ವಿಶ್ಲೇಷಿಸುವಾಗ.

ಸಲಹೆ: ಕ್ಷೇತ್ರ schemas ಒದಗಿಸಿ ಮತ್ತು OCR ಸಾಮಾನ್ಯೀಕರಣ ಸೂಚಿಸಿ.

SYSTEM: ನೀವು ದಸ್ತಾವೇಜು ಅರ್ಥಮಾಡಿಕೆ ವಿಶ್ಲೇಷಕ. ಕ್ಷೇತ್ರಗಳನ್ನು ನಿಖರವಾಗಿ ಹೊರತೆಗೆಯಿರಿ ಮತ್ತು ಘಟಕಗಳನ್ನು ಉಳಿಸಿ.
USER:
ಚಿತ್ರ: <document image>
ಗುರಿ: ಸಾಕ್ಷ್ಯದೊಂದಿಗೆ ದಸ್ತಾವೇಜಿನ ಪ್ರಶ್ನೆಗಳಿಗೆ ಉತ್ತರಿಸು.
ಪ್ರಶ್ನೆಗಳು:
1) ಇನ್ವಾಯಿಸ್ ಸಂಖ್ಯೆ ಏನು?
2) ಒಟ್ಟು ಮೊತ್ತ (ಸಂಖ್ಯಾತ್ಮಕ ಮೌಲ್ಯ ಮತ್ತು ಕರೆನ್ಸಿ) ಎಷ್ಟು?
3) ಅವಧಿ ದಿನಾಂಕ (ISO-8601) ಯಾವುದು?
ನಿಯಮಗಳು:
- ಬಹು ಅಭ್ಯರ್ಥಿಗಳಿದ್ದರೆ, ಉನ್ನತ-2ನ್ನು ಸ್ಥಳ ಸೂಚನೆಗಳೊಂದಿಗೆ ನೀಡಿರಿ.
- ದಿನಾಂಕಗಳನ್ನು YYYY-MM-DD ಗೆ ಸಾಮಾನ್ಯೀಕರಿಸಿ.
- 0-1 ನಡುವಿನ ವಿಶ್ವಾಸ ಅಂಕೆಯನ್ನು ಸೇರಿಸಿ.
ಔಟ್‌ಪುಟ್ JSON ಸ್ವರೂಪ:
{
"answers": [
{"question": "string", "value": "string|number|null", "alt_candidates": [{"value":"string", "bbox":[x1,y1,x2,y2]}], "confidence": 0.0}
],
"notes": "string"
}

3) ಬಹುಚಿತ್ರ ಹೋಲಿಕೆ ಮತ್ತು ತರ್ಕ

ಬಳಸದಾಗ: A/B ಹೋಲಿಕೆಗಳು, ಫ್ರೇಮ್‌ಗಳಲ್ಲಿ ದೋಷ ಪತ್ತೆ, ಮೊದಲು/ಬೇಡ ನಂತರ ಚಿತ್ರಗಳು.

ಸಲಹೆ: ಚಿತ್ರಗಳಿಗೆ ಸ್ಪಷ್ಟ ಲೇಬಲ್ ನೀಡಿ ಮತ್ತು ರಚನಾತ್ಮಕ ಭೇದಗಳನ್ನು ಬಲವಂತ ಮಾಡಿರಿ.

SYSTEM: ನೀವು ಗಮನದಿಂದ visual ಹೋಲಿಕೆಯಾಗುವವನು. ಎರಡೂ ಚಿತ್ರಗಳಲ್ಲಿ ಸಾಕ್ಷ್ಯಗಳನ್ನು ಉಪಯೋಗಿಸು.
USER:
ಚಿತ್ರಗಳು: A=<image A>, B=<image B>
ಕಾರ್ಯ: A ಮತ್ತು B ಹೋಲಿಸಿ ಮತ್ತು ಪ್ರಶ್ನೆಗೆ ಉತ್ತರ ನೀಡಿರಿ.
ಪ್ರಶ್ನೆ: ಯಾರು A ಮತ್ತು B ನಡುವೆ ಏನಾದರೂ ಬದಲಾವಣೆಯಾಗಿದೆ ಮತ್ತು ಅದರಿಂದ ಬಳಕೆಯ ಸಾಮರ್ಥ್ಯ ಹೇಗೆ ಪ್ರಭಾವಿತವಾಗಬಹುದು?
ನಿಯಮಗಳು:
- ದೃಶ್ಯಮಾನ ಅಂಶಗಳ ಮೇಲೆ ಕೇಂದ್ರೀಕೃತ (ಪಠ್ಯ, ಐಕಾನ்கள், ವಿನ್ಯಾಸ, ಬಣ್ಣಗಳು, ಅಂತರ). 
- ಪರಿಣಾಮದ ಮಟ್ಟ (ಕಮ್ಮಿ/ಮಧ್ಯಮ/ಹೆಚ್ಚು) ಸಹಿತ ಬುಲೆಟ್ ಪಟ್ಟಿ ಬದಲಾವಣೆಗಳನ್ನು ನೀಡಿ.
ಔಟ್‌ಪುಟ್ ಸ್ವರೂಪ:
- ಸಾರಾಂಶ (2 ವಾಕ್ಯಗಳು)
- ಬದಲಾವಣೆಗಳು: [ {"element": "string", "change": "string", "impact": "low|medium|high"} ]
- ಸಾಕ್ಷ್ಯ: ಭಾಗ ಉಲ್ಲೇಖಗಳು (ಎಡ/ಬಲ, x%, y% ಇದ್ದರೆ)

4) ಹಂತ-ಹಂತ ದೃಶ್ಯ ತರ್ಕ

ಬಳಸದಾಗ: ಎಣಿಕೆ, ಜ್ಯಾಮಿತೀಯ ಅಥವಾ ಸ್ಥಳೀಯ ತರ್ಕಕ್ಕೆ ಮಾದರಿಯು ಸರಪಳಿಯಾದ ಚಿಂತನೆ ಮಾಡಬೇಕಾಗಿದ್ದಾಗ.

ಸಲಹೆ: ಸರಳವಾದ ತರ್ಕ ಟೋಕನ್ಗಳನ್ನು ಕೇಳಿ, ಆದರೆ ನಿಮ್ಮ ದಾಖಲಿಸುವ ಅಥವಾ ಹಂಚುವ ಔಟ್‌ಪುಟ್‌ನಲ್ಲಿ ಸರಪಳಿ-ಆಲೋಚನೆಯ ವಿಷಯವನ್ನು ನಿಕಜಾವಾಗಿ ಬರೆದಬೇಡಿ.

SYSTEM: ನೀವು visual ತರ್ಕ ಸಹಾಯಕ. ಹಂತ-ಹಂತ ಚಿಂತನೆ ಮಾಡಿ ಆದರೆ ಅಂತಿಮ ಉತ್ತರ ಮತ್ತು ಸಣ್ಣ ಸಮರ್ಥನೆ ಮಾತ್ರ ನೀಡಿರಿ.
USER:
ಚಿತ್ರ: <image>
ಪ್ರಶ್ನೆ: ಎಷ್ಟು ಸ್ಕ್ರೂಗಳು ತೋರಿಸುತ್ತವೆ ಮತ್ತು ಮೇಲ್ಮೈ ಸಾಲಿನ ಯಾವುದು ಕಳೆದುಕೊಂಡಿವೆ?
ಔಟ್‌ಪುಟ್:
- ಉತ್ತರ: <number>
- ಸಮರ್ಥನೆ (ಸಂಕ್ಷಿಪ್ತ): ಸಾಲು/ಕಾಲಮ್ ತರ್ಕ ಮತ್ತು ಯಾವುದೇ ಆವರಣ ಸಮಸ್ಯೆಗಳನ್ನು ಉಲ್ಲೇಖಿಸಿ.
- ಆಯ್ಕೆಯಾಗಿ ಸಾಕ್ಷ್ಯ: ಭಾಗ ವರ್ಣನಗಳು

5) ಸುರಕ್ಷತೆ ಮಾರ್ಗದರ್ಶಕ visual Q&A (ಅನುಕೂಲ/ರೀಡ್ಯಾಕ್ಷನ್)

ಬಳಸದಾಗ: ವೈಯಕ್ತಿಕ ಮಾಹಿತಿ ಲೋಪ ಅಥವಾ ಸಂವೇದನಶೀಲ ವಿಷಯದಿಂದ ತಪ್ಪಿಸಬೇಕಾದಾಗ.

ಸಲಹೆ: ಸುರಕ್ಷಿತ/ಅಸುರಕ್ಷಿತ ವರ್ಗಗಳು ಮತ್ತು ರೀಡ್ಯಾಕ್ಷನ್ ನಿಯಮಗಳನ್ನು ನಿಗದಿಪಡಿಸಿ.

SYSTEM: ನೀವು ದೃಶ್ಯ ಗೌಪ್ಯತೆ ಮತ್ತು ಅನುಕೂಲ ಉಳಿತಾಯ. PII (ಮುಖಗಳು, ಐಡಿ, ವಾಹನ ಪೇಟಕಗಳನ್ನು) ಕಂಡುಬಂದರೆ, ಆ ಕ್ಷೇತ್ರಕ್ಕೆ "REDACTED" ಎಂದು ಹುಡುಕಿ ಮತ್ತು ಯಾಕೆ ಎಂದು ವಿವರಿಸಿ.
USER:
ಚಿತ್ರ: <image>
ಕಾರ್ಯ: ಅಂಗಡಿಯ ಹೆಸರು, ವಿಳಾಸ ಮತ್ತು ಕಂಡುಬರುವ ಸಿಬ್ಬಂದಿ ಸಂಖ್ಯೆಯನ್ನು ಹೊರತೆಗೆಯಿರಿ.
ನಿಯಮಗಳು: ಮುಖಗಳು ಮತ್ತು ಯಾವುದೇ ಐಡಿ ಸಂಖ್ಯೆಗಳನ್ನು ರೀಡ್ಯಾಕ್ಟ್ ಮಾಡಿ.
ಔಟ್‌ಪುಟ್ JSON:
{
"store_name": "string|null",
"address": "string|null",
"staff_count": "int|null",
"redactions": [{"type": "face|id|license_plate", "reason": "string"}]
}

ಪ್ರಾಂಪ್ಟ್ ಅಂಶಗಳು, ಆಗಾಗ್ಗೆ ಸ್ಪಷ್ಟತೆ ಸುಧಾರಿಸುವವು

ರೋಲ್ ಪ್ರೈಮಿಂಗ್: “ನೀವು ದಸ್ತಾವೇಜು ವಿಶ್ಲೇಷಕ/QA ತಪಾಸಕ” ಎಂದು ಹೇಳುವುದರಿಂದ ವರ್ತನೆ ಕಡಿಮೆಯಾಗುತ್ತದೆ.

ನಿರೀಕ್ಷಣೀಯ ಅನುಮಾನ: “ನिश्चितವಿಲ್ಲ” ಎಂಬುದನ್ನು ಸಣ್ಣ ಕಾರಣದೊಂದಿಗೆ ಪ್ರೋತ್ಸಾಹಿಸಿ.

ಸಾಕ್ಷ್ಯ ಕ್ಷೇತ್ರಗಳು: ಬೌಂಡಿಂಗ್ ಬಾಕ್ಸ್‌ಗಳು ಅಥವಾ ತಾತ್ಕಾಲಿಕ ಸಂಯೋಜನೆಗಳು ಉತ್ತರಕ್ಕೆ ಬಲ ನೀಡುತ್ತವೆ.

ಸಾಮಾನ್ಯೀಕರಣ ನಿಯಮಗಳು: ದಿನಾಂಕ, ಕರೆನ್ಸಿ, ಮೂರಣಕ್ಷರ, ಘಟಕಗಳು - ಅಸ್ಪಷ್ಟತೆ ತೆರವುಮಾಡಿ.

ಔಟ್‌ಪುಟ್ ಒಪ್ಪಂದಗಳು: JSON schemas ಸ್ವರೂಪ ಭ್ರಷ್ಟತೆಯನ್ನು ತಡೆಯುತ್ತವೆ ಮತ್ತು ನಂತರದ ವಿಶ್ಲೇಷಣೆಯನ್ನು ಸರಳಗೊಳಿಸುತ್ತವೆ.

ಅಡಿಗೋಡೆಗಳು: ಹಾಲುಸಿನೇಷನ್ ಗಳು ಮತ್ತು ತಪ್ಪು ಓದುವಿಕೆಯನ್ನು ಕಡಿಮೆಮಾಡಿ

ಸಂದರ್ಭವನ್ನು ನಿಯಂತ್ರಿಸಿ: “ಛಾಯಾಚಿತ್ರ(ಗಳ)ಿಂದ ಮಾತ್ರ ಉತ್ತರಿಸಿ. ಹೊರಗಿನ ವಾಸ್ತವಗಳನ್ನು ಊಹಿಸಬೇಡಿ” ಎಂದು ನೆನಪಿನಲ್ಲಿ ಇಟ್ಟುಕೊಳ್ಳಿ.

ಗುಣತೆ ಪರಿಶೀಲನೆ: ಪಠ್ಯ ಧೂಳಾಗಿರುವುದು, ಕಟ್ ಆಗಿರುವುದು ಅಥವಾ ಆವರಣವಾಗಿರುವುದು ತಿಳಿಸುವಂತೆ ಕೇಳಿ.

ದೈರ್ಘ್ಯ ಮಿತಿ: ನಿಖರತೆ ಮುಖ್ಯವಾದಾಗ ಸಾರಾಂಶದಂತೆ, ವಾಸ್ತವ ಕ್ರಮಾಂಕಿತ ಔಟ್‌ಪುಟ್‌ಗಳನ್ನು ಆಯ್ಕೆಮಾಡಿ.

ಬಾಧಾ ಪ್ರಾಂಪ್ಟ್‌ಗಳು: ವಿಶ್ವಾಸ < 0.6 ಇರುತ್ತದಿನಂತೆ, ಸ್ಪಷ್ಟೀಕರಣ ಅಥವಾ ಕಡಿತದೃಶ್ಯವನ್ನು ಕೇಳಿ.

ಮೌಲ್ಯಮಾಪನ ಸೆಟ್‌ಗಳು: ಪುನಃಪರೀಕ್ಷೆಗಾಗಿ ಸಣ್ಣ, ಲೇಬಲ್ ಮಾಡಲಾದ ಚಿತ್ರ ಸೆಟ್ ಬಳಸಿ.

ಪ್ರಕರಣ ಅಧ್ಯಯನಗಳು: ಮ್ಯಾಜಿಸ್ಟ್ರಲ್ 1.2 ನ ಸಂಪ್ರದಾಯಿಕ ಬಳಕೆ

ಕೆಳಗಿರುವ ನಾಲ್ಕು ನೈಜ ಘಟನೆಗಳು ಮ್ಯಾಜಿಸ್ಟ್ರಲ್ 1.2 ಅನ್ನು visual Q&Aಗಾಗಿ ಪ್ರಾಂಪ್ಟ್ ಟೆಂಪ್ಲೇಟ್ಗಳು, ಔಟ್‌ಪುಟ್‌ಗಳು ಮತ್ತು ಕಲಿತ ಪಾಠಗಳೊಂದಿಗೆ ಹೇಗೆ ಬಳಸಬೇಕೆಂದು ತೋರಿಸುತ್ತವೆ.

ಪ್ರಕರಣ ಅಧ್ಯಯನ 1: ಚಿಲ್ಲರೆ ಶೇಲ್ಫ್ ಪತ್ತೆ (CPG)

ಸಮಸ್ಯೆ: ಫೀಲ್ಡ್ ಪ್ರತಿನಿಧಿಗಳು ಯೋಜನಾ ಅನುಗತತೆಯ ಮತ್ತು ಇನ್‌ಸ್ಟಾಕ್ ಇಲ್ಲದ ವಸ್ತುಗಳನ್ನು ಪರಿಶೀಲಿಸಬೇಕು.

ಸೆಟಪ್: ಶೇಲ್ಫ್ ಬೇಗಳನ್ನು ಸ್ಮಾರ್ಟ್‌ಫೋನ್ ಫೋಟೋಗಳಿಂದ ತೆಗೆದುಕೊಳ್ಳುತ್ತಾರೆ, ಕೆಲವೊಮ್ಮೆ ಕೋನದಿಂದ.

ಪ್ರಾಂಪ್ಟ್: ವರ್ಗಗಳ ಮತ್ತು ಎಣಿಕೆಗಳೊಂದಿಗೆ ಬಹು ವಸ್ತುಗಳ ಹೊರತೆಗೆಯುವಿಕೆ.

SYSTEM: ನೀವು ಚಿಲ್ಲರೆ ಶೇಲ್ಫ್ ಪರಿಶೀಲಕ. ಭಾಗವಾಗಿ ಆವರಣ ಇರলেও ಉತ್ಪನ್ನಗಳು ಮತ್ತು ಎಣಿಕೆಗಳನ್ನು ಗುರುತಿಸಿ. ಆಧಾರಿತ ಅಭಿಪ್ರಾಯಗಳೊಂದಿಗೆ ಮಾತ್ರ ಪ್ರತಿಕ್ರಿಯಿಸಿ.
USER:
ಚಿತ್ರ: <shelf photo>
ಕಾರ್ಯ: ಪ್ರತಿಯೊಂದು ಗುರಿ SKU (Cereal A, Cereal B, Cereal C)ಗಾಗಿ ಎದುರು ನೋಡುತ್ತಿರುವ ಎಣಿಕೆ ಮತ್ತು ಗ್ಯಾಪ್‌ಗಳು ವರದಿ ಮಾಡಿ.
ಔಟ್‌ಪುಟ್:
{
"sku_counts": [{"sku":"Cereal A","facings":int,"gaps":int}],
"issues": ["ತಪ್ಪಾಗಿ ಇರಿಸುವ ವಸ್ತು", "ಬೆಲೆ ಟ್ಯಾಗ್ ಕಾಣೆಯು"],
"confidence": 0.0
}

ಪರಿಣಾಮ: 86% ಪ್ರಕರಣಗಳಲ್ಲಿ ±1 ನಿಂವು ಯಥಾರ್ಥ ಎದುರಿಸುವ ಎಣಿಕೆಗಳು. ‘ತಪ್ಪಾಗಿ ಇರಿಸುವ ವಸ್ತು’ ವರ್ಗವನ್ನು ಸೇರಿಸುವುದು ಮತ್ತು ಗ್ಯಾಪ್‌ಗಳನ್ನು ಸ್ಪಷ್ಟವಾಗಿ ಕೇಳುವುದು ಅತ್ಯಂತ ಲಾಭಕಾರಿ ಆಗಿತ್ತು.

ಸಲಹೆ: ಚಿತ್ರಗಳ ಕೋಣ ಭಿನ್ನವಾಗಿದ್ದರೆ, ಮಾದರಿಯಿಂದ ದೃಷ್ಟಿಕೋನ ಸಡಿಲತೆಯನ್ನು ಉಲ್ಲೇಖಿಸಲು ಕೇಳಿ ಅದು ಎಣಿಕೆಗಳನ್ನು ಪ್ರಭಾವಿತ ಮಾಡುತ್ತದೆಯೇ ಎಂದು ತಿಳಿಯಿರಿ.

ಪ್ರಕರಣ ಅಧ್ಯಯನ 2: ಇನ್ವಾಯಿಸ್ QA (FinOps)

ಸಮಸ್ಯೆ: ಇನ್ವಾಯಿಸ್ ಒಟ್ಟು ಮತ್ತು ದಿನಾಂಕಗಳ ಮ್ಯಾನುಯಲ್ ಪರಿಶೀಲನೆಗಳು ವಿಳಂಬ ಮತ್ತು ದೋಷಗಳನ್ನುಂಟುಮಾಡುತ್ತವೆ.

ಸೆಟಪ್: ಸ್ಟ್ಯಾಂಪ್‌ಗಳು ಮತ್ತು ಅಸಮತೋಲನ ಬೆಳಕಿನೊಂದಿಗೆ ಸ್ಕ್ಯಾನ್ ಮಾಡಲಾದ ಇನ್ವಾಯಿಸುಗಳು.

ಪ್ರಾಂಪ್ಟ್: ಮಡುವಿನ ಅರಿವಿನೊಂದಿಗೆ ದಸ್ತಾವೇಜು Q&A ಮತ್ತು ಸಾಮಾನ್ಯೀಕರಣ ನಿಯಮಗಳು.

SYSTEM: ನೀವು FinOps ದಸ್ತಾವೇಜು ತಪಾಸಕ. ಒಟ್ಟುಗಳು ಮತ್ತು ದಿನಾಂಕಗಳನ್ನು ಸಾಕ್ಷ್ಯ ಮತ್ತು ವಿಶ್ವಾಸ ಮಾಹಿತಿ ಜೊತೆ ಹೊರತೆಗೆಯಿರಿ.
USER:
ಚಿತ್ರ: <invoice>
ಪ್ರಶ್ನೆಗಳು: ಇನ್ವಾಯಿಸ್ ಸಂಖ್ಯೆ, ಒಟ್ಟು ಬಾಕಿ (ಕರೆನ್ಸಿ ಜೊತೆ), ಕೊನೆ ದಿನಾಂಕ.
ನಿಯಮಗಳು: ಸ್ಥಳ ಸೂಚನೆಗಳೊಡನೆ ಉನ್ನತ-2 ಅಭ್ಯರ್ಥಿಗಳನ್ನು ನೀಡಿರಿ.

ಪರಿಣಾಮ: ಕರೆನ್ಸಿ ಸಾಮಾನ್ಯೀಕರಣ ಮತ್ತು ‘ಪರ್ಯಾಯ ಅಭ್ಯರ್ಥಿಗಳು’ ಸೇರಿಸುವ ಮೂಲಕ ಒಟ್ಟುಗಳ 94% ನಿಖರ ಹೊಂದಾಣಿಕೆ. ‘ಉಪಮೊತ್ತ’ ಮತ್ತು ‘ತೆರಿಗೆ’ ಸಾಲುಗಳನ್ನು స్పಷ್ಟವಾಗಿ ಕೇಳುವವರೆಗೆ ನಿರ್ಲಕ್ಷಿಸುವುದರಿಂದ ತಪ್ಪು ಸಕಾರಾತ್ಮಕಗಳು ಕಡಿಮೆಯಾದವು.

ಸಲಹೆ: ಗೊಂಪುಹಾದಿ ಕ್ಷೇತ್ರಗಳನ್ನು ಹೊರತುಗೊಳ್ಳಲು ನಿರ್ಬಂಧಿತ ಸೂಚನೆಗಳನ್ನು ಸೇರಿಸಿ.

ಪ್ರಕರಣ ಅಧ್ಯಯನ 3: ಅಸೆಂಬ್ಲಿ ಲೈನಿನ ಉತ್ಪನ್ನ QA (ತೆವಣಿಗೆಯಲ್ಲಿ)

ಸಮಸ್ಯೆ: ಕಳೆದುಹೋದ ಸ್ಕ್ರೂಗಳು ಮತ್ತು ತಪ್ಪಾಗಿ ಹೊಂದಿಸಲ್ಪಟ್ಟ ಲೇಬಲ್‌ಗಳನ್ನು ನುಡಿಮಾಡು.

ಸೆಟಪ್: 720p ಒವರ್‌ಹೆಡ್ ಕ್ಯಾಮೆರಾ ಫ್ರೇಮ್‌ಗಳು, ಬದಲಾದ ಬೆಳಕು.

ಪ್ರಾಂಪ್ಟ್: ಹಂತ-ಹಂತ ತರ್ಕದೊಂದಿಗೆ ಸಣ್ಣ ಸಮರ್ಥನೆಗಳು, ಸಾಲು/ಕಾಲಮ್ ಗಣನೆಗೆ ಒತ್ತು.

SYSTEM: ನೀವು ಗುಣಮಟ್ಟ ಕಂಟ್ರೋಲ್ ಇನ್ಸ್ಪೆಕ್ಟರ್. ನಿರ್ದಿಷ್ಟ ಫ್ಯಾಸ್ಟನರ್ಸ್ ಎಣಿಸಿ ಮತ್ತು ಲೇಬಲ್ ಸಮರಸೆ ಪರಿಶೀಲಿಸಿ.
USER:
ಚಿತ್ರ: <frame>
ಪ್ರಶ್ನೆ: ಮೇಲ್ಮೈ ಸಾಲಿನ ಎಲ್ಲಾ 8 ಸ್ಕ್ರೂಗಳು ಇದ್ದವೆಯೇ ಮತ್ತು ಲೇಬಲ್ ಸಮಮಿತಿತೆಯಲ್ಲದೇ ಇದೆಯೇ (<3° ತಿರುವು)?
ಔಟ್‌ಪುಟ್:
{"screws_present": true|false, "missing_indices": [int], "label_aligned": true|false, "confidence": 0-1}

ಪರಿಣಾಮ: ಪ್ರತಿಬಿಂಬಗಳನ್ನು ನಿರ್ಲಕ್ಷಿಸುವ ನಿಯಮ ಸೇರಿಸಿದ ನಂತರ 92% ಗಿಂತ ಹೆಚ್ಚು ನಿಖರತೆ. ಮೇರುದರ್ಜೆ ಅಂದಾಜು ಕಚ್ಚಾ ಡಿಗ್ರಿ ಬದಲು ಬೂಲಿಯನ್ ಮಿತಿಗೆ ವಿನ್ಯಾಸಗೊಳಿಸಿದಾಗ ಸ್ಥಿರತೆ ಸುಧಾರಿತಿತು.

ಸಲಹೆ: ನಿರಂತರ ಅಳತೆಗಳನ್ನು ಮಿತಿವೇಧಗಳಿಗೆ ಪರಿವರ್ತಿಸಿ ಹೆಚ್ಚಿನ ಸुस್ಪಷ್ಟ ತರಗತಿಗಾಗಿ.

ಪ್ರಕರಣ ಅಧ್ಯಯನ 4: ವೆಬ್ ಅಪ್ಲಿಕೇಶನ್‌ಗಳ UI ರಿಗ್ರೆಶನ್ (DevOps)

ಸಮಸ್ಯೆ: ದೃಶ್ಯ ಭೇದಗಳು ಪಿಕ್ಸೆಲ್ ಬದಲಾವಣೆಗಳನ್ನು ಹಿಡಿದರೂ, ಅರ್ಥಾತ್ಮಕ ಹಿಂದೊ enfermed್ಡನೆಗಳನ್ನು ಮಿಸ್ ಮಾಡುತ್ತದೆ (ಉದಾಹರಣೆಗೆ, ನಿಷ್ಕ್ರಿಯ ಬಟನ್).

ಸೆಟಪ್: ಮಹತ್ವದ ಕಾರ್ಯ ನೀಚ ಬಳಿಕ ರಾತ್ರಿ ಸ್ಕ್ರೀನ್‌ಶಾಟ್‌ಗಳು.

ಪ್ರಾಂಪ್ಟ್: ಪರಿಣಾಮ ಮೌಲ್ಯಮಾಪನಗಳೊಂದಿಗೆ ಬಹುಚಿತ್ರ ಹೋಲಿಕೆ.

SYSTEM: ನೀವು UI ಸ್ಕ್ರೀನ್‌ಶಾಟ್‌ಗಳನ್ನು ಅರ್ಥಾತ್ಮಕ ಹಿಂಬಾಲಿಗಾಗಿ ಹೋಲಿಸುತ್ತೀರಿ.
USER:
ಚಿತ್ರಗಳು: A=<baseline>, B=<candidate>
ಪ್ರಶ್ನೆ: ಬಳಕೆ ಮತ್ತು ಪ್ರವೇಶಳತೆಗೆ ಪ್ರಭಾವ ಬೀರುವ ಬದಲಾವಣೆಗಳ ಪಟ್ಟಿ ನೀಡಿರಿ.
ಔಟ್‌ಪುಟ್: ಸಾರಾಂಶ + ಪರಿಣಾಮ ಮತ್ತು ಸಾಕ್ಷಿ ಹೊಂದಿರುವ ಬದಲಾವಣೆಗಳ ಅರೇ.

ಪರಿಣಾಮ: ನಿಷ್ಕ್ರಿಯ CTA ಸ್ಥಿತಿಗಳು ಮತ್ತು ಹೊಂದಾಣಿಕೆಯ ಸಮಸ್ಯೆಗಳನ್ನು ತಡಪಡದೆ ಹಿಡಿದಿಡಿತು. ತಂಡ “ಹೆಚ್ಚು ಪರಿಣಾಮ” ಬದಲಾವಣೆಗಳ ಮೇಲೆ ಸ್ವಯಂಚಾಲಿತ ಗೇಟ್‌ಗಳನ್ನು ಸೇರಿಸಿತು.

ಸಲಹೆ: ತೂಕದ ಅನುಪಾತಗಳು, ಫೋಕಸ್ ಸ್ಥಿತಿಗಳು ಹಾಗೂ ARIA ಲೇಬಲ್‌ಗಳು (ಕಂಡಿರುವಲ್ಲಿ) ಉಲ್ಲೇಖಿಸಲು ಪ್ರೋತ್ಸಾಹಿಸಿ.

ಪವರ್ ಬಳಕೆದಾರರಿಗಾಗಿ ಮುನ್ನೆಚ್ಚರಿಕೆಯ ತಂತ್ರಗಳು

ಪ್ರದೇಶ ಮೊದಲ ಪ್ರಾಂಪ್ಟ್: ಗೊಂದಲ ಕಡಿಮೆಮಾಡಲು ಕಡಿತದ ಪ್ರದೇಶಗಳನ್ನು ಒದಗಿಸಿ. ಸಂಪೂರ್ಣ ಚಿತ್ರಕ್ಕೂ ಮುಂಚೆ ಪ್ರದೇಶಗಳನ್ನು ವಿಶ್ಲೇಷಿಸಲು ಮಾದರಿಯನ್ನು ಕೇಳಿ.

ಪ್ರಶ್ನೆಗಳ ಸರಪಳಿ: ಸಂಕೀರ್ಣ ಕಾರ್ಯಗಳನ್ನು ಸಾಲುಪ್ರಶ್ನೆಗಳಾಗಿ ಹೋಡಿಸಿ: ವಿನ್ಯಾಸ ಪತ್ತೆಮಾಡಿ → ಕ್ಷೇತ್ರಗಳನ್ನು ಹೊರತೆಗೆಯು → ಒಟ್ಟುಗಳನ್ನು ಪರಿಶೀಲಿಸು.

ಔಟ್‌ಪುಟ್‌ಗಳ ಮೂಲಕ ಉಪಕರಣ ಬಳಕೆ: ಮುಂದಿನ ದೃಷ್ಟಿ ಪೈಪ್‌ಲೈನ್‌ಗೆ ಸಂಯೋಜನೆಗಳು ಅಥವಾ ಚಿತ್ರ ಕಡಿತದ ಸೂಚನೆಗಳನ್ನು ಉತ್ಪಾದಿಸಲು ಮಾದರಿಯನ್ನು ವಿನಂತಿಸಿ.

ಸಾಮಾನ್ಯೀಕರಣ ಗ್ರಂಥಾಲಯಗಳು: ನಂತರ ಸೇರ್ಪಡೆಯಿಗಾಗಿ ಸ್ಪಷ್ಟ ಸ್ಟ್ರಿಂಗ್ ಸ್ವರೂಪಗಳನ್ನು ಸೂಚಿಸಿ (ಉದಾ., ISO-8601, UPPER_SNAKE_CASE).

ವಿಶ್ವಾಸ-ಅನ್ವೇಷಿತ ಕಾರ್ಯಪ್ರವಾಹಗಳು: ವಿಶ್ವಾಸ < 0.7 ಉಂಟಾದರೆ, ಕೈಯ ಮೂಲಕ ಪರಿಶೀಲನೆಗೆ ಹೋಡಿ ಅಥವಾ ಎರಡನೇ ಚಿತ್ರವನ್ನು ಕೇಳಿ.

ಮೌಲ್ಯಮಾಪನ: Visual Q&A ಗುಣಮಟ್ಟವನ್ನು ಹೇಗೆ ಅಳೆಯುವುದು

ಸಮರ್ಪಕ ಹೊಂದಿಕೆ (EM): ರಚನಾತ್ಮಕ ಕ್ಷೇತ್ರಗಳಿಗೆ (ದಿನಾಂಕಗಳು, ಒಟ್ಟುಗಳು).

F1 ಸ್ಕೋರ್ ಸ್ಪ್ಯಾನ್ಸ್ ಮೇಲೆ: ದಸ್ತಾವೇಜುಗಳ ಒಳಗಿನ ಪಠ್ಯಕ್ಕೆ.

mAP / precision@k: ವಸ್ತು ಇರುವಿಕೆ ಮತ್ತು ಎಣಿಕೆಗಳಿಗೆ.

ಮಾನವ ಸಂಯೋಜನೆ: 5–10% ನಂಬರ್ ಮಾದರಿಗಾಗಿ ಆಯ್ಕೆಯ ತಪಾಸಣೆ; ತಾರತಮ್ಯದ ಲಾಗ್ ಮಾಡು.

ಡ್ರಿಫ್ಟ್ ವಾಚ್: ಸ್ಥಿರ ಬಸ್ಮ/templates ನಿದ್ದೆಗೆ ಕಾಯಿರಿ; ಪ್ರತಿ ಪ್ರಾಂಪ್ಟ್ ಬದಲಾವಣೆಯ ನಂತರ ಪುನಃ ಓದಿ.

ವಾರಾಂತರ ಪರೀಕ್ಷೆಗಾಗಿ ಸರಳ ನಿಯಮಗಳು:

ನಿಖರತೆ ಗುರಿ: ಮುಖ್ಯ ಕ್ಷೇತ್ರಗಳಲ್ಲಿ 90% EM; ಪತ್ತೆಗಳಲ್ಲ 85% ನಿಖರತೆ.

ದಡಕಣೆ: ಉತ್ಪಾದನಾ ರೆಸಲ್ಯೂಷನ್‌ನಲ್ಲಿ ಪ್ರತಿ ಚಿತ್ರಕ್ಕೆ <1.2 ಸೆಕೆಂಡು.

ಸ್ಥಿರತೆ: ಪ್ರಾಂಪ್ಟ್ ಸಂಪಾದನೆಗಳಲ್ಲ ±2% ಗಿಂತ ಹೆಚ್ಚಿನ ಬದಲಾವಣೆ ಇಲ್ಲ.

ಸಾಮಾನ್ಯ VQA ಸಮಸ್ಯೆಗಳಿಗೆ ತ್ವರಿತ ಪರಿಹಾರಗಳು

ಕಡಿಮೆಯಾದ ಪಠ್ಯ ಓದುವಿಕೆ (ಧೂಳಾಗಿರುವಿಕೆ): “ಉತ್ತಮ ಊಹೆ ಮತ್ತು ಅನುಮಾನದ ಕಾರಣ” ಕೇಳಿ. ಹೆಚ್ಚಿನ ರೆಸಲ್ಯೂಷನ್ ಕಡಿತವನ್ನು ಪರಿಗಣಿಸಿ.

ಒಟ್ಟುಗಳ vs ಉಪಒಟ್ಟುಗಳ ಗೊಂದಲ: ಸ್ಪಷ್ಟವಾದ ತಿದ್ದುಪಡುವನ್ನು ಸೇರಿಸಿ; ಸಂಖ್ಯೆಯ ಹತ್ತಿರ ಕರೆನ್ಸಿ ಸಂಕೇತ ಅಗತ್ಯವಿದೆ.

ಸಣ್ಣ ವಸ್ತುಗಳ ಹೆಚ್ಚು ಎಣಿಕೆ: “ಪ್ರತಿಬಿಂಬ/ಅಳೆಕಡೆಗಳನ್ನು ನಿರ್ಲಕ್ಷಿಸು” ಮತ್ತು ಕನಿಷ್ಠ ಗಾತ್ರ ಮಿತಿಯನ್ನು ನಿಗದಿಪಡಿಸಿ.

ಅಸಮಾನ JSON: schema ಪುನರಾವರ್ತಿಸಿ ಮತ್ತು “ಕ್ಷೇತ್ರ ಕಳೆದೇ ಇದ್ದರೆ null ಬಳಸಿ” ಸೇರಿಸಿ.

ಹಾಲುಸಿನೇಷನ್ ಪೃಥ್ವಿಯಲ್ಲಿ ಅಸಂಬಂಧ ವಾಸ್ತವಗಳು: ನೆನಪಿಸಿ “ಚಿತ್ರದಲ್ಲಿ ಸ್ಪಷ್ಟವಾಗಿ ಕಾಣದ ಬ್ರ್ಯಾಂಡ್ ಅಥವಾ ಮಾದರಿಯನ್ನು ಊಹಿಸಬೇಡಿ.”

ಒಟ್ಟುಗೂಡಿಸುವಿಕೆ: ನೀವು ಪುನಃಬಳಕೆ ಮಾಡಬಹುದಾದ ಒಂದು ಡೌನ್‌ವರ್ಗಡ ಪ್ರಾಂಪ್ಟ್

SYSTEM: ನೀವು ನಿಖರ visual Q&A ಮಾದರಿ. ಕೇವಲ ನೀಡಲಾದ ಚಿತ್ರ(ಗಳು) ಮೇಲೆ ನಂಬಿಕೆ ಇಡಿ. ಅನಿಶ್ಚಿತ ಇದ್ದರೆ, "ನिश्चितವಿಲ್ಲ" ಹೇಳಿ ಮತ್ತು ಯಾಕೆ ಎಂದು ಸೇರಿಸಿ. ಕಡ್ಡಾಯವಾಗಿ ಕೇಳಿದ schema ನಲ್ಲಿ ಔಟ್‌ಪುಟ್ ನೀಡಿರಿ.
USER:
ಪ್ರಸಂಗ: <business use case>
ಚಿತ್ರ(ಗಳು): <ಒಂದು ಅಥವಾ ಹೆಚ್ಚು>
ಕಾರ್ಯ: <ಎನು ತೆಗೆಯಬೇಕೇ ಅಥವಾ ಉತ್ತರಿಸಬೇಕೇ>
ನಿಯಮಗಳು:
- ವ್ಯಾಪ್ತಿ: <ಆಕರ್ಷಕ ವಸ್ತುಗಳು/ಕ್ಷೇತ್ರಗಳು>
- ನಿರಾಕರಣೆ: <ನಿರ್ಲಕ್ಷಿಸುವುದಾದ ವಿಷಯಗಳು>
- ಸಾಮಾನ್ಯೀಕರಣ: <ದಿನಾಂಕ/ಕರೆನ್ಸಿ/ಘಟಕಗಳು>
- ಸಾಕ್ಷ್ಯ: <ಬಾಕ್ಸ್‌ಗಳು ಅಥವಾ ಭಾಗ ಉಲ್ಲೇಖಗಳು ಇದ್ದರೆ>
ಔಟ್‌ಪುಟ್ schema: <JSON ಆಕಾರ>

ಈ ಟೆಂಪ್ಲೇಟ್ ನಿಮ್ಮ Visual Q&A ಪ್ರಾಂಪ್ಟ್‌ಗಳನ್ನು ತಂಡಗಳ ಮತ್ತು ಮಾಹಿತಿಯ ಮೂಲಗಳ ಮೂಲಕ ಒಂದೇ ಶೈಲಿಯಲ್ಲಿ ಇಡುತ್ತದೆ.

ನಿಮ್ಮ visual Q&A ಕಾರ್ಯಪ್ರವಾಹದಲ್ಲಿ Sider.ai ಅನ್ನು ಬಳಸಬೇಕಾದಾಗ

ಪ್ರಾಂಪ್ಟ್‌ಗಳ ತ್ವರಿತ ಪುನರವೀಕ್ಷಣೆ: ಗಮನಾರ್ಹವಾಗಿ, Sider.ai ನೀವೂ ಪ್ರಾಂಪ್ಟ್ ರೂಪಿಸಿ, ನಡೆಸಿ ಮತ್ತು ಮ್ಯಾಜಿಸ್ಟ್ರಲ್ ಶೈಲಿಯ ಪ್ರಾಂಪ್ಟ್‌ಗಳನ್ನು ಚಿತ್ರಗಳು ಮತ್ತು ವೆಬ್‌ಪುಟಗಳೊಂದಿಗೆ ತಯಾರಿಸಿ, ಉತ್ಪನ್ನ ತಂಡಗಳು ಬ್ರೌಸರ್ ಬಿಟ್ಟು ಹೊರಡುವ ಅಗತ್ಯವಿಲ್ಲದೆ ಅತಿ ಜೆದ ಘಟನೆಗಳನ್ನು ಪರೀಕ್ಷಿಸಬಹುದು.

ಕ್ರಾಸ್ ತಂಡ ವಿಮರ್ಶನ: ಪ್ರಾಂಪ್ಟ್ ಟೆಂಪ್ಲೇಟ್ಗಳು ಮತ್ತು ಪಕ್ಕ-ಪಕ್ಕದ ಔಟ್‌ಪುಟ್‌ಗಳನ್ನು ವೇಗವಾಗಿ ಪ್ರತಿಕ್ರಿಯೆಗೆ ಹಂಚಿಕೊಳ್ಳಿ.

ದಸ್ತಾವೇಜೀಕರಣ ಮತ್ತು ಉಲ್ಲೇಖ: ಮಾನ್ಯ ಪ್ರಾಂಪ್ಟ್‌ಗಳನ್ನು ಸಂಗ್ರಹಿಸಿ ಮತ್ತು ಪ್ರತಿ ಯೋಜನೆಗೆ (schema, ಕ್ಷೇತ್ರಗಳು) ಚರಗಳನ್ನು ಸೇರಿಸಿ.

Sider.aiವಂತಹ ಉಪಕರಣದ ಬಳಕೆ “ಐಡಿಯಾ → ಪರೀಕ್ಷಿಸಲಾದ ಪ್ರಾಂಪ್ಟ್ → ಅನುಮೋದಿತ ಟೆಂಪ್ಲೇಟ್ಗೆ” ಪ್ರಕ್ರಿಯೆಯ ಹೊಳೆಗೆ ಕಡಿಮೆಮಾಡುತ್ತದೆ, ಇದು ಸಾಮಾನ್ಯವಾಗಿ Visual Q&Aಯ ಉತ್ಪಾದನೆಗೆ ಅಡ್ಡಿಯಾಗುತ್ತದೆ.

ಕಾರ್ಯ ಯೋಜನೆ: ಈ ವಾರ visual Q&Aಗಾಗಿ ಮ್ಯಾಜಿಸ್ಟ್ರಲ್ 1.2 ಅನ್ನು ನಿಯೋಜಿಸಿ

ಒಂದು ಬಳಕಾ ಪ್ರಕರಣ (ಇನ್ವಾಯಿಸುಗಳು, ಶೇಲ್ಫ್‌ಗಳು, UI ಭೇದಗಳು) ಆಯ್ಕೆಮಾಡಿ.

ಮೇಲಿನ ಅತಿ ಸಮೀಪದ ಟೆಂಪ್ಲೇಟ್ನಿಂದ ಪ್ರಾರಂಭಿಸಿ; ನಿಮ್ಮ schema ಮತ್ತು ನಿರಾಕರಣೆಗಳನ್ನು ಸೇರಿಸಿ.

30 ಚಿತ್ರಗಳ ನಿಜ ಅಸ್ಥಿತ್ವದ ಮಾನದಂಡವನ್ನು ನಿರ್ಮಿಸಿ.

ಹಂತ ಹಂತದಲ್ಲಿ ಒಂದು ಪ್ರಾಂಪ್ಟ್ ಅಂಶವನ್ನು ಬದಲಾಯಿಸಿ ಮತ್ತು ಪುನಃ ಪರೀಕ್ಷಿಸಿ.

ಸ್ವಯಂಚಾಲಿತ ಮಾಡಿ: ಔಟ್‌ಪುಟ್ JSON ಕಡ್ಡಾಯ ಮಾಡಿ, ವಿಶ್ವಾಸ ಮಿತಿಗಳನ್ನು ಸೇರಿಸಿ, ಕೈಯ ದಕ್ಷಿಣ ಪರಿಶೀಲನೆ ನಿಯಮಗಳನ್ನು ಸೆಟ್ಟ್ನಲ್ಲಿ ಇಡಿ.

ದಸ್ತಾವೇಜು ಮಾಡಿ: ಅಂತಿಮ ಪ್ರಾಂಪ್ಟ್‌ಗಳು, ಮಾದರಿ ಔಟ್‌ಪುಟ್‌ಗಳು ಮತ್ತು ಬದ್ಧ ಘಟನೆಗಳನ್ನು ಸಂಗ್ರಹಿಸಿ ಹೊಸದಾಗಿ ಸೇರಿದವರಿಗೆ ನೀಡಲು.

ಮುಖ್ಯ ಸಂಕ್ಷೇಪಣೆಗಳು

ನೀವು ಪ್ರಾಂಪ್ಟ್‌ಗಳನ್ನು ಸ್ಪೆಕ್ಸ್‌ನಂತೆ ಪರಿಗಣಿಸಿದಾಗ Magistral 1.2 ಹೆಚ್ಚು ವಿಶ್ವಾಸಾರ್ಹವಾಗುತ್ತದೆ: ಪಾತ್ರ, ವ್ಯಾಪ್ತಿ, ಫಾರ್ಮ್ಯಾಟ್ ಮತ್ತು ಪುರಾವೆ.

ಕಾರ್ಯಕ್ಕೆ ಹೊಂದಿಕೆಯಾಗುವ ಗುರಿಯುಳ್ಳ ಟೆಂಪ್ಲೇಟ್‌ಗಳನ್ನು ಬಳಸಿ (ವಸ್ತು ಗುಣಲಕ್ಷಣಗಳು, ಡಾಕ್ಯುಮೆಂಟ್ ಲೇಔಟ್, ಮಲ್ಟಿ-ಇಮೇಜ್ ಹೋಲಿಕೆ, ಹಂತ-ಹಂತದ ತಾರ್ಕಿಕತೆ).

ಭ್ರಮೆಗಳನ್ನು ಕಡಿತಗೊಳಿಸಲು ಮತ್ತು ನಂಬಿಕೆಯನ್ನು ಸುಧಾರಿಸಲು ಗಾರ್ಡ್‌ರೈಲ್‌ಗಳನ್ನು ಸೇರಿಸಿ - ಅನಿಶ್ಚಿತತೆ, ಹೊರಗಿಡುವಿಕೆಗಳು, ಸಾಮಾನ್ಯೀಕರಣ.

ಸಣ್ಣ, ಲೇಬಲ್ ಮಾಡಲಾದ ಮೌಲ್ಯಮಾಪನ ಸೆಟ್‌ಗಳೊಂದಿಗೆ ಮೌಲ್ಯೀಕರಿಸಿ ಮತ್ತು ಎಡಿಟ್‌ಗಳ ನಂತರ ಡ್ರಿಫ್ಟ್‌ಗಾಗಿ ವೀಕ್ಷಿಸಿ.

ಬ್ರೌಸರ್‌ನಲ್ಲಿ ವೇಗದ ಪುನರಾವರ್ತನೆಗಾಗಿ, Sider.ai ತಂಡಗಳಿಗೆ ಪ್ರಾಂಪ್ಟ್‌ಗಳನ್ನು ಪರಿಷ್ಕರಿಸಲು ಮತ್ತು ಪ್ರಮಾಣೀಕರಿಸಲು ಸಹಾಯ ಮಾಡುತ್ತದೆ.

ನೀವು ವಿಷುಯಲ್ Q&A ಬಗ್ಗೆ ಹಿಂಜರಿಯುತ್ತಿದ್ದರೆ, ಈಗ ನಿಮ್ಮ ಬಳಿ ನೈಜವಾದದ್ದನ್ನು ತ್ವರಿತವಾಗಿ ಮತ್ತು ಸುರಕ್ಷಿತವಾಗಿ ರವಾನಿಸಲು ಟೆಂಪ್ಲೇಟ್‌ಗಳು ಮತ್ತು ಕೇಸ್ ಸ್ಟಡೀಸ್ ಇವೆ.

FAQ

Q1: ಇನ್‌ವಾಯ್ಸ್‌ಗಳಲ್ಲಿ ವಿಷುಯಲ್ Q&A ಗಾಗಿ Magistral 1.2 ಅನ್ನು ನಾನು ಹೇಗೆ ಬಳಸುವುದು? ಗುರಿ ಕ್ಷೇತ್ರಗಳನ್ನು (ಇನ್‌ವಾಯ್ಸ್ ಸಂಖ್ಯೆ, ಒಟ್ಟು, ನಿಗದಿತ ದಿನಾಂಕ), ಸಾಮಾನ್ಯೀಕರಣ ನಿಯಮಗಳನ್ನು ({ISO-8601} ದಿನಾಂಕಗಳು, ಕರೆನ್ಸಿ) ಮತ್ತು ಬೌಂಡಿಂಗ್ ಬಾಕ್ಸ್‌ಗಳಂತಹ ಪುರಾವೆಗಳನ್ನು ನಿರ್ದಿಷ್ಟಪಡಿಸುವ ಲೇಔಟ್-ಅರಿವುಳ್ಳ ಪ್ರಾಂಪ್ಟ್ ಬಳಸಿ. ಪರ್ಯಾಯ ಅಭ್ಯರ್ಥಿಗಳು ಮತ್ತು ವಿಶ್ವಾಸದ ಸ್ಕೋರ್‌ಗಳನ್ನು ನೀವು ಸೇರಿಸಿದಾಗ Magistral 1.2 ಉತ್ತಮವಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ.

Q2: Magistral 1.2 ವಿಷುಯಲ್ Q&A ಗಾಗಿ ಉತ್ತಮ ಪ್ರಾಂಪ್ಟ್ ಟೆಂಪ್ಲೇಟ್‌ಗಳು ಯಾವುವು? ರಚನಾತ್ಮಕ ಟೆಂಪ್ಲೇಟ್‌ಗಳೊಂದಿಗೆ ಪ್ರಾರಂಭಿಸಿ: ವಸ್ತು ಮತ್ತು ಗುಣಲಕ್ಷಣ ಹೊರತೆಗೆಯುವಿಕೆ, ಡಾಕ್ಯುಮೆಂಟ್ Q&A, ಮಲ್ಟಿ-ಇಮೇಜ್ ಹೋಲಿಕೆ ಮತ್ತು ಹಂತ-ಹಂತದ ತಾರ್ಕಿಕತೆ. ಪ್ರತಿಯೊಂದು ಟೆಂಪ್ಲೇಟ್ ಪಾತ್ರ ಪ್ರೈಮಿಂಗ್, ಹೊರಗಿಡುವಿಕೆಗಳು, ಸಾಮಾನ್ಯೀಕರಣ ಮತ್ತು ಕಟ್ಟುನಿಟ್ಟಾದ JSON ಔಟ್‌ಪುಟ್ ಸ್ಕೀಮಾವನ್ನು ಒಳಗೊಂಡಿರಬೇಕು.

Q3: Magistral 1.2 ನೊಂದಿಗೆ ವಿಷುಯಲ್ Q&A ನಲ್ಲಿ ಭ್ರಮೆಗಳನ್ನು ನಾನು ಹೇಗೆ ಕಡಿಮೆ ಮಾಡಬಹುದು? ಚಿತ್ರದಿಂದ ಮಾತ್ರ ಉತ್ತರಿಸಲು ಮಾದರಿಯನ್ನು ನಿರ್ಬಂಧಿಸಿ, ಗೋಚರತೆ ಕಡಿಮೆಯಾದಾಗ ಅನಿಶ್ಚಿತತೆಯ ಅಗತ್ಯವಿರುತ್ತದೆ ಮತ್ತು ಸ್ಪಷ್ಟವಾದ ಹೊರಗಿಡುವಿಕೆಗಳನ್ನು ಸೇರಿಸಿ. ವಿಶ್ವಾಸದ ಮಿತಿಗಳನ್ನು ಬಳಸಿ ಮತ್ತು ಲಭ್ಯವಿದ್ದಾಗ ಪ್ರದೇಶದ ನಿರ್ದೇಶಾಂಕಗಳಂತಹ ಪುರಾವೆಗಳನ್ನು ವಿನಂತಿಸಿ.

Q4: ಹೋಲಿಕೆಗಾಗಿ Magistral 1.2 ಅನೇಕ ಚಿತ್ರಗಳನ್ನು ನಿರ್ವಹಿಸಬಹುದೇ? ಹೌದು. ಚಿತ್ರಗಳಿಗೆ ಲೇಬಲ್ ಮಾಡಿ (A/B), ಗೋಚರ ಬದಲಾವಣೆಗಳ ಮೇಲೆ ಕೇಂದ್ರೀಕರಿಸಿ ಮತ್ತು ಪರಿಣಾಮ ರೇಟಿಂಗ್‌ಗಳೊಂದಿಗೆ ರಚನಾತ್ಮಕ ವ್ಯತ್ಯಾಸವನ್ನು ಒತ್ತಾಯಿಸಿ. ಇದು UI ರಿಗ್ರೆಷನ್, ಮೊದಲು/ನಂತರ ಪರಿಶೀಲನೆಗಳು ಮತ್ತು ದೋಷ ಪತ್ತೆಗಾಗಿ ಸ್ಥಿರತೆಯನ್ನು ಸುಧಾರಿಸುತ್ತದೆ.

Q5: ವಿಷುಯಲ್ Q&A ಗಾಗಿ ಪ್ರಾಂಪ್ಟ್‌ಗಳನ್ನು ತ್ವರಿತವಾಗಿ ಪುನರಾವರ್ತಿಸಲು ಯಾವ ಪರಿಕರಗಳು ನನಗೆ ಸಹಾಯ ಮಾಡುತ್ತವೆ? ನೀವು Magistral 1.2 ಪ್ರಾಂಪ್ಟ್‌ಗಳನ್ನು ನೇರವಾಗಿ ಮೂಲಮಾದರಿಯಾಗಿಸಬಹುದು ಮತ್ತು Sider.ai ಚಿತ್ರಗಳು ಮತ್ತು ವೆಬ್ ವಿಷಯದ ಜೊತೆಗೆ ಪ್ರಾಂಪ್ಟ್‌ಗಳನ್ನು ಪರೀಕ್ಷಿಸಲು ಮತ್ತು ಪರಿಷ್ಕರಿಸಲು ನಿಮಗೆ ಅನುಮತಿಸುತ್ತದೆ ಎಂಬುದನ್ನು ಗಮನಿಸುವುದು ಮುಖ್ಯ. ಇದು ವಿಮರ್ಶೆ ಚಕ್ರಗಳನ್ನು ಕಡಿಮೆ ಮಾಡುತ್ತದೆ ಮತ್ತು ತಂಡಗಳಾದ್ಯಂತ ಟೆಂಪ್ಲೇಟ್‌ಗಳನ್ನು ಪ್ರಮಾಣೀಕರಿಸುತ್ತದೆ.