רגע, זה משחק וידאו או כדור בדולח?
צפיתם פעם בדמות שאינה שחקן (non-player character) צועדת אל תוך קיר וחשבתם לעצמכם, "כן, זה אני ביום שני"? מנועי וידאו ומשחק מסורתיים מצוינים בלגרום לפיקסלים להיראות כמו עולמות – אבל הם עדיין בעיקר בובות על חוטים. המודל העולמי של Odyssey רוצה לגזור את החוטים. הוא לא רק מעבד את מה שמוצג על המסך; הוא מנסה להבין מה יקרה הלאה. תחשבו פחות על תפאורה, יותר על מוח בתוך קופסה.
אם ראיתם את ההדגמות האלה שבהן בינה מלאכותית מסתכלת על סצנה וחוזה מה יקרה – כמו כדור שמתגלגל מאחורי ספה ואז מופיע מחדש בצד השני – Odyssey משחקת בארגז החול הזה. והיא עושה את זה בצורה שגורמת ל-Unreal ול-Unity להרגיש… ובכן, קצת בסיסיות. לא חסרות תועלת. פשוט כמו מחשבונים בהשוואה לגיליונות אלקטרוניים. שימושי מאוד – עד שאתם צריכים שהמודל יחשוב.
אז בואו נפרק את האופן שבו המודל העולמי של Odyssey שונה ממנועי וידאו ומשחק מסורתיים – בלי תואר דוקטור, מדריך בן 500 עמודים או בקר שצריך שש אגודלים כדי להשתמש בו.
תמצית המעלית: מנועי וידאו מעבדים; Odyssey מדמה מציאות
- מנועים מסורתיים: מערכות דטרמיניסטיות (או פסאודו-אקראיות) מבוססות חוקים שנועדו לצייר פריימים, לדמות פיזיקה ולהגיב לקלטים. הם מכחולי צבע בזמן אמת עם חוקים.
- המודל העולמי של Odyssey: מנוע נלמד וחזוי. הוא לא רק מצייר את הסצנה; הוא מעריך את המצב הנסתר של העולם וצופה עתידים סבירים. זה לא רק "מה שאתה רואה" – זה "מה שסביר שיקרה הלאה".
ההבדל העיקרי: מנועים מדמים את מה שאתה אומר להם לדמות; Odyssey מסיקה מה העולם ומה הוא עשוי להיות. הקפיצה הזו – מתסריטים להבנת מצב – היא הסיבה שזה משנה.
תחשבו על במאים: מנועי משחק יוצרים תסריטים מצולמים; Odyssey מאלתרת
- ב-Unity או Unreal, אתם הבמאים שקובעים כל שורה: התאורה, הפיזיקה, ניתוב הבינה המלאכותית, תיבות הפגיעה. המנוע מבצע את התוכנית שלכם ללא רבב (עד שהוא לא, היי באגים של התנגשות).
- המודל העולמי של Odyssey הוא השחקן שיכול לאלתר. תנו לו סצנה, והוא מסיק כוונות, הסתרות ודינמיקה שלא נצפתה. הוא לומד דפוסים מסרטונים, לא התנהגויות מקודדות ממך. פחות תיאטרון בובות, יותר שכל ישר חזוי.
זמן אנלוגיה: מנועים מסורתיים הם כמו Google Maps במצב ניווט – פנייה אחר פנייה, מתוסרט במפורש. Odyssey היא כמו אותו חבר שנהג במסלול אלף פעמים ואיכשהו מכיר את קיצור הדרך כשהכביש המהיר נסגר. לא תיכנתם את זה; זה הסיק את זה.
הקלטים: נכסים ותסריטים לעומת חוויה גולמית
- מנועים מסורתיים קולטים רשתות, טקסטורות, הצללות, אנימציות ותסריטים. אתם יוצרים את העולם בעבודת יד.
- Odyssey קולטת סרטונים, מסלולים ונתונים מרובי מודלים. היא לא רק מחקה פריימים; היא בונה ייצוג סמוי – מוח דחוס ומתימטי – שתופס את האופן שבו העולם נוטה להתנהג.
האפקט: מנועים דורשים מאמנים ומעצבים לבנות כל לבנה; Odyssey מנסה ללמוד את כל תוכנית העיר על ידי צפייה בצילומי זמן-lapse. היא מפנימה דינמיקה כמו מומנטום, הסתרה וסיבתיות מבלי שתנהלו כל משתנה במיקרו.
פיזיקה: חוקים אפויים לעומת דינמיקה נלמדת
- מנועים = פיזיקה מפורשת. כוח הכבידה הוא 9.81 מ'/שנייה² אלא אם כן תשנו אותו. התנגשויות הן קשיחות אלא אם כן תרככו אותן.
- Odyssey = פיזיקה נלמדת. היא מעריכה כיצד דברים בדרך כלל נעים, מתי הם מחליקים, מקפצים, מתעוותים – או פשוט נעלמים מאחורי ספה לשלושה פריימים.
יש לציין, פיזיקה נלמדת יכולה לעבור הכללה למקרים קיצוניים מבולגנים בעולם האמיתי. פיזיקת משחק היא ללא רבב עד שבובת סמרטוט מתעטשת ומשוגרת למסלול.
חוסר ודאות: משחקים נמנעים ממנה; Odyssey ניזונה ממנה
מנועי משחק אוהבים ודאות. אם האור כאן, הצל שם. אם הקוד אומר "ללכת", הדמות הולכת. Odyssey מאמצת הסתברות. היא עוקבת אחר מספר עתידים אפשריים ומשייכת סבירויות. זו הסיבה שהיא חזקה לחיזוי – נתיבי רובוטים, תנועות מצלמה, תנועה. היא לא קורסת את המציאות לתסריט אחד; היא משאירה את ה"אולי" בחיים.
אם אתם בונים עוזרים לרחפנים או מכוניות או רובוטים – או אפילו כלי עריכת וידאו שמנחשים את החיתוך הבא שלכם – זה משנה. העולם הוא שד כאוס. Odyssey מדגמת את השד.
שליטה: פקודות ציווי לעומת כוונות ברמה גבוהה
- מנועים מסורתיים: אתם לוחצים על A, הדמות קופצת; אתם קוראים ל-API, הצללה מתקמפלת. אתם מקבלים שליטה ישירה.
- Odyssey: אתם מגדירים מטרה, כמו "להגיע לדלת", והיא חוזה רצפים שמשיגים את המטרה תחת פיזיקה והקשר. פחות ג'ויסטיק, יותר תדריך משימה.
זו הסיבה שאנשים מתרגשים ממודלים עולמיים עבור סוכנים אוטונומיים. זה לא קשור להנפשת מריו; זה קשור לאמירה למערכת "לא להתנגש בעגלת התינוק" ולבטוח בה שתתכנן.
ייצוג: גיאומטריה תחילה לעומת סמוי תחילה
מנועים מסורתיים בונים עולמות מגיאומטריה וחומרים. Odyssey בונה עולמות במרחב סמוי – מרק וקטורי דחוס שבו אובייקטים, תנועה וכוונות הם "מאפיינים", לא משולשים.
יתרון מפתיע: מרחבים סמויים נהדרים למילוי מידע חסר. אם רוכב אופניים מתכופף מאחורי משאית, מנוע לא יודע מה יש מאחורי המשאית אלא אם כן יצרתם את זה. Odyssey אומרת, "כנראה שעדיין יש רוכב אופניים", ומתכננת בהתאם.
גם: מודלים דומים ל-Odyssey יכולים לסנתז סרטון משכנע ללא נכסים מפורשים. זה עיבוד באמצעות הבנה, לא עיבוד באמצעות מצולעים.
נאמנות לעומת ראייה מראש: מנועים מנצחים ביופי, Odyssey מנצחת בחיזוי
- מנועים מצליחים בתאורה מושלמת לפריים, השתקפויות, שלוליות 4K שלעולם לא תשימו לב אליהן.
- Odyssey מצליחה ב-"מה יקרה אם…" אתם מקבלים ראייה מראש: זיהוי איומים, חיזוי מסלול, פריימים סבירים הבאים, ועובדות מנוגדות.
זה לא טוב יותר או גרוע יותר; זה שונה. אם אתם מכינים את The Last of Us הבא, שמרו על Unreal. אם אתם מכינים רובוט שאסור לו לבעוט בפח אשפה לתנועה, המידול העולמי של Odyssey הוא החבר הכי טוב החדש שלכם.
אימון לעומת יצירה: רעב לנתונים לעומת רעב לעבודה
- מנועים צורכים עבודה: עיצוב רמות, ריגום, תסריט. אתם שולחים תוכן.
- Odyssey צורכת נתונים: סרטונים, יומנים, הזנות חיישנים. אתם שולחים חוויה.
כן, זה אומר GPUs. דליים מהם. גם ממשל נתונים, פרטיות, הפחתת הטיה – מזנון הבינה המלאכותית המודרני כולו. אבל זה הופך את המשוואה: פחות חוקים לתחזוקה, יותר הכללה כאשר הסביבה משתנה.
איתור באגים: מיליון סליידרים לעומת מיליון דוגמאות
- באג מנוע: תשנו קוליידר, תוסיפו הצהרת if, קראו לזה יום.
- באג מודל עולמי: אספו עוד נתונים, התאימו פונקציות הפסד, קצצו חריגים, הוסיפו אילוצים. אתם עורכים את הזיכרון שלו, לא את הקוד שלו.
הצד החיובי? כשהוא לומד, הוא עובר הכללה. תיקון התנגשות בודדת במנוע לא הופך כל דלת לחכמה יותר. אימון מודל עולמי על דלתות עשוי.
היכן Odyssey זורחת: מציאות מבולגנת ולא מתוסרטת
- רובוטיקה: תכנון נתיבים סביב בני אדם, חיות מחמד ו-Roombas סוררים.
- נהיגה אוטונומית: חיזוי מה הטנדר הזה עשוי לעשות כשהאור הופך לצהוב (ספוילר: כל דבר).
- AR/VR: שמירה על יציבות ואמינות של אובייקטים וירטואליים כשאתם מסתובבים בסלון שלכם כאילו הפלתם עדשה.
- כלי וידאו: השלמת הסתרות, חיזוי פריימים הבאים, ייצוב צילומים, סינתזה של B-roll מהקשר.
- סוכנים: לתת לתוכנה להחליט "מה הלאה" ממטרה ברמה גבוהה, לא מאקרו בן 300 שלבים.
מנועים מסורתיים מצטיינים כשאתם שולטים בכל דבר: אורות אולפן, אירועים מתוסרטים, קהל שלא יגע בכלום. Odyssey זורחת כשהקהל מציק, קם ושופך סודה על הבמה – והמופע חייב להימשך.
מתחת למכסה המנוע: סיור חנונים קצר מאוד
- מצב עולם סמוי: ייצוג דחוס של אובייקטים, תנועה ויחסים.
- מודל דינמיקה: חוזה את המצב הסמוי הבא בהתחשב בנוכחי ובפעולות.
- מודל תצפית: הופך מצבים סמויים לפריימים או קריאות חיישנים צפויים.
- מתכנן/מדיניות: מחפש פעולות אפשריות כדי להשיג מטרה, תוך התחשבות בחוסר ודאות.
למנועים מסורתיים יש מחסנית משלהם – מעבדים, פיזיקה, תסריטי AI – אבל הם לא לומדים את הדינמיקה מחוויה גולמית. Odyssey כן.
ביצועים: זמן אמת שונה בארץ המודלים
מנועים מותאמים לחומרה עבור רסטריזציה ופיזיקה. מודלים עולמיים נשענים על מאיצים עבור הסקת מסקנות עצבית. זמן אמת אפשרי, אבל אתם מחליפים נאמנות חזותית בכוח חיזוי. זה אומר שלפעמים זה נראה פחות מבריק אבל מתנהג יותר חכם ברחוב. תחשבו: פחות קרני אל, יותר "לא להידרס מאוטובוס".
מעקות בטיחות: מדוע הזיות חשובות יותר מטשטוש תנועה
במשחקים, תקלה היא TikTok. בעולם האמיתי, תקלה היא תביעה משפטית. אז מערכות בסגנון Odyssey צריכות:
- כיול עם אמיתות קרקע (חיישנים, מפות)
- הערכות חוסר ודאות (ביטחון בעתידים)
- אילוצי בטיחות (חוקי "אל תעז" קשים)
- בדיקות אנושיות בלולאה עבור שיחות בעלות סיכון גבוה
מנועים מסורתיים לא ידמיינו לפתע נתיב חדש. מודלים עולמיים עשויים. מעקות בטיחות הם חלק מהעבודה.
פרק הקרוסאובר: האם הם יכולים לעבוד יחד?
בהחלט. תארו לעצמכם את הצינור הזה:
- אב טיפוס של התנהגות במודל עולמי באמצעות סרטון מוקלט.
- אמת וחדד בארגז חול של מנוע משחק עם משתנים ניתנים לשליטה.
- חזרו אחורה – מנוע חושף מקרים קיצוניים, מודל עובר אימון מחדש.
מנועים נותנים לכם שליטה ובדיקה. מודלים עולמיים נותנים לכם הכללה. זה חמאת בוטנים וריבה, פחות המקלדת הדביקה.
עלות, מורכבות ו-"למה עכשיו"
- GPUs נעשו מהירים יותר, ארכיטקטורות מודלים נעשו חכמות יותר, ויש יותר סרטונים מתמונות חתולים (בסדר, כמעט).
- מפתחים מגיעים לתקרת התסריטים. יצירת כל תרחיש ביד לא ניתנת להרחבה כאשר האפליקציה שלכם פוגשת את העולם האמיתי.
- משתמשים רוצים עוזרים שמגיבים. לא רק מעבדים. זה השינוי.
האם זה זול? לא. אבל גם בניית צינור חיתוך משלכם לא הייתה זולה בשנת 2012. ההבדל: מודלים מפחיתים את עלות הלמידה על פני מקרי שימוש. ברגע שהוא יודע "איך דלתות עובדות", כל דלת נהנית.
תרחישים מעשיים: מה באמת משתנה עבורכם
- אתם מפתח רובוטיקה: במקום לקודד if-thens למדרגות לעומת רמפות, אתם מתאמנים על הרבה סרטוני מדרגות ורמפות. Odyssey חוזה את יכולת המעבר ומתכננת בהתאם.
- אתם בונים AR: במקום לכוונן עוקבי תכונות עבור כל מרקם סלון, המודל עוקב אחר אובייקטים דרך הסתרות ומנחש את ההופעה מחדש. המנורה הווירטואלית נשארת במקומה.
- אתם יצרן כלי וידאו: אתם מציעים הצעות "תחזית צילום הבא", לא רק מעברים. המודל יודע שזה סרטון בישול וכנראה צריך תקריב של הבצלים הבאים.
- אתם בסימולציה: השתמשו במנוע משחק כדי לבחון מצבי סיכון נדירים; השתמשו ב-Odyssey כדי ללמוד כיצד בני אדם מגיבים בפועל. ביחד, אתם מקבלים בטיחות + ריאליזם.
השוואה מהירה: Odyssey לעומת מנועים מסורתיים
- מטרה: ראייה מראש לעומת נאמנות.
- קלטים: ניסיון לעומת נכסים.
- שליטה: כוונות לעומת פקודות ציווי.
- פיזיקה: נלמדת לעומת מקודדת.
- מצבי כשל: הזיות לעומת גזירה.
- חוזק: הכללה לעומת דיוק מחבר.
אם אתם עושים ויזואליה באיכות קולנועית, מנועים הם הנסיעה שלכם. אם אתם צריכים "מה יקרה הלאה", המודל העולמי של Odyssey הוא המבוגר האחראי במסיבה.
בדיקת מציאות של כלי עבודה: מה שתצטרכו בפועל
- צינורות נתונים עבור קליטת סרטונים/חיישנים ותיוג (או פיקוח חלש).
- תשתית אימון – GPUs בענן או אשכולות מקומיים, בתוספת נקודות ביקורת ורתמות הערכה.
- שכבת הגשה שיכולה לעשות הסקה מהירה, באופן אידיאלי עם אצווה וקוונטיזציה.
- יכולת צפייה: מעקב אחר סחיפה, מקרי כשל ושיאי חוסר ודאות.
- תוכנית גיבוי: ברירות מחדל בטוחות כאשר הביטחון יורד.
האם זה זוהר? לא במיוחד. אבל זה המחיר של ללמד את האפליקציה שלכם לחשוב במקום לשנן.
שימו לב: היכן Sider.AI משתלבת בתמונה הזו
ראוי לציין: אם הראש שלכם מסתובב בניסיון להשוות גישות, Sider.AI יכולה לעזור לכם למיין את שאלת "מה עלי לבנות". תזינו לה את מקרה השימוש שלכם – ניתוב רובוטים, ייצוב AR, חיזוי – והיא תסכם פשרות, תציף מחקר רלוונטי ואפילו תשרטט תוכנית טכנית מהר יותר ממה שאתם יכולים להגיד "למה ההפסד שלי לא יורד". היא לא כאן כדי למכור לכם השתקפויות שלוליות. היא כאן כדי למנוע מכם להמציא מחדש חצי ממעבדת מחקר. התפיסות המוטעות שלא ימותו
- "מודלים עולמיים מחליפים מנועים." לא ממש. הם מגדילים אותם. מנועים זורחים בוויזואליה נשלטת; מודלים זורחים במציאות מבולגנת.
- "אי אפשר לסמוך על פיזיקה נלמדת." אתם יכולים – אם אתם מכיילים ומגבילים. מהנדסים עושים זאת במערכות בקרה במשך עשרות שנים.
- "זה רק חיזוי וידאו." זה חיזוי וידאו עם מטרה: תכנון, קבלת החלטות, חוסר ודאות. זה הצעד הקסום מיפה לשימושי.
כיצד להחליט: תרשים זרימה מיני בסגנון שטרן
- צריכים ויזואליה קולנועית ודטרמיניסטית? השתמשו במנוע משחק.
- צריכים חיזוי הסתברותי בעולם האמיתי? השתמשו במודל עולמי.
- צריכים את שניהם? התחילו עם מודל להתנהגות ומנוע לבדיקה. תגרמו להם ללחוץ ידיים.
- אין לכם נתונים? התחילו לאסוף. העתיד שלכם יקנה לכם קפה.
תחזית העתיד (כראוי): הכל היברידי
צפו שמנועים יספגו רכיבים נלמדים נוספים – מודלים של התנהגות NPC, פיזיקה נלמדת, אפילו תנועת מצלמה. צפו שמודלים עולמיים יהפכו ליותר ניתנים לשליטה וידידותיים לכלי עבודה – תחשבו על תכנון שניתן לעודד, סצנות סמויות שניתן לערוך, וערבויות על בטיחות.
בקרוב, אתם עשויים "ליצור" סצנה על ידי תיאור כוונות: "אחר צהריים גשום, הולך רגל מוסח, רובוט משלוחים צריך לנתב מחדש." המערכת מעבדת את הוויזואליה ואת הדינמיקה. אתם עורכים את שניהם כמו שכבות בציר זמן. זה הנתיב הממוזג שאליו אנו נכנסים.
סיכום: מי מנווט – אתם, התסריט או המודל?
מנועים מסורתיים הם במאים פנטסטיים של מחזה אמין מאוד. המודל העולמי של Odyssey הוא קבוצת האלתור שגם עברה את מבחן הביניים בפיזיקה. אם אתם צריכים שליטה, לכו עם התסריט. אם אתם צריכים יכולת הסתגלות, לכו עם המודל. אם אתם צריכים את שניהם – הצטרפו לשארנו, להטוטני GPUs כמו תפוחי אדמה לוהטים.
הנה המסקנה שלכם: מנועים מראים לכם את העולם שבניתם. Odyssey מנסה להראות לכם את העולם שתפגשו. בחרו בהתאם – ואולי תחזיקו מטלית בהישג יד לסודה שעל הבמה.
שאלות נפוצות
ש1:האם המודל העולמי של Odyssey הוא תחליף ל-Unity או Unreal?
לא. תחשבו על השלמה, לא תחליף. השתמשו במנועי משחק עבור ויזואליה באיכות גבוהה ושליטה מדויקת, והשתמשו במודל העולמי של Odyssey כשאתם צריכים חיזוי, טיפול בחוסר ודאות והכללה בעולם האמיתי.
ש2:מדוע מודל עולמי חשוב לרובוטיקה ו-AR?
מכיוון שהעולם לא עוקב אחר התסריט שלכם. מודל עולמי חוזה תוצאות סבירות, עוקב אחר אובייקטים דרך הסתרות ומתכנן סביב בני אדם וכאוס – דברים שמנועים מסורתיים לא לומדים מחוויה גולמית.
ש3:מה התפיסה עם פיזיקה ותחזיות נלמדות?
הם יכולים להזות או להיות בטוחים מדי. התיקון: לכייל עם אמיתות קרקע, לעקוב אחר חוסר ודאות, להוסיף אילוצי בטיחות, ולהשאיר בני אדם בלולאה עבור החלטות בעלות סיכון גבוה.
ש4:האם אני יכול להריץ מודל עולמי בזמן אמת?
כן, עם החומרה הנכונה ואופטימיזציות מודלים – קוונטיזציה, זיקוק, אצווה. צפו לפשרה: פחות סוכריות עיניים קולנועיות, יותר ראייה מראש חכמה ברחוב.
ש5:כיצד אני מתחיל לעבור מתסריטים למודלים עולמיים?
אספו נתונים רלוונטיים למשימה, הגדירו מטרות, אמנו מודל דינמיקה ושלבו מתכנן. אמת בארגז חול של מנוע משחק, ואז חזרו על עצמכם. בונוס: כלים כמו Sider.AI יכולים לעזור למפות את המחסנית ולהימנע ממבוי סתום.