שימור קונטקסט (Caching)Context Caching
הגדרה מהירה
מה זה Context Caching? (TL;DR)
טכנולוגיית Gemini המאפשרת להקפיא זיכרון של מיליוני טוקנים כדי לחסוך בעלויות ולהזניק את המהירות.
ציטוט
השתמשתם בדף הזה? תנו קרדיט.
עתונאים, חוקרים וצוותי AI - בחרו פורמט להעתקה. ה-citation האקדמי שלנו בקליק.
מונחים קשורים
הנדסת קונטקסט
התחום החדש של עיצוב מידע שניתן לסוכני AI כך שהם יוכלו להיכנס מחדש לפרויקט בלי להישבר.
גבול חלון הקונטקסט
הכמות המקסימלית של tokens ש-LLM יכול לעבד בקריאה אחת - מ-128K עד 1M ב-2026.
שימור פרומפטים (Prompt Caching)
מנגנון של Anthropic לשימור הוראות מערכת ארוכות וקבועות, מה שמוריד את עלות ה-Input ב-90%.
שגיאת נזילת הקונטקסט (AI Crash)
כאשר כותבים קובץ ארוך (>300 שורות), ה-Claude/Cursor שוכח לממשק פונקציות בסיס ודורס קוד קיים.
הסקת מסקנות בקונטקסט ארוך
יכולת המודל לחבר בין רסיסי מידע שנמצאים במקומות רחוקים מאוד בתוך ה-Codebase.
הטמעת Prompt Caching
טכניקת אופטימיזציה ל-Anthropic/Gemini שמורידה עלות tokens של system prompts חוזרים ב-50-90%.
Audit הנדסי לפרויקט · 24 שעות · חינם
תארו מה שבור או מה החלום. נחזור עם אבחון הנדסי + תוכנית חילוץ ראשונית - בלי התחייבות.
מעדיפים לדלג? כתבו לנו ישירות בווצאפ