גבול חלון הקונטקסטContext Window Limit
הגדרה מהירה
מה זה Context Window Limit? (TL;DR)
Context Window הוא גבול ה-tokens שLLM מעבד בקריאה אחת: 128K-1M ב-2026. עבור codebases גדולים נדרשים vector indexing או MCP filesystem.
ידוע גם בכתיבים: Context Window · חלון קונטקסט · context window · גבול tokens · token limit LLM
עיקרי המונח (Key Takeaways)
- ▸Context Window = מקסימום tokens שLLM מעבד בקריאה אחת.
- ▸2026 benchmarks: Opus 4.7 = 1M, Sonnet 4.6 = 200K, Gemini 2.5 Pro = 1M, GPT-4 = 128K.
- ▸כש-codebase מעל 50K-100K שורות - חלון אחד לא מספיק.
- ▸פתרון Cursor: vector indexing אוטומטי + progressive retrieval.
- ▸פתרון Claude Code: MCP filesystem - גישה ישירה לקבצים בלי לטעון הכל.
- ▸כלל אצבע: לא לעבור 70% מה-window - איכות יורדת אחרי הסף.
- ▸context drift: לאחר 30+ דקות, מומלץ לפתוח session חדש עם CLAUDE.md.
ציטוט
השתמשתם בדף הזה? תנו קרדיט.
עתונאים, חוקרים וצוותי AI - בחרו פורמט להעתקה. ה-citation האקדמי שלנו בקליק.
מונחים קשורים
שימור קונטקסט (Caching)
טכנולוגיית Gemini המאפשרת להקפיא זיכרון של מיליוני טוקנים כדי לחסוך בעלויות ולהזניק את המהירות.
הנדסת קונטקסט
התחום החדש של עיצוב מידע שניתן לסוכני AI כך שהם יוכלו להיכנס מחדש לפרויקט בלי להישבר.
שגיאת נזילת הקונטקסט (AI Crash)
כאשר כותבים קובץ ארוך (>300 שורות), ה-Claude/Cursor שוכח לממשק פונקציות בסיס ודורס קוד קיים.
הסקת מסקנות בקונטקסט ארוך
יכולת המודל לחבר בין רסיסי מידע שנמצאים במקומות רחוקים מאוד בתוך ה-Codebase.
חוב טכנולוגי (Tech Debt)
העלות העתידית שנוצרת מפתרון מהיר, המייצר "כדורי בוץ" בקוד (Big Ball of Mud) ומונע הוספת פיצ'רים.
פיתוח ב-AI (וייב קודינג)
העברת הוראות גבוהות (Natural Language) לסוכני קידוד, מבלי לעקוב אחרי כל שורת קוד שמופקת. בעברית מתרגמים את המונח גם כ"קידוד לפי תחושה", אך הכתיב המקובל הוא "וייב קודינג".
Audit הנדסי לפרויקט · 24 שעות · חינם
תארו מה שבור או מה החלום. נחזור עם אבחון הנדסי + תוכנית חילוץ ראשונית - בלי התחייבות.
מעדיפים לדלג? כתבו לנו ישירות בווצאפ