ספריית ידע ענק (RAG)
חיפוש סמנטי חכם במסמכים גדולים
מה זה ולמה צריך?
נניח שיש לכם מדיניות משלוחים בת 3 עמודים, נהלי שירות מפורטים, ו-FAQ ארוך. להזין את הכל ידנית במאגר הידע זה עבודה רבה. עם ספריית הידע, פשוט מעלים את הקבצים.
כשלקוח שואל שאלה, המערכת מבצעת חיפוש סמנטי — לא חיפוש מילות מפתח רגיל, אלא חיפוש שמבין את הכוונה מאחורי השאלה.
סוגי קבצים נתמכים
.txt
טקסט רגיל
קובץ PDF
.docx
מסמך Word
URL
גרידת דף אינטרנט
גודל מקסימלי: 10MB לקובץ, עד ~50,000 אסימונים (~150KB טקסט).
איך מפעילים?
1 הפעלת החיפוש
בדשבורד, נכנסים לעמוד "ספריית ידע ענק" ומפעילים את הטוגל "הפעל חיפוש חכם בספריה".
2 העלאת מסמך
לחצו "העלה מסמך" ובחרו קובץ TXT, PDF, Word או הזינו כתובת URL.
3 המתנה לעיבוד
המערכת מפצלת, מעבדת ויוצרת וקטורים. לוקח 10-60 שניות בהתאם לגודל.
4 הבוט מוכן!
ברגע שהסטטוס משתנה ל"מוכן", הבוט מתחיל לחפש בספרייה בכל שיחה.
מה לשים בקובץ?
התוכן צריך להיות טקסט שפתי - עברית או אנגלית - שמתאר נהלים, שירותים או מדיניות.
✅ דוגמאות טובות
מדיניות ונהלים מובנים
שאלות ותשובות (FAQ)
## לכל נושא. המערכת מפצלת לפי
כותרות, מה שמבטיח שכל נושא יהיה חתיכה נפרדת.
❌ מה לא לשים
- קוד (HTML, CSS, JavaScript) — הבוט לא יודע לפרש קוד כידע
- קבצי Excel ישירות — המירו ל-CSV או TXT קודם
- תמונות או PDF סרוק ללא טקסט
- תוכן שאינו קשור לעסק
איך זה עובד מאחורי הקלעים?
ספריית הידע מבוססת על טכנולוגיית RAG (Retrieval Augmented Generation):
שלב העלאה (חד פעמי)
- פירוס (Parse) — הקובץ מומר לטקסט רגיל
- פיצול (Chunk) — הטקסט נחתך לחתיכות של ~500 אסימונים עם חפיפה ביניהן
- וקטוריזציה (Embed) — כל חתיכה הופכת לוקטור מספרי בן 768 ממדים
- שמירה — הוקטורים נשמרים במסד הנתונים לחיפוש מהיר
שלב שיחה (כל הודעה)
- שאלת הלקוח הופכת לוקטור
- חיפוש דמיון בין הוקטור של השאלה לכל החתיכות
- 4 החתיכות הכי רלוונטיות (מעל 60% דמיון) מצורפות לידע הבוט
- ה-AI מקבל את החתיכות ועונה על בסיסן
טיפים להצלחה
- Markdown עם כותרות — הפורמט הטוב ביותר. כותרת
##לכל נושא - כתבו תיאורים מלאים — "משלוח רגיל תוך 3-5 ימי עסקים" עדיף מ-"משלוח 3-5 ימים"
- הוסיפו מילים נרדפות — "ביטול / החזרה / cancellation" משפר את דיוק החיפוש
- אפשר כמה מסמכים — אין מגבלה על מספר המסמכים, רק על גודל כל אחד
- בדקו עם הסימולטור — אחרי ההעלאה, שאלו שאלות בבדיקת הבוט ותוודאו שהוא מוצא את המידע