כריית נתונים או כריית נתונים הוא תהליך הסיווג באמצעות מערכי נתונים גדולים לזיהוי דפוסים וביסוס קשרים לפתרון בעיות באמצעות ניתוח נתונים. כלי כריית נתונים מאפשרים לחברות לחזות מגמות עתידיות.
בכריית נתונים, כללי האסוציאציה נוצרים על ידי ניתוח נתונים לדפוסים תכופים, תוך שימוש בקריטריונים של תמיכה וביטחון כדי לאתר את היחסים החשובים ביותר בתוך הנתונים. תמיכה היא התדירות בה מופיעים פריטים במסד הנתונים, בעוד שהביטחון הוא מספר הפעמים שההצהרות מדויקות.
פרמטרים אחרים של כריית נתונים כוללים רצף או ניתוח נתיבים, סיווג, אשכולות ותחזית. פרמטרי ניתוח הרצף או נתיב לחפש דפוסים אשר אחד מוביל לאירוע אחר עוקב אירוע. רצף הוא רשימה מסודרת של ערכות פריטים והיא סוג נפוץ של מבנה נתונים שנמצא בבסיסי נתונים רבים. פרמטר סיווג מחפש דפוסים חדשים ויכול לגרום לשינוי באופן הארגון של הנתונים. אלגוריתמים לסיווג לנבא משתנים בהתבסס על גורמים אחרים בתוך מסד הנתונים.
פרמטרים מקבצים מוצאים ומתעדים באופן חזותי קבוצות של עובדות שלא היו ידועות בעבר. קיבוץ מקבץ קבוצה של אובייקטים ומאגד אותם בהתבסס על מידת דמיונם זה לזה.
ישנן דרכים שונות בהן משתמש יכול לפרוס את האשכול, ולהבדיל בין כל מודל אשכול. עידוד הפרמטרים בכריית נתונים יכול לחשוף דפוסים בנתונים שיכולים להוביל לחיזויים סבירים לגבי העתיד, הידועים גם בשם ניתוח ניבוי.
טכניקות כריית נתונים משמשות בתחומי מחקר רבים, כולל מתמטיקה, קיברנטיקה, גנטיקה ושיווק. אמנם טכניקות כריית נתונים הן אמצעי להנעת יעילות וחיזוי התנהגות לקוחות, אך אם משתמשים בה נכון, עסק יכול לבדל את עצמו מהתחרות שלו באמצעות ניתוח ניבוי.
כריית אתרים, סוג של כריית נתונים המשמשת לניהול קשרי לקוחות, משלבת מידע שנאסף באמצעות שיטות וטכניקות כריית נתונים מסורתיים ברשת. כריית אתרים שואפת להבין את התנהגות הלקוחות ולהעריך את האפקטיביות של אתר מסוים.