जब भी हम मशीन लर्निंग मॉडल बनाते हैं, तो हमें अपने डेटा को दो हिस्सों में बांटना पड़ता है – Training Dataset और Testing Dataset। आइए समझते हैं इन दोनों का उपयोग और इनका फर्क।
यह वह हिस्सा होता है जिससे मॉडल सीखता है। इसमें डेटा के साथ-साथ उनके सही उत्तर (Labels) भी होते हैं, जिससे मॉडल पैटर्न और लॉजिक सीखता है।
यह डेटा मॉडल को कभी नहीं दिखाया गया होता। इसे मॉडल की परफॉर्मेंस मापने के लिए उपयोग किया जाता है। इससे हम जानते हैं कि मॉडल नए डेटा पर कितना सही अनुमान लगाता है।
सारांश: Training Dataset मॉडल को सिखाने का काम करता है, जबकि Testing Dataset यह जांचता है कि मॉडल कितना सही अनुमान लगा रहा है। दोनों मिलकर मशीन लर्निंग को सफल बनाते हैं।
