अपनी एमएल पाइपलाइन को प्रोडक्शन के लिए तैयार करने के लिए, आपको यह काम करना होगा:
- अपनी पाइपलाइन के लिए कंप्यूट संसाधन उपलब्ध कराना
- लॉगिंग, मॉनिटरिंग, और सूचना देने की सुविधा लागू करना
कंप्यूट संसाधनों को चालू करना
मशीन लर्निंग पाइपलाइन चलाने के लिए, कंप्यूट रिसॉर्स की ज़रूरत होती है. जैसे, रैम, सीपीयू, और जीपीयू/टीपीयू. ज़रूरत के हिसाब से कंप्यूट क्षमता न होने पर, पाइपलाइन नहीं चलाई जा सकतीं. इसलिए, यह पक्का करें कि आपको ज़रूरी कोटा मिल गया हो, ताकि आपकी पाइपलाइन को प्रोडक्शन में चलाने के लिए ज़रूरी संसाधन उपलब्ध कराए जा सकें.
विज्ञापन दिखाने, ट्रेनिंग देने, और पुष्टि करने वाली पाइपलाइन. इन पाइपलाइन के लिए टीपीयू, जीपीयू या सीपीयू की ज़रूरत होती है. इस्तेमाल के उदाहरण के आधार पर, अलग-अलग हार्डवेयर पर ट्रेनिंग दी जा सकती है और उन्हें इस्तेमाल किया जा सकता है. इसके अलावा, एक ही हार्डवेयर का इस्तेमाल भी किया जा सकता है. उदाहरण के लिए, ट्रेनिंग सीपीयू पर हो सकती है, लेकिन टीपीयू का इस्तेमाल करके सेवा दी जा सकती है या इसके उलट भी हो सकता है. आम तौर पर, बड़े हार्डवेयर पर मॉडल को ट्रेन किया जाता है और फिर छोटे हार्डवेयर पर उसे इस्तेमाल किया जाता है.
हार्डवेयर चुनते समय, इन बातों का ध्यान रखें:
- क्या इसे कम खर्चीले हार्डवेयर पर ट्रेन किया जा सकता है?
- क्या किसी दूसरे हार्डवेयर पर स्विच करने से परफ़ॉर्मेंस बेहतर होगी?
- मॉडल का साइज़ क्या है और कौनसे हार्डवेयर से इसकी परफ़ॉर्मेंस को ऑप्टिमाइज़ किया जा सकता है?
- आपके मॉडल के आर्किटेक्चर के हिसाब से, कौनसा हार्डवेयर सबसे सही है?
डेटा पाइपलाइन. डेटा पाइपलाइन के लिए, रैम और सीपीयू के लिए कोटा की ज़रूरत होती है आपको यह अनुमान लगाना होगा कि ट्रेनिंग और टेस्ट डेटासेट जनरेट करने के लिए, आपकी पाइपलाइन को कितने कोटे की ज़रूरत है.
ऐसा हो सकता है कि आपने हर पाइपलाइन के लिए कोटा असाइन न किया हो. इसके बजाय, पाइपलाइन के लिए ऐसा कोटा असाइन किया जा सकता है जिसे शेयर किया जा सकता है. ऐसे मामलों में, पुष्टि करें कि आपके पास सभी पाइपलाइन चलाने के लिए, ज़रूरत के मुताबिक कोटा है. साथ ही, मॉनिटरिंग और बदलाव करने की सुविधा सेट अप करें, ताकि कोई एक पाइपलाइन पूरा कोटा इस्तेमाल न कर ले.
कोटा का अनुमान लगाया जा रहा है
डेटा और ट्रेनिंग पाइपलाइन के लिए ज़रूरी कोटे का अनुमान लगाने के लिए, ऐसे मिलते-जुलते प्रोजेक्ट ढूंढें जिनके आधार पर अनुमान लगाया जा सके. सर्विसिंग कोटा का अनुमान लगाने के लिए, सेवा की क्वेरी प्रति सेकंड का अनुमान लगाएं. इन तरीकों से, आपको एक शुरुआती जानकारी मिलती है. एक्सपेरिमेंट के दौरान, समाधान का प्रोटोटाइप बनाना शुरू करने पर, आपको कोटे का ज़्यादा सटीक अनुमान मिलने लगेगा.
कोटा का अनुमान लगाते समय, यह ध्यान रखें कि कोटा सिर्फ़ प्रोडक्शन पाइपलाइन के लिए नहीं, बल्कि चालू एक्सपेरिमेंट के लिए भी होता है.
देखें कि आपको कितना समझ आया
लॉगिंग, मॉनिटरिंग, और सूचनाएं
प्रोडक्शन मॉडल के व्यवहार को लॉग करना और मॉनिटर करना ज़रूरी है. मज़बूत मॉनिटरिंग इन्फ़्रास्ट्रक्चर से यह पुष्टि होती है कि आपके मॉडल, भरोसेमंद और अच्छी क्वालिटी के अनुमान दिखा रहे हैं.
लॉगिंग और मॉनिटरिंग के सही तरीकों से, एमएल पाइपलाइन में आने वाली समस्याओं का पहले से ही पता लगाने में मदद मिलती है. साथ ही, कारोबार पर पड़ने वाले संभावित असर को कम किया जा सकता है. समस्याएं होने पर, सूचनाएं आपकी टीम के सदस्यों को सूचना देती हैं. साथ ही, पूरे लॉग से समस्या की मुख्य वजह का पता लगाने में मदद मिलती है.
आपको लॉगिंग और मॉनिटरिंग की सुविधा लागू करनी चाहिए, ताकि एमएल पाइपलाइन से जुड़ी इन समस्याओं का पता लगाया जा सके:
पाइपलाइन | निगरानी |
---|---|
सेवा में है |
|
Data |
|
ट्रेनिंग |
|
पुष्टि |
|
आपको इन चीज़ों के लिए भी लॉगिंग, मॉनिटरिंग, और सूचनाएं पाने की सुविधा चाहिए होगी:
- लेटेंसी. अनुमानित जवाब देने में कितना समय लगता है?
- सेवा बंद होना. क्या मॉडल ने अनुमान देना बंद कर दिया है?
देखें कि आपको कितना समझ आया
मॉडल डिप्लॉय करना
मॉडल डिप्लॉयमेंट के लिए, आपको इन बातों का दस्तावेज़ बनाना होगा:
- डप्लॉयमेंट शुरू करने और रोल आउट बढ़ाने के लिए अनुमतियां ज़रूरी हैं.
- किसी मॉडल को प्रोडक्शन में कैसे डालें.
- मॉडल को कहां डिप्लॉय किया जाता है. उदाहरण के लिए, अगर स्टेजिंग या कैनरी एनवायरमेंट मौजूद हैं.
- अगर कोई डिप्लॉयमेंट पूरा नहीं होता है, तो क्या करें.
- प्रोडक्शन में पहले से मौजूद मॉडल को वापस लाने का तरीका.
मॉडल की ट्रेनिंग को अपने-आप होने की सुविधा चालू करने के बाद, आपको पुष्टि करने और डिप्लॉयमेंट की प्रोसेस को भी अपने-आप होने की सुविधा चालू करनी होगी. डिप्लॉयमेंट को ऑटोमेट करने से, ज़िम्मेदारी बंट जाती है. साथ ही, किसी एक व्यक्ति की वजह से डिप्लॉयमेंट में आने वाली रुकावट की संभावना कम हो जाती है. इससे संभावित गलतियां भी कम होती हैं. साथ ही, यह ज़्यादा असरदार और भरोसेमंद होता है. इससे कॉल पर रोटेशन और एसआरई सहायता भी मिलती है.
आम तौर पर, नए मॉडल को उपयोगकर्ताओं के एक सबसेट के लिए डिप्लॉय किया जाता है. इससे यह पता चलता है कि मॉडल उम्मीद के मुताबिक काम कर रहा है या नहीं. अगर ऐसा है, तो डिप्लॉयमेंट जारी रखें. अगर ऐसा नहीं होता है, तो डिप्लॉयमेंट को वापस रोलबैक करें और समस्याओं का पता लगाकर उन्हें ठीक करें.