वीडियो प्रोडक्शन

अपनी एमएल पाइपलाइन को प्रोडक्शन के लिए तैयार करने के लिए, आपको यह काम करना होगा:

  • अपनी पाइपलाइन के लिए कंप्यूट संसाधन उपलब्ध कराना
  • लॉगिंग, मॉनिटरिंग, और सूचना देने की सुविधा लागू करना

कंप्यूट संसाधनों को चालू करना

मशीन लर्निंग पाइपलाइन चलाने के लिए, कंप्यूट रिसॉर्स की ज़रूरत होती है. जैसे, रैम, सीपीयू, और जीपीयू/टीपीयू. ज़रूरत के हिसाब से कंप्यूट क्षमता न होने पर, पाइपलाइन नहीं चलाई जा सकतीं. इसलिए, यह पक्का करें कि आपको ज़रूरी कोटा मिल गया हो, ताकि आपकी पाइपलाइन को प्रोडक्शन में चलाने के लिए ज़रूरी संसाधन उपलब्ध कराए जा सकें.

  • विज्ञापन दिखाने, ट्रेनिंग देने, और पुष्टि करने वाली पाइपलाइन. इन पाइपलाइन के लिए टीपीयू, जीपीयू या सीपीयू की ज़रूरत होती है. इस्तेमाल के उदाहरण के आधार पर, अलग-अलग हार्डवेयर पर ट्रेनिंग दी जा सकती है और उन्हें इस्तेमाल किया जा सकता है. इसके अलावा, एक ही हार्डवेयर का इस्तेमाल भी किया जा सकता है. उदाहरण के लिए, ट्रेनिंग सीपीयू पर हो सकती है, लेकिन टीपीयू का इस्तेमाल करके सेवा दी जा सकती है या इसके उलट भी हो सकता है. आम तौर पर, बड़े हार्डवेयर पर मॉडल को ट्रेन किया जाता है और फिर छोटे हार्डवेयर पर उसे इस्तेमाल किया जाता है.

    हार्डवेयर चुनते समय, इन बातों का ध्यान रखें:

    • क्या इसे कम खर्चीले हार्डवेयर पर ट्रेन किया जा सकता है?
    • क्या किसी दूसरे हार्डवेयर पर स्विच करने से परफ़ॉर्मेंस बेहतर होगी?
    • मॉडल का साइज़ क्या है और कौनसे हार्डवेयर से इसकी परफ़ॉर्मेंस को ऑप्टिमाइज़ किया जा सकता है?
    • आपके मॉडल के आर्किटेक्चर के हिसाब से, कौनसा हार्डवेयर सबसे सही है?
  • डेटा पाइपलाइन. डेटा पाइपलाइन के लिए, रैम और सीपीयू के लिए कोटा की ज़रूरत होती है आपको यह अनुमान लगाना होगा कि ट्रेनिंग और टेस्ट डेटासेट जनरेट करने के लिए, आपकी पाइपलाइन को कितने कोटे की ज़रूरत है.

ऐसा हो सकता है कि आपने हर पाइपलाइन के लिए कोटा असाइन न किया हो. इसके बजाय, पाइपलाइन के लिए ऐसा कोटा असाइन किया जा सकता है जिसे शेयर किया जा सकता है. ऐसे मामलों में, पुष्टि करें कि आपके पास सभी पाइपलाइन चलाने के लिए, ज़रूरत के मुताबिक कोटा है. साथ ही, मॉनिटरिंग और बदलाव करने की सुविधा सेट अप करें, ताकि कोई एक पाइपलाइन पूरा कोटा इस्तेमाल न कर ले.

कोटा का अनुमान लगाया जा रहा है

डेटा और ट्रेनिंग पाइपलाइन के लिए ज़रूरी कोटे का अनुमान लगाने के लिए, ऐसे मिलते-जुलते प्रोजेक्ट ढूंढें जिनके आधार पर अनुमान लगाया जा सके. सर्विसिंग कोटा का अनुमान लगाने के लिए, सेवा की क्वेरी प्रति सेकंड का अनुमान लगाएं. इन तरीकों से, आपको एक शुरुआती जानकारी मिलती है. एक्सपेरिमेंट के दौरान, समाधान का प्रोटोटाइप बनाना शुरू करने पर, आपको कोटे का ज़्यादा सटीक अनुमान मिलने लगेगा.

कोटा का अनुमान लगाते समय, यह ध्यान रखें कि कोटा सिर्फ़ प्रोडक्शन पाइपलाइन के लिए नहीं, बल्कि चालू एक्सपेरिमेंट के लिए भी होता है.

देखें कि आपको कितना समझ आया

अनुमान लगाने के लिए हार्डवेयर चुनते समय, आपको हमेशा उस हार्डवेयर से ज़्यादा बेहतर हार्डवेयर चुनना चाहिए जिसका इस्तेमाल मॉडल को ट्रेन करने के लिए किया गया था.
गलत
सही. आम तौर पर, ट्रेनिंग के लिए सर्विंग के मुकाबले ज़्यादा बड़े हार्डवेयर की ज़रूरत होती है.
सही

लॉगिंग, मॉनिटरिंग, और सूचनाएं

प्रोडक्शन मॉडल के व्यवहार को लॉग करना और मॉनिटर करना ज़रूरी है. मज़बूत मॉनिटरिंग इन्फ़्रास्ट्रक्चर से यह पुष्टि होती है कि आपके मॉडल, भरोसेमंद और अच्छी क्वालिटी के अनुमान दिखा रहे हैं.

लॉगिंग और मॉनिटरिंग के सही तरीकों से, एमएल पाइपलाइन में आने वाली समस्याओं का पहले से ही पता लगाने में मदद मिलती है. साथ ही, कारोबार पर पड़ने वाले संभावित असर को कम किया जा सकता है. समस्याएं होने पर, सूचनाएं आपकी टीम के सदस्यों को सूचना देती हैं. साथ ही, पूरे लॉग से समस्या की मुख्य वजह का पता लगाने में मदद मिलती है.

आपको लॉगिंग और मॉनिटरिंग की सुविधा लागू करनी चाहिए, ताकि एमएल पाइपलाइन से जुड़ी इन समस्याओं का पता लगाया जा सके:

पाइपलाइन निगरानी
सेवा में है
  • ट्रेनिंग डेटा की तुलना में, विज्ञापन दिखाने के डेटा में अंतर या बदलाव
  • पूर्वानुमानों में गड़बड़ी या बदलाव
  • डेटा टाइप से जुड़ी समस्याएं, जैसे कि वैल्यू मौजूद नहीं हैं या उनमें कोई गड़बड़ी है
  • कोटा का इस्तेमाल
  • मॉडल की क्वालिटी के मेट्रिक
Data
  • फ़ीचर वैल्यू में अंतर और बदलाव
  • लेबल की वैल्यू में अंतर और बदलाव
  • डेटा टाइप से जुड़ी समस्याएं, जैसे कि वैल्यू मौजूद नहीं हैं या उनमें कोई गड़बड़ी है
  • कोटा इस्तेमाल करने की दर
  • कोटे की तय सीमा पूरी होने वाली है
ट्रेनिंग
  • ट्रेनिंग में लगने वाला समय
  • ट्रेनिंग पूरी न हो पाना
  • कोटा का इस्तेमाल
पुष्टि
  • टेस्ट डेटासेट में बदलाव या गड़बड़ी

आपको इन चीज़ों के लिए भी लॉगिंग, मॉनिटरिंग, और सूचनाएं पाने की सुविधा चाहिए होगी:

  • लेटेंसी. अनुमानित जवाब देने में कितना समय लगता है?
  • सेवा बंद होना. क्या मॉडल ने अनुमान देना बंद कर दिया है?

देखें कि आपको कितना समझ आया

नीचे दिए गए विकल्पों में से, एमएल पाइपलाइन को लॉग और मॉनिटर करने की मुख्य वजह क्या है?
उपयोगकर्ताओं पर असर डालने से पहले ही समस्याओं का पता लगाना
कोटे और संसाधन के इस्तेमाल को ट्रैक करना
सुरक्षा से जुड़ी संभावित समस्याओं का पता लगाना
ऊपर दिए गए सभी जवाब
सही. अपनी एमएल पाइपलाइन को लॉग और मॉनिटर करने से, समस्याओं को गंभीर होने से पहले ही रोका जा सकता है और उनका पता लगाया जा सकता है.

मॉडल डिप्लॉय करना

मॉडल डिप्लॉयमेंट के लिए, आपको इन बातों का दस्तावेज़ बनाना होगा:

  • डप्लॉयमेंट शुरू करने और रोल आउट बढ़ाने के लिए अनुमतियां ज़रूरी हैं.
  • किसी मॉडल को प्रोडक्शन में कैसे डालें.
  • मॉडल को कहां डिप्लॉय किया जाता है. उदाहरण के लिए, अगर स्टेजिंग या कैनरी एनवायरमेंट मौजूद हैं.
  • अगर कोई डिप्लॉयमेंट पूरा नहीं होता है, तो क्या करें.
  • प्रोडक्शन में पहले से मौजूद मॉडल को वापस लाने का तरीका.

मॉडल की ट्रेनिंग को अपने-आप होने की सुविधा चालू करने के बाद, आपको पुष्टि करने और डिप्लॉयमेंट की प्रोसेस को भी अपने-आप होने की सुविधा चालू करनी होगी. डिप्लॉयमेंट को ऑटोमेट करने से, ज़िम्मेदारी बंट जाती है. साथ ही, किसी एक व्यक्ति की वजह से डिप्लॉयमेंट में आने वाली रुकावट की संभावना कम हो जाती है. इससे संभावित गलतियां भी कम होती हैं. साथ ही, यह ज़्यादा असरदार और भरोसेमंद होता है. इससे कॉल पर रोटेशन और एसआरई सहायता भी मिलती है.

आम तौर पर, नए मॉडल को उपयोगकर्ताओं के एक सबसेट के लिए डिप्लॉय किया जाता है. इससे यह पता चलता है कि मॉडल उम्मीद के मुताबिक काम कर रहा है या नहीं. अगर ऐसा है, तो डिप्लॉयमेंट जारी रखें. अगर ऐसा नहीं होता है, तो डिप्लॉयमेंट को वापस रोलबैक करें और समस्याओं का पता लगाकर उन्हें ठीक करें.