OpenAI’s “Sora” Model

OpenAI का “सोरा” मॉडल

जीएस-3: विज्ञान एवं प्रौद्योगिकी

(यूपीएससी/राज्य पीएससी)

प्रारंभिक परीक्षा के लिए महत्वपूर्ण:

चैटजीपीटी, जेनेरेटिव आर्टिफिशियल इंटेलिजेंस (GenAI) मॉडल "सोरा"।

मुख्य परीक्षा के लिए महत्वपूर्ण:

सोरा के बारे में, तंत्र, इसका महत्व, सोरा मॉडल के कार्य, OpenAI सोरा की चिंताएं, सीमाएं, और भविष्य।

19 फ़रवरी 2024

चर्चा में क्यों:

हाल ही में, क्रांतिकारी चैटबॉट ChatGPT के निर्माता, OpenAI के सीईओ सैम अल्टमैन ने एक नया जेनरेटिव आर्टिफिशियल इंटेलिजेंस (GenAI) मॉडल "सोरा" लॉन्च किया है।

 “सोरा” मॉडल के बारे में:

  • कंपनी की इंजीनियरिंग टीम के अनुसार, जापानी भाषा में ‘सोरा’ का मतलब आकाश(sky) होता है, एक ऐसी कल्पना जो 'असीम रचनात्मक क्षमता' को उजागर करती है।
  • यह नया प्रसार-आधारित AI मॉडल, ChatGPT जैसे बड़े भाषा मॉडल के समान, ट्रांसफॉर्मर आर्किटेक्चर की नींव पर बनाया गया है।
  • सोरा एक ओपनएआई टेक्स्ट-टू-वीडियो मॉडल है जो एक मिनट तक के जटिल दृश्यों वाले वीडियो तैयार करता है।
  • सोरा ये वीडियो उपयोगकर्ता के वर्णनात्मक कैप्शन और स्थिर छवि संकेतों से बनाता है। ओपनएआई ने निर्दिष्ट किया है कि सोरा का मुख्य लक्ष्य वास्तविक दुनिया में उपयोग के लिए है; भौतिक दुनिया को गति में समझने के लिए एआई को प्रशिक्षित करके लोगों को उन समस्याओं को हल करने में मदद करना जिनके लिए वास्तविक दुनिया की बातचीत की आवश्यकता होती है।

तंत्र:

  • "सोरा" मॉडल में उच्च गुणवत्ता वाली छवियां और वीडियो बनाने के लिए डिफ्यूजन मॉडल का उपयोग किया जाता है। डिफ्यूजन मॉडल एक भौतिक प्रक्रिया है जिसमें अणु उच्च-सांद्रता से निम्न-सांद्रता क्षेत्रों की ओर बढ़ते हैं।

महत्त्व:

  • सोरा एक एआई मॉडल है जो पाठ निर्देशों से यथार्थवादी और कल्पनाशील दृश्य बना सकता है।
  • सोरा दृश्य गुणवत्ता और उपयोगकर्ता के संकेत का पालन करते हुए एक मिनट तक के वीडियो तैयार कर सकता है।
  • सोरा कई पात्रों, विशिष्ट प्रकार की गति और विषय और पृष्ठभूमि के सटीक विवरण के साथ जटिल दृश्य उत्पन्न करने में सक्षम है।
  • यह किसी दिए गए विषय पर लगभग सटीकता के साथ चित्र और वीडियो बना सकता है। यह एक छवि से एक वीडियो बना सकता है और मौजूदा वीडियो क्लिप में अंतराल भी भर सकता है।

“सोरा” मॉडल के कार्य:

  • टेक्स्ट टू वीडियो: सोरा मॉडल उपयोगकर्ता के निर्देशों के अनुसार उच्च दृश्य गुणवत्ता और पालन सुनिश्चित करते हुए एक मिनट तक की लंबाई के वीडियो बनाने में सक्षम है।
  • जटिल दृश्य उत्पन्न करें: सोरा कई पात्रों, विभिन्न प्रकार की गति और विषय और पृष्ठभूमि दोनों के सटीक विवरण वाले जटिल दृश्य उत्पन्न कर सकता है।
  • गतिशील प्रभाव: यह समझ सकता है कि वस्तुएँ वास्तविकता में कैसे कार्य करती हैं, संकेतों की सटीक व्याख्या करती हैं। यह आकर्षक चरित्र उत्पन्न कर सकता है जो जीवंत भावनाएं व्यक्त करता है।
  • मल्टीशॉट अवतार: सोरा एक ही जेनरेट किए गए वीडियो के भीतर कई शॉट्स भी तैयार कर सकता है जो पात्रों और दृश्य शैली को सटीक रूप से बनाए रखता है।
  • नोट: वर्तमान में, सोरा मॉडल OpenAI के उत्पादों में उपलब्ध नहीं है। सभी सुरक्षा जांच पूरी होने के बाद इस तक पहुंचा जा सकेगा।

जनरेटिव आर्टिफिशियल इंटेलिजेंस (जेनएआई) के बारे में:

  • जेनरेटिव एआई मशीनों को नई सामग्री (मशीन जनित) उत्पन्न करने में सक्षम बनाने के लिए आर्टिफिशियल इंटेलिजेंस और मशीन लर्निंग एल्गोरिदम का उपयोग करता है।
  • सिस्टम पहले से बनाई गई सामग्री का उपयोग करते हैं, जैसे टेक्स्ट, ऑडियो, वीडियो, चित्र और कोड।
  • 'जेनरेटिव' शब्द मॉडलों को केवल पहचानने के बजाय नया डेटा बनाना सीखने की क्षमता को संदर्भित करता है। उदाहरण के लिए, एक जेनेरिक मॉडल यह सीख सकता है कि मापदंडों के एक सेट (जैसे आंखें, बाल, या त्वचा का रंग आदि) को देखते हुए ऐसी छवियां कैसे उत्पन्न की जाएं जो चेहरों से मिलती जुलती हों।

चिंताएँ एवं सीमाएँ:

  • मौजूदा मॉडल में कमज़ोरियाँ हैं। यह एक जटिल दृश्य की भौतिकी का सटीक अनुकरण करने में संघर्ष कर सकता है, और कारण और प्रभाव के विशिष्ट उदाहरणों को नहीं समझ सकता है।
  • कई एआई अनुप्रयोगों की तरह, ओपनएआई सोरा का उपयोग हिंसा, वयस्क सामग्री, या वास्तविक लोगों या नामित कलाकारों की शैली को दर्शाने वाले वीडियो बनाने के लिए नहीं किया जा सकता है। इसकी घोषणाओं पर, फिल्म निर्माताओं और रचनात्मक पेशेवरों द्वारा कॉपीराइट के उल्लंघन के साथ-साथ कार्यक्रम की सुरक्षा और सत्यता पर भी तत्काल सवाल उठाए गए हैं - विशेष रूप से गलत सूचना के प्रसार में। शोधकर्ता बिल पीबल्स के इस दावे के बावजूद कि "प्रशिक्षण डेटा उस सामग्री से है जिसे हमने (ओपनएआई सोरा) लाइसेंस प्राप्त किया है और सार्वजनिक रूप से उपलब्ध सामग्री भी है", एआई द्वारा "सार्वजनिक रूप से उपलब्ध" कॉपीराइट सामग्री के उपयोग के संबंध में कई मुकदमे वर्तमान में चल रहे हैं।

“सोरा” मॉडल का भविष्य:

  • ओपन एआई भ्रामक सामग्री का पता लगाने में मदद करने के लिए उपकरण बना रहा है जैसे कि एक डिटेक्शन क्लासिफायर जो बता सकता है कि सोरा द्वारा कोई वीडियो कब तैयार किया गया था।
  • ओपन एआई दुनिया भर के नीति निर्माताओं, शिक्षकों और कलाकारों को उनकी चिंताओं को समझने और इस नई तकनीक के लिए सकारात्मक उपयोग के मामलों की पहचान करने में शामिल करेगा।

स्रोत: द हिंदू

‘OpenAI सोरा क्या है? इसके महत्व, चिंताओं और सीमाओं पर चर्चा करें।