LATEST NEWS :
Mentorship Program For UPSC and UPPCS separate Batch in English & Hindi . Limited seats available . For more details kindly give us a call on 7388114444 , 7355556256.
asdas
Print Friendly and PDF

लार्ज लैंग्वेज मॉडल (एलएलएम)

28.02.2024

लार्ज लैंग्वेज मॉडल  (एलएलएम)

                                                                                                                                                                            

                                                                                                                                                              प्रीलिम्स के लिए: लार्ज लैंग्वेज मॉडल (एलएलएम) के बारे में, एलएलएम के प्रकार, एलएलएम का उपयोग किस लिए किया जाता है?

 

           

खबरों में क्यों?

जनरेटिव एआई मॉडल की मनुष्यों के साथ "बातचीत" करने की क्षमता लार्ज लैंग्वेज मॉडल या एलएलएम के नाम से जाना जाने वाला एक प्रोग्राम है।

 

लार्ज लैंग्वेज मॉडल  (एलएलएम) के बारे में:

  • लार्ज लैंग्वेज मॉडल (एलएलएम) एक प्रकार का कृत्रिम बुद्धिमत्ता (एआई) प्रोग्राम है जो अन्य कार्यों के अलावा संदेश को पहचान और उत्पन्न कर सकता है।
  • एलएलएम को डेटा के विशाल सेट पर प्रशिक्षित किया जाता है - इसलिए इसका नाम "लार्ज" है।
  • एलएलएम मशीन लर्निंग पर बनाए गए हैं: विशेष रूप से, एक प्रकार का तंत्रिका नेटवर्क जिसे ट्रांसफार्मर मॉडल कहा जाता है।
  • सरल शब्दों में, एलएलएम एक कंप्यूटर प्रोग्राम है जिसमें मानव भाषा या अन्य प्रकार के जटिल डेटा को पहचानने और व्याख्या करने में सक्षम होने के लिए पर्याप्त उदाहरण दिए गए हैं।
  • कई एलएलएम को उस डेटा पर प्रशिक्षित किया जाता है जो इंटरनेट से हजारों या लाखों गीगाबाइट मूल्य के संदेश को इकट्ठा किया गया है।
  • हालाँकि, नमूनों की गुणवत्ता इस बात पर प्रभाव डालती है कि एलएलएम प्राकृतिक भाषा कितनी अच्छी तरह सीखेंगे, इसलिए एलएलएम के प्रोग्रामर अधिक क्यूरेटेड डेटा सेट का उपयोग कर सकते हैं।
  • अक्षर, शब्द और वाक्य एक साथ कैसे कार्य करते हैं, यह समझने के लिए एलएलएम एक प्रकार की मशीन लर्निंग का उपयोग करते हैं जिसे डीप लर्निंग कहा जाता है।
  • गहन शिक्षण में असंरचित डेटा का संभाव्य विश्लेषण शामिल होता है, जो अंततः गहन शिक्षण मॉडल को मानवीय हस्तक्षेप के बिना सामग्री के टुकड़ों के बीच अंतर को पहचानने में सक्षम बनाता है।
  • एलएलएम को फिर ट्यूनिंग के माध्यम से प्रशिक्षित किया जाता है: उन्हें उस विशेष कार्य के लिए ठीक से तैयार किया जाता है या तुरंत तैयार किया जाता है जो प्रोग्रामर उनसे कराना चाहता है, जैसे कि प्रश्नों की व्याख्या करना और प्रतिक्रियाएं उत्पन्न करना, या एक भाषा से दूसरी भाषा में पाठ का अनुवाद करना।

 

एलएलएम  के प्रकार

एलएलएमए  को वर्गीकृत करने के विभिन्न तरीके हैं-

  •  आर्किटेक्चर के आधार पर, तीन प्रकार हैं - ऑटोरेग्रेसिव, ट्रांसफार्मर-आधारित और एनकोडर-डिकोडर।

○ GPT-3 एक ऑटोरेग्रेसिव मॉडल का एक उदाहरण है क्योंकि वे पिछले शब्दों के आधार पर अनुक्रम में अगले शब्द की भविष्यवाणी करते हैं।

○इसी तरह, LaMDA या जेमिनी (पूर्व में बार्ड) ट्रांसफार्मर-आधारित हैं क्योंकि वे भाषा प्रसंस्करण के लिए एक विशिष्ट प्रकार के तंत्रिका नेटवर्क आर्किटेक्चर का उपयोग करते हैं।

  • प्रशिक्षण डेटा के आधार पर, एलएलएम  तीन प्रकार के होते हैं - पूर्व प्रशिक्षित और परिष्कृत, बहुभाषी या मॉडल जो कई भाषाओं में पाठ को समझ और उत्पन्न कर सकते हैं, और डोमेन-विशिष्ट या मॉडल जो कानूनी जैसे विशिष्ट डोमेन से संबंधित डेटा पर प्रशिक्षित होते हैं , वित्त या स्वास्थ्य सेवा।

 

  • उपलब्धता के आधार पर उन्हें ओपन-सोर्स और क्लोज्ड-सोर्स के रूप में भी वर्गीकृत किया जा सकता है क्योंकि कुछ स्वतंत्र रूप से उपलब्ध हैं जबकि कुछ मालिकाना हैं।

○ LLaMA 2, BlOOM, Google BERT, Falcon 180B, OPT-175 B कुछ ओपन-सोर्स LLM हैं, जबकि क्लाउड 2, बार्ड, GPT-4, कुछ मालिकाना LLM हैं।

 

एलएलएम  का उपयोग किस लिए किया जाता है?

  • एलएलएम को कई कार्य करने के लिए प्रशिक्षित किया जा सकता है। सबसे प्रसिद्ध उपयोगों में से एक जेनरेटिव एआई के रूप में उनका अनुप्रयोग है: जब कोई संकेत दिया जाता है या कोई प्रश्न पूछा जाता है, तो वे उत्तर में संदेश उत्पन्न कर सकते हैं।
  • उदाहरण के लिए, सार्वजनिक रूप से उपलब्ध एलएलएम चैटजीपीटी, उपयोगकर्ता इनपुट के जवाब में निबंध, कविताएं और अन्य पाठ्य रूप उत्पन्न कर सकता है।

 

                                                                      स्रोतः इंडियन एक्सप्रेस

Get a Callback