भारतजेन: विश्व का पहला सरकारी वित्तपोषित मल्टीमॉडल लार्ज लैंग्वेज मॉडल

पाठ्यक्रम: GS3/ विज्ञान और प्रौद्योगिकी

समाचार में

  • विज्ञान एवं प्रौद्योगिकी मंत्रालय द्वारा शुरू की गई विश्व की पहली सरकारी वित्तपोषित मल्टीमॉडल LLM पहल “भारतजेन”।

भारतजेन के बारे में

  • उद्देश्य: भाषा, भाषण और कंप्यूटर विज़न में आधारभूत मॉडल विकसित करके सार्वजनिक सेवा वितरण में क्रांतिकारी परिवर्तन लाना और नागरिक सहभागिता को बढ़ाना।
  • कार्यान्वयन: राष्ट्रीय अंतःविषय साइबर-भौतिक प्रणाली मिशन (NM-ICPS) के तहत IIT बॉम्बे द्वारा
  • भारतजन की मुख्य विशेषताएँ:
    • बहुभाषी और बहुविध आधारभूत मॉडल।
    • भारत-केंद्रित डेटासेट के आधार पर निर्माण और प्रशिक्षण।
    • AI अनुसंधान और नवाचार को बढ़ावा देने के लिए ओपन-सोर्स प्लेटफ़ॉर्म।
    • इस परियोजना के 2026 तक पूरा होने की उम्मीद है, जिसमें AI अनुप्रयोगों के अनुसंधान, विकास और स्केलिंग जारी रहेगी।

महत्त्व

  • भारतजनरेशन टेक्स्ट और स्पीच दोनों को संबोधित करेगा, जिससे भारत के विविध भाषाई परिदृश्य में प्रतिनिधित्व सुनिश्चित होगा।
    •  बहुभाषी डेटासेट का उपयोग करके, यह भारतीय भाषाओं की बारीकियों को पकड़ेगा, जिन्हें प्रायः वैश्विक AI मॉडल में कम दर्शाया जाता है। डेटा संप्रभुता पर यह बल भारत को अपने डिजिटल संसाधनों और कथा पर अधिक नियंत्रण देता है। 
  • भारतजनरेशन सरकार, शिक्षा और निजी क्षेत्रों में AI तक पहुँच का लोकतंत्रीकरण करेगा, जिससे यह सुनिश्चित होगा कि AI समाज के सभी वर्गों, विशेष रूप से वंचित भारतीय भाषाओं को लाभ पहुँचाए।
  •  भारतजनरेशन विशेष रूप से भारत के लिए AI मॉडल विकसित करके आत्मनिर्भर भारत के दृष्टिकोण के साथ संरेखित है। (इन तकनीकों को घरेलू स्तर पर बनाकर।)

LLM क्या हैं?

  • बड़े भाषा मॉडल, जिन्हें LLM के रूप में भी जाना जाता है, बहुत बड़े डीप लर्निंग मॉडल हैं जो विशाल मात्रा में डेटा पर पहले से प्रशिक्षित होते हैं। 
  • LLM मानव भाषाओं या अन्य जटिल डेटा को पहचानने, व्याख्या करने और उत्पन्न करने के लिए मशीन लर्निंग तकनीकों का उपयोग करते हैं। 
  • उनकी क्षमताएँ संरचित और असंरचित डेटा को संभालने तक भी विस्तारित होती हैं, जिसमें भाषण, चित्र और अन्य मल्टीमॉडल इनपुट शामिल हैं, जो ग्राहक सेवा, स्वास्थ्य सेवा तथा शिक्षा जैसे क्षेत्रों में उनकी उपयोगिता को बढ़ाता है।
जनरेटिव AI (GenAI)
– यह एक आर्टिफिशियल इंटेलिजेंस (AI) तकनीक है जो प्राकृतिक भाषा के संवादी इंटरफेस में लिखे गए संकेतों के जवाब में स्वचालित रूप से सामग्री तैयार करती है।
– वर्तमान वेब पेजों को केवल क्यूरेट करने के बजाय, उपस्थित सामग्री का उपयोग करके, GenAI वास्तव में नई सामग्री तैयार करता है।
– सामग्री ऐसे प्रारूपों में दिखाई दे सकती है जिसमें मानव सोच के सभी प्रतीकात्मक प्रतिनिधित्व शामिल हैं: प्राकृतिक भाषा में लिखे गए पाठ, चित्र (फोटो से लेकर डिजिटल पेंटिंग और कार्टून तक), वीडियो, संगीत और सॉफ़्टवेयर कोड।
– GenAI को वेब पेजों, सोशल मीडिया वार्तालापों और अन्य ऑनलाइन मीडिया से एकत्र किए गए डेटा का उपयोग करके प्रशिक्षित किया जाता है। यह अपने द्वारा ग्रहण किए गए डेटा में शब्दों, पिक्सेल या अन्य तत्वों के वितरण का सांख्यिकीय रूप से विश्लेषण करके और सामान्य पैटर्न की पहचान करके और उन्हें दोहराकर अपनी सामग्री तैयार करता है।
– नवंबर 2022 में, OpenAI ने ChatGPT (चैट जेनरेटिव प्री-ट्रेन्ड ट्रांसफॉर्मर) को जनता के लिए जारी किया।

Source: BS

 

Other News of the Day

पाठ्यक्रम: GS1/ समाज, GS3/ अर्थव्यवस्था सन्दर्भ अंतर्राष्ट्रीय वृद्धजन दिवस प्रत्येक वर्ष 1 अक्टूबर को मनाया जाता है। परिचय उत्पत्ति: इस विचार की शुरुआत संयुक्त राष्ट्र द्वारा की गई थी। यह वियना इंटरनेशनल प्लान ऑफ एक्शन ऑन एजिंग से उपजा(stems) है, जिसे 1982 में वर्ल्ड असेंबली ऑन एजिंग द्वारा अपनाया गया था। संयुक्त राष्ट्र महासभा का...
Read More

पाठ्यक्रम: GS1/ भूगोल समाचार में 2 अक्टूबर को दक्षिण अमेरिका के कुछ भागों में वलयाकार सूर्यग्रहण दिखाई देगा, जबकि दक्षिण अमेरिका, अंटार्कटिका, उत्तरी अमेरिका तथा हवाई सहित अटलांटिक और प्रशांत महासागरों के क्षेत्रों में आंशिक सूर्यग्रहण देखा जा सकेगा। सूर्य ग्रहण के बारे में सूर्य ग्रहण तब होता है जब सूर्य, चंद्रमा और पृथ्वी एक...
Read More

पाठ्यक्रम: GS2/राजनीति और शासन सन्दर्भ न्यूयॉर्क स्थित भारत के महावाणिज्य दूतावास ने स्पष्ट किया है कि OCIs को “विदेशी” के रूप में पुनर्वर्गीकृत किए जाने के संबंध में सोशल मीडिया पर प्रसारित अफवाहें झूठी हैं। समुद्रपारीय भारतीय नागरिक OCI को भारत सरकार ने 2005 में शुरू किया था। एक पंजीकृत OCI को भारत आने के...
Read More

पाठ्यक्रम: GS2/राजनीति और शासन सन्दर्भ उच्चतम न्यायालय ने हाल ही में कहा कि संवैधानिक न्यायालय धन शोधन निवारण अधिनियम के प्रावधानों को प्रवर्तन निदेशालय के हाथों में हथियार बनने की अनुमति नहीं दे सकतीं, जिससे वे लंबे समय तक लोगों को कैद में रख सकें। धन शोधन निवारण अधिनियम (PMLA) इसे 2002 में संविधान के...
Read More

पाठ्यक्रम: GS3/अर्थव्यवस्था सन्दर्भ केंद्र सरकार व्यापार सुधार कार्य योजना (BRAP) 2024 का अनावरण करने के लिए तैयार है। व्यापार सुधार कार्य योजना (BRAP) इसे वाणिज्य एवं उद्योग मंत्रालय ने 2014-2015 में लॉन्च किया था, जिसका उद्देश्य देश में व्यापार करने में सुलभता को बेहतर बनाना और समग्र व्यावसायिक वातावरण को बेहतर बनाना है। मुख्य उद्देश्य:...
Read More

पाठ्यक्रम: GS3/ विज्ञान और प्रौद्योगिकी समाचार में विज्ञान एवं प्रौद्योगिकी मंत्रालय द्वारा शुरू की गई विश्व की पहली सरकारी वित्तपोषित मल्टीमॉडल LLM पहल “भारतजेन”। भारतजेन के बारे में उद्देश्य: भाषा, भाषण और कंप्यूटर विज़न में आधारभूत मॉडल विकसित करके सार्वजनिक सेवा वितरण में क्रांतिकारी परिवर्तन लाना और नागरिक सहभागिता को बढ़ाना। कार्यान्वयन: राष्ट्रीय अंतःविषय साइबर-भौतिक...
Read More

पर्माफ्रॉस्ट पाठ्यक्रम: GS1/भौतिक भूगोल सन्दर्भ वर्तमान में नॉर्वे के हिमाद्री अनुसंधान केंद्र में कार्यरत ग्लेशियोलॉजिस्ट पर्माफ्रॉस्ट पतन के कारण होने वाली आपदाओं की संभावना की पहचान करने के लिए गहन खोज कर रहे हैं। परिचय पर्माफ्रॉस्ट वह ज़मीन है जो कम से कम दो वर्ष तक पूरी तरह जमी रहती है – 32°F (0°C) या...
Read More