BharatGen ने चेताया है कि अगर भारत अपने फाउंडेशनल AI मॉडल नहीं बनाता तो वह महज़ 'उपभोक्ता' बनकर रह जाएगा। Mint की रिपोर्ट के अनुसार, अमेरिकी मॉडल्स पर निर्भरता का मतलब है कि हिंदी-तमिल-बांग्ला में भी AI पश्चिमी नज़रिए से सोचेगा — भाषाई संप्रभुता, डेटा और रोज़गार तीनों दाँव पर हैं।

जब आप हिंदी में ChatGPT से पूछते हैं कि 'अच्छा खाना क्या है', तो जवाब में क्विनोआ सलाद आता है — दाल-चावल नहीं। यह मज़ाक नहीं, यह लक्षण है। लक्षण उस गहरी बीमारी का जिसे BharatGen ने Mint को दिए अपने ताज़ा बयान में 'तकनीकी उपभोक्तावाद' कहा है: अगर भारत अपने फाउंडेशनल AI मॉडल नहीं बनाता, तो दुनिया का सबसे बड़ा लोकतंत्र किसी और की बौद्धिक कठपुतली बनकर रह जाएगा।

BharatGen की चेतावनी सुनने में सामान्य लगती है — 'बनाओ वरना पिछड़ोगे।' लेकिन इसके भीतर तीन परतें हैं जो किसी वायर रिपोर्ट में नहीं खुलतीं: भाषा का अर्थशास्त्र, डेटा का उपनिवेशवाद, और रोज़गार का ढाँचागत ख़तरा।

पहली परत: भाषा सिर्फ़ शब्द नहीं, अर्थव्यवस्था है

Mint की रिपोर्ट के अनुसार, BharatGen ने 22 भारतीय भाषाओं में AI मॉडल विकसित करने की ज़रूरत पर ज़ोर दिया है। सवाल यह है कि OpenAI या Google का GPT या Gemini हिंदी 'बोल' तो सकता है, लेकिन क्या हिंदी में 'सोच' सकता है? जवाब है — नहीं। ये मॉडल अंग्रेज़ी डेटा पर ट्रेन होते हैं, फिर हिंदी या बांग्ला में अनुवाद करते हैं। इसका मतलब है कि हर जवाब — चाहे वह स्वास्थ्य परामर्श हो, कानूनी सलाह हो, या खेती का नुस्ख़ा — एक अमेरिकी 'फ़िल्टर' से होकर गुज़रता है।

अब इसे अर्थशास्त्र की ज़बान में समझिए: जब AI किसी भाषा को 'सेवा' के तौर पर देता है (बनाम उस भाषा में 'सोचता' है), तो उस भाषा के स्थानीय ज्ञान — आयुर्वेद, स्थानीय कृषि, क्षेत्रीय क़ानून — की कोई क़ीमत AI इकोसिस्टम में नहीं रहती। यह सांस्कृतिक पूँजी का मुफ़्त निर्यात है।

दूसरी परत: डेटा-उपनिवेशवाद — ईस्ट इंडिया कंपनी 2.0?

BharatGen की चिंता का दूसरा आयाम वह है जिसे विशेषज्ञ 'डेटा कॉलोनियलिज़्म' कहते हैं। भारत के 140 करोड़ लोग रोज़ाना अरबों डेटा पॉइंट्स पैदा करते हैं — UPI ट्रांज़ैक्शन, आधार वेरिफिकेशन, WhatsApp मैसेज, यूट्यूब सर्च। यह डेटा अमेरिकी कंपनियों के मॉडल्स को स्मार्ट बनाता है, लेकिन उस स्मार्टनेस का मालिकाना हक़ भारत के पास नहीं रहता।

तेल की तरह सोचिए: भारत अपनी 90% से ज़्यादा तेल ज़रूरत बाहर से पूरी करता है और हर भू-राजनीतिक संकट में इसकी क़ीमत चुकाता है। AI में यही हो रहा है — बस 'बैरल' की जगह 'पैरामीटर' पढ़ लीजिए। Mint की रिपोर्ट में BharatGen ने स्पष्ट कहा है कि भारत को 'मेकर' बनना होगा, सिर्फ़ 'यूज़र' नहीं। फ़र्क़ यह है कि तेल में विकल्प सीमित हैं, AI में अभी खिड़की खुली है — लेकिन तेज़ी से बंद हो रही है।

तीसरी परत: रोज़गार — जिसकी बात कोई नहीं कर रहा

सबसे कम चर्चा इस बात की है कि AI फाउंडेशन मॉडल का मालिकाना हक़ रोज़गार की दिशा तय करता है। जब मॉडल अमेरिकी है, तो उस पर बनने वाले ऐप्स, सर्विसेज़ और टूल्स का 'वैल्यू चेन' का सबसे मोटा हिस्सा अमेरिका में रहता है। भारतीय स्टार्टअप्स 'रैपर' बनते हैं — दूसरे के मॉडल के ऊपर पतली परत चढ़ाने वाले — जिनकी मार्जिन पतली और ज़िंदगी अनिश्चित होती है। स्वदेशी फाउंडेशन मॉडल का मतलब है कि ट्रेनिंग, फ़ाइन-ट्यूनिंग, डेटा क्यूरेशन, और डिप्लॉयमेंट — ये सब रोज़गार भारत में पैदा होंगे।

BharatGen का 22 भाषाओं वाला दृष्टिकोण यहाँ अहम है। अगर AI मॉडल को मैथिली, भोजपुरी, या राजस्थानी में प्रभावी बनाना है, तो उसे स्थानीय भाषाविदों, सांस्कृतिक विशेषज्ञों, और डेटा एनोटेटर्स की ज़रूरत होगी — यह रोज़गार का वह स्तर है जो अमेरिकी मॉडल के हिंदी अनुवाद से कभी पैदा नहीं होगा।

असली सवाल: 'किल-स्विच' कहाँ है?

2025-26 में Anthropic ने भारत में अपनी सेवाएँ अस्थायी रूप से रोकीं, ट्रंप प्रशासन ने AI चिप निर्यात पर पाबंदियाँ कसीं — इन घटनाओं ने साबित किया कि जब AI की सप्लाई चेन का हर 'किल-स्विच' किसी और के हाथ में हो, तो 'भरोसा' एक कूटनीतिक शब्द है, नीति नहीं। BharatGen की चेतावनी इसी संदर्भ में पढ़ी जानी चाहिए: यह सिर्फ़ तकनीकी महत्वाकांक्षा नहीं, यह रणनीतिक ज़रूरत है।

Mint की रिपोर्ट के अनुसार, BharatGen ने भारत सरकार और निजी क्षेत्र दोनों से निवेश की अपील की है। लेकिन यहाँ विरोधाभास है: भारत ने $57 बिलियन के AI निवेश वादे Amazon, Microsoft और Google से लिए हैं — यानी उन्हीं कंपनियों से जिनके मॉडल्स से स्वतंत्रता की बात हो रही है। यह ऐसे है जैसे कोई देश अपनी सेना का हथियार उसी देश से ख़रीदे जिससे ख़तरा हो।

भारत के पास अभी क्या है — और क्या चाहिए?

BharatGen ने Param 17B नाम का मल्टीलिंगुअल मॉडल लॉन्च किया है जो 22 भारतीय भाषाओं को सपोर्ट करता है। IIT बॉम्बे की ज़मीन से उपजी इस पहल में Yann LeCun जैसे वैश्विक AI दिग्गजों का भी समर्थन मिला है। लेकिन सच यह है कि GPT-5 स्तर के मॉडल बनाने के लिए जिस स्तर का कम्प्यूट इंफ्रास्ट्रक्चर चाहिए — हज़ारों Nvidia H100/B200 चिप्स — वह भारत के पास नहीं है, और उनकी सप्लाई अमेरिकी निर्यात नियंत्रण के अधीन है।

यहीं BharatGen की चेतावनी का सबसे तीखा हिस्सा छिपा है: भारत को सिर्फ़ मॉडल नहीं, पूरा 'स्टैक' चाहिए — चिप्स से लेकर डेटा सेंटर तक, ट्रेनिंग डेटा से लेकर डिप्लॉयमेंट प्लेटफ़ॉर्म तक। सिर्फ़ एक परत बनाना काफ़ी नहीं अगर बाक़ी परतें किसी और के कब्ज़े में हों।

तो असली जवाब क्या है?

BharatGen जो कह रहा है, उसे अर्थशास्त्र की भाषा में इस तरह पढ़िए: AI में 'मेक इन इंडिया' का मतलब है — वैल्यू चेन पर कब्ज़ा, सप्लाई चेन में विविधता, और सबसे ज़रूरी — अपनी भाषाओं में सोचने की क्षमता। यह ऐसी सांस्कृतिक संप्रभुता है जिसकी क़ीमत GDP में नहीं नापी जाती, लेकिन जिसके बिना GDP की परिभाषा भी कोई और तय करेगा।

140 करोड़ लोगों का डेटा, 22 ज़िंदा भाषाएँ, और दुनिया की सबसे बड़ी युवा आबादी — यह AI का कच्चा माल है। सवाल सिर्फ़ इतना है: क्या हम इसे ख़ुद रिफ़ाइन करेंगे, या फिर कच्चा निर्यात करके दूसरों से 'फ़िनिश्ड प्रोडक्ट' ख़रीदेंगे — ठीक वैसे जैसे सदियों से कपास और मसालों के साथ करते आए हैं?

Key Takeaways

  • BharatGen ने Mint को बताया कि भारत बिना स्वदेशी AI फाउंडेशन मॉडल के 'तकनीकी उपभोक्ता' बनकर रह जाएगा
  • अमेरिकी AI मॉडल हिंदी 'बोलते' हैं लेकिन 'सोचते' अंग्रेज़ी में हैं — स्थानीय ज्ञान और संस्कृति की कोई जगह नहीं
  • भारत का डेटा अमेरिकी मॉडल्स को स्मार्ट बना रहा है, लेकिन उस बौद्धिक संपदा का मालिकाना हक़ भारत के पास नहीं
  • BharatGen ने Param 17B मॉडल 22 भाषाओं के लिए लॉन्च किया है, लेकिन कम्प्यूट चिप्स की सप्लाई अमेरिकी नियंत्रण में है
  • $57 बिलियन AI निवेश उन्हीं कंपनियों से आ रहा है जिनसे तकनीकी स्वतंत्रता की बात हो रही है — यह मूलभूत विरोधाभास है

Frequently Asked Questions

BharatGen क्या है और इसे किसने बनाया?

BharatGen एक भारतीय AI पहल है जो IIT बॉम्बे से जुड़ी है। इसका उद्देश्य भारत की 22 भाषाओं में स्वदेशी फाउंडेशनल AI मॉडल विकसित करना है, ताकि भारत अमेरिकी AI मॉडल्स पर पूरी तरह निर्भर न रहे।

भारत को अपना AI फाउंडेशन मॉडल क्यों बनाना चाहिए?

Mint की रिपोर्ट के अनुसार BharatGen ने चेताया है कि बिना स्वदेशी मॉडल के भारत सिर्फ़ AI उपभोक्ता बनेगा। विदेशी मॉडल्स में भारतीय भाषाओं का ज्ञान, सांस्कृतिक संदर्भ और स्थानीय ज़रूरतों की समझ नहीं होती, जिससे भाषाई संप्रभुता और आर्थिक आत्मनिर्भरता दोनों प्रभावित होते हैं।

Param 17B मॉडल क्या है?

Param 17B, BharatGen द्वारा विकसित एक मल्टीलिंगुअल AI मॉडल है जो भारत की संविधान में मान्यता प्राप्त 22 भाषाओं को सपोर्ट करता है। यह भारत के पहले बड़े स्वदेशी जनरेटिव AI मॉडल्स में से एक है।

डेटा कॉलोनियलिज़्म AI में कैसे काम करता है?

भारत के 140 करोड़ लोगों का डेटा अमेरिकी AI कंपनियों के मॉडल्स को ट्रेन करता है, लेकिन उस बौद्धिक संपदा का मालिकाना हक़ भारत के पास नहीं रहता। यह कच्चे माल के निर्यात और तैयार उत्पाद के आयात जैसा ही ढाँचा है — इसे विशेषज्ञ 'डेटा उपनिवेशवाद' कहते हैं।

Find out more: