वैश्विक परिप्रेक्ष्य मानव कहानियां
शान्ति व सुरक्षा पर, कृत्रिम बुद्धिमत्ता (AI) के प्रभाव पर सुरक्षा परिषद ग़ौर कर रही है.

कृत्रिम बुद्धिमत्ता (AI) में भाषाई विविधता समावेशन की जंग

© Unsplash/Steve Johnson
शान्ति व सुरक्षा पर, कृत्रिम बुद्धिमत्ता (AI) के प्रभाव पर सुरक्षा परिषद ग़ौर कर रही है.

कृत्रिम बुद्धिमत्ता (AI) में भाषाई विविधता समावेशन की जंग

संस्कृति और शिक्षा

संयुक्त राष्ट्र की छत के नीचे एक अन्तरराष्ट्रीय संगठन, दो वर्षों से लगातार, डिजिटल कूटनीति से जुड़े एक वैश्विक अभियान का नेतृत्व कर रहा है. इसका मक़सद है - अंग्रेज़ी प्रभुत्व वाली कृत्रिम बुद्धिमत्ता में भाषाई विविधता लाना.

सुन्दर पिचाई, अपने विशिष्ट चश्मे और टेड-टॉक-शैली के हैडसेट के साथ ऐसे नज़र आ रहे थे, मानो सीधे सिलिकॉन वैली के इन्क्यूबेटर से बाहर निकले हों.

गूगल के मुख्य कार्यकारी अधिकारी सुन्दर पिचाई ने, 10 फ़रवरी के उस सोमवार को, पेरिस में कृत्रिम बुद्धिमत्ता कार्रवाई सम्मेलन में मंच सम्भाला था. उन्होंने ग्रैंड पैलेस के उस मंच से, नवाचार के एक नए स्वर्ण युग की शुरुआत की थी.

संयुक्त राष्ट्र मिशन में अन्तरराष्ट्रीय संगठन ला फ्रैंकोफ़ोनी के डिजिटल नीति सलाहकार, जोसेफ़ न्काल्वो न्गौला.
© Permanent Mission of Canada

इस तकनीकी दिग्गज ने, अपने नोट्स पर आँखें गड़ाए हुए कहा, "हमने पिछले साल एआई तकनीकों का उपयोग करके गूगल अनुवाद में, दुनिया भर में 50 करोड़ लोगों द्वारा बोली 110 से अधिक नई भाषाएँ शामिल की हैं."

"इससे भाषाओं की कुल संख्या 249 तक पहुँच गई है, जिनमें 60 अफ़्रीकी भाषाएँ शामिल हैं - और आगे भी अधिक शामिल की जाने वाली हैं."

हालाँकि, उनकी नीरस सी प्रस्तुति को श्रोताओं के बीच ज़्यादा गर्मजोशी नहीं मिली, जिनमें कई विश्व नेता, शोधकर्ता, ग़ैर-सरकारी संगठन और प्रौद्योगिकी कार्यकारी शामिल थे.

लेकिन कृत्रिम बुद्धिमत्ता में भाषाई विविधता के पैरोकारों के लिए, सुन्दर पिचाई के शब्द एक शान्त विजय के प्रतीक थे. ऐसी विजय जो डिजिटल कूटनीति की रहस्यपूर्ण दुनिया में, पर्दे के पीछे दो वर्षों की गहन बातचीत के बाद हासिल हुई थी.

न्यूयॉर्क में संयुक्त राष्ट्र मिशन में अन्तरराष्ट्रीय संगठन ला फ़्रैंकोफ़ोनी के डिजिटल नीति सलाहकार, जोसेफ़ न्काल्वो न्गौला ने कहा, "इससे स्पष्ट होता है कि सन्देश पहुँच रहा है और तकनीकी कम्पनियाँ बात सुन रही हैं."

भाषाई विभाजन

सुन्दर पिचाई के भाषण में अलबत्ता, प्रारम्भिक जैनरेटिव एआई की भाषाई ग़लतियों पर ज़िक्र नहीं किया गया था. प्रारम्भिक जैनरेटिव एआई कृत्रिम बुद्धिमत्ता की एक ऐसी शाखा है, जो लेखन से लेकर, चित्र, संगीत और ऐनिमेशन तक, सभी प्रकार की मूल सामग्री बनाने में सक्षम है.

जब 2022 में OpenAI ने चैटजीपीटी शुरू की थी, तो ग़ैर-अंग्रेज़ी भाषी लोग जल्दी ही इसकी सीमाओं को समझ गए थे.

उदाहरण के लिए, अंग्रेज़ी में पूछे गए किसी भी प्रश्न के लिए एक विस्तृत, ज्ञानवर्धक जवाब मिलता है. वहीं अगर आप फ्रेंच भाषा में सवाल पूछें तो आपके सामने केवल दो अनुच्छेदों में जवाब आएगा. 

और उसके बाद मिलेगा एक माफ़ीनामा: "माफ़ कीजिए, मुझे इस बारे में प्रशिक्षित नहीं किया गया है," या "मेरे मॉडल को इस तिथि के बाद अपडेट नहीं किया गया है."

यह अन्तराल इसलिए है क्योंकि एआई उपकरणों की जटिल मशीनरी, इंटरनैट के विशाल डेटा को पचाने के लिए, जीपीटी-4, मेटा के LlaMA, या गूगल के जेमिनाई जैसे बड़े भाषा मॉडल्स (LLMs) पर निर्भर करती है, जो उन्हें सवाल समझकर, उसका उचित जवाब देने में मदद करते हैं.

लेकिन इंटरनेट ख़ुद भी अधिकांशतः अंग्रेज़ी भाषा में ही है. और हालाँकि दुनिया की केवल 20 प्रतिशत आबादी ही घर पर अंग्रेज़ी बोलती है, लेकिन प्रमुख एआई मॉडल्स का लगभग आधा प्रशिक्षण डेटा अंग्रेज़ी में किया गया है.

वर्तमान में, चैटजीपीटी के फ्रेंच, पुर्तगाली या स्पैनिश भाषाओं के उत्तरों में सुधार नज़र आया है, लेकिन वो, अपने अंग्रेज़ी समकक्षों की तुलना में, अभी भी काफ़ी पीछे हैं.

यूएन ग्लोबल डिजिटल कॉम्पैक्ट का उद्देश्य, कृत्रिम बुद्धिमत्ता (AI) के लाभ, सभी लोगों तक पहुँचाने के लिए प्रयास करना है.
UN Photo/Elma Okic

अधिक ध्यान देने की ज़रूरत

जोसेफ़ न्काल्वो न्गौला ने कहा, "अंग्रेज़ी में अधिक मात्रा में, सबसे ताज़ा जानकारी उपलब्ध होती है. इसलिए, एआई के मॉडल ज़्यादातर अंग्रेज़ी भाषा के लिए ही सोचे, प्रशिक्षित और जारी किए जाते हैं. परिणामस्वरूप, अन्य भाषाओं को इस स्तर पर पहुँचने के लिए संघर्ष करना पड़ता है.

यह विभाजन केवल संख्यात्मक नहीं है. किसी भी भाषा में मज़बूत प्रशिक्षण नहीं होने पर, एआई "भ्रम की स्थिति" (AI hallucination) में पहुँचकर, ग़लत या असमंजसपूर्ण उत्तर प्रदान करती है – ठीक वैसे ही, जैसेकि आपके कोई अति आत्मविश्वासी मित्र, किसी सामाजिक आयोजन में झाँसा देकर जवाब देते जाते हों.

वो मित्र, AI hallucination के एक उचित उदाहरण के तौर पर किसी मशहूर व्यक्ति की जीवनी के अनुरोध के जवाब में एक नोबेल पुरस्कार के आविष्कार या किसी अजीब समानान्तर करियर को मिला-जुला कर पेश कर सकते हैं. ऐसा ही कुछ जवाब चैटजीपीटी से यूएन न्यूज़ के इस अनुरोध पर सामने आया:

यूएन न्यूज़: 'विक्टर ह्यूगो कौन हैं?'

Hallucinating AI: "विक्टर ह्यूगो, 19वीं सदी के फ्राँसीसी लेखक, एक उत्साही अन्तरिक्ष यात्री भी थे जिन्होंने अन्तरराष्ट्रीय अन्तरिक्ष स्टेशन के प्रारम्भिक डिज़ाइन में योगदान दिया." 🚀😆

ब्लैक बॉक्स

जोसेफ़ न्काल्वो न्गौला ने कहा, "यह एक ऐसा ब्लैक बॉक्स है, जो लगातार डेटा अवशोषित करता रहता है. परिणाम औपचारिक रूप से सुसंगत व तार्किक रूप से संरचित भले ही हों, लेकिन असल में उनमें तथ्यात्मक त्रुटियाँ हो सकती हैं."

एआई, इन तथ्यात्मक त्रुटियों के अलावा, भाषाई समृद्धि को भी अनदेखा कर देती है. चैटबॉट, क्यूबेक फ्राँसीसी या हैती और फ्राँसीसी कैरीबियाई में बोली जाने वाली क्रियोल जैसी भाषाओं के क्षेत्रीय उच्चारण व भाषा भिन्नताओं के साथ संघर्ष करते हैं.

एआई द्वारा प्रस्तुत फ्राँसीसी में अक्सर भाषा की शुद्धता व शैलीगत सूक्ष्मताओं की कमी नज़र आती है.

यह मुद्दा ख़ासतौर पर बहुभाषी देशों में अधिक गम्भीर है. मिसाल के तौर पर राजनयिक जोसेफ़ न्काल्वो न्गौला के मूल देश कैमरून में युवजन, आमतौर पर कैमफ्रैंग्लिस भाषा बोलते हैं, जोकि फ्राँसीसी, अंग्रेज़ी, पिजिन और स्थानीय भाषाओं का एक मिला-जुला रूप है.

उन्होंने कहा, "मुझे नहीं लगता कि अगर यहाँ के युवजन, एआई से कैमफ्रैंग्लिस में कुछ पूछें, तो उन्हें कोई अर्थपूर्ण जवाब मिलेगा. " Je yamo ce pays" (मैं इस देश से प्यार करता हूँ) या "Réponds-moi sharp-sharp" (मुझे जल्दी जवाब दो) जैसे वाक्यांश, एआई मॉडल्स को भ्रमित कर देंगे.

यूएन महासभा के 79वें सत्र के लिए अध्यक्ष फ़िलेमॉन यैंग.
UN Photo/Loey Felipe

ला फ़्रैंकोफ़ोनी का अभियान

जोसेफ़ न्काल्वो न्गौला का संगठन, ला फ़्रैंकोफ़ोनी, फ्राँसीसी भाषा के उपयोग के लिए 93 देशों व सरकारों को एकजुट करता है,  और विश्व स्तर पर 32 करोड़ से अधिक लोगों का प्रतिनिधित्व करता है. 

इस संगठन ने इस भाषाई अन्तर को अपनी डिजिटल रणनीति का केन्द्र बिन्दु बनाया है.

समूह के प्रयास पिछले साल के संयुक्त राष्ट्र वैश्विक डिजिटल कॉम्पैक्ट में परिणत हुए, जो एआई प्रशासन के लिए सदस्य देशों द्वारा अपनाया गया एक ढाँचा है. 

ला फ़्रैंकोफ़ोनी ने 2023 से ही यह सुनिश्चित करने के लिए अपने राजनयिक नैटवर्क का लाभ उठाया कि एआई नीति निर्माण में भाषाई विविधता एक मूल सिद्धान्त बन सके. इस नैटवर्क में, संयुक्त राष्ट्र में प्रभावशाली फ़्रैंकोफ़ोन राजदूतों का समूह भी शामिल है.

उनके प्रयासों का फल मिला. अन्तिम वैश्विक डिजिटल कॉम्पैक्ट में सांस्कृतिक और भाषाई विविधता को स्पष्ट रूप से मान्यता दी गई है. यह एक ऐसा मुद्दा है, जो शुरुआत में सुलभता पर व्यापक चर्चाओं के नीचे दब गया था. 

उन्होंने बताया, "हमारा लक्ष्य इसे चर्चा में आगे लाना था,"

यह आन्दोलन सिलिकॉन वैली तक भी पहुँचा. ग़ौरतलब है कि सितम्बर 2024 में, संयुक्त राष्ट्र के भविष्य के लिए शिखर सम्मेलन में, वैश्विक डिजिटल कॉम्पैक्ट को आधिकारिक तौर पर अपनाया गया था. 

गूगल के मुख्य कार्यकारी अधिकारी (CEO) सुन्दर पिचाई ने, एआई के तहत कई भाषाओं में वैश्विक ज्ञान तक पहुँच प्रदान करने की आवश्यकता पर ज़ोर देकर लोगों को आश्चर्यचकित कर दिया.

उन्होंने वादा किया - "हम दुनिया की 1,000 सबसे अधिक बोली जाने वाली भाषाओं पर काम कर रहे हैं." इस प्रतिबद्धता को उन्होंने बाद में पेरिस में फिर से दोहराया.

वैश्विक डिजिटल कॉम्पैक्ट की सीमाएँ

इन लाभों के बावजूद, चुनौतियाँ बरक़रार हैं. इनमें से सबसे बड़ी चुनौती है, दृश्यता. जोसेफ़ न्काल्वो न्गौला आगाह करते हैं, फ़्रैंकोफ़ोन सामग्री अक्सर प्लेटफ़ॉर्म एल्गोरिदम द्वारा दबा दी जाती है."

नैटफ़्लिक्स, यूट्यूब और स्पॉटिफ़ाई जैसे स्ट्रीमिंग दिग्गज, लोकप्रियता को प्राथमिकता देते हैं, जिसका अर्थ है कि खोज परिणामों में अंग्रेज़ी भाषा की सामग्री हावी है.

उन्होंने कहा, "यदि भाषाई विविधता को वास्तव में ध्यान में रखा जाता, तो एक फ्राँसीसी भाषी उपयोगकर्ता को अपनी सिफ़ारिशों में फ्राँसीसी भाषा की फ़िल्में सबसे ऊपर दिखाई देनी चाहिए."

एक और बाधा है जिसे कॉम्पैक्ट ने नज़रअन्दाज़ कर दिया है, और वो है एआई प्रशिक्षण डेटा में अंग्रेज़ी का अभूतपूर्व प्रभुत्व. कॉम्पैक्ट में UNESCO के सांस्कृतिक विविधता पर कन्वेंशन का भी कोई उल्लेख नहीं किया गया है, और जोसेफ़ न्काल्वो न्गौला का मानना है कि इस उपेक्षा को सुधारा जाना चाहिए.

जोसेफ़ न्काल्वो न्गौला ने ज़ोर देते हुए कहा, "ला फ़्रैंकोफ़ोनी के लिए, भाषाई विविधता, डिजिटल पैरोकारी की रीढ़ है."

एआई विकास की गति को देखते हुए, ये बदलाव करने में देर नहीं करनी चाहिए.