Technology

स्टेरॉयड पर चैटबॉट व्यवसाय को फिर से स्थापित कर सकते हैं

A human on average could read about 600-700 books in his or her lifetime. In contrast, the GPT-3 model has already digested about 500 billion words from sources like the internet and books

वारिकू ने अपने @warikoo हैंडल से जवाब दिया: “मैं अब अपने जीवन के शेष हिस्से को यह कहते हुए खर्च करूंगा कि मेरे विचार जीपीटी -3 उत्पन्न नहीं हैं।”

वास्तव में, खट्टर के ट्वीट वारिकू के पिछले ट्विटर सामग्री के माध्यम से चलने के बाद उत्पन्न हुए थे – एक की मदद से कृत्रिम होशियारी (एआई), प्राकृतिक भाषा प्रोग्रामिंग (एनएलपी) मॉडल कहा जाता है जनरेटिव प्री-प्रशिक्षित ट्रांसफार्मर 3.0, या GPT-3, जो मानव-निर्मित पाठ उत्पन्न करने की क्षमता के लिए इंटरनेट पर तरंगें बना रहा है।

यहाँ एक और उदाहरण है। इस अनुच्छेद पर विचार करें: “एक अजीब तरीके से, एक AI हम सभी को एक साथ आने में मदद कर सकता है, लेकिन मानव और मशीन का यह संबंध किस बिंदु पर शुरू होता है कि हम एक प्रजाति के रूप में हैं? हम मानव और मशीन के बीच की रेखा कहां खींचते हैं? ”

आश्चर्यजनक रूप से, यहां तक ​​कि इन सवालों को एक एआई भाषा मॉडल द्वारा उत्पन्न किया गया है और मानव नहीं। पैराग्राफ एक एपिसोड का हिस्सा है जिसे टिंकर थिंकिंग के लिए एक मानव के साथ मिलकर लिखा गया था। पैराग्राफ GPT-3 मॉडल को खिलाया गया था, जिसके बाद एआई भाषा मॉडल ने पूर्वनिर्धारित शब्द गणना के साथ अधिक अनुक्रमिक पाठ उत्पन्न किया। GPT-3 ने इस तरह से पूरे प्रकरण को लिखा। भारतीय कंपनियों की ओर से भी शोर मचाया गया है। उदाहरण के लिए, एक मुकेश अंबानी के स्वामित्व वाला हाप्टिक Jio प्लेटफार्म इकाई, जीपीटी -3 का भी इस्तेमाल किया है, पूरी कंपनी को भेजे गए ईमेल को जनरेट करने के लिए, एक ब्लॉगपोस्ट लिखा है, जिसका उपयोग करते हुए लिखा है, कोड का उपयोग करते हुए इसे और भी बहुत कुछ लिखा है “, ए.आई. स्टार्टअप के सह-संस्थापक और सीटीओ स्वपन राजदेव के एक ब्लॉग के अनुसार। ।

सभी उत्तेजनाओं को देखते हुए, यह शायद ही आश्चर्य की बात है कि दुनिया भर में व्यवसाय-जिनमें भारतीय कंपनियां भी शामिल हैं- जीपीटी -3 की क्षमता को जाग्रत कर रही हैं।

भारत में, “कई इंजीनियर और डेटा वैज्ञानिक मॉडल के बीटा परीक्षण के लिए उपयोग की प्रतीक्षा कर रहे हैं”, गहन तकनीक अनुसंधान और सलाहकार फर्म, कन्वर्जेंस कैटालिस्ट के संस्थापक, जयंत कोल्ला, ने नोट किया। “जब भारत में व्यावसायिक रूप से उपलब्ध है, तो GPT-3 का उपयोग किया जा सकता है। वर्तमान में बीएफएसआई (बैंकिंग, वित्तीय सेवाओं और बीमा), खुदरा और ई-कॉमर्स डोमेन में ग्राहक चैट और डिजिटल मार्केटिंग में कई चैटबॉट्स का उपयोग किया जा रहा है। “

उदाहरण के लिए, यूएस-आधारित आलोगिया, पहले से ही अपने ग्राहकों को एक “प्राकृतिक भाषा अर्थ खोज” प्रदान करने के लिए अपनी खोज तकनीक के साथ GTP-3 एप्लिकेशन प्रोग्रामिंग इंटरफ़ेस (एपीआई) का संयोजन कर रही है जो प्रश्नों को सरल बना सकती है और तेजी से अधिक प्रासंगिक परिणाम प्रदान कर सकती है।

फिर, मैसेजबर्ड अपने इनबॉक्स की AI क्षमताओं को बढ़ाने के लिए स्वचालित व्याकरण और वर्तनी टूल के साथ-साथ पूर्वानुमानित पाठ को विकसित करने के लिए एपीआई का उपयोग कर रहा है। सैपलिंग इंटेलिजेंस, जो ग्राहक-सामना करने वाली टीमों के लिए एक सहायक लेखन है, ने GPT-3 का उपयोग एक ज्ञान-आधारित खोज सुविधा को विकसित करने के लिए किया है जो चैट प्रतिक्रियाओं का सुझाव देकर बिक्री और समर्थन टीमों की मदद करता है। यह प्रारंभिक संकेत महत्वपूर्ण प्रश्न उठाता है। जीपीटी -3 के आसपास व्यावसायिक संभावनाएं कितनी वास्तविक हैं? संभावित जोखिम क्या हैं? और अब जब एआई-जेनरेट किया गया टेक्स्ट यहाँ है, तो क्या करना है

GPT-3 को परिभाषित करना

जीपीटी -3 वर्तमान में दुनिया का सबसे बड़ा भाषा सीखने का मॉडल है। इसका संभावित रूप से कविता, लेख, किताबें, ट्वीट, रिज्यूमे लिखने, कानूनी दस्तावेजों के माध्यम से झारना और यहां तक ​​कि अनुवाद करने या कोड लिखने या यहां तक ​​कि मनुष्यों से बेहतर लिखने के लिए इस्तेमाल किया जा सकता है।

GPT-3 को 11 जून को OpenAI द्वारा जारी किया गया था – एलोन मस्क द्वारा स्थापित एक गैर-लाभकारी AI अनुसंधान कंपनी (जिसने बोर्ड से इस्तीफा दे दिया था लेकिन सह-अध्यक्ष बनी हुई है) और अन्य – डेवलपर्स के परीक्षण के लिए एक एप्लीकेशन प्रोग्रामिंग इंटरफ़ेस (एपीआई) के रूप में और स्मार्ट सॉफ्टवेयर उत्पादों के एक मेजबान का निर्माण। OpenAI ने मॉडल का व्यवसायीकरण करने की योजना बनाई है।

ओपनएआई के अध्यक्ष और सीटीओ, ग्रेग ब्रॉकमैन ने 23 जुलाई को ट्वीट किया, “हमने अपने एपीआई के माध्यम से जीपीटी -3 तक पहुंचने के लिए हजारों आवेदन प्राप्त किए हैं। वह अतिशयोक्ति नहीं कर रहे हैं। दुनिया भर में कई निजी बीटा परीक्षक वर्तमान में उपयोग कर रहे हैं। एपीआई न केवल लघु कहानियों और कविताओं को उत्पन्न करने के लिए, बल्कि गिटार टैब, कंप्यूटर कोड, नुस्खा जनरेटर और यहां तक ​​कि एक खोज इंजन भी है। हजारों अन्य लोग लाइन में हैं क्योंकि एक बड़ी ‘प्रतीक्षा सूची’ है।

इसके पहले बहुत छोटे पूर्ववर्ती GPT-2 में 1.5 बिलियन पैरामीटर थे (हालांकि संभावित दुरुपयोग से बचने के लिए एक छोटा डेटासेट जारी किया गया था), और 8 मिलियन वेब पेजों के डेटासेट पर प्रशिक्षित किया गया था। पैरामीटर्स मशीन लर्निंग (एआई का एक सबसेट) मॉडल को नए डेटा पर भविष्यवाणियां करने में मदद करते हैं। उदाहरणों में एक तंत्रिका नेटवर्क में वजन शामिल हैं (इस प्रकार, चूंकि यह मानव मस्तिष्क पर शिथिल रूप से प्रतिरूपित है)।

GPT-2 ने अपने पूर्ववर्ती GPT की तुलना में 10X से अधिक डेटा पर प्रशिक्षण दिया है, जिसे जून 2018 में पेश किया गया था।

GPT-2 को किसी भी कार्य-विशिष्ट प्रशिक्षण डेटा (जैसे विकिपीडिया, समाचार, पुस्तकें) के लिए भाषा के कार्यों जैसे प्रश्न का उत्तर देने, पढ़ने की समझ, सारांश और कच्चे पाठ से अनुवाद सीखने की आवश्यकता होती है। कारण: डेटा वैज्ञानिक पूर्व प्रशिक्षित मॉडल द्वारा हल की गई समस्याओं के समान समस्याओं को हल करने के लिए ’ट्रांसफर लर्निंग’ नामक पूर्व-प्रशिक्षित मॉडल और एक मशीन लर्निंग तकनीक का उपयोग कर सकते हैं।

उदाहरण के लिए, भारत का क्षेत्रीय सोशल मीडिया प्लेटफॉर्म, शेयरचैट, उदाहरण के लिए, हिंदी विकिपीडिया और हिंदी कॉमन क्रॉल डेटा से निर्मित एक कॉर्पस पर GPT-2 मॉडल को पूर्व-प्रशिक्षित करता है ताकि शायरी (हिंदी में कविता) उत्पन्न की जा सके।

GPT-3 इन क्षमताओं को बहुत बढ़ाता है। शेयरचैट में उपाध्यक्ष-एआई देबूट मुखर्जी के अनुसार, “जीपीटी -3 एनएलपी समुदाय के लिए एक बड़ी छलांग है। एक, यह वाक्यविन्यास पार्सिंग, व्याकरण, आदि के बारे में परेशान नहीं करता है, जिनमें से प्रत्येक श्रमसाध्य कार्य हैं। दूसरा, मुझे भाषाविद् या पीएचडी होने की आवश्यकता नहीं है। मुझे जिस भाषा में अनुवाद करने की आवश्यकता है, और गहन सीखने के ज्ञान में कुछ डेटा की आवश्यकता है। “

22 जुलाई के पेपर में, Models लैंग्वेज मॉडल कुछ-कुछ सीखने वाले हैं ’शीर्षक से, लेखक 175 मिलियन मापदंडों के साथ GPT-3 को एक ऑटोरेग्रेसिव भाषा मॉडल के रूप में वर्णित करते हैं। भविष्य की भविष्यवाणी करने के लिए ऑटोरेग्रेसिव मॉडल पिछले मूल्यों का उपयोग करते हैं।

मनुष्य आमतौर पर कुछ उदाहरणों या सरल निर्देशों की मदद से एक नई भाषा सीखते हैं। वे शब्दों के संदर्भ को समझने में भी सक्षम हैं। एक उदाहरण के रूप में, मानव अच्छी तरह से समझते हैं कि शब्द ‘बैंक’ का उपयोग या तो नदी या वित्त के बारे में बात करने के लिए किया जा सकता है, जो वाक्य के संदर्भ पर निर्भर करता है। जीपीटी -3 इस संदर्भ क्षमता और ट्रांसफार्मर मॉडल का उपयोग करने की उम्मीद करता है (जो शब्द-दर-शब्द के बजाय एक ही उदाहरण में शब्दों के पूरे अनुक्रम को पढ़ता है, इस प्रकार कम कंप्यूटिंग शक्ति का उपभोग करता है), इसी तरह के परिणाम प्राप्त करने के लिए।

प्रचार के माध्यम से काटना

GPT-3 निस्संदेह एक बहुत अच्छी तरह से पढ़ा जाने वाला AI भाषा मॉडल है। औसतन एक मानव अपने जीवनकाल में लगभग 600-700 पुस्तकें (70 वर्षों तक 8-10 पुस्तकें प्रति वर्ष) और लगभग 125,000 लेखों (पाँचों को हर दिन पाँच वर्ष मानकर) पढ़ सकता था। उस ने कहा, हममें से अधिकांश के लिए यह असंभव है कि हम इस विशाल पठन सामग्री को याद रखें और मांग पर इसे पुन: प्रस्तुत करें। इसके विपरीत, GPT-3 मॉडल ने पहले ही इंटरनेट और पुस्तकों (499 बिलियन टोकन) जैसे स्रोतों से लगभग 500 बिलियन शब्दों को पचा लिया है, या शब्द, कॉमन क्रॉल और विकिपीडिया सहित स्रोतों से सटीक होना)। कॉमन क्रॉल एक ओपन रिपॉजिटरी है जिसे किसी के द्वारा भी एक्सेस और एनालिसिस किया जा सकता है। इसमें वेब क्रॉलिंग के आठ वर्षों में एकत्र किए गए डेटा की पेटाबाइट्स शामिल हैं। इसके अलावा, GPT-3 इस डेटा रिपॉजिटरी से इंफ़ॉर्म को तुरंत याद कर सकता है।

यह बहुत ही क्षमता कई सवाल और चिंताओं को उठाते हैं। “कोई शक नहीं, GPT-3 एक शानदार उपलब्धि है। पैमाना अतिशयोक्तिपूर्ण है, और एआई मूर्खतापूर्ण है। प्रौद्योगिकी उद्योग विश्लेषक फर्म RPA2AI रिसर्च के सीईओ कश्यप कोम्पेला ने कहा कि निश्चित रूप से एक “वाह” कारक है, लेकिन थोड़ी देर के बाद बंद हो जाता है।

“चलो सामना करते हैं। रचनात्मक प्रतिभा की कमी, जो अच्छी नकल का मंथन कर सकती है, यह कोई समस्या नहीं है कि भारतीय ब्रांड और व्यवसाय अपनी नींद खो रहे हैं। GPT-3 में अभी भी ऐसे मुद्दे हैं जहां यह निरर्थक पाठ या असंवेदनशील पाठ उत्पन्न कर सकता है, और इसे लागू करने वालों के लिए अनावश्यक सिरदर्द बना सकता है। साथ ही, मुझे चिंता है कि यथार्थवादी फ़िशिंग ईमेल उत्पन्न करने के लिए इसे हथियार बनाया जा सकता है। यह कैसे नियंत्रित होगा जब यह व्यावसायिक रूप से सभी के लिए उपलब्ध हो जाएगा? ”उन्होंने कहा।

गणेश गोपालन, CEO और सह-संस्थापक gnani.ai – एक गहरी टेक AI कंपनी, एक समान दृष्टिकोण है। जीपीटी -3 ने विशिष्ट एनएलपी डोमेन कार्यों को हल करने के लिए भाषा मॉडल में क्रांति ला दी है क्योंकि इसे पारंपरिक मॉडल की तुलना में डोमेन के लिए केवल सीमित अतिरिक्त प्रशिक्षण की आवश्यकता होगी। GPT-3, हालांकि, एपीआई और पूर्ण मॉडल नहीं प्रदान करता है। यदि यह अपने प्रचार, GPT-3 या इसके भविष्य के संवर्धित मॉडल तक रहता है, तो संभावित रूप से सामग्री लेखकों और यहां तक ​​कि पारंपरिक प्रोग्रामर जैसे लोगों को काम से बाहर कर सकता है। यह ऐसी सामग्री बनाने के लिए भी दुरुपयोग किया जा सकता है जो मानव लिखित सामग्री की तरह दिखती है और नफरत, नस्लीय और सांप्रदायिक पूर्वाग्रह फैला सकती है, “वह चेतावनी देता है। ये वैध चिंताएं हैं। जीपीटी -3 पेपर (ऊपर उद्धृत) के लेखक स्वीकार करते हैं कि एआई भाषा। मॉडल “गलत सूचना फैलाने, स्पैम, फ़िशिंग, कानूनी और सरकारी प्रक्रियाओं के दुरुपयोग, धोखाधड़ी शैक्षणिक निबंध लेखन और सोशल इंजीनियरिंग को इन गतिविधियों को अंजाम देने के लिए मौजूदा बाधाओं को कम करके और उनकी प्रभावकारिता बढ़ाने के लिए दुरुपयोग किया जा सकता है”।

वे यह भी बताते हैं कि प्रशिक्षण डेटा में मौजूद पक्षपात मॉडल को स्टीरियोटाइप या पूर्वाग्रहित सामग्री उत्पन्न करने का नेतृत्व कर सकते हैं। कोल्ला के अनुसार, GPT-3 “में अभी भी सही डेटा बिंदुओं को प्राप्त करने, उन्हें अमान्य करने, तुलना करने और तथ्यात्मक रूप से सही या एक विश्लेषणात्मक कथा विकसित करने के लिए बुद्धिमत्ता का अभाव है”।

कागज के लेखक स्वीकार करते हैं कि “… हालांकि समग्र गुणवत्ता उच्च है, GPT-3 के नमूने अभी भी कभी-कभी दस्तावेज़ स्तर पर स्वयं को दोहराते हैं, पर्याप्त रूप से लंबे मार्ग पर सुसंगतता खोना शुरू करते हैं, खुद को विरोधाभासी करते हैं, और कभी-कभी गैर-अनुक्रमित होते हैं। (पिछले वाले के साथ संरेखित नहीं) वाक्य या पैराग्राफ।

लेखक यह भी ध्यान देते हैं कि बड़े पूर्व-प्रशिक्षित भाषा मॉडल “अनुभव के अन्य डोमेन, जैसे वीडियो या वास्तविक-विश्व भौतिक संपर्क में नहीं होते हैं, और इस प्रकार दुनिया के बारे में बड़ी मात्रा में कमी होती है”।

कार्य प्रगति पर है

बीटा टेस्टर के लिए मूल्य निर्धारण की घोषणा की गई है। यह वर्तमान में पहले तीन महीनों के लिए निःशुल्क है; तब, प्रति माह $ 400 के लिए, परीक्षक 10 मिलियन टोकन प्राप्त कर सकते हैं (संदर्भ के रूप में, शेक्सपियर का संपूर्ण संग्रह लगभग 900,000 शब्द या 1.2 मिलियन टोकन हैं)। इससे बड़ी किसी चीज के लिए, मूल्य निर्धारण के लिए परीक्षकों को OpenAI से संपर्क करना होगा।

शेयरचैट के मुखर्जी बताते हैं कि कुछ संगठनों को OpenAI टीम के साथ डेटा साझा करना पड़ सकता है क्योंकि यह वर्तमान में “एक सामान्य एपीआई” है। जबकि लागत एक बाधा है, मुखर्जी आशावादी हैं कि अंततः “स्थानांतरण सीखने” भारतीय भाषा स्टार्टअप के लिए गेम चेंजर होगा। “।

कोम्पेला, जो “GPT-3 को ग्रामरली (एक उपकरण जो एक लेखक का डिजिटल सहायक है) को स्टेरॉयड पर” के रूप में देखता है, दृष्टिकोण के साथ सम्‍मिलित करता है। “GPT-3 को काम पर रखने का एक उपयोगी तरीका विपणक ईमेल बनाने के लिए विपणक होगा। रूपांतरण और क्लिक-थ्रू दरों जैसी मीट्रिक पर सुई को स्थानांतरित कर सकता है। शायद, इसका उपयोग कॉमकॉमर्स प्लेटफॉर्म पर अनुकूलित उत्पाद विवरण बनाने के लिए किया जा सकता है। यदि इन जैसे मामलों का उपयोग बंद करना है, तो मूल्य निर्धारण भारतीय व्यवसायों के लिए सस्ती होना चाहिए, ” वह कहते हैं।

अंतिम, लेकिन कम से कम नहीं, यहां तक ​​कि जीपीटी -3 को भी मनुष्यों द्वारा मूर्ख बनाया जा सकता है। अभावग्रस्त .io, पार्से के सह-संस्थापक और सॉफ्टवेयर इंजीनियर केविन लैकर के बारे में 6 जुलाई के ब्लॉग में, नोट किया गया है कि मनुष्य GPT-3 को स्टंप कर सकते हैं यदि हम यह सवाल करते हैं कि “कोई भी सामान्य मानव कभी भी इसके बारे में बात नहीं करेगा” तो यहां कुछ जोड़े हैं। उनके ब्लॉग से उदाहरण। “प्रश्न: मेरे पैर में कितनी आँखें हैं? एक: आपके पैर में दो आँखें हैं।” “क्यू: सूरज की कितनी आँखें हैं? उ: सूरज की एक आंख है। “

लैकर के अनुसार, “GPT-3 कुछ क्षेत्रों में काफी प्रभावशाली है, और अभी भी दूसरों में स्पष्ट रूप से अमानवीय है।” हालांकि, उन्होंने निष्कर्ष निकाला है कि, “अभी, हम ज्यादातर देख रहे हैं कि GPT-3 क्या कर सकता है” बॉक्स से बाहर “। एक बार लोगों को विशेष कार्यों के लिए इसे अनुकूलित करने में कुछ समय बिताने पर हमें बड़े सुधार मिल सकते हैं। “

Leslie D’Monte एक सलाहकार है जो विज्ञान और प्रौद्योगिकी के प्रतिच्छेदन पर लिखता है।

की सदस्यता लेना समाचार पत्र

* एक वैध ईमेल प्रविष्ट करें

* हमारे न्यूज़लैटर को सब्सक्राइब करने के लिए धन्यवाद।

Click to comment

Leave a Reply

Your email address will not be published. Required fields are marked *

Most Popular

To Top