क्‍या बात है! गूगल का आर्टिफिशियल दिमाग लिखेगा फिक्‍शन-बनाएगा वीडियो, क्‍या खत्‍म हो जाएगी इंसानी सोच की जरूरत?

दिल्ली : क्या आर्टफिशियल इंटेंलिजेंस (AI)फिक्शन लिख सकता है, लंबे-चौड़े वीडियो बना सकता है या म्यूजिक बना सकता है? गूगल फिलहाल यही समझने की कोशिश कर रहा है. इस बीच अपने नए वर्डक्राफ्ट प्रोजेक्ट के जरिए गूगल का चैटबॉट LaMDA अब लेखकों के इनपुट के आधार पर फिक्शन लिख रहा है. बता दें कि LaMDA गूगल का कंवर्जेशनल AI है, जो इस साल की शुरुआत में एक इंजीनियर के दावे के बाद विवादों में घिर गया था.

इस बारे में गूगल ने न्यूयॉर्क में अपने AI कार्यक्रम में खुलासा किया कि उसने पेशेवर लेखकों के साथ मिलकर काम किया था, जिन्होंने वर्डक्राफ्ट एडिटर का उपयोग करके शॉर्ट स्टोरीज बनाईं. ये स्टोरीज अब पढ़ने के लिए ऑनलाइन उपलब्ध हैं.

गूगल रिसर्च के सीनियर रिसर्चर डायरेक्टर Douglas Eck ने इवेंट से पहले एक प्रेस कॉन्फ्रेंस में कहा, ‘मेरा मानना ​​है कि हम लोगों के रचनात्मक रूप से खुद को व्यक्त करने के तरीके को बदलने जा रहे हैं. हमने पेशेवर लेखकों के साथ काम किया और उन्हें एक टूल के रूप में LaMDA का उपयोग करके एक्सपेरिमेंटल स्टोरीज लिखने के लिए आमंत्रित किया. इस दौरान हमने सीखा कि यह आसान नहीं है. LaMDA सभी काम नहीं कर सकता है. यह लेखक हैं जो काम कर रहे हैं.’

इजराइल हिंसा: पुलिस से झड़प में दो फलस्तीनियों की मौत

इंसानी मदद की दरकार
उन्होंने बताया कि अगर किसी ने LaMDA को पूरी कहानी लिखने के लिए कहा जाए, तो परिणाम उतने अच्छे या दिलचस्प नहीं होंगे और LaMDA लेखकों की जगह नहीं ले सकता है, लेकिन हम यह जानने की कोशिश करते रहेंगे यह टूल क्या कर सकते हैं. उन्होंने यह भी स्वीकार किया कि ये मॉडल हाई रिस्क पैदा करते हैं और इसका उद्देश्य वास्तविक और एआई-आधारित स्टोरीज के बीच के अंतर को धुंधला करना नहीं है.

वीडियो और म्यूजिक बनाने के लिए इस्तेमाल
उन्होंने कहा कि गूगल अपने AI मॉडल की मदद से केवल फिक्शन लिखने का क्रिएटिव तरीका ही एक्सपलोर नहीं कर रही है, बल्कि यह भी देख रही है कि वीडियो और म्यूजिक बनाने लिए AI का उपयोग कैसे किया जा सकता है. AI-बेस्ड वीडियो जनरेशन पर गूगल ने इमेजेन और फेनाकी नामक दो नए मॉडल का खुलासा किया है. इमेजन वीडियो हाई क्वालिटी इमेजिस के जनरेट करने के लिए diffusion का इस्तेाल करता है. Google का दावा है कि यह शॉर्ट वीडियो के लिए उपयुक्त है. वहीं, फेनाकी लंबे वीडियो बनाने के लिए sequence learning तकनीक का इस्तेमाल करता है.

पियानो तक सीमित है म्यूजिक
कंपनी ने इवेंट में दो मॉडलों द्वारा बनाए गए वीडियो का भी खुलासा किया है. इस बारे में Douglas Eck ने कहा कि यह एक कठिन काम है. वीडियो बनाने में फ्रेमिंग करना एक मूलभूत चुनौती है, जिसे पूरी तरह से हल करना बाकी है. इसके अलावा गूगल के AudioLM फ्रेमवर्क के जरिए शॉर्ट ऑडियो नमूने के आधार पर रियल स्पीच और म्यूजिक बना सकता है. हालांकि, म्यूजिक अभी पियानो तक ही सीमित है. गूगल का कहना है कि यह एक प्योर ऑडियो मॉडल है, जिसे बिना किसी टेक्स्ट या म्यूजिक के सिंबल के ट्रैन किया जा सकता है.

Back to top button

Adblock Detected

Please consider supporting us by disabling your ad blocker