साकेंतिक तस्वीर
Microsoft VALL-E: तकनीक के बदलते दौर में कब कौन सी तकनीक आ जाए कह नहीं सकते. अब माइक्रोसॉफ्ट ने एक ऐसा मॉडल लॉन्च किया है, जिसकी मदद से न केवल किसी भी टेक्स्ट को आवाज में कन्वर्ट किया जा सकता है. बल्कि किसी भी शख्स की आवाज को मात्र 3 सेकेंड में निकाला जा सकता है. माइक्रोसॉफ्ट के इस AI मॉडल का नाम VALL-E है. आइए जानते हैं इसके बारे में.
मात्र 3 सेकेंड में कर सकता है इतने काम
माइक्रोसॉफ्ट का ये न्यू मॉडल अपने तरह का एक बेहतरीन प्रोडक्ट साबित हो सकता है. बताया जा रहा है कि माइक्रोसॉफ्ट का VALL-E प्रोडक्ट टेक्स्ट-टू-स्पीच पर काम करता है. यानी कि ये लिखे हुए शब्दों को मात्र तीन सेकेंड में पढ़ सकता है. वहीं इसका जो सबसे खास फीचर है वो ये है कि VALL-E किसी की भी आवाज निकाल सकता है.
VALL-E कि खासियत इतनी है कि यह किसी लिखी हुई भाषा को एक इमोशनल टच भी दे सकता है. मिली जानकारी के मुताबिक, इस प्रोडक्ट का उपयोग एक दिन हाई-एंड टेस्ट-टू-स्पीच एप्लिकेशन में किया जा सकेगा.
आखिर क्या है ये VALL-E ?
बताया जा रहा है कि VALL-E माइक्रोसॉफ्ट का एक अहम प्रोजेक्ट है. जिसका उपयोग हाई-एंड टेस्ट-टू-स्पीच एप्लिकेशन में किया जाएगा. रिसर्चर्स ने इस मॉडल के बारे में जो जानकारी दी है वो हैरान करने वाली है. इसके अनुसार इस AI मॉडल को 60 हजार घंटे से ज्यादा की इंग्लिश लैंग्वेज स्पीच की ट्रेनिंग दी गई है. इसके लिए 7 हजार से ज्यादा स्पीकर का इस्तेमाल किया गया है.
अपने इस मॉडल VALL-E को कंपनी neural codec language model कहती है. इसने ट्रेनिंग के दौरान जिस किसी भी आवाज की नकल की है, उसे हूबहू वैसा ही निकाला भी है.
इसे भी पढ़ें: Portable Geyser: 500 रुपये में लें गीजर का मजा, पलक झपकते ही गर्म हो जाएगा पानी
गलत इस्तेमाल होने की आशंका
चूंकि अभी प्रोडक्ट टेस्टिंग की अवस्था में है, ऐसे में सभी प्रक्रियाओं से गुजरने के बाद यह प्रोडक्ट अपना अंतिम रूप लेने के बाद बाजार में आ सकता है. यह किसी वक्ता के लिए लिखी हुई स्पीच को उसकी ही आवाज में आसानी से पढ़ सकेगा. यह आवाज किसी मशीन की नहीं बल्कि एक इंसान की तरह लगेगी. आशंका जताई जा रही है कि इसका गलत इस्तेमाल भी किया जा सकता है. फिलहाल अभी बाजार में इस प्रोडक्ट को आने में कुछ वक्त लग जाएगा.