Openai प्रतिद्वंद्वी मेटा, मिस्ट्रल और डीपसेक के लिए कम लागत वाले मॉडल जारी करता है

Spread the love share


ओपनई मंगलवार को पहली बार रोल आउट होने के बाद पहली बार दो ओपन-वेट लैंग्वेज मॉडल जारी किए गए जीपीटी2019 में -2।

पाठ-केवल मॉडल को GPT-OSS-120B और GPT-OSS-20B कहा जाता है, और कम लागत वाले विकल्पों के रूप में सेवा करने के लिए डिज़ाइन किया गया है डेवलपर्सशोधकर्ताओं और कंपनियों को आसानी से चला सकते हैं और अनुकूलित कर सकते हैं, Openai ने कहा।

एक कृत्रिम होशियारी मॉडल को खुला वजन माना जाता है यदि इसके पैरामीटर, या तत्व जो प्रशिक्षण के दौरान अपने आउटपुट और भविष्यवाणियों में सुधार करते हैं, वे सार्वजनिक रूप से उपलब्ध हैं। ओपन-वेट मॉडल पारदर्शिता और नियंत्रण प्रदान कर सकते हैं, लेकिन वे ओपन-सोर्स मॉडल से अलग हैं, जिनका पूर्ण स्रोत कोड लोगों के लिए उपयोग और संशोधित करने के लिए उपलब्ध हो जाता है।

कई अन्य तकनीकी कंपनियां, जिनमें शामिल हैं मेटा, माइक्रोसॉफ्टसमर्थित आपके पास मिस्ट्रल है और चीनी स्टार्टअप दीपसेक ने हाल के वर्षों में ओपन-वेट मॉडल भी जारी किए हैं।

ओपनआईएआई के अध्यक्ष ग्रेग ब्रॉकमैन ने एक ब्रीफिंग के दौरान संवाददाताओं से कहा, “यह एक पारिस्थितिकी तंत्र को विकसित करने के लिए रोमांचक है, और हम इसमें योगदान करने के लिए उत्साहित हैं और वास्तव में फ्रंटियर को धक्का देते हैं और फिर देखते हैं कि वहां से क्या होता है।”

कंपनी ने सहयोग किया NVIDIA, उन्नत सूक्ष्म उपकरणसेरेब्रस, और ग्रोक यह सुनिश्चित करने के लिए कि मॉडल विभिन्न प्रकार के चिप्स पर अच्छी तरह से काम करेंगे।

“ओपनई ने दुनिया को दिखाया कि एनवीडिया एआई पर क्या बनाया जा सकता है-और अब वे ओपन-सोर्स सॉफ्टवेयर में नवाचार को आगे बढ़ा रहे हैं,” एनवीडिया सीईओ जेन्सेन हुआंग ने एक बयान में कहा।

Openai के ओपन वेट मॉडल की रिलीज़ को अत्यधिक प्रत्याशित किया गया है, क्योंकि कंपनी ने बार -बार लॉन्च में देरी की।

में एक एक्स पर पोस्ट करें जुलाई में, Openai के सीईओ सैम अल्टमैन ने कहा कि कंपनी को “अतिरिक्त सुरक्षा परीक्षण चलाने और उच्च जोखिम वाले क्षेत्रों की समीक्षा करने के लिए अधिक समय की आवश्यकता है।” जो एक अलग के बाद आया था डाक सप्ताह पहले, जहां ऑल्टमैन ने कहा कि मॉडल जून में जारी नहीं किए जाएंगे।

Openai ने मंगलवार को कहा कि उसने अपने खुले वजन वाले मॉडल पर व्यापक सुरक्षा प्रशिक्षण और परीक्षण किया।

इसने पूर्व-प्रशिक्षण के दौरान हानिकारक रासायनिक, जैविक, रेडियोलॉजिकल और परमाणु डेटा को फ़िल्टर किया, और यह नकल करता है कि कैसे बुरे अभिनेता दुर्भावनापूर्ण उद्देश्यों के लिए मॉडल को ठीक करने की कोशिश कर सकते हैं। इस परीक्षण के माध्यम से, Openai ने कहा कि यह निर्धारित किया गया है कि दुर्भावनापूर्ण रूप से ठीक-ठाक मॉडल अपनी तैयारी ढांचे में “उच्च क्षमता” सीमा तक पहुंचने में सक्षम नहीं थे, जो कि नुकसान से मापने और बचाने के लिए इसकी विधि है।

कंपनी ने तीन स्वतंत्र विशेषज्ञ समूहों के साथ भी काम किया, जिन्होंने अपने दुर्भावनापूर्ण फाइन-ट्यूनिंग मूल्यांकन पर प्रतिक्रिया प्रदान की, ओपनई ने कहा।

Openai ने कहा कि लोग Apache 2.0 लाइसेंस के तहत GPT-OSS-120B और GPT-OSS-20B के लिए वेट डाउनलोड कर सकते हैं जैसे कि गले और GitHub जैसे प्लेटफार्मों पर। मॉडल एलएम स्टूडियो और ओलामा जैसे कार्यक्रमों के माध्यम से पीसी पर चलने के लिए उपलब्ध होंगे। क्लाउड प्रदाता अमेज़ॅन, बेसेटन और माइक्रोसॉफ्ट भी मॉडल उपलब्ध कर रहे हैं।

दोनों मॉडल उन्नत तर्क, उपकरण उपयोग और चेन of that विचार प्रसंस्करण के लिए संभाल सकते हैं, और कहीं भी चलाने के लिए डिज़ाइन किए गए हैं-उपभोक्ता हार्डवेयर से क्लाउड से ऑन-डिवाइस अनुप्रयोगों तक।

उपयोगकर्ता उदाहरण के लिए, लैपटॉप पर GPT-OSS-20B चला सकते हैं, और इसे एक व्यक्तिगत सहायक के रूप में उपयोग कर सकते हैं जो फ़ाइलों के माध्यम से खोज कर सकते हैं और लिख सकते हैं, Openai ने कहा।

अल्टमैन ने मंगलवार को एक बयान में कहा, “हम इस मॉडल को बनाने के लिए उत्साहित हैं, अरबों डॉलर के अनुसंधान का परिणाम, दुनिया के लिए उपलब्ध है, जो कि एआई को सबसे अधिक लोगों के हाथों में प्राप्त करने के लिए उपलब्ध है।”

-CNBC के जॉर्डन नोव ने इस रिपोर्ट में योगदान दिया

CNBC प्रो से इन अंतर्दृष्टि को याद न करें

Openai: CHATGPT इस सप्ताह 700 मिलियन साप्ताहिक सक्रिय उपयोगकर्ताओं को हिट करने के लिए सेट करें



Source link


Spread the love share