बेंगलुरु स्थित स्टार्टअप सर्वम AI भारत के सॉवरेन AI प्रयासों में सबसे आगे निकलकर आया है, जिसने देश की भाषाई और सांस्कृतिक विविधता के हिसाब से मॉडल लॉन्च किए हैं। इसके लेटेस्ट रिलीज़—**सर्वम विज़न** (डॉक्यूमेंट समझने और OCR के लिए एक विज़न-लैंग्वेज मॉडल) और **बुलबुल V3** (एडवांस्ड टेक्स्ट-टू-स्पीच)—ने खास बेंचमार्क में, खासकर भारतीय भाषाओं के लिए, Google Gemini, OpenAI के ChatGPT और DeepSeek जैसे ग्लोबल दिग्गजों को पीछे छोड़ दिया है।
सर्वम विज़न, एक 3-बिलियन-पैरामीटर स्टेट-स्पेस मॉडल, ऑप्टिकल कैरेक्टर रिकग्निशन और इमेज कैप्शनिंग, सीन टेक्स्ट रिकग्निशन, चार्ट एनालिसिस और जटिल टेबल इंटरप्रिटेशन जैसे विज़ुअल कामों में बेहतरीन है। **olmOCR-Bench** (अंग्रेजी सबसेट) पर, इसने **84.3%** सटीकता हासिल की, जो Gemini 3 Pro, DeepSeek OCR v2 और ChatGPT से बेहतर है। **OmniDocBench v1.5** पर, इसने कुल मिलाकर **93.28%** स्कोर किया, जो जटिल लेआउट, तकनीकी टेबल, गणितीय समीकरण, स्कैन किए गए डॉक्यूमेंट और फॉर्म को बेहतर तरीके से संभालने की क्षमता दिखाता है। यह सभी **22 शेड्यूल भारतीय भाषाओं** को सपोर्ट करता है और भारतीय-विशिष्ट टेस्ट (जैसे हिंदी, तमिल, बंगाली में उच्च शब्द सटीकता) पर सबसे अच्छा प्रदर्शन करता है, जिससे मुख्य रूप से अंग्रेजी पर प्रशिक्षित ग्लोबल मॉडल की कमियों को दूर किया जा रहा है।
बुलबुल V3, सर्वम का प्रमुख TTS मॉडल, कोड-मिक्सिंग, न्यूमेरिक्स, नामित संस्थाओं और तकनीकी सामग्री जैसे वास्तविक दुनिया के इनपुट पर कम एरर रेट के साथ स्वाभाविक, अभिव्यंजक, प्रोडक्शन-रेडी आवाज़ें देता है। यह वर्तमान में **11 भारतीय भाषाओं** में **35+ उच्च-गुणवत्ता वाली आवाज़ों** (पेशेवर कलाकारों से) को सपोर्ट करता है, और इसे **22** तक बढ़ाने की योजना है। स्वतंत्र ब्लाइंड लिसनिंग स्टडीज़ में ElevenLabs V3 Alpha और Cartesia Sonic-3 जैसे प्रतिस्पर्धियों की तुलना में स्वाभाविकपन (48 kHz और 8 kHz टेलीफोनी पर), मजबूती और न्यूनतम स्किप/गलत उच्चारण के लिए श्रोताओं की सबसे अधिक पसंद देखी गई।
ये मॉडल भारत के सॉवरेन AI के लिए एक मील का पत्थर हैं—जो सरकार, BFSI, शिक्षा और सार्वजनिक सेवाओं में सुरक्षित, सांस्कृतिक रूप से अनुकूलित एप्लिकेशन के लिए स्थानीय रूप से बनाए गए हैं। सर्वम ने हाल ही में ओडिशा (50MW AI कंप्यूट सुविधा) और तमिलनाडु (डिजिटल संगम सॉवरेन AI रिसर्च पार्क) के साथ बुनियादी ढांचे को बढ़ाने और AI को सार्वजनिक उपयोगिता के रूप में तैनात करने के लिए साझेदारी की घोषणा की है। US/चीन की लैब्स के ग्लोबल दबदबे के बीच, सर्वम का भारतीय चुनौतियों पर फोकस भारत को मल्टीलिंगुअल AI में एक गंभीर दावेदार के तौर पर स्थापित करता है।
Navyug Sandesh Hindi Newspaper, Latest News, Findings & Fact Check