Sarvam startet sprachgesteuerten KI-Bot für indische Sprachen
Indisches KI-Startup Sarvam startet mehrsprachigen, sprachgesteuerten KI-Bot, der über 10 indische Sprachen unterstützt
Das indische KI-Startup Sarvam hat einen sprachgesteuerten KI-Bot vorgestellt, der mehr als 10 indische Sprachen unterstützt. Damit will das Unternehmen die sprachliche Vielfalt in Indien ansprechen. Das in Bengaluru ansässige Unternehmen, das hauptsächlich Unternehmen und Betriebe bedient, erkennt den Wunsch, in der Muttersprache zu sprechen, anstatt zu tippen. Mitbegründer Vivek Raghavan betonte die Schwierigkeiten beim Tippen in indischen Sprachen und hob die Vorteile der Sprachinteraktion hervor.
Die von Sarvam angebotenen KI-Agenten können in Plattformen wie WhatsApp integriert werden und traditionelle Telefonanrufe durchführen. Die Preise beginnen bei ₹1 pro Minute. Das Unternehmen hat seine sprachgesteuerten Agenten mit einem Grundmodell namens Sarvam 2B entwickelt, das auf einem Datensatz von 4 Billionen Token basiert, die alle synthetisch erzeugt wurden. Raghavan erklärte die Notwendigkeit, synthetische Daten zu verwenden, da indischer Sprachinhalt im offenen Web nur begrenzt verfügbar ist.
Außerdem startet Sarvam ein Audio-Sprachmodell namens Shuka, das auf dem Saaras v1 Audio-Decoder und Meta’s Llama3-8B Instruct basiert und Open Source sein wird. Darüber hinaus führt das Unternehmen eine generative KI-Werkbank namens A1 ein, die Anwälten bei regulatorischen Recherchen, der Erstellung von Dokumenten, der Redigierung und der Datenextraktion helfen soll.
Sarvam gehört zu einer ausgewählten Gruppe indischer Startups, die KI-Anwendungen fördern, die mit den Interessen des Landes übereinstimmen, und die Bemühungen der Regierung unterstützen, eine maßgeschneiderte KI-Infrastruktur zu entwickeln. Das Programm IndiaAI der Regierung umfasst Initiativen wie die IndiaAI Compute Capacity, die darauf abzielt, einen Supercomputer mit mindestens 10.000 GPUs aufzubauen, und Bhashini, das darauf abzielt, den Zugang zu digitalen Dienstleistungen in verschiedenen indischen Sprachen zu demokratisieren. Raghavan äußerte die Bereitschaft des Unternehmens, mit der Regierung an diesen Initiativen zusammenzuarbeiten.
Wichtigste Erkenntnisse
- Sarvam AI startet einen sprachgesteuerten Bot, der über 10 indische Sprachen unterstützt.
- KI-Agenten kosten ₹1 pro Minute, einsetzbar auf WhatsApp und bei traditionellen Anrufen.
- Das Modell Sarvam 2B, das auf synthetischen Daten trainiert wurde, kostet nur ein Zehntel des Branchenniveaus.
- Das Audio-Sprachmodell Shuka und die A1-KI-Werkbank für rechtliche Anwendungen werden ebenfalls eingeführt.
- Sarvam unterstützt die souveränen KI-Bemühungen Indiens und trägt zum IndiaAI-Programm bei.
Analyse
Die Einführung eines mehrsprachigen, sprachgesteuerten KI-Bots durch Sarvam könnte die sprachliche Vielfalt Indiens angehen und Unternehmen einen leichteren Zugang ermöglichen. Dieser Schritt könnte den Markt stören, indem kosteneffiziente KI-Lösungen zu ₹1 pro Minute angeboten werden, was Auswirkungen auf Wettbewerber und Telekommunikationsanbieter haben könnte. Der Einsatz synthetischer Daten zur Schulung von Modellen verringert die Abhängigkeit von begrenztem Webinhalt und schafft einen Präzedenzfall für die zukünftige KI-Entwicklung in datenarmen Regionen. Langfristig positioniert sich Sarvam durch die Ausrichtung auf IndiaAI-Initiativen, um von der Unterstützung der Regierung beim Aufbau einer nationalen KI-Infrastruktur zu profitieren, was potenziell zu einer breiteren Einführung von KI-Technologien führt, die auf indische Bedürfnisse zugeschnitten sind.
Wussten Sie schon?
- Sarvam 2B Modell:
- Das Sarvam 2B, ein grundlegendes kleines Sprachmodell, das von Sarvam AI entwickelt wurde, wurde speziell auf einem Datensatz von 4 Billionen Token trainiert. Diese Token sind synthetisch erzeugt worden, um die Knappheit an indischem Sprachinhalt im offenen Web zu adressieren. Dieses Modell dient als Rückgrat der sprachgesteuerten KI-Agenten von Sarvam und ermöglicht es ihnen, effektiv mehrere indische Sprachen zu verstehen und zu verarbeiten.
- Shuka Audio-Sprachmodell:
- Das Shuka-Modell, das von Sarvam AI eingeführt wurde, ist dafür konzipiert, gesprochene Spracheingaben zu verarbeiten und zu verstehen. Es basiert auf dem Saaras v1 Audio-Decoder und Meta’s Llama3-8B Instruct und verbessert die Fähigkeiten von Sarvams KI-Agenten im Umgang mit Sprachinteraktionen. Die Integration von Shuka mit Meta’s Llama3-8B Instruct, das Open Source sein wird, zeigt einen kollaborativen Ansatz zur Weiterentwicklung der KI-Technologie in der Sprachverarbeitung.
- A1 Generative KI-Werkbank:
- Die A1-Werkbank, ein spezialisiertes generatives KI-Werkzeug, das von Sarvam AI eingeführt wurde, ist auf rechtliche Fachkräfte zugeschnitten. Sie unterstützt bei verschiedenen Aufgaben wie regulatorischen Recherchen, der Erstellung von Dokumenten, der Redigierung und der Datenextraktion und nutzt KI, um rechtliche Arbeitsabläufe zu optimieren. Dieses Werkzeug erleichtert es Anwälten, große Mengen rechtlicher Dokumente und Daten effizient zu verwalten und zu verarbeiten.