| Product Informations - Entwicklungssysteme |
Loquendo VoxNauta Lite
VoxNauta ist eine Software-Plattform für qualitativ hochwertige und einfach zu bedienende Sprachapplikationen. Sie basiert auf den neuesten Releaseständen folgender Technologien: ASR 7.x, TTS 7.x, Speaker Verification und VoiceXML 2.0 W3C compliant Interpreter.
Die Plattform erlaubt den Einsatz vielsprachiger und vielstimmiger Sprachdienste, die über Telefon oder VoIP gesteuert werden können.
VoxNauta bietet verschiedene Installations-Möglichkeiten, um direkt mit einem PSTN/PBX Netzwerk oder über ein Voice-over-IP Netz zu kommunizieren. Diese verschiedenen, einstellbaren Profile reduzieren den Integrationsaufwand auf ein Minimum.
Die VoxNauta Plattform kann so konfiguriert werden, dass drei verschiedene Telefonübertragungstechnologien ausgewählt werden können:
- Analoges Telefon (Loopstart Protokoll), basiert auf NMS bzw. Intel Dialogic Technologie.
- Digitales Telefon (EuroISDN Protokoll) basiert auf NMS Technologie mit Standard Euro ISDN mit DSS1 Signalisierung.
Voice over IP (VoIP) basiert auf dem SIP und RTP Protokoll. Weder spezielle Hardware noch zusätzliche Software wird benötigt.
Loquendo ASR (Automatic Speech Recognition)
Die VoxNauta Plattform ist mit der neuesten Version des qualitativ hochwertigen Spracherkennungssystems, entwickelt von Loquendos Technologieabteilung, ausgerüstet. Der sprecherunabhängige phonetische Erkenner ist mit der innovativen Verschmelzung neuronaler Netze und dem „hidden Markov Modell“ ausgerüstet. Marktinformationen und Tests bei Kunden haben gezeigt, dass die Erkennungsqualität, im Vergleich mit anderen auf dem Markt befindlichen Erkennern, am höchsten eingeschätzt wird.
Loquendo ASR erkennt zuverlässig Worte aus einer kontinuierlich gesprochenen Sprache. Bei sehr großen Sprachbibliotheken und mit lauten Hintergrundgeräuschen, wie z.B. bei Handys oder im Auto, werden sehr hohe Qualitäten erreicht. Unerwünschte Nebengeräusche während der Spracheingabe werden selektiert und adaptiert.
Loquendos ASR kann sofort mit der Erkennung beginnen, sobald eine Sprecherstimme erkannt wird, selbst wenn ein Sprachprompt noch nicht zu Ende abgespielt ist. Diese Eigenschaft ist bekannt als „Barge-in“ und kann entsprechend den Dialoganforderungen speziell angepasst werden.
Loquendos ASR Technologie ist in allen gängigen Sprachen verfügbar und erfüllt alle Spezifikationen von VoiceXML, wie z.B. “N-best”, dass es erlaubt, eine sogenannte Trefferliste (Score List) der am besten passenden Übereinstimmungen mit den Bibliotheksinhalten zu erzeugen.
Zusätzliche Plattformparameter erlauben ein Feintuning einiger ASR Eigenschaften.
Es ist ebenfalls möglich, entweder vorkompilierte Erkennungsobjekte, die auf der Plattform erstellt wurden, oder eine direkt erzeugte Grammatik-Kompilierung, zu benutzen. Die letzte Methode ist hilfreich bei der Erstellung dynamisch erzeugter Erkennungsgrammatiken.
Eine effiziente Prozessorauslastung ermöglicht den Einsatz vieler paralleler Erkennungskanäle. Dadurch wird erreicht, dass eine zuverlässige und schnelle Erkennung, trotz eines sehr großen Vokabulars, erreicht wird. Bei vorkompilierten Grammatiken ist die Erkennungsgeschwindigkeit sogar 10mal schneller, natürlich abhängig von der Komplexität der zu erkennenden Worte.
Unterstützte Grammatikformate:
- W3C SRGS XML
- W3C SRGS ABNF
Loquendo unterstützt auch die SISR W3C Formalismen, die bei der semantischen Interpretation der Grammatik benutzt werden.
Das JSGF (Java Speech Grammar Format) wird unterstützt, von Loquendo erweitert um semantische Regeln der Erkennungsgrammatiken.
Loquendos ASR benutzt die selben phonetischen Beschreibungen wie Loquendos TTS.
Weiterhin bietet Loquendo Produktlösungen im Bereich “Speaker Verification” und “Speaker Identification” an. Mit dieser Technologie können mit einem sogenannten „Voice Print“ (vergleichbar mit einem Fingerabdruck), Personen (Stimmen) erkannt werden.
Loquendo TTS (Text-to-Speech)
Die Sprachsynthesetechnologie, die in die VoxNauta Plattform eingearbeitet ist, beruht auf den neuesten Versionen der Loquendo TTS Produkte, die eine ausgezeichnete und natürlich klingende Sprachsynthese erzeugen.
Loquendos “Unit Selection” mit einer speziellen Verknüpfungstechnik ergibt eine Sprachsynthese, die klar verständlich, natürlich und fließend gesprochen wird.
·Zahlreiche einstellbare Elemente: Lautstärke, Abtastrate, Tonhöhe, Betonung und emotionale Effekte sind einstellbar und können dazu beitragen, maßgeschneiderte Dialoge zu erzeugen, die sowohl spezielle Vorlieben als auch andere mögliche Anforderungen für eine anwenderfreundliche Sprachapplikation erfüllen.
Anwenderlexikon: Loquendos TTS ist in der Lage, ein anwenderspezifisches Lexikon zu erzeugen, in dem spezielle Vokabelausdrücke, Abkürzungen und sogar regional unterschiedliche Aussprachevarianten definiert werden können. Dadurch kann jeder Dialogtext an seine Umgebung angepasst werden.
Umschalten der Stimme: Im Text können verschiedene Stimmen mit verschiedenen Sprachen kontinuierlich umgeschaltet werden.
Mischsprachen: Eine eingestellte Stimme kann verschiedene Sprachen sprechen, ohne dass die Sprecherstimme ausgetauscht werden muß. Mit der Option „Language Guesser“ kann sogar vom System überprüft werden, welcher Sprache ein Wort/Satz angehört, um dann automatisch auf diese Sprachbibliothek umzuschalten.
Viele Sprachen verfügbar: mit dem heutigen Stand können 16 verschiedene Sprachen ausgewählt, bzw. auf einem System installiert werden. Die Auswahl der Sprachen reicht von fast allen europäischen, amerikanischen und südamerikanischen bis hin zu Mandarin Chinesisch. Die hohe Qualität der Sprachen ist die weltweit anerkannte Stärke Loquendos.
Mischen von Audioelementen: mit einfachen Befehlen, die in den Text mit eingearbeitet werden, kann der Benutzer Audioelemente oder Musik mit dem jeweiligen Text vermischen. Mit den Befehlen Mix, Play, Stop, Pause, Resume, Loop und Fading ist eine komplette Steuerung der Audioelemente möglich.
Spezialstimmen: Loquendo bietet die Entwicklung spezieller Stimmen an, die für bestimmte Sachgebiete zugeschnitten sind, wie Informationstechnologie, Sport u.s.w. Diese Möglichkeit erlaubt dem Benutzer eine größtmögliche Anpassung an seine Vorstellungen.
MP3 Audio Format: mp3, wav und raw pcm in a-law und u-law Formaten stehen zur Verfügung.
SSML: Loquendos TTS unterstützt SSML (Speech Synthesis Markup Language) W3C Standard.
Loquendo VoiceXML Interpreter
Loquendo folgt der VoiceXML Version 2.0, im Hinblick auf die Spezifikation des W3C Konsortiums für Voice eXtensible Markup Language (VoiceXML).
Loquendo ist Mitglied der Arbeitsgruppe W3C VBWG (Voice Browser Working Group) und maßgeblich beteiligt an der Erstellung der VoiceXML 2.0 Empfehlung. Im Moment arbeitet die W3C Arbeitsgruppe an der Definition der VoiceXML 2.1 Spezifikation.
Der VoiceXML Interpreter (VoiceXML V.2.0) der VoxNauta Plattform entspricht den Spezifikationen des W3C Konsortiums. Zusätzlich werden einige Erweiterung unterstützt (z.B. für Reporting).
Der Loquendo VoiceXML Interpreter unterstützt ebenfalls ECMA-262 (JavaScript). Mit deren Hilfe kann die Sprachapplikation durchdachte Entscheidungen treffen bzw. entsprechende Daten auf der Client-Seite manipulieren, z.B. zur Validierung der Anrufereingaben.
Der VoiceXML Interpreter kann entfernte Programme aufrufen, wie z.B. ASP, JSP und Servlet, die sich auf einem entfernten Rechner befinden und komplexe Server-Aufgaben wie z.B. Datenbankabfragen (DBMS) und Zugriff auf „legacy systems“ erfüllen, um dynamische VoiceXML Seiten zu erzeugen.
VoxNauta Operation Management
Das VoxNauta Operation Management verwendet ein Modul mit dem Namen “Runtime Tools”. Dieses Modul beinhaltet eine Reihe von Hilfsmitteln für “Operation” und “Maintenance”. Diese Tools sind unter anderem:
- Service Scheduler: hilft dem Administrator bei der Entscheidung, welche Sprachapplikation gestartet werden soll, wenn ein Anruf eingeht.
- Front End Monitor: erlaubt die Statusüberprüfung der physikalischen Telefonleitungen
- Control Bar: erlaubt zahlreiche OA&M Aktivitäten, wie Start/Stop der Plattform, exportieren der Log-Daten und Statistik, Applikationszuteilung etc.
- Web Reporting: liefert Informationen bezüglich der “Call Session”.
- Service Cockpit: gibt Informationen über das Verhalten der Sprachapplikationen im Bezug auf die Spracherkennung. Das Cockpit erlaubt die Analyse des Erkennungsergebnisses, um die ASR Aktivitäten zu überwachen, zu tunen und zu optimieren.
- Platform Monitoring: unterstützt die Überwachung jedes einzelnen Teils der Plattform: Hardware, Betriebssystem und Software Komponente. Das VoxNauta Plattform Überwachungssystem benutzt eine stardardmäßige Methode zum Netzwerkmanagement, basierend auf dem Standard SNMP (Simple Network Management Protocol). Jedes Software Modul innerhalb des VoxNauta Systems besitzt eine eigene Instanz eines SNMP Agenten.
VoxNauta kann auch über das “Loquendo public management protocol“, mit dem Namen I-MS (Interface Management System), kommunizieren. I-MS erlaubt den Zugriff auf die OA&M Tools von VoxNauta.
Logging und Reporting
Jedes Software Modul und jede einzelne Komponente des VoxNauta Systems schreibt eigene Logdaten. Jede dieser Logdateien kann separat mit einer unterschiedlichen Loggingtiefe konfiguriert werden. Das Sammeln der Logdaten erfolgt automatisch und in regelmäßigen Intervallen.
VoxNauta beinhaltet auch vorgefertigte webbasierte Reports für den Plattform-Administrator:
- Plattform-Reports: geben Aufschluss über die tatsächlich verwendeten Ressourcen der Plattform und beantworten u.a. Fragen wie: “Wieviele Anrufe wurden vom Server im letzten Monat abgearbeitet?”
- Service-Reports: geben Aufschluss über die Nutzung der Sprachapplikationen, unabhängig von Struktur und Inhalt.
Loquendo Studio
Loquendo bietet alle Tools an, die für eine korrekte Sprachapplikationsentwicklung notwendig sind, darunter auch die technisch ausgefeilten Software Tools mit dem Namen „Loquendo Studio“. „Loquendo Studio“ ist eine komplette Applikationsentwicklungs- und Testumgebung zur Vereinfachung des Entwicklungsprozesses.
Das Loquendo Studio deckt alle Aktivitäten bezüglich Entwicklung, Konfiguration und Test einer Sprachapplikation ab, ohne das der Entwicklungs-PC eine Telefonleitung benötigt. Es beinhaltet folgende Module:
- Administration Modul: erlaubt die Entwicklung von multi-user und multi-service Applikationen.
- Grammar Test Module: erlaubt das Editieren und Kompilieren der Grammatiken zur Durchführung besonderer Tests der Grammatiken und deren korrekte Benutzung.
- Configuration Module: erlaubt die Konfiguration der Applikations-Parameter, die von der Plattform benötigt werden.
VoiceXML Debugger: erlaubt ein schrittweises Überprüfen (Debugging) des VoiceXML Codes, sogar für VoiceXML Seiten, die dynamisch von einem Applikationsserver erzeugt wurden.
Last Updated (Sunday, 30 August 2009 14:19)




