Automatisierung im Gaming-Bereich

Effizienz in einer Kreativbranche


In Sachen Aufzeichnungstechnik für Audio findet derzeit eine stille Revolution statt. Plattformen werden in die Cloud verlagert, wodurch Produktionssteigerungen und Vorteile erzielt werden, die bei der Lokalisierung von Texten schon seit Jahren als selbstverständlich angesehen werden. Lionbridge Gaming unterstützt diesen Trend mit seiner Cloud-basierten Produktionsplattform, die speziell für die Audioproduktion von Games entwickelt wurde.

Durch Automatisierung lässt sich die Produktivität steigern, die Anzahl menschlicher Fehler reduzieren und die Erfahrung der Nutzer optimieren, indem ihre Aufgaben vereinfacht werden und langweilige Tasks wegfallen. Doch Automatisierung kann auch ein Hindernis für den kreativen Prozess darstellen: Wie oft hat die Texterkennungsfunktion auf Ihrem Smartphone nicht schon Ihre individuellen Nachrichten durch standardisierte, mechanische Textbausteine ersetzt?

Auf der Grundlage solcher Erfahrungen ist es nicht verwunderlich, dass der Vorschlag, Automatisierung in kreativen Bereichen einzuführen, häufig auf Ablehnung stößt. Kreativität darf und muss Regeln brechen, denn hierbei geht es um die Freiheit, fachkundige Entscheidungen umzusetzen oder sich (manchmal wortwörtlich) nicht an das Skript zu halten. Wie bekommen wir diese widersprüchlichen Anforderungen unter einen Hut?

Das Zusammenspiel von Dingen und Menschen

Dinge und Menschen miteinander zu verbinden, wirkt auf den ersten Blick nicht wie eine Automatisierung, und das ist in der Kreativbranche erst einmal positiv! Das Endergebnis ist jedoch gleich: Abläufe von geringer Wertschöpfung werden von Maschinen übernommen. Früher umfasste ein Großteil der Workflows in der Audioproduktion den Austausch von Content und Daten zwischen Studios auf der ganzen Welt, zwischen Personen im gleichen Team sowie von Toolset zu Toolset.

Indem wir Tools und Teams auf einer einzigen Produktionsplattform vereinen, wird dieser Austausch von Daten überflüssig, und der Output eines Arbeitsschritts wird unmittelbar zum Input für den nächsten. In Lionbridge Games Cloud for Audio bedeutet das konkret, dass der vom Steuerungsteam zum Skriptmanagement eingestellte Inhalt gleichzeitig die Basis für die Lokalisierung durch alle Teams ist und für die automatisierte Überprüfung der Assets herangezogen wird. Basierend auf diesen Assets werden Recording-Sessions u. a. für die Batch-Verarbeitung und die Qualitätssicherung generiert.

Das Verbinden von Workflow-Schritten bringt zudem Teammitglieder zusammen, die vorher möglicherweise mit ganz unterschiedlicher Software gearbeitet haben: den mit der Skriptadaption betrauten Sprachler, die Sprecherregie im Studio und die für die Nachbearbeitung zuständige Tontechnikerin oder den LQA-Tester. In unserer Cloud-Lösung für Games sind alle diese Personen in Echtzeit verbunden. Sie arbeiten mit dem gleichen Toolset und kommunizieren über Kommentare und Fragen, die dem Text beliebig hinzugefügt werden können. So entfällt die Notwendigkeit eines zusätzlichen Toolsets für die Kommunikation, und es entsteht ein gemeinschaftlicher Arbeitsbereich, der den kreativen Prozess unterstützt.

Durch das Verbinden von Dingen und Personen werden Automatisierungsziele fast beiläufig erreicht, und gleichzeitig wird die kreative Zusammenarbeit gefördert. Das Wort „Automatisierung“ braucht dabei nicht einmal zu fallen!

Automatisierung konzipiert für die Integration mit Fachprozessen

Fragen Sie doch einmal einen Tontechniker sechs Wochen nach seiner Ausbildung, wie Audiodateien für Spiele nachbearbeitet werden. Als Antwort erhalten Sie eine übersichtliche Liste mit allen erforderlichen Schritten: beste Voraussetzungen für die Automatisierung! Wenn Sie den gleichen Experten fünf Jahre später noch einmal vor diese Aufgabe stellen, fragt er wohl eher verwundert zurück, wie das denn gemeint sei.

Dieses Phänomen wurde erstmals von Softwareteams bemerkt, die in den 1970er-Jahren mit Expertensystemen arbeiteten. Experten folgen nicht ausgetretenen Pfaden, sie gehen vielmehr neue Wege, indem sie fortwährend – und dabei oft unbewusst – ihre Prozesse an die Besonderheiten einer bestehenden Aufgabe anpassen.  Wenn aber schon die Automatisierung von Expertenaufgaben schwierig ist, wie sieht es dann erst mit kreativen Ansätzen aus?

Was ist hier möglich? Erst einmal ist die Erkenntnis entscheidend, dass eine Automatisierung niemals der Experte eines Prozesses ist. Eine Automatisierung kommt zum Zug, wenn der Experte dies entscheidet und die Parameter dafür bestimmt. Beispielsweise kennt die Lionbridge Games Cloud for Audio selbstverständlich die Zeitdauerbegrenzung für Standardaufzeichnungen von Games. Wenn der Experte jedoch den Wert der Übereinstimmung mit dem Quellaudio auf +/- 27 % („Match Source Duration +/- 27%”) einstellt, setzt die Software diese Anweisung pflichtgetreu um und warnt die Nutzer, wenn das Zielaudio diese Einschränkung nicht erfüllt.

Zweitens geschieht es häufig, dass Experten Prozesse an einzelne Zeilen anpassen und darauf zuschneiden. Daher lassen sich Automatisierungs- und Batch-Prozesse in Lionbridge Games Cloud für jede Audiozeile individuell konfigurieren: Es können jederzeit Mini-Batch-Prozesse, die die Konfiguration überschreiben, für beliebig ausgewählte Zeilen ausgeführt werden. Das gilt auch für Situationen, in denen es vielleicht noch gar keine passende Lösung gibt, weil weitere Informationen ausstehen. Voice Directors, die im Studio mit Lionbridge Games Cloud arbeiten, können mit einem einzigen Klick alternative Takes als neue Zeilen einfügen.

Durch die Bereitstellung von schnell konfigurierbaren und schnell anwendbaren Automatisierungselementen für kleinere Blöcke können kreative Teams diese zeitsparenden Schritte als Bausteine in den Prozess integrieren, den der Experte im Allgemeinen spontan aufsetzt. So behält der Experte stets die Kontrolle und hat gleichzeitig die Möglichkeit, Regeln gegebenenfalls außer Kraft zu setzen. Durch die automatisierten Prüfungen in Lionbridge Games Cloud erhalten die zuständigen Teams (wie etwa die Qualitätssicherung) eine Meldung, wenn und wann Regeln gebrochen wurden. Die integrierte Kommunikation sorgt außerdem dafür, dass jeder die Gründe hierfür erfährt und bestätigen kann, dass diese angemessen sind.

So behält der Experte stets die Kontrolle und hat gleichzeitig die Möglichkeit, Regeln gegebenenfalls außer Kraft zu setzen.

Stärkung und Unterstützung von Experten

Dieser auf den Menschen fokussierte Ansatz zur Automatisierung erkennt, dass kreative Köpfe in manchen Fällen eine Aufgabe einfach deutlich besser ausführen als jeglicher verfügbare automatisierte Prozess. Allerdings kann es immer noch Bereiche geben, in denen sich die Benutzerfreundlichkeit verbessern lässt.   

Abweichungen zwischen Skript und Audio stellen beispielsweise die häufigsten Audio-Fehler dar. QA- und LQA-Teams ist klar, dass es Abweichungen im Content gibt – sie müssen sie nur finden! Das entspricht der Suche nach der sprichwörtlichen Nadel im Heuhaufen und erfordert das mehrmalige genaue Anhören jeder einzelnen Audiodatei. Unsere Cloud-Lösung für Games nutzt Sprache-zu-Text-Funktionalität (STT), um den Inhalt von Audiodateien in Strings zu extrahieren und diese mit dem Skript abzugleichen.

STT funktioniert zwar hervorragend für Filme und Videokonferenzen, die ungewöhnlichen Sätze, Wörter und meist kurzen Zeilen in Spielen machen der Funktion jedoch teilweise zu schaffen. So kann eine hohe Anzahl falscher Negativwerte generiert werden. Mit unserer verbesserten Technologie STT+ haben wir erhebliche Fortschritte bei der Genauigkeit der Erkennung von Abweichungen erzielt. Ungefähr 85 Prozent der Zeilen – variierend je nach Sprache – können definitiv als „Einwandfrei!“ markiert werden. Die verbleibenden 15 Prozent des „Heuhaufens“ werden zur Weiterbearbeitung an eine Fachkraft gesendet.

Dank einem visuellen Vergleich (rot/blau) von Audio- und Skript-Strings genügt es dann, dass der Nutzer den Content überfliegt und sich daraufhin ausschließlich die Audio-Stellen anhört, die als potenziell abweichend markiert sind. Jede einzelne Nadel im Heuhaufen zu finden, lässt sich so durch eine Kombination aus Automatisierung und menschlicher Fachkompetenz vereinfachen. Darüber hinaus werden die Informationen in einer Form präsentiert, die dem Nutzer die Weiterverarbeitung besonders einfach macht.

Für die Erkennung von Verstößen gegen zeitliche Beschränkungen ist unser Ansatz ähnlich: Anhand einer automatisierten Prüfung werden potenzielle Fehler ermittelt, woraufhin visuelle Anhaltspunkte bei der Entscheidung unterstützen, ob eine Fehlerkorrektur erforderlich ist. Für synchronisierte Audioaufnahmen, bei denen auch die Sprechpausen im Quell- und Zielaudio übereinstimmen müssen, werden die Signalformen von Quelle und Ziel überlagert und die Pausen (Stille) visuell markiert. So sieht der Nutzer auf den ersten Blick, wie genau die Pausen übereinstimmen, und kann fachkundig entscheiden, ob diese Übereinstimmung für den fraglichen Kontext ausreicht.

Verbesserungen als Zusammenspiel

Wie die Entwicklungsteams für Games seit jeher wissen, hat eine angemessene Automatisierung in kreativen Branchen ihre Berechtigung. Das gilt auch für Voice-Aufnahmen von Spielen. Allerdings ist „angemessen“ hier das entscheidende Wort, denn Automatisierung kann die menschliche Komponente nicht ersetzen. Routinemäßige, repetitive Aufgaben sollten automatisiert werden. Kreative Prozesse hingegen, die Menschen besser ausführen, sollten von Experten wahrgenommen werden.

Anstelle von Funktionen wie der Autokorrektur auf Ihrem Smartphone, die Änderungen selbsttätig durchführen, brauchen wir mehr Tools wie die Rechtschreibprüfung in Textverarbeitungsprogrammen, die mögliche Fehler hervorheben. Das heißt, wir brauchen Tools, bei denen der Experte die Kontrolle behält und das Sagen hat und die Ihnen die Freiheit geben, Regeln zu ignorieren und kreativ zu sein.


linkedin sharing button
  • #audio
  • #blog_posts
AUTHOR
Nicolas Underwood