Veröffentlicht inScience

Googles KI kann einzelne Stimmen unterscheiden

Google-Entwicklern ist es gelungen, ihre künstliche Intelligenz darauf zu trainieren, den Individuen einer Menschenmenge ihre korrekten Stimmen zuzuordnen.

Menschenmenge (illustriert)
Googles künstliche Intelligenz kann Stimmen isolieren und zuordnen. Foto: imago/Ikon Images

Auf Partys oder in größeren Menschenmengen fällt es uns als Menschen in der Regel nicht allzu schwer, einzelnen Personen in unserem Kopf die richtige Stimme zuzuordnen, sodass wir den richtigen Personen antworten können. In der Psychologie nennt sich dieses Phänomen auch „Cocktailparty-Effekt“. Computer haben damit schon ein größeres Problem.

KI in Party-Stimmung

Umso erstaunlicher ist es, was die Entwickler der Google KI nun erreicht haben. Engadget berichtet, dass diese virtuelle „Partys“ erschaffen hätten, um der künstlichen Intelligenz beizubringen, Geräusche voneinander zu unterscheiden und somit einzelne Stimmen zu separieren. Hierfür zerlegt die KI die Geräuschkulisse in einzelne Audio-Stränge und isoliert die relevanten Stimmen von den Hintergrundgeräuschen.

An dieser Stelle befindet sich ein externer Inhalt von YouTube, der von unserer Redaktion empfohlen wird. Er ergänzt den Artikel und kann mit einem Klick angezeigt und wieder ausgeblendet werden.

Ich bin damit einverstanden, dass mir dieser externe Inhalt angezeigt wird. Es können dabei personenbezogene Daten an den Anbieter des Inhalts und Drittdienste übermittelt werden.

Mit der Hilfe von Kameras analysiert das System außerdem Gesichter, sodass es im Anschluss der korrekten Person deren Stimme zugewiesen werden kann, um ihr „zuzuhören“. Somit kann die KI eine klare Tonaufnahme von dem machen, was ein Mensch sagt, indem sie sich schlichtweg auf dessen Gesicht fokussiert – das funktioniert sogar, wenn der Mund durch ein Mikrofon oder ähnliches zeitweilig verdeckt wird.

Potentielle Anwendungen

Google arbeitet stetig weiter an seiner KI und versucht herauszufinden, inwiefern sich die neue Entwicklung in bestehende Systeme integrieren lässt. So will man die Technologie beispielsweise als Hör-Unterstützung nutzen, um Menschen, die vor einem stehen, mit Hilfe der Smartphone-Kameras besser zu verstehen.

———-

Das könnte ebenfalls interessant sein:

———-

Google ist nicht allein

Auch andere Hersteller arbeiten an der künstlichen Intelligenz. Mit Headsets wollen einige von ihnen beispielsweise Gedanken in Schrift umwandeln, sodass der Nutzer nicht einmal mehr die Finger auf eine Tastatur legen muss. Andere wiederum wollen mit ihrer Hilfe Autounfälle vermeiden oder Alzheimer behandeln. Die Anwendungsgebiete der künstlichen Intelligenz haben bisher keine Grenzen.

Du willst mehr von uns lesen? Folge uns auf Google News.