Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Vorschlag zur Erweiterung des OpenAI-Audiobook-Generators um automatische Übersetzungsfunktion #9

Open
Soliver84 opened this issue Feb 20, 2024 · 3 comments

Comments

@Soliver84
Copy link

Soliver84 commented Feb 20, 2024

Sehr geehrter Morpheus,

Ich weis nicht wo ich dir das schicken sollte deswegen hier.

Mein Name ist Alex, und ich bin ein begeisterter Nutzer von Technologien zur Sprachverarbeitung und -synthese. Mit großem Interesse verfolge ich die Entwicklungen im Bereich der künstlichen Intelligenz und bin überzeugt von deren Potenzial, die Zugänglichkeit von digitalen Inhalten global zu verbessern. In diesem Zusammenhang möchte ich Ihnen eine Idee vorstellen, die, wie ich glaube, die Vielseitigkeit und Reichweite des OpenAI-Audiobook-Generators signifikant erweitern könnte.

Die Kernidee besteht darin, eine Funktion zu implementieren, die es ermöglicht, englischsprachige YouTube-Videos automatisch ins Deutsche zu übersetzen, indem die Transkriptions- und Zeitmarkenfunktionen von YouTube genutzt werden. Durch die Anwendung fortschrittlicher Übersetzungstechnologie in Kombination mit Sprachsynthesemethoden könnte eine Lösung entwickelt werden, die automatisch übersetzte Inhalte mit den entsprechenden Zeitmarken synchronisiert. Anschließend könnte mit Tools wie ffmpeg ein neues Video mit deutscher Sprachausgabe erstellt werden.

Für die Realisierung der Sprachsynthese könnte das Open-Source-Projekt "Real-Time Voice Cloning" genutzt werden. Dieses Projekt ermöglicht es, eine synthetische Stimme zu erzeugen kostenlos lokal, die in hoher Qualität gesprochene Inhalte wiedergibt:

GitHub-Projekt für Voice Cloning: https://github.com/CorentinJ/Real-Time-Voice-Cloning
Deutsche Sprachanpassung: https://github.com/padmalcom/Real-Time-Voice-Cloning-German/tree/main
Kurs zur Sprachsynthese (auf Deutsch): https://www.udemy.com/course/voice-cloning/
Ich bin mir der technischen und rechtlichen Herausforderungen bewusst, die mit der Umsetzung einer solchen Idee verbunden sind, insbesondere in Bezug auf Urheberrechte und die Qualität der automatischen Übersetzungen. Dennoch bin ich überzeugt, dass die potenziellen Vorteile für die Zugänglichkeit und Diversität der Inhalte diese Herausforderungen rechtfertigen könnten.

Ich würde mich sehr freuen, wenn wir die Möglichkeit hätten, diese Idee weiter zu diskutieren. Vielleicht sehen Sie Wege, wie OpenAI diese Initiative unterstützen könnte, oder Sie haben Vorschläge zur Verbesserung und Weiterentwicklung des Konzepts. Ich bin überzeugt, dass wir gemeinsam einen bedeutenden Beitrag zur Förderung der globalen Zugänglichkeit und Vielfalt digitaler Inhalte leisten können.

Vielen Dank für Ihre Zeit und Aufmerksamkeit. Ich freue mich auf Ihre Antwort und stehe gerne für weitere Fragen oder einen detaillierteren Austausch zur Verfügung.

Mit freundlichen Grüßen,
Alex

@TheMorpheus407
Copy link
Owner

Hi Alex,

Passt hier glaube ich nicht so ganz rein, daher gerne per Mail (Impressum).
Aber allgemein kann ich dazu sagen: ja, genau das habe ich schon so implementiert, allerdings die andere Richtung, also für meine Videos von Deutsch nach Englisch.
Leider gibt's einen großen Haken: YouTube weigert sich auch nach dem 5. Mal fragen meinerseits mir die Funktion zu mehrsprachigen Videos zu geben. Sprich ich kann die englische Tonspur nicht hochladen. Auf diese Funktion warte ich seither.

Liebe Grüße

@Soliver84
Copy link
Author

HI ist des online kann man auch von Englsich nach Deutsch? :)

@Soliver84
Copy link
Author

Was möchtest du dafür ich brauch das :)

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants