Spaces:

DHEIVER
/

SeamlessTranslator

Sleeping

App Files Files Community

DHEIVER commited on Jan 18

Commit

2f8841d

verified ·

1 Parent(s): 58e0199

Update app.py

Browse files

Files changed (1) hide show

app.py +168 -112

app.py CHANGED Viewed

@@ -3,197 +3,253 @@ import torch
 import torchaudio
 import numpy as np
 from transformers import AutoProcessor, SeamlessM4Tv2Model
-from datetime import datetime
-class SeamlessTranslator:
     def __init__(self):
         self.model_name = "facebook/seamless-m4t-v2-large"
         print("Loading model...")
         self.processor = AutoProcessor.from_pretrained(self.model_name)
         self.model = SeamlessM4Tv2Model.from_pretrained(self.model_name)
         self.sample_rate = self.model.config.sampling_rate
         self.languages = {
-            "🇺🇸 English": "eng",
-            "🇪🇸 Spanish": "spa",
-            "🇫🇷 French": "fra",
-            "🇩🇪 German": "deu",
-            "🇮🇹 Italian": "ita",
-            "🇵🇹 Portuguese": "por",
-            "🇷🇺 Russian": "rus",
-            "🇨🇳 Chinese": "cmn",
-            "🇯🇵 Japanese": "jpn",
-            "🇰🇷 Korean": "kor"
         }
     def translate_text(self, text, src_lang, tgt_lang, progress=gr.Progress()):
-        progress(0.3, desc="Processing input...")
         try:
             inputs = self.processor(text=text, src_lang=self.languages[src_lang], return_tensors="pt")
-            progress(0.6, desc="Generating audio...")
             audio_array = self.model.generate(**inputs, tgt_lang=self.languages[tgt_lang])[0].cpu().numpy().squeeze()
-            progress(1.0, desc="Done!")
-            return (self.sample_rate, audio_array), f"✅ Translation completed: {src_lang} → {tgt_lang}"
         except Exception as e:
-            raise gr.Error(f"❌ Translation failed: {str(e)}")
     def translate_audio(self, audio_path, tgt_lang, progress=gr.Progress()):
-        if audio_path is None:
-            raise gr.Error("❌ Please upload an audio file")
-        progress(0.3, desc="Loading audio...")
         try:
             audio, orig_freq = torchaudio.load(audio_path)
             audio = torchaudio.functional.resample(audio, orig_freq=orig_freq, new_freq=16000)
             progress(0.6, desc="Translating...")
             inputs = self.processor(audios=audio, return_tensors="pt")
             audio_array = self.model.generate(**inputs, tgt_lang=self.languages[tgt_lang])[0].cpu().numpy().squeeze()
-            progress(1.0, desc="Done!")
-            return (self.sample_rate, audio_array), "✅ Audio translation completed"
         except Exception as e:
-            raise gr.Error(f"❌ Translation failed: {str(e)}")
 css = """
 .gradio-container {
     max-width: 1200px !important;
-    margin: auto !important;
 }
-.main-header {
     text-align: center;
-    margin-bottom: 2rem;
-    padding: 2rem;
-    background: linear-gradient(135deg, #1e40af, #3b82f6);
-    border-radius: 12px;
     color: white;
 }
-.main-title {
-    font-size: 2.5rem;
-    font-weight: bold;
-    margin-bottom: 0.5rem;
 }
-.main-subtitle {
-    font-size: 1.2rem;
     opacity: 0.9;
 }
-.container {
-    padding: 1.5rem;
-    border-radius: 12px;
     background: white;
-    box-shadow: 0 1px 3px rgba(0, 0, 0, 0.1);
-    margin-bottom: 1.5rem;
 }
-.status-box {
-    padding: 1rem;
-    border-radius: 8px;
-    background: #f0f9ff;
-    border-left: 4px solid #3b82f6;
-    margin-top: 1rem;
 }
 .footer {
     text-align: center;
-    margin-top: 2rem;
-    padding: 1rem;
-    color: #666;
 }
 """
 def create_ui():
-    translator = SeamlessTranslator()
-    with gr.Blocks(css=css, title="A.R.I.S. Translator") as demo:
         gr.HTML(
             """
-            <div class="main-header">
-                <div class="main-title">A.R.I.S. Translator</div>
-                <div class="main-subtitle">Advanced Real-time Interpretation System</div>
             </div>
             """
         )
         with gr.Tabs():
             # Text Translation Tab
-            with gr.Tab("🔤 Text Translation"):
-                with gr.Row():
-                    with gr.Column():
-                        text_input = gr.Textbox(
-                            label="Text to Translate",
-                            placeholder="Enter your text here...",
-                            lines=5
                         )
-                        with gr.Row():
-                            src_lang = gr.Dropdown(
-                                choices=list(translator.languages.keys()),
-                                value="🇺🇸 English",
-                                label="Source Language"
-                            )
-                            tgt_lang = gr.Dropdown(
-                                choices=list(translator.languages.keys()),
-                                value="🇪🇸 Spanish",
-                                label="Target Language"
-                            )
-                        translate_btn = gr.Button("🔄 Translate", variant="primary")
-                        status_text = gr.Textbox(
-                            label="Status",
-                            interactive=False
-                        )
-                    with gr.Column():
-                        audio_output = gr.Audio(
-                            label="Translation Output",
-                            type="numpy"
                         )
             # Audio Translation Tab
-            with gr.Tab("🎤 Audio Translation"):
-                with gr.Row():
-                    with gr.Column():
-                        audio_input = gr.Audio(
-                            label="Upload Audio",
-                            type="filepath"
-                        )
-                        tgt_lang_audio = gr.Dropdown(
-                            choices=list(translator.languages.keys()),
-                            value="🇺🇸 English",
-                            label="Target Language"
-                        )
-                        translate_audio_btn = gr.Button("🔄 Translate Audio", variant="primary")
-                        status_text_audio = gr.Textbox(
-                            label="Status",
-                            interactive=False
-                        )
-                    with gr.Column():
-                        audio_output_from_audio = gr.Audio(
-                            label="Translation Output",
-                            type="numpy"
-                        )
         gr.HTML(
             """
             <div class="footer">
-                Powered by Meta's SeamlessM4T model | Built with Gradio
             </div>
             """
         )
         # Event handlers
         translate_btn.click(
-            fn=translator.translate_text,
             inputs=[text_input, src_lang, tgt_lang],
-            outputs=[audio_output, status_text]
         )
         translate_audio_btn.click(
-            fn=translator.translate_audio,
             inputs=[audio_input, tgt_lang_audio],
-            outputs=[audio_output_from_audio, status_text_audio]
         )
     return demo

 import torchaudio
 import numpy as np
 from transformers import AutoProcessor, SeamlessM4Tv2Model
+class TranslationModel:
     def __init__(self):
         self.model_name = "facebook/seamless-m4t-v2-large"
         print("Loading model...")
         self.processor = AutoProcessor.from_pretrained(self.model_name)
         self.model = SeamlessM4Tv2Model.from_pretrained(self.model_name)
         self.sample_rate = self.model.config.sampling_rate
         self.languages = {
+            "English": "eng",
+            "Spanish": "spa",
+            "French": "fra",
+            "German": "deu",
+            "Italian": "ita",
+            "Portuguese": "por",
+            "Russian": "rus",
+            "Chinese": "cmn",
+            "Japanese": "jpn",
+            "Korean": "kor"
         }
     def translate_text(self, text, src_lang, tgt_lang, progress=gr.Progress()):
         try:
+            progress(0.3, desc="Processing...")
             inputs = self.processor(text=text, src_lang=self.languages[src_lang], return_tensors="pt")
+            progress(0.6, desc="Generating...")
             audio_array = self.model.generate(**inputs, tgt_lang=self.languages[tgt_lang])[0].cpu().numpy().squeeze()
+            progress(1.0, desc="Complete")
+            return (self.sample_rate, audio_array)
         except Exception as e:
+            raise gr.Error(str(e))
     def translate_audio(self, audio_path, tgt_lang, progress=gr.Progress()):
+        if not audio_path:
+            raise gr.Error("Please upload an audio file")
         try:
+            progress(0.3, desc="Processing...")
             audio, orig_freq = torchaudio.load(audio_path)
             audio = torchaudio.functional.resample(audio, orig_freq=orig_freq, new_freq=16000)
             progress(0.6, desc="Translating...")
             inputs = self.processor(audios=audio, return_tensors="pt")
             audio_array = self.model.generate(**inputs, tgt_lang=self.languages[tgt_lang])[0].cpu().numpy().squeeze()
+            progress(1.0, desc="Complete")
+            return (self.sample_rate, audio_array)
         except Exception as e:
+            raise gr.Error(str(e))
 css = """
+:root {
+    --primary-color: #2D3648;
+    --secondary-color: #5E6AD2;
+    --background-color: #F5F7FF;
+    --text-color: #2D3648;
+    --border-radius: 12px;
+    --spacing: 20px;
+}
 .gradio-container {
+    background-color: var(--background-color) !important;
+}
+.main-container {
     max-width: 1200px !important;
+    margin: 0 auto !important;
+    padding: var(--spacing) !important;
 }
+.app-header {
     text-align: center;
+    padding: 40px 20px;
+    background: linear-gradient(45deg, var(--primary-color), var(--secondary-color));
+    border-radius: var(--border-radius);
     color: white;
+    margin-bottom: var(--spacing);
 }
+.app-title {
+    font-size: 2.5em;
+    font-weight: 700;
+    margin-bottom: 10px;
 }
+.app-subtitle {
+    font-size: 1.2em;
     opacity: 0.9;
 }
+.content-block {
     background: white;
+    padding: var(--spacing);
+    border-radius: var(--border-radius);
+    box-shadow: 0 4px 6px rgba(0, 0, 0, 0.05);
+    margin-bottom: var(--spacing);
+}
+.gr-button {
+    background: var(--secondary-color) !important;
+    border: none !important;
+    color: white !important;
 }
+.gr-button:hover {
+    box-shadow: 0 4px 10px rgba(94, 106, 210, 0.3) !important;
+    transform: translateY(-1px);
+}
+.gr-input, .gr-select {
+    border-radius: 8px !important;
+    border: 2px solid #E5E7EB !important;
+    padding: 12px !important;
+}
+.gr-input:focus, .gr-select:focus {
+    border-color: var(--secondary-color) !important;
+    box-shadow: 0 0 0 3px rgba(94, 106, 210, 0.1) !important;
+}
+.gr-form {
+    background: white !important;
+    padding: var(--spacing) !important;
+    border-radius: var(--border-radius) !important;
+    box-shadow: 0 4px 6px rgba(0, 0, 0, 0.05) !important;
+}
+.gr-box {
+    border-radius: var(--border-radius) !important;
+    border: none !important;
+    box-shadow: 0 4px 6px rgba(0, 0, 0, 0.05) !important;
 }
 .footer {
     text-align: center;
+    color: var(--text-color);
+    padding: var(--spacing);
+    opacity: 0.8;
+}
+/* Custom Tabs Styling */
+.tab-nav {
+    background: white !important;
+    padding: 10px !important;
+    border-radius: var(--border-radius) !important;
+    margin-bottom: var(--spacing) !important;
+}
+.tab-nav button {
+    border-radius: 8px !important;
+    padding: 12px 24px !important;
+}
+.tab-nav button.selected {
+    background: var(--secondary-color) !important;
+    color: white !important;
 }
 """
 def create_ui():
+    model = TranslationModel()
+    with gr.Blocks(css=css, title="AI Language Translator") as demo:
         gr.HTML(
             """
+            <div class="app-header">
+                <div class="app-title">AI Language Translator</div>
+                <div class="app-subtitle">Powered by Neural Machine Translation</div>
             </div>
             """
         )
         with gr.Tabs():
             # Text Translation Tab
+            with gr.Tab("Text to Speech"):
+                with gr.Column(variant="panel"):
+                    gr.Markdown("### Enter Text")
+                    text_input = gr.Textbox(
+                        label="",
+                        placeholder="Type or paste your text here...",
+                        lines=4
+                    )
+                    with gr.Row():
+                        src_lang = gr.Dropdown(
+                            choices=sorted(model.languages.keys()),
+                            value="English",
+                            label="From"
                         )
+                        tgt_lang = gr.Dropdown(
+                            choices=sorted(model.languages.keys()),
+                            value="Spanish",
+                            label="To"
                         )
+                    translate_btn = gr.Button("Translate", size="lg")
+                    gr.Markdown("### Translation Output")
+                    audio_output = gr.Audio(
+                        label="",
+                        type="numpy",
+                        show_download_button=True
+                    )
             # Audio Translation Tab
+            with gr.Tab("Speech to Speech"):
+                with gr.Column(variant="panel"):
+                    gr.Markdown("### Upload Audio")
+                    audio_input = gr.Audio(
+                        label="",
+                        type="filepath",
+                        sources=["upload", "microphone"]
+                    )
+                    tgt_lang_audio = gr.Dropdown(
+                        choices=sorted(model.languages.keys()),
+                        value="English",
+                        label="Translate to"
+                    )
+                    translate_audio_btn = gr.Button("Translate Audio", size="lg")
+                    gr.Markdown("### Translation Output")
+                    audio_output_from_audio = gr.Audio(
+                        label="",
+                        type="numpy",
+                        show_download_button=True
+                    )
         gr.HTML(
             """
             <div class="footer">
+                Built with ❤️ using Meta's SeamlessM4T and Gradio
             </div>
             """
         )
         # Event handlers
         translate_btn.click(
+            fn=model.translate_text,
             inputs=[text_input, src_lang, tgt_lang],
+            outputs=audio_output
         )
         translate_audio_btn.click(
+            fn=model.translate_audio,
             inputs=[audio_input, tgt_lang_audio],
+            outputs=audio_output_from_audio
         )
     return demo