Spaces:

Abhishek279
/

Video_Transcription_Analysis

Running

Abhishek279 commited on 1 day ago

Commit

1ed4703

verified ·

1 Parent(s): 4fc3c42

Update src/streamlit_app.py

Files changed (1) hide show

src/streamlit_app.py CHANGED Viewed

@@ -1104,6 +1104,13 @@ if language_option == "Specify Language":
     )
     selected_language = language_codes[selected_language_name]
 # Load models
 with st.spinner(f"Loading models..."):
     model = load_whisper_model(model_size)
@@ -1209,8 +1216,17 @@ if uploaded_file is not None:
                     "best_of": 1,  # Use single best result
                     "beam_size": 5,  # Beam search size for better accuracy
                 }
-                if selected_language:
-                    transcribe_options["language"] = selected_language
                 # Show progress
                 progress_placeholder = st.empty()

     )
     selected_language = language_codes[selected_language_name]
+# Translation option: always output English text (for Hindi and other languages)
+translate_to_english = st.sidebar.checkbox(
+    "Translate non-English speech to English text",
+    value=True,
+    help="When enabled, Whisper will output English text even if the speakers are talking in Hindi or other languages."
+)
 # Load models
 with st.spinner(f"Loading models..."):
     model = load_whisper_model(model_size)
                     "best_of": 1,  # Use single best result
                     "beam_size": 5,  # Beam search size for better accuracy
                 }
+                # Language and translation handling
+                if translate_to_english:
+                    # Ask Whisper to translate any non-English speech into English text
+                    transcribe_options["task"] = "translate"
+                    # If the user explicitly selected a source language (e.g. Hindi), pass it as the input language
+                    if selected_language and selected_language != "en":
+                        transcribe_options["language"] = selected_language
+                else:
+                    # Normal transcription in the spoken language
+                    if selected_language:
+                        transcribe_options["language"] = selected_language
                 # Show progress
                 progress_placeholder = st.empty()