faster-whisper-server output seems something wrong #160

burness · 2024-11-14T15:06:42Z

After a certain segment, all subsequent recognized texts are incorrect：

from openai import OpenAI

client = OpenAI(api_key="cant-be-empty", base_url="http://192.168.31.100:8000/v1/")

audio_file = open("../../examples/test_02.mp3", "rb")
transcript = client.audio.transcriptions.create(
    model="Systran/faster-whisper-large-v3", file=audio_file
)
print(transcript.text)

I use the same file to transcript in faster_whisper, it seems ok

from faster_whisper import WhisperModel

model_size = "large-v3"

model = WhisperModel(model_size, device="cuda")
segments, info = model.transcribe("test_02.mp3", beam_size=5)

print("Detected language '%s' with probability %f" % (info.language, info.language_probability))

for segment in segments:
    print("[%.2fs -> %.2fs] %s" % (segment.start, segment.end, segment.text))

Can anybody help me ?

The text was updated successfully, but these errors were encountered:

burness · 2024-11-14T15:46:29Z

It seems that the default temperature 0 cause this wrong. I change the 0 to 0.7 to solve it.

A small suggestion:

Change the default temperature 0 to 0.7.

burness mentioned this issue Nov 14, 2024

Change the default temperature 0.0 to 0.7 #161

Open

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

faster-whisper-server output seems something wrong #160

faster-whisper-server output seems something wrong #160

burness commented Nov 14, 2024 •

edited

Loading

burness commented Nov 14, 2024

faster-whisper-server output seems something wrong #160

faster-whisper-server output seems something wrong #160

Comments

burness commented Nov 14, 2024 • edited Loading

burness commented Nov 14, 2024

burness commented Nov 14, 2024 •

edited

Loading