Make Voxtral the only transcription provider

2026-06-09 16:54:54 +03:00
parent 5c965be8c9
commit 9bd6d726f0
15 changed files with 128 additions and 900 deletions
--- a/internal/config/config.go
+++ b/internal/config/config.go
@@ -14,27 +14,17 @@ type Config struct {
 	MigrateOnStart bool
 	APIAuthToken   string

-	LLMBaseURL             string
-	LLMAPIKey              string
-	LLMModel               string
-	LLMTimeout             time.Duration
-	TranscriptionProviders []string
-	WhisperXURL            string
-	WhisperXTimeout        time.Duration
-	WhisperXLeadSilence    time.Duration
-	QwenAudioBaseURL       string
-	QwenAudioAPIKey        string
-	QwenAudioModel         string
-	QwenAudioTimeout       time.Duration
-	VoxtralBaseURL         string
-	VoxtralAPIKey          string
-	VoxtralModel           string
-	VoxtralTimeout         time.Duration
-	AudioLLMMaxTokens      int
-	AudioLLMPrompt         string
-	FfmpegPath             string
-	AIStatsSidecarURL      string
-	AIStatsTimeout         time.Duration
+	LLMBaseURL        string
+	LLMAPIKey         string
+	LLMModel          string
+	LLMTimeout        time.Duration
+	VoxtralBaseURL    string
+	VoxtralAPIKey     string
+	VoxtralModel      string
+	VoxtralTimeout    time.Duration
+	AudioLLMPrompt    string
+	AIStatsSidecarURL string
+	AIStatsTimeout    time.Duration

 	WorkerID            string
 	WorkerHTTPHost      string
@@ -54,27 +44,17 @@ func Load() Config {
 		MigrateOnStart: envBool("MIGRATE_ON_START", true),
 		APIAuthToken:   envString("AI_SERVICE_TOKEN", ""),

-		LLMBaseURL:             envString("LLM_BASE_URL", ""),
-		LLMAPIKey:              envString("LLM_API_KEY", ""),
-		LLMModel:               envString("LLM_MODEL", "qwen2.5-14b"),
-		LLMTimeout:             envDuration("LLM_TIMEOUT", 5*time.Minute),
-		TranscriptionProviders: envCSVDefault("TRANSCRIPTION_PROVIDERS", []string{"whisperx"}),
-		WhisperXURL:            envString("WHISPERX_URL", ""),
-		WhisperXTimeout:        envDuration("WHISPERX_TIMEOUT", 10*time.Minute),
-		WhisperXLeadSilence:    envDuration("WHISPERX_LEAD_SILENCE", 800*time.Millisecond),
-		QwenAudioBaseURL:       envString("QWEN_AUDIO_BASE_URL", envString("AUDIO_LLM_BASE_URL", "")),
-		QwenAudioAPIKey:        envString("QWEN_AUDIO_API_KEY", envString("AUDIO_LLM_API_KEY", envString("LLM_API_KEY", ""))),
-		QwenAudioModel:         envString("QWEN_AUDIO_MODEL", "Qwen/Qwen2-Audio-7B-Instruct"),
-		QwenAudioTimeout:       envDuration("QWEN_AUDIO_TIMEOUT", envDuration("AUDIO_LLM_TIMEOUT", 10*time.Minute)),
-		VoxtralBaseURL:         envString("VOXTRAL_BASE_URL", envString("AUDIO_LLM_BASE_URL", "")),
-		VoxtralAPIKey:          envString("VOXTRAL_API_KEY", envString("AUDIO_LLM_API_KEY", envString("LLM_API_KEY", ""))),
-		VoxtralModel:           envString("VOXTRAL_MODEL", "mistralai/Voxtral-Small-24B-2507"),
-		VoxtralTimeout:         envDuration("VOXTRAL_TIMEOUT", envDuration("AUDIO_LLM_TIMEOUT", 10*time.Minute)),
-		AudioLLMMaxTokens:      envInt("AUDIO_LLM_MAX_TOKENS", 4096),
-		AudioLLMPrompt:         envString("AUDIO_LLM_PROMPT", defaultAudioLLMPrompt()),
-		FfmpegPath:             envString("FFMPEG_PATH", "/usr/bin/ffmpeg"),
-		AIStatsSidecarURL:      envString("AI_STATS_SIDECAR_URL", ""),
-		AIStatsTimeout:         envDuration("AI_STATS_TIMEOUT", 8*time.Second),
+		LLMBaseURL:        envString("LLM_BASE_URL", ""),
+		LLMAPIKey:         envString("LLM_API_KEY", ""),
+		LLMModel:          envString("LLM_MODEL", "qwen2.5-14b"),
+		LLMTimeout:        envDuration("LLM_TIMEOUT", 5*time.Minute),
+		VoxtralBaseURL:    envString("VOXTRAL_BASE_URL", envString("AUDIO_LLM_BASE_URL", "")),
+		VoxtralAPIKey:     envString("VOXTRAL_API_KEY", envString("AUDIO_LLM_API_KEY", envString("LLM_API_KEY", ""))),
+		VoxtralModel:      envString("VOXTRAL_MODEL", "mistralai/Voxtral-Small-24B-2507"),
+		VoxtralTimeout:    envDuration("VOXTRAL_TIMEOUT", envDuration("AUDIO_LLM_TIMEOUT", 10*time.Minute)),
+		AudioLLMPrompt:    envString("AUDIO_LLM_PROMPT", defaultAudioLLMPrompt()),
+		AIStatsSidecarURL: envString("AI_STATS_SIDECAR_URL", ""),
+		AIStatsTimeout:    envDuration("AI_STATS_TIMEOUT", 8*time.Second),

 		WorkerID:            envString("WORKER_ID", hostname()),
 		WorkerHTTPHost:      envString("WORKER_HTTP_HOST", "0.0.0.0"),