#

diarization

Here are 64 public repositories matching this topic...

transcriptionstream / transcriptionstream

turnkey self-hosted offline transcription and diarization service with llm summary

automation speech-recognition transcription whisper speaker-diarization diarization llm whisperx ollama mistral-7b

Updated Jun 2, 2024
Python

R3gm / SoniTranslate

Synchronized Translation for Videos. Video dubbing

text-to-speech translation tts speech-to-text stt audio-processing asr document-translator dubbing diarization automatic-dubbing subtitle-to-speech translate-audio translate-video video-dubbing

Updated Sep 12, 2024
Python

microsoft / UniSpeech

UniSpeech - Large Scale Self-Supervised Learning for Speech

speech pytorch speech-recognition speaker-verification speech-processing speech-separation diarization speech-diarization

Updated Apr 5, 2024
Python

gong-io / gecko

Gecko - A Tool for Effective Annotation of Human Conversations

transcription voice-detection diarization human-conversations annotating-files

Updated Mar 15, 2023
JavaScript

SuyashMore / MevonAI-Speech-Emotion-Recognition

Identify the emotion of multiple speakers in an Audio Segment

machine-learning deep-learning artificial-intelligence convolutional-neural-networks mfcc emotion-analysis speech-processing keras-tensorflow emotion-recognition colab-notebook mfcc-analysis uis-rnn diarization

Updated Feb 12, 2023
C

cvqluu / simple_diarizer

Simplified diarization pipeline using some pretrained models - audio file to diarized segments in a few lines of code

speech-to-text transcription asr speaker-diarization colab-notebook diarization

Updated May 2, 2024
Python

desh2608 / dover-lap

Python package for combining diarization system outputs.

ensemble-machine-learning diarization dover-lap

Updated Oct 12, 2023
Python

wq2012 / SimpleDER

A lightweight library to compute Diarization Error Rate (DER).

machine-learning metrics speech-recognition speech-processing speaker-diarization diarization

Updated Aug 28, 2023
Python

cvqluu / nn-similarity-diarization

Neural network based similarity scoring for diarization (pytorch implementation of "LSTM based Similarity Measurement with Spectral Clustering for Speaker Diarization")

neural-network speech pytorch similarity lstm kaldi speaker-recognition similarity-score speaker-diarization diarization

Updated Oct 21, 2020
Python

desh2608 / spyder

Simple Python package for fast DER computation

der diarization

Updated Jun 29, 2023
C++

ai-engine

exemplaryai / ai-engine

Easy to use Multi-Provider ASR/Speech To Text and NLP engine

nlp open-source natural-language-processing deep-learning speech speech-recognition neural-networks automatic-speech-recognition speech-to-text language-models speaker-recognition stt asr low-code natural-language-understanding conversational-ai multi-provider diarization automatic-speech-processing

Updated Nov 10, 2022

thewh1teagle / sherpa-rs

Rust bindings to https://github.com/k2-fsa/sherpa-onnx

audio rust embeddings speech-recognition sherpa diarization

Updated Aug 11, 2024
Rust

Picovoice / falcon

On-device speaker diarization powered by deep learning

deep-learning speaker-recognition speaker-diarization on-device diarization

Updated Aug 27, 2024
Python

JSchmie / ScrAIbe

Tool for automatic transcription and speaker diarization based on whisper and pyannote.

speech-to-text transcription diarization

Updated Sep 10, 2024
Python

shahruk10 / kaldi-tflite

Convert kaldi feature extraction and nnet3 models into Tensorflow Lite models. Currently aimed at converting kaldi's x-vector models and diarization pipelines to tensorflow models.

tensorflow speech kaldi tflite x-vector diarization

Updated Oct 6, 2022
Python

chimechallenge / chime-utils

Scripts for data generation, scoring and data manifest preparation for CHiME-8 DASR task.

speech-recognition automatic-speech-recognition speech-processing speech-separation speech-enhancement far-field-speech-recognition diarization multi-speaker-asr meeting-transcription

Updated Sep 16, 2024
Python

thewh1teagle / pyannote-rs

pyannote audio diarization in rust

rust speech-recognition whisper asr diarization onnxruntime

Updated Sep 9, 2024
Rust

cadia-lvl / kaldi-speaker-diarization

This repository creates speaker diarization recipes to be used within the egs folder of kaldi.

audio-files wav icelandic kaldi plda speaker-diarization ahc diarization mfccs

Updated Aug 12, 2024
Shell

SEERNET / Multi-Speaker-Diarization

Automated Multi Speaker diarization API for meetings, calls, interviews, press-conference etc.

speaker-diarization speaker-identification diarization multi-speaker-diarization

Updated Jan 30, 2019

orianemartin / WhispGrid

A Whisper to TextGrid script that I use to automatize Corpus Annotation on Praat, with speaker diarization.

speech-recognition alignment whisper praat textgrid diarization

Updated Nov 14, 2023
Python

Improve this page

Add a description, image, and links to the diarization topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the diarization topic, visit your repo's landing page and select "manage topics."