attention

Accent recognition, for great justice.

Scripts

build_config.py

Parses a directory containing {.mov,.wav} files.
Builds config file of the form: {language, count}

get_dataset.py

Parses a config file generated by build_config.py
Downloads (via ftp) and converts to .wav (via ffmpeg).
Involves multi-processing.
Puts everything (.wav) into a single directory (/data).

feature_extraction.py

Parses the files in /data (from get_dataset.py)
Extracts features (mfcc, et al.) from /data,
writes as serialized numpy arrays to /processed.

Notebooks

Audiolab.ipynb

prototyping environment, spectrograms, signal-vectors

Config Files

dataset.conf

lang count of source files (complete)

Data Files

/data (.wav encoded audio)
speech_archive_meta.tsv: Complementary dataset, contains additional info about speakers involved in each recording.

Todo:

Extract features, store in database (sqlite).
Parse speech_archive_meta.tsv, put into database
Do ML, hope for the best.
Get different features return to step 1.

Name		Name	Last commit message	Last commit date
Latest commit History 21 Commits
db		db
norm_processed		norm_processed
paper		paper
processed		processed
scripts		scripts
.gitignore		.gitignore
Audiolab.ipynb		Audiolab.ipynb
LICENSE		LICENSE
Learning.ipynb		Learning.ipynb
Presentation.ipynb		Presentation.ipynb
README.md		README.md
elicitation.txt		elicitation.txt
extract.py		extract.py
feature_extraction.py		feature_extraction.py
features.py		features.py
master_dataset.conf		master_dataset.conf
speech_archive_meta.tsv		speech_archive_meta.tsv
states.csv		states.csv
tone_pallettes.py		tone_pallettes.py
training_data.py		training_data.py
usa_cities_to_state.csv		usa_cities_to_state.csv

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

attention

Scripts

build_config.py

get_dataset.py

feature_extraction.py

Notebooks

Audiolab.ipynb

Config Files

dataset.conf

Data Files

Todo:

About

Releases

Packages

Languages

License

athuras/attention

Folders and files

Latest commit

History

Repository files navigation

attention

Scripts

build_config.py

get_dataset.py

feature_extraction.py

Notebooks

Audiolab.ipynb

Config Files

dataset.conf

Data Files

Todo:

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages