updated readme and changelog

3f0ec788 · Lucas Ondel Yang · 386df4df · 3f0ec788 · 3f0ec788 · 3f0ec788
Verified Commit 3f0ec788 authored 2 years ago by Lucas Ondel Yang
--- a/Project.toml
+++ b/Project.toml
 name = "SpeechCorpora"
 uuid = "3225a15e-d855-4a07-9546-2418058331ae"
 authors = ["Lucas ONDEL YANG <lucas.ondel@cnrs.fr>"]
-version = "0.1.1"
+version = "0.2.0"
 [deps]
 HTTP = "cd3eb016-35fb-5094-929b-558a96fad6f3"

--- a/README.md
+++ b/README.md
@@ -4,7 +4,7 @@ A Julia package to download and prepare speech corpus.
 ## Installation
-Make sure to add the [FAST registry](https://src.koda.cnrs.fr/fast/registry)
+Make sure to add the [FAST registry](https://gitlab.lisn.upsaclay.fr/fast/registry)
 to your julia installation. Then, install the package as usual:
 ```
 pkg> add SpeechCorpora

--- a/src/SpeechCorpora.jl
+++ b/src/SpeechCorpora.jl
@@ -23,11 +23,13 @@ export
    prepare,
    # Corpora
-    MultilingualLibriSpeech
+    MultilingualLibriSpeech,
+    MiniLibriSpeech
 include("manifest_item.jl")
 include("manifest_io.jl")
 include("corpora/multilingual_librispeech.jl")
+include("corpora/mini_librispeech.jl")
 end
--- a/src/corpora/multilingual_librispeech.jl
+++ b/src/corpora/multilingual_librispeech.jl
@@ -59,7 +59,7 @@ function Base.download(::MultilingualLibriSpeechCorpus, lang, outdir)
    @info "dataset in $outdir"
 end
-function recordings(lang, dir, subset)
+function recordings(::MultilingualLibriSpeechCorpus, lang, dir, subset)
    subsetdir = joinpath(dir, "mls_$(MLS_LANG_CODE[lang])", subset, "audio")
    recs = Dict()
@@ -80,7 +80,7 @@ function recordings(lang, dir, subset)
    recs
 end
-function supervisions(lang, dir, subset)
+function supervisions(::MultilingualLibriSpeechCorpus, lang, dir, subset)
    trans = joinpath(dir, "mls_$(MLS_LANG_CODE[lang])", subset, "transcripts.txt")
    sups = Dict()
    open(trans, "r") do f
@@ -94,13 +94,13 @@ function supervisions(lang, dir, subset)
    sups
 end
-function prepare(::MultilingualLibriSpeechCorpus, lang, dir)
+function prepare(multils::MultilingualLibriSpeechCorpus, lang, dir)
    # 1. Recording manifests.
    for subset in ["train", "dev", "test"]
        out = joinpath(dir, "recording-manifest-$subset.jsonl")
        @info "preparing recording manifest ($subset) $out"
        if ! isfile(out)
-            recs = recordings(lang, dir, subset)
+            recs = recordings(multils, lang, dir, subset)
            open(out, "w") do f
                writemanifest(f, recs)
            end
@@ -112,7 +112,7 @@ function prepare(::MultilingualLibriSpeechCorpus, lang, dir)
        out = joinpath(dir, "supervision-manifest-$subset.jsonl")
        @info "preparing supervision manifest ($subset) $out"
        if ! isfile(out)
-            sups = supervisions(lang, dir, subset)
+            sups = supervisions(multils, lang, dir, subset)
            open(out, "w") do f
                writemanifest(f, sups)
            end