--- license: cc-by-3.0 datasets: - espnet/yodas language: - ja --- # 概要 [espnet/yodas](https://huggingface.co/datasets/espnet/yodas)のja000を[WADA SNR](http://www.cs.cmu.edu/~robust/Papers/KimSternIS08.pdf)を用いて、音声の分析およびSNR値が100以上の音声ファイルのみをまとめたもの # 分析結果 分析結果の詳細はaudio_analysis_results.jsonをご確認ください 以下はjsonの内容をヒストグラムにしたものです ![](audio_quality_histogram.png) 以下は分析結果のjsonの構成です ```json [ { "ファイル名": "3IZFPbj6Z5c-00116-00045672-00046034", "SNR値": 11.850106999992533, "トランスクリプション": "それと僕が材料をお伝えした時にバニラエッセンスを入れたじゃないですか" }, { "ファイル名": "3fr1NoJcLzE-00084-00039552-00039962", "SNR値": 6.813705012877472, "トランスクリプション": "1弦の5フレット、2弦の5フレット、 3弦の5フレット、2弦の7フレット、" }, ... ] ``` # 備考 こちらのデータ分析は「ローカルLLMに向き合う会」が主催する[LOCAL AI HACKATHON](https://prtimes.jp/main/html/rd/p/000000007.000056944.html)にてリソースをお借りして処理を行いました