前回のエントリーでは音声ファイルからテキスト化を行いましたが、日本語音声から日本語テキストへの変換でした。実は英語の変換に関してはWhisper
の解析時のオプション(task=”translate”
)の追加を行うだけで行えるのですが、英語以外の言語に変換するにはどうすればと悩んでしましました。
英語だけでもいいじゃないかということもありますが、自分の住んでいる地域はブラジル(言語はポルトガル語)の方が結構いるので、そういう方々に向けて情報を出すのは比較的需要あるかな?ってことで調べてみました。
【参考】
外国人住民数を国籍別に見ると、ブラジルが60,397人で、全体の21.1%を占め、ベトナム49,719人(17.3%)、中国43,918人(15.3%)、フィリピン41,918人(14.6%)、韓国・朝鮮28,864人(10.1%)、ネパール12,844人(4.5%)と続いています。
https://www.pref.aichi.jp/soshiki/tabunka/gaikokuzinjuminsu-2022-12.html
続きを読む