Ubuntu

WSL環境でVOICEVOX CORE + Python 音声合成システムの導入と活用

最近、音声認識の処理を行うプログラムを作成しています。開発・デバッグの際、マイクの前でテーマに沿った話をして、音声認識の確認を行う必要があるのです。内心これがとても面倒だなと思っています。特にテーマなどに全く関心がない場合には、なんにも頭…

WSLでLinux音声アプリを動かそう!WSLgとPulseAudioの基礎

まえまえから気になっていたことがあります。WSLのプログラムで『音声ファイルを鳴らすことができるのか?』ということです。 現在、音声関連の処理を行うプログラムを書いているので、これが可能となると実験機器の数が減るので便利なんだけどなという思い…

【メモ】WSLのTab補完時のベル音を含めた警告音の抑止設定

WSLのコンソールを使うようになってからPCの音声をミュートしています。それはコンソールでコマンドなどのTab補完を行っていると、候補を出すたびにベルがなっていたからです。一応以下の設定はしていたので、警告時のベルの抑止はしていました。 .bashrcに…

【イベント参加レポート】生成AIを使ったアプリ開発、応用編~watsonx.ai Dojo #4~

毎月開催されているwatsonx.ai Dojoのハンズオンの内容の復習の続きになります。 イベントページ ibm-developer.connpass.com 応用編として開催された今回のハンズオンでは、これまでのプロンプトエンジニアリングから一歩進んで、RAG(Retrieval-Augmented …

【メモ】WSL環境での実行時にWindows側のプログラムを参照してしまう謎現象

割とハマったのでメモ Windows11上のWSLのUbuntu24.04でshファイル内でnpm run startを実行していて以下のようなエラーに遭遇。 git cloneコマンドで持ってきたプログラムだったのですが、他の環境ではこのようなエラーは発生していませんでした。 エラーの…

最新のLLMを体験!IBM Granite 3.0モデルをOllamaで動かしてみた

IBMさんからOllamaに対応したIBM Granite 3.0 modelsがリリースされたというニュースがありました(2024.10.21)。 ollama.com ラスベガスで行われているTechXchange Conference 2024に合わせた発表なのかなと。 www.ibm.com これまで、IBMのLLMでOllamaに対…

【メモ】GPUコンテナが動かない?Ubuntuアップデート後のトラブル解消法

今後、失敗してもリカバリできるようにメモ Ubuntuでアプリセンターなどでアプリ関係のアップデートを行うとNVIDIAやCUDAのドライバー関連、Docker側のGPUドライバを含んだ形でアップデートされてしまい。コンテナ関連が動作しなくなるという現象が発生しま…

UbuntuでGPUの動きをサクッと確認!topコマンド風モニタリングツール解説(nvtop/nvitop)

仕事関連でOllama関連の作業を少しお休みしていたのですが、そろそろ開始するかということで触り始めていたのですが、GTX1070 mobileではあるもののGPUありPCでのLLMの動作が遅く感じていました。なんでかなと思っていたのですが、わからず進めていました。…

【イベント参加レポート】生成AIを使ったアプリ開発、入門編 〜watsonx.ai Dojo #2〜

すでに一ヶ月ほど経ってしまっていますが、生成AIを使ったアプリ開発、入門編 〜watsonx.ai Dojo #2〜に参加しましたので、そのハンズオン内容の復習レポートとして記してみたいと思います。 参考 uepon.hatenadiary.com 前回は概論的な予備知識的な内容でし…

手間を削減!CLIでディレクトリ作成・直後に移動するを簡単にする方法(トホホ編?)

いままでもずっと手間だなと感じてはいたのですが、「ディレクトリを作成してすぐにそのディレクトリに移動するということ」。これまでは非IT系のジャンルにいたので、CLIなどの作業はあまりありませんでしたが、最近はその職から離れ、開発的なところにいる…

Docker初心者必見!『What's Next...』メッセージを非表示にする設定方法

Dockerでコンテナを触っているとdocker run実行後に以下のような表示が出たことはないでしょうか。ここ最近DockerでOllamaを触って、そのころから毎回出力されている状態です。 What's next: Try Docker Debug for seamless, persistent debugging tools in …

初心者でもできる!HuggingFaceモデルをGGUF形式に変換しOllamaで使う手順

最近、AIのことは一応触ってはいますが、ちっともわからない状況です 先日までOllamaを使用していたのでローカルLLMについてはなんとなく分かってきた様でもありという状況ですが、OllamaはGGUF形式のモデルが使えるとはいえ、すべてのモデルがGUFF形式で公…

Ollamaで広がるローカルLLMの世界 - GGUF形式モデルのインポート方法

これまでOllamaを使用して比較的容易にローカルLLMモデルを使用することをやってきました。ここまで来ると未対応のLLMモデルを使用したくなってきます(よね)。 そこで、OllamaのREADMEファイルを読んでいったところ github.com Import GGUFという項目があり…

ローカルLLMをWebUIで手軽に操作!噂のllama3、phi3、Graniteも使える!

最近では、生成系AIも徐々に多様化してきて、ローカルLLMの使用も流行ってきていますね。個人利用であれば、OpenAIのChatGPTなどのSaaS型の生成AIでも問題ないのですが、企業活動になるとそう言ってもいられない事象があるのはもっともかもしれません。 今回…

【メモ】UbuntuにNVIDIA Container Toolkitをインストールする

GPUを持つUbuntuでDocker経由でCUDAを使用する場合に必要となるNVIDIA Container Toolkitをインストールします。 使用したUbuntuのバージョンはUbuntu22.04LTS。下記リンクを参照しインストールを行う。 docs.nvidia.com $ curl -fsSL https://nvidia.github…

【メモ】UbuntuにVisualStudioCodeをインストールする

UbuntuにVisualStudioCodeをインストール UbuntuのバージョンはUbuntu22.04LTS。 debパッケージをダウンロードして、dpkgコマンドでインストールする方法もありますが、 今回はaptコマンドでインストールしています。 Ubuntu22.04LTSにVisualStudioCodeをイ…

【メモ】UbuntuにDockerをインストールする

UbuntuにDockerをインストールするメモ 今回のバージョンはUbuntu24.04LTSにDockerをインストールしています。 以下のスクリプトでインストールまで可能。インストール後は再起動をしたほうが楽です。 Ubuntu22.04LTSにDockerをクリーンインストールする 参考…

古いゲーミングPCを再利用!UbuntuでAI画像生成環境を構築するための手順

NVIDIA製GPUを家では使用できるようにしたのですが、外出中でもなんとか使えないかと思いっていたところGTX1070Mobileを搭載した少し古めのゲーミングPCが準備できたので、OSにUbuntu24.04LTSをインストールし、NVIDIAドライバとCUDAをセッティングするとい…

Node-REDの学習に最適!GitHub Codespacesを使った実行環境の構築法

これまでNode-REDを体験するワークショップの環境をどうやって作るかを昨年ぐらいから考えていたのですが、ようやく答えが出てきたのでまとめておこうと思います。 IBM Cloudの環境でもカード登録なく無料での使用(学生にとってはかなり重要)ができなくな…

PEP668エラー回避のヒント:pipxの活用

最近のUbuntuやRaspberryPiを使用しているとpipコマンドでライブラリのインストールをするときにPEP668のエラーが出てきます。 以下は最新のRaspberryPi OSであるDebian GNU/Linux 12 (bookworm)でpipコマンドを使用してnumpyを インストールしてみた結果に…

UbuntuやRaspberry Piでも利用可能な音声合成エンジンEdge-TTSの導入方法

先日来使用しているVOICEVOXですが、PCであればかなり高速に処理をすることができるとはいえ、リアルタイム性?というところではやはり処理時間がかかるため会話というところには使用が難しいと思いました。そこで、他にもなにかないかなと思い探してみるこ…

復習:各OSの環境変数の使い方を学びなおす

環境変数とシェル変数の混同があったので少し修正いたしました(2024.02.05) 久々にNode-REDを復習してみようと考えて、Node-RED日本ユーザ会のホームページを眺めていました。 nodered.jp そういえば、これまでに開発時に環境変数って使ったことあまりなか…

気になる音声合成ソフト「VOICEVOX」をUbuntuで試してみた!

前から気になっていたVOICEVOXをUbuntuに入れてみました。WindowsやMacでは動くのは当然だよね~ってところで、Linuxにも正式に対応しているというのが割とすごいなという印象です。以前から気にはなっていたのですが、なかなかさわる機会がなかったので、今…

NVIDIA CUDAとDocker: ノートPCでのAI開発の第一歩

2023.12.21 追記 コンテナが起動しない場合 最近、生成系AIに関しても興味がでてきたのでちょこっとStable Diffusionなんかも簡単に動かしたいなあと思うようになりました。と入っても、ノートPCではストレージにも余裕がそこまでなく、やばいときには環境を…

Pythonでの多言語翻訳の探求

前回のエントリーでは音声ファイルからテキスト化を行いましたが、日本語音声から日本語テキストへの変換でした。実は英語の変換に関してはWhisperの解析時のオプション(task=”translate”)の追加を行うだけで行えるのですが、英語以外の言語に変換するには…

Whisperを使ってYouTube字幕ファイルの作成がこれほど簡単だったなんて!

少し前のエントリでYouTubeから音声データをダウンロードするといった内容のことをやっていたのですが、それならその音声データをWhisperに入力し、生成された音声解析のテキストデータをYouTubeの字幕ファイルに変えてみたらどうなるかなと思っていました。…

日経Linux11月号に寄稿しました!おすすめPython小ネタを紹介!

日経Linux11月号が今月発売されています。今回もちょっとだけですが、記事を書かせていただいていたので、 発売されているところを見に行きました。書かせていただいていると、こういうのことが楽しかったりする 内容としては「お薦めコマンド&スクリプト」…

Pythonとyt-dlpを活用した動画・音声のダウンロード方法

ちょっと前まで、とある原稿を書いていたのですが、その時の没ネタを少しメモしておきます。 Pythonを使用した便利な処理ということでのネタ探しでしたが、紙面の関係と、微妙に権利関係の懸念もあって没としていました。 内容としてはYouTubeの動画および、…

GUI不要!UbuntuにコマンドラインだけでChromeをスムーズにインストールする方法

私はUbuntuを定期的にクリーンインストールするような作業を行っています。また最近、検証としてVersion23.04を入れることになりました。定期的にインストールをしているのでほぼ慣れた感じでインストールはしていますが、中には作業をど忘れすることがあり…

RaspberryPiとMinitestで自分だけのブロック世界を作ろう!

子どもたちにも人気のMinecraft。自分も3年ほど前はかなりハマっていたのですが、さすがに時間が無尽蔵にあるというわけではないので、現在ではほぼ遊んではいません。 Minecraftは有料ゲーム(アプリ)ですが、最近はで教育版もリリースでてきていて、各地…

/* -----codeの行番号----- */