python

【初心者向け】Pythonリンター&フォーマッタ、Ruffの始め方|インストールからVSCode設定まで

Pythonでコードを書いていると、「このインデントおかしくない?」 「importの順番これでいいんだっけ?」みたいな細かいところが気になります。 最近は、エディタの機能でほぼなんとかなるのですが、たまにコピー&ペーストをVimなどに行うとズレてひどい目…

【コピペで動く】BERT感情分析×PythonでGoogleマップの口コミを分析する方法

今回は、BERTを使った感情分析に挑戦してみました。「BERTって難しそう...」と思っていたのですが、実際にやってみるとPython初心者でも意外と簡単に実装できたのでまとめてみました。 なぜBERT感情分析をやってみたのか? きっかけは... 大学の同期の方がBE…

ベクトルDBなしでRAG構築!Gemini File SearchでWikipedia検索システムを作る方法【ソースコード付】

この記事は以下のエントリの継続的な記事になっています。 WikipediaAPIから情報を取得する方法 uepon.hatenadiary.com ChromaDB+GeminiAPIでRAGシステムを構築する方法 uepon.hatenadiary.com 2025年11月にリリースされたGoogle Gemini APIのFile Search T…

【実践】ChromaDB + Gemini APIでRAGシステムを構築する方法【ソースコード付】

先日はWikipediaAPIを使用して、Wikipediaの記事を取得する方法について書いてみました。今回はそのデータを活用して、RAG(Retrieval-Augmented Generation)システムを構築してみようと思います。 参考 uepon.hatenadiary.com RAGは、大規模言語モデル(LL…

Wikipedia API活用術|Pythonで記事・カテゴリ・リンク情報を一括収集する方法

私の研究分野では十分にドキュメント化されていないジャンルを扱っているため、Wikipediaから基礎情報を収集することが度々あります。そこで、効率的にデータを取得する方法をまとめることにしました。 Wikipediaからデータを取得する方法はいくつかあります…

Mac製ZIPファイルの文字化け問題(解)

先日、Mac製ZIPファイルの文字化け問題について書きましたが、その後さらに調べていたところ、根本的な解決方法につながる情報を見つけました。 その結果、前回の記事で書いた「WindowsがUTF-8に対応していない」という理解は誤りだったことが判明しました実…

自分用pandasを使うためのチートシート

最近、pandasを使うことが増えてきたので、自分用にチートシート作成します pandasは、プログラミング言語Pythonにおいて、データ解析を支援する機能を提供するライブラリである。特に、数表および時系列データを操作するためのデータ構造と演算を提供する。…

【実践】PythonとOpenStreetMapで学ぶ経路システム開発入門

前回はGoogle Map APIを使用して開発を行いましたが、今回はOpenStreetMapを使用した似たようなことにチャレンジしてみようと思います。Pythonを使ってOpenStreetMapの経路検索URLを生成する方法ことを目的とします。 参考 uepon.hatenadiary.com オープンス…

【実践】PythonとGoogle Maps APIで学ぶ経路システム開発入門

少し前から興味のあったGoogle Map APIを少し本格的に使用してみたいと考えたので、PythonとGoogle Maps APIを使用して、 現在地から最寄りの避難所への経路URLを生成するシステムを構築みたという体験記になります。 まあ、学び直しということで🫡

Db2 Vector機能を試す!LangChainとDockerとWSLで作る実験環境

Db2がベクトル検索にも対応したということで、connpassにイベントがあったのですが、スケジュール調整うまくいかず参加できませんでした そこで、資料の公開もあったので、それをもとにテストしてみる環境をローカルで作ってみました。体験記というかよくわ…

uvでPython仮想環境(.venv)を移動したらどうなる?従来のvenvとの違いを検証

最近、読んだjunichimさんのエントリ「venv環境を移動してはまった話」という記事。確かに自分もハマったことがあったな~と勉強になりました。 blog.mori-soft.com で、ふと思ったんです。「最近話題の爆速パッケージマネージャーuvならどうなの🤔」って。

【AIリスキリング】Whisper超え?(ほんと?)IBM Granite Speech 3.3をGoogle Colabで実際に試してみた

ちょっと、タイトル言いすぎかもしれないので、すみません IBMが2025年にリリースした革新的な音声AIモデルGranite Speech 3.3(以下、Granite Speech)をご存知でしょうか? このオープンソースモデルは、Hugging Face Open ASR Leaderboardで業界トップク…

学会発表・プレゼン準備を効率化!PowerPointノート自動音声変換ツールを作ってみた

授業や研究発表の準備でPowerPointを使っていると、「発表者ノートを音声で聞きながら練習したい」「通勤中に耳で復習したい」という気分になってきます。自分も発表時間を気にするときに、どれくらいのスピードで話すと時間におさまるのか?こういうチェッ…

【AIリスキリング】未経験でも大丈夫!Chainlitでチャットボット開発を始める方法【WSL対応】

最近のAI開発において、チャットインターフェースは欠かせない要素になりました。しかし、いざ自分で作ろうとすると「どこから始めればいいのか」と悩むことが多いのではないでしょうか。もし今やるなら、StreamlitやGradioを使うかなと思いますが、Webを見…

【大人の学び直し】機密データもOK!gpt-oss-20bをローカルで!LM Studio+WSL+Python環境構築術

最近、OpenAIからgpt-ossというオープンウェイトモデルがリリースされ、ローカル環境でもかなり品質の良いLLMが使えるようになりました。実際に触ってみると、日本語の応答品質が想像以上で、これは実用的に使えると感じました ✨ また、少し前にインストール…

対話的プロセス自動化ツール|pexpectとexpectで始めるコマンド自動化入門

こんな経験ない? 毎日同じサーバーにSSHでログインして、同じコマンドを打つのが面倒 ‐ CLIで標準入力かつ手動入力で操作するプログラム。入力ミスすると致命的なのでなんとかしたい。 バックアップスクリプトを夜中に自動実行したいが、途中でパスワードが…

自分用Python環境管理uvコマンドのチートシート

この内容はPythonの開発時に使用するpip/venv/pyenvの代替ツールのチートシートになります。 自分用に作成したので、かなり偏った内容になっています。※Macについては私が使用していないので適当かもしれません。

【Python exe化】WindowsでNuitkaを使った実行ファイル作成方法

【2025.06.20 追記】Windows版のNuitkaでrequestsライブラリが動作しないと記載していましたが、Store版Python3.10にバージョンダウンしたところ無事に動作を確認しました。 先日は、WSL環境でNuitkaでの実行ファイルの作成にチャレンジしました。ただ、作成…

【5分解決】Pythonアプリの実行ファイル化|Nuitkaならコマンド1行で完了!

こんな経験ありませんか? 「作ったPythonアプリを友達に使ってもらいたいけど...」 「でも相手のPCにはPythonが入ってない」 「『Pythonをインストールして、ライブラリも入れて...』って説明するのが面倒」 こういった悩みはファイルを実行ファイル化すれ…

uvって何?Pythonパッケージ管理の新しい選択肢について

uvというツールを耳にしたことはありますか? 2024年に登場したこのRust製のPythonのパッケージマネージャが、開発者の間で注目になっています。ようやく従来のpipやvenvに慣れ親しんだというのに…「新しいツールって本当に必要?」なんだろうかというちょっ…

Pocketに溜まった記事をNotionに移行したい!移行ツールをPythonで自作

「後で読む」と思ってPocketに保存した記事が、気がつけば数百件と溜まっていませんか?私もその一人です興味深い記事を見つけるたびにPocketに保存するものの、実際に読み返すことは少なく、積読状態 しかし、Pocketに大きな変化が起きました。Mozilla(Fir…

IoT開発のファーストステップ!RaspberryPi内蔵センサーでモックデータ作成

RaspberryPiでセンサーデータをクラウド上のIoTサービスにアップロードするプロジェクトはよくあります。ただ、開発やテストの段階では、実際のセンサーを用意せずに、クラウド側との通信の動作確認をしたいことも多いと思います。 そこで、今回はセンサーを…

【Google Colab対応】Google I/O 2025新登場 Gemini・Gemmaモデルの無料API活用術

先日のGoogle I/O 2025で発表された、GeminiとGemmaの新しいモデルをPythonとGoogle Colab環境を使用し、API経由(無料枠内)で実行してみました。 注意事項 本記事の実行結果は特定の時点でのプレビュー版の性能です 正式リリース時には性能や回答品質が変…

NotionのデータをPythonで操る技術:API連携で実現する情報管理の自動化へ

メモ、タスク、アイデア、参考資料...日々増え続ける情報の洪水に困ったことはありませんか? メモアプリはたくさん使ってみたけど、続かない... 情報がバラバラで、必要な時に見つからない... 同じ作業の繰り返しに時間を取られている... こんな状況でもPyt…

Introducing Docling — A Versatile Document‑Conversion Tool for RAG Workflows

During my participation in an IBM watsonx.ai Dojo session, I was introduced to an excellent conversion tool capable of handling various file formats. That tool is Docling! It appears to be quite effective for Retrieval-Augmented Generatio…

【メモ】Python初心者の悩み解決!python3ではなくpythonで実行する最適な設定方法

Linux環境(WSLを含む)でPythonを使用する際、一般的にpython3コマンドでPython3を起動する必要があります。Python2の存在感が薄れている現在であれば、pythonだけで実行できるほうが助かります。そこで、pythonでpython3で動作させるための方法を紹介しま…

【WSLで実践】Python + Azure Functions超入門 - 90分でゼロからサーバーレスを学ぶハンズオン

前回のエントリーの内容 を他の人も使えるようにハンズオンにしてみました。初めて作ってみたけどどうだろうか はじめに:PythonによるAzure Functionsクイックスタート (所要時間:約5分) このハンズオンでは、Azure Functionsというサーバーレスコンピュー…

もう怖くない!サーバーレス入門 - Pythonで行うAzure Functionsの実践

以前から「サーバーレス」という言葉をよく耳にしていたのですが、なかなか手が出せていませんでした。サーバーレスの仕組みはサーバーの管理や運用を自分たちで気にしなくていいため、開発に集中できる魅力があり、使ってみたい仕組みの一つではあります。…

Whisperの文字起こし結果の検証に!タイムコード表示付き字幕の再生ツール開発

音声認識を行っていると、音声と認識された文字起こしデータを比較することが多いと思います。実際はあっている・あっていないは、開発側ではなく別の方に調べてもらうほうが良いのですが、最低限の確認をする必要はあると思います。他にも音声認識の結果が…

micro:bitとWeb Bluetoothで始める!ブラウザからのIoT制御入門

子ども向けのレクチャーとしてmicro:bitを使用していますが、IoT系のハッカソンなどでは、複雑になってくるとmicro:bitからRaspberryPiへの変更を余儀なくされることもあります。ただ、micro:bitは電池駆動ができることで、身につけるものにもつけられるとい…