AI

StreamlitのLLM呼び出しが遅い?並列処理で爆速化する3つの方法を比較してみた

修論まだ終わってないのに… 現在、絶賛修論執筆中の身ですが、修論の研究でStreamlitでLLMを使った実験用のアプリを作っていたときに 「複数のLLM APIを呼び出して、結果が返ってくるの遅くない?」から始まった技術検証の話を書きます。 複数のプロンプトを…

AIエージェントの2025年を振り返る|MCP・A2Aとは何かを初心者向けにやさしく解説してみた

この画像はエントリの内容ををNano Banana Proのインフォグラフィックスとなります なぜ今さら"規格"の話が大事なのか 2025年はAIエージェントの年になるって予想がいろいろ出ていましたよね。2026年1月現在の振り返ってみると、少なくともAIエージェントの…

AI活用の第一歩|ファインチューニング・LoRA・RAGの違いを説明できるようにする

ファインチューニング / LoRA / RAG は何が違うの? AIや大規模言語モデル(LLM)の話をしていると、次のような質問がありますよね。 ファインチューニング(Fine-Tuning) LoRA RAG 最近AIを勉強はじめた方と話をしていると、この3つの違いについて質問され…

【開発者目線】2025年のIBM AI動向振り返り:エージェントの時代が来た感じがする

これまで、OpenAI、Anthropic、Googleといったメジャーどころの生成AIモデルやサービスの動向を追ってきましたが、IBM関連の技術も追っているため、2025年のIBMのAI戦略と技術動向についてもまとめてみようと思います。 IBMのAI関連サービスは「watsonx」と…

【3社比較の最終回】2025年Google AI総まとめ|OpenAI・Anthropicとの違いは「全方位展開」?

OpenAI、Anthropicと振り返ってきたこのシリーズ、最後はGoogleです。 参考 uepon.hatenadiary.com uepon.hatenadiary.com 正直なところ、今年のGoogleを一言で表現するのは難しいと感じています。モデルの進化、エージェント機能、企業向けプラットフォーム…

Anthropicの2025年、地味に見えて実は凄かった?1年分のリリースを振り返る

前回の記事ではOpenAIの2025年を振り返りましたが、今回はAnthropic編です。 参考 uepon.hatenadiary.com 正直なところ、Anthropicに対しては「OpenAIほどリリースが派手じゃないよね」という印象を持っていた方も多いのではないでしょうか。私自身もそう感…

OpenAIの2025年のリリース、ぜんぶ追えてる人いる?自分用に整理してみた

AI競争の火付け役であるOpenAI。2025年も数多くのリリースがありましたが、皆さんはどこまで追えていますか? 私自身、AIについては学んでいるつもりでしたが、振り返ってみると「知らなかった」「見落としていた」というものが結構ありました。 新モデルの…

【コピペで動く】BERT感情分析×PythonでGoogleマップの口コミを分析する方法

今回は、BERTを使った感情分析に挑戦してみました。「BERTって難しそう...」と思っていたのですが、実際にやってみるとPython初心者でも意外と簡単に実装できたのでまとめてみました。 なぜBERT感情分析をやってみたのか? きっかけは... 大学の同期の方がBE…

AIに「からあげが降ってくるゲーム作って」と頼んだらちゃんとしたゲームができた件【Project Bob】🍗

このブログはからあげ帝国 Advent Calendar 2025の23日目の記事です。 qiita.com 今回は最新のAIのIDE環境であるIBM Project Bob(以下Project Bob)を使用してゲームを作成した感想とゲームの紹介となります。 これまで、Claude Codeや Gemini CLiなども使…

Gemini 3 Flashが来た!「速い・安い」は本当か?安全に使うための視点も含めて整理してみた

2025年12月17日、GoogleからGemini 3 Flashが発表されました。GeminiアプリやSearchのAI Modeでデフォルトモデルになったということで話題になっています。 12月15日に研究用のデータの生成にGemini 2.5 Flashを大規模に使用してコストを払ったのに… 今回は…

ベクトルDBなしでRAG構築!Gemini File SearchでWikipedia検索システムを作る方法【ソースコード付】

この記事は以下のエントリの継続的な記事になっています。 WikipediaAPIから情報を取得する方法 uepon.hatenadiary.com ChromaDB+GeminiAPIでRAGシステムを構築する方法 uepon.hatenadiary.com 2025年11月にリリースされたGoogle Gemini APIのFile Search T…

【初心者向け】Gemini APIのモデル選びに迷ったら?一覧取得ツールで解決!

年末に向けて、生成AIのモデルのバージョンアップラッシュが続いていますね。ChatGPT 5.1、Claude 4.5、そしてGoogleのGemini 3.0Proなど、さまざまなAIモデルが登場しました。どれを使えばいいのか迷ってしまう方も多いのではないでしょうか 自分は研究でG…

【実践】ChromaDB + Gemini APIでRAGシステムを構築する方法【ソースコード付】

先日はWikipediaAPIを使用して、Wikipediaの記事を取得する方法について書いてみました。今回はそのデータを活用して、RAG(Retrieval-Augmented Generation)システムを構築してみようと思います。 参考 uepon.hatenadiary.com RAGは、大規模言語モデル(LL…

【実践】9つの視点でアイデア発想!オズボーンのチェックリストGPTを作ってみた

アイデアを改良したい、もっと多角的に考えられないか——そんな悩みはありませんか? またかYO! 自分の研究がどんどんアイディエーション支援の領域に入ってきたこともあり、先日はTRIZのカスタムGPTを作成しましたが、今回はオズボーンのチェックリストを使…

【実践】AI活用×ChatGPTで作る!TRIZ問題解決カスタムGPTの作り方

アイデアを改良したい、でもどう考えればいいか分からない——そんな経験はありませんか? 自分の研究がそういったアイディエーションの支援型の領域に入ってきたので、教授からTRIZ(発明的問題解決理論)を紹介されました。これを調べるうえでどういうものな…

Claude使用量の確認が面倒?フローティング表示で解決するChrome拡張

ClaudeのWeb版を使っていて、「あとどれくらい使えるんだろう?」 「使用量の上限に達していないかな?」と気になったことはありませんか?特に、MAXプランを使用している方からするとOpusの上限は結構気にするかもしれません。 Webの管理画面で確認はできます…

もう「いつ聞いたっけ?」と迷わない!ClaudeのチャットのタイムスタンプをつけるChrome拡張機能

ClaudeのWeb版を使っていて、「いつ質問したか」 「会話一覧のチャット日時」がパッと見でわかりにくいと感じたことはありませんか? 「何日前なんかで表示されてもなあ…」 そこで、Claudeのチャット画面とChatの履歴ページにタイムスタンプを表示するChrome…

Db2 Vector機能を試す!LangChainとDockerとWSLで作る実験環境

Db2がベクトル検索にも対応したということで、connpassにイベントがあったのですが、スケジュール調整うまくいかず参加できませんでした そこで、資料の公開もあったので、それをもとにテストしてみる環境をローカルで作ってみました。体験記というかよくわ…

【イベント運営&登壇】なごあずの集い#6|VS Codeで完結するLLM開発とAI Toolkit活用法

9月20日に開催された、なごあず(JAZUG 名古屋支部)の「なごあずの集い #6」を運営・登壇の両面で関わらせていただきました。これまでは運営ばかりだったので、実は初登壇なのでした 会場をお借りした日立ソリューションズ中部事業所 様ありがとうございま…

【AIリスキリング・60分ハンズオン】プログラミング不要・環境構築なし!ブラウザだけで作るローカルLLM×RAGチャットボット

以前作成したGitHub Codespaces上のローカルLLM&LangFlowの環境のハンズオンを作成してみました。 これを行うと、ブラウザだけでLLM&RAGノーコード開発が可能になります。ハンズオンは60分想定で作成しましたが、そんなにかからないと思います。 必要なの…

【AIリスキリング】Whisper超え?(ほんと?)IBM Granite Speech 3.3をGoogle Colabで実際に試してみた

ちょっと、タイトル言いすぎかもしれないので、すみません IBMが2025年にリリースした革新的な音声AIモデルGranite Speech 3.3(以下、Granite Speech)をご存知でしょうか? このオープンソースモデルは、Hugging Face Open ASR Leaderboardで業界トップク…

【AIリスキリング】50分で完成!LM Studio×LangChainで作る無料RAG対応チャットボット

先日はRAGとMCPの概念を学びました。今回は実際に手を動かして、LM StudioとLangChainを使ったRAGチャットボットを作成してみたいと思います。概念がわかっていても実際にプログラミングを行わないとわからないことが多いので今回は環境づくりやコーディング…

【AIリスキリング】未経験でも大丈夫!Chainlitでチャットボット開発を始める方法【WSL対応】

最近のAI開発において、チャットインターフェースは欠かせない要素になりました。しかし、いざ自分で作ろうとすると「どこから始めればいいのか」と悩むことが多いのではないでしょうか。もし今やるなら、StreamlitやGradioを使うかなと思いますが、Webを見…

【AIリスキリング】RAGとMCPを理解する!生成AI活用の基礎知識

生成AI(LLM)を使っていると、「どうやって自分のデータや最新情報を使わせるか」という疑問にぶつかります。最近のChatGPT、Gemini、ClaudeといったメジャーどころのLLMではWeb検索機能がデフォルトでONになっていたりして、現在の天気や株価なども取得で…

なぜ4GBで20Bモデルが動く?知らないと損するその仕組みを初心者向けに解説してみた

先日、「きしだのHatenaブログ」さんの「GPUメモリ4GBしかなくても、GPT-oss 20B(MoEモデル)をある程度の速度で動かせる」という内容の記事を読んでいました。初心者の私はGPUメモリが4GBでなんでGPT-oss 20Bが動くの?とさっぱりわからなかったし、Attent…

【AIリスキリング】ローカルLLMツール選び方|初心者も理解できる選択のポイント

ChatGPTやClaudeを使っていると、ふと気になることがあります。「このデータ、本当に外部に送信して大丈夫だろうか」「もう少し思い通りに動かせないだろうか」そんな疑問から、ローカルLLMに興味を持つ方が増えています。 私自身、50代になってからAI開発の…

GitHub Codespacesで作るAI開発環境|Langflow + Ollama完全セットアップ

SNSで知り合いの方がLangflowを使っていました。最近、注目されているLangflowは、ローコード/ノーコードでAIアプリケーションを構築できるツールです。Difyやn8nと同様にフロー型開発環境として人気が高まっています。 【Langflowの実行画面】 今回は、GitH…

学び直しの現在地から見たSORACOM Flux、そこから見えた未来

今更感のある内容ですが、先月開催されたSORACOM Discovery 2025に行ってきました。社会人だと休みで行けばいいのですが、現在は休職中なのでそんな金銭的な余裕もないため、高速バスを乗り継いで参加してきました。 「SORACOM Discovery 2025」 東京ミッド…

【大人の学び直し】機密データもOK!gpt-oss-20bをローカルで!LM Studio+WSL+Python環境構築術

最近、OpenAIからgpt-ossというオープンウェイトモデルがリリースされ、ローカル環境でもかなり品質の良いLLMが使えるようになりました。実際に触ってみると、日本語の応答品質が想像以上で、これは実用的に使えると感じました ✨ また、少し前にインストール…

【2025年最新】Ollama v0.10.0でGUI対応!Windows環境での導入ガイド

ローカル環境でLLMを動かすツールOllamaが、2025年7月31日にリリースされたv0.10.0で、ついに待望のGUI機能に対応しました。これまでのコマンドライン中心の操作から一転、ChatGPTのような直感的なチャット画面でLLMと対話できるようになりました。 「ローカ…