LLM

非エンジニアのためのClaude Cowork入門|WEBチャットとの違い・設定手順・活用Tipsまとめ

4月に復帰してからというもの、日中は業務に追われてClaudeをじっくり触る時間がほとんど取れていない。Max 5xプラン($100/月)を契約しているのに、正直もったいない状態が続いている 私は世間的には非エンジニアにカテゴライズされているメモ帳プログラマ…

RAG4パターン比較 …AIのカンニングペーパーにも組み方がある!?

大学も卒業したので、やっているときにはあまり考えられなかったところを、かじった程度の視点から考えてみました。 RAGってそもそも何? AI(大規模言語モデル=LLM)は賢いけれど、社内固有情報や新事実に対してはそのままでは弱い。「うちの会社の就業規…

llamafile + USBメモリで持ち歩くローカルLLMを作成する!実用的なモデルサイズは?

最近、ローカルLLMの実行環境としてOllamaやllama.cppを使うことが多くなりました。そんななか、「もっとポータブルにできないかな?」と想像してしまいます。出先のPCでサクッとLLMを動かしたい場面って意外とあるんですよ特に、勉強会でのデモや、企業の社…

OpenVINO Model ServerをWindowsネイティブ環境のNPUでLLM推論してみた!

3月はDELLのアンバサダー・プログラムでIntel Core Ultra 7 268V搭載のPCをお借りしていましたが、せっかくNPUがあるのにあまり活用できていないなーと思っていました。ローカルLLMは、普段llama.cpp、Ollama、LM Studioなどで動かしていますが、これらのタ…

ゲーミングPCじゃなくても動くの?Copilot+ PCでローカルLLMに挑んでみた

今回でいよいよ最終回、5回目のDell Pro 13 Premiumガチレビューとなります。 本記事は、デル アンバサダープログラムのモニターに参加し、Dell Pro 13 Premiumをお借りしてレビューしています。 #デルアンバサダー #DellPC #DellPro13Premium #ノートPCレビ…

TinyTroupe × 人狼ゲーム — WSL2でマルチエージェントシミュレーション環境を構築してみた

この内容は「なごあずの集い#8」で発表した内容をベースに、さらに詳細な手順や補足情報を加えたものになります。 https://75az.connpass.com/event/383389/ speakerdeck.com Microsoftが開発したマルチエージェントシミュレーションライブラリTinyTroupeを…

【Ollama Cloud×Python】ローカルLLMとクラウドLLMをプライバシーで振り分けるルーターを作ってみた

OllamaはローカルでのLLM実行ツールとしておなじみですが、2025年9月から「クラウドモデル」がプレビューとして提供されています。手元のPCでは動かせないような大規模モデルを、Ollamaのデータセンター上で実行できる機能です。 ちょっと思ったのは、「ロー…

ExcelからローカルLLM(Ollama)を呼べるか試してみた →Power Queryだけでどこまでできる?

最近、ローカルLLMを使用していると、いろいろなアプリケーションから使いたいなと思っていて、ふと「Excelから直接ローカルLLMを呼べないかな?」と思ったんですよね。 ExcelからLLMといえばVBAを使う方法が真っ先に浮かびますが、正直なところ新規でVBAを…

llama.cppの開発元がHugging Faceに合流 ― GGUF・Ollama・LM Studioへの影響を考える

2026年2月、ローカルLLMを触っている人にとってはかなり大きなニュースがありました。 llama.cppの創設者であるGeorgi Gerganov率いるggml.aiが、Hugging Faceに合流するというものです。 Hugging Face公式ブログではこう書かれています。 We are super happ…

【備忘録】llama.cppのWindowsインストール手順をまとめた(CUDA/Vulkan/CPU別)

Windowsでのllama.cppのインストールに関して自分用にまとめておこうと思います。OllamaやLM Studioはインストーラーがありますが、llama.cppはインストールがないので、一旦まとめておきます。 これは、動作させる環境がCPUのみ、CUDAあり、その他環境もあ…

IBM Project BobのAIエージェントがWSLで動かない! ― ファイル編集はできるのにコマンドだけ失敗する原因と解決策

IBM Project Bob(このエントリでは以降 Bob IDEとします)は、IBMが開発したAIエージェント搭載のIDE(VS Codeのフォーク)です。AIエージェントにコマンドを実行させ、プログラムの生成や実行を自動化できる、いわゆるAIコーディングエージェント系のツー…

Raspberry Piの値上げニュースで考えた、「小型のローカルLLMデバイス選び」はN100ミニPCが現実解?

Raspberry Pi 5がまた値上げになりましたね www.gizmodo.jp 16GBモデルが60ドルアップで205ドル(約3万円)。しかも2025年12月に値上げしたばかりで、わずか2カ月での再値上げです。原因は世界的なRAM不足とのこと。 このニュースを見て真っ先に思ったのが、…

「Doclingが有料化した」は間違い ― IBM Elite Support for Doclingのリリース情報を正しく理解する

2026年1月27日、「IBM Elite Support for Docling」の一般提供(GA: General Availability)について発表がありました。 community.ibm.com これだけ見るとDoclingは有料になっちゃうの?と感じますが、そうでは無いようです。 この発表の意味するところや企…

8GBメモリでOK!Raspberry Pi 5で使える日本語対応ローカルLLM一覧

以前のエントリなどでも触れていましたが、Raspberry Pi 5(8GB RAM)でリアルタイム対話可能な日本語LLMは実現可能となりつつあります。それも、特別なハードウェアを使用することなしにです。 これは、1B〜3Bパラメータのモデルでもかなり優秀になってきて…

IBM Granite この半年の進化を振り返る ― 他のオープンモデルとどう違うのか?

最近、卒業研究の論文で忙しかったのですが、ようやく峠をこえましたそんななかで「Graniteって最近どうなってるんだろう?」と思い立ち、公式サイトやHugging Faceのibm-graniteリポジトリを眺めてみました。LlamaやMistral、Qwenなど選択肢が増える中で、I…

【これなら実用できる!】Raspberry Pi 5 + llama.cpp + LFM 2.5でローカルLLM環境構築【実測値15tokens/s】

2026/01/21追記:CPU N100、12GBメモリのWindowsPCでllama.cppで動作したところ10tokens/sというスピードでした。 前回はGPUなしで動く!1GB小型LLM「LFM 2.5」の導入方法と実力検証という内容で、軽量なLLMモデルLFM 2.5をGPUのないノートPC環境で動かす方…

GPUなしで動く!1GB小型LLM「LFM 2.5」の導入方法と実力検証

2026/01/21追記あり:LM Studioから直接モデルのダウンロードができる様になりました。 2026/01/21追記あり:N100CPUでの動作スピードを追記(約8tokens/s)。 最近、ローカルLLMを動かすためのGPUやメモリの価格が高騰していて、「新しくPC環境を揃えるのは…

StreamlitのLLM呼び出しが遅い?並列処理で爆速化する3つの方法を比較してみた

修論まだ終わってないのに… 現在、絶賛修論執筆中の身ですが、修論の研究でStreamlitでLLMを使った実験用のアプリを作っていたときに 「複数のLLM APIを呼び出して、結果が返ってくるの遅くない?」から始まった技術検証の話を書きます。 複数のプロンプトを…

AIエージェントの2025年を振り返る|MCP・A2Aとは何かを初心者向けにやさしく解説してみた

この画像はエントリの内容ををNano Banana Proのインフォグラフィックスとなります なぜ今さら"規格"の話が大事なのか 2025年はAIエージェントの年になるって予想がいろいろ出ていましたよね。2026年1月現在の振り返ってみると、少なくともAIエージェントの…

AI活用の第一歩|ファインチューニング・LoRA・RAGの違いを説明できるようにする

ファインチューニング / LoRA / RAG は何が違うの? AIや大規模言語モデル(LLM)の話をしていると、次のような質問がありますよね。 ファインチューニング(Fine-Tuning) LoRA RAG 最近AIを勉強はじめた方と話をしていると、この3つの違いについて質問され…

【開発者目線】2025年のIBM AI動向振り返り:エージェントの時代が来た感じがする

これまで、OpenAI、Anthropic、Googleといったメジャーどころの生成AIモデルやサービスの動向を追ってきましたが、IBM関連の技術も追っているため、2025年のIBMのAI戦略と技術動向についてもまとめてみようと思います。 IBMのAI関連サービスは「watsonx」と…

【3社比較の最終回】2025年Google AI総まとめ|OpenAI・Anthropicとの違いは「全方位展開」?

OpenAI、Anthropicと振り返ってきたこのシリーズ、最後はGoogleです。 参考 uepon.hatenadiary.com uepon.hatenadiary.com 正直なところ、今年のGoogleを一言で表現するのは難しいと感じています。モデルの進化、エージェント機能、企業向けプラットフォーム…

Anthropicの2025年、地味に見えて実は凄かった?1年分のリリースを振り返る

前回の記事ではOpenAIの2025年を振り返りましたが、今回はAnthropic編です。 参考 uepon.hatenadiary.com 正直なところ、Anthropicに対しては「OpenAIほどリリースが派手じゃないよね」という印象を持っていた方も多いのではないでしょうか。私自身もそう感…

OpenAIの2025年のリリース、ぜんぶ追えてる人いる?自分用に整理してみた

AI競争の火付け役であるOpenAI。2025年も数多くのリリースがありましたが、皆さんはどこまで追えていますか? 私自身、AIについては学んでいるつもりでしたが、振り返ってみると「知らなかった」「見落としていた」というものが結構ありました。 新モデルの…

【コピペで動く】BERT感情分析×PythonでGoogleマップの口コミを分析する方法

今回は、BERTを使った感情分析に挑戦してみました。「BERTって難しそう...」と思っていたのですが、実際にやってみるとPython初心者でも意外と簡単に実装できたのでまとめてみました。 なぜBERT感情分析をやってみたのか? きっかけは... 大学の同期の方がBE…

AIに「からあげが降ってくるゲーム作って」と頼んだらちゃんとしたゲームができた件【Project Bob】🍗

このブログはからあげ帝国 Advent Calendar 2025の23日目の記事です。 qiita.com 今回は最新のAIのIDE環境であるIBM Project Bob(以下Project Bob)を使用してゲームを作成した感想とゲームの紹介となります。 これまで、Claude Codeや Gemini CLiなども使…

ベクトルDBなしでRAG構築!Gemini File SearchでWikipedia検索システムを作る方法【ソースコード付】

この記事は以下のエントリの継続的な記事になっています。 WikipediaAPIから情報を取得する方法 uepon.hatenadiary.com ChromaDB+GeminiAPIでRAGシステムを構築する方法 uepon.hatenadiary.com 2025年11月にリリースされたGoogle Gemini APIのFile Search T…

【初心者向け】Gemini APIのモデル選びに迷ったら?一覧取得ツールで解決!

年末に向けて、生成AIのモデルのバージョンアップラッシュが続いていますね。ChatGPT 5.1、Claude 4.5、そしてGoogleのGemini 3.0Proなど、さまざまなAIモデルが登場しました。どれを使えばいいのか迷ってしまう方も多いのではないでしょうか 自分は研究でG…

【実践】ChromaDB + Gemini APIでRAGシステムを構築する方法【ソースコード付】

先日はWikipediaAPIを使用して、Wikipediaの記事を取得する方法について書いてみました。今回はそのデータを活用して、RAG(Retrieval-Augmented Generation)システムを構築してみようと思います。 参考 uepon.hatenadiary.com RAGは、大規模言語モデル(LL…

【実践】9つの視点でアイデア発想!オズボーンのチェックリストGPTを作ってみた

アイデアを改良したい、もっと多角的に考えられないか——そんな悩みはありませんか? またかYO! 自分の研究がどんどんアイディエーション支援の領域に入ってきたこともあり、先日はTRIZのカスタムGPTを作成しましたが、今回はオズボーンのチェックリストを使…