LLM
4月に復帰してからというもの、日中は業務に追われてClaudeをじっくり触る時間がほとんど取れていない。Max 5xプラン($100/月)を契約しているのに、正直もったいない状態が続いている 私は世間的には非エンジニアにカテゴライズされているメモ帳プログラマ…
大学も卒業したので、やっているときにはあまり考えられなかったところを、かじった程度の視点から考えてみました。 RAGってそもそも何? AI(大規模言語モデル=LLM)は賢いけれど、社内固有情報や新事実に対してはそのままでは弱い。「うちの会社の就業規…
最近、ローカルLLMの実行環境としてOllamaやllama.cppを使うことが多くなりました。そんななか、「もっとポータブルにできないかな?」と想像してしまいます。出先のPCでサクッとLLMを動かしたい場面って意外とあるんですよ特に、勉強会でのデモや、企業の社…
3月はDELLのアンバサダー・プログラムでIntel Core Ultra 7 268V搭載のPCをお借りしていましたが、せっかくNPUがあるのにあまり活用できていないなーと思っていました。ローカルLLMは、普段llama.cpp、Ollama、LM Studioなどで動かしていますが、これらのタ…
今回でいよいよ最終回、5回目のDell Pro 13 Premiumガチレビューとなります。 本記事は、デル アンバサダープログラムのモニターに参加し、Dell Pro 13 Premiumをお借りしてレビューしています。 #デルアンバサダー #DellPC #DellPro13Premium #ノートPCレビ…
この内容は「なごあずの集い#8」で発表した内容をベースに、さらに詳細な手順や補足情報を加えたものになります。 https://75az.connpass.com/event/383389/ speakerdeck.com Microsoftが開発したマルチエージェントシミュレーションライブラリTinyTroupeを…
OllamaはローカルでのLLM実行ツールとしておなじみですが、2025年9月から「クラウドモデル」がプレビューとして提供されています。手元のPCでは動かせないような大規模モデルを、Ollamaのデータセンター上で実行できる機能です。 ちょっと思ったのは、「ロー…
最近、ローカルLLMを使用していると、いろいろなアプリケーションから使いたいなと思っていて、ふと「Excelから直接ローカルLLMを呼べないかな?」と思ったんですよね。 ExcelからLLMといえばVBAを使う方法が真っ先に浮かびますが、正直なところ新規でVBAを…
2026年2月、ローカルLLMを触っている人にとってはかなり大きなニュースがありました。 llama.cppの創設者であるGeorgi Gerganov率いるggml.aiが、Hugging Faceに合流するというものです。 Hugging Face公式ブログではこう書かれています。 We are super happ…
Windowsでのllama.cppのインストールに関して自分用にまとめておこうと思います。OllamaやLM Studioはインストーラーがありますが、llama.cppはインストールがないので、一旦まとめておきます。 これは、動作させる環境がCPUのみ、CUDAあり、その他環境もあ…
IBM Project Bob(このエントリでは以降 Bob IDEとします)は、IBMが開発したAIエージェント搭載のIDE(VS Codeのフォーク)です。AIエージェントにコマンドを実行させ、プログラムの生成や実行を自動化できる、いわゆるAIコーディングエージェント系のツー…
Raspberry Pi 5がまた値上げになりましたね www.gizmodo.jp 16GBモデルが60ドルアップで205ドル(約3万円)。しかも2025年12月に値上げしたばかりで、わずか2カ月での再値上げです。原因は世界的なRAM不足とのこと。 このニュースを見て真っ先に思ったのが、…
2026年1月27日、「IBM Elite Support for Docling」の一般提供(GA: General Availability)について発表がありました。 community.ibm.com これだけ見るとDoclingは有料になっちゃうの?と感じますが、そうでは無いようです。 この発表の意味するところや企…
以前のエントリなどでも触れていましたが、Raspberry Pi 5(8GB RAM)でリアルタイム対話可能な日本語LLMは実現可能となりつつあります。それも、特別なハードウェアを使用することなしにです。 これは、1B〜3Bパラメータのモデルでもかなり優秀になってきて…
最近、卒業研究の論文で忙しかったのですが、ようやく峠をこえましたそんななかで「Graniteって最近どうなってるんだろう?」と思い立ち、公式サイトやHugging Faceのibm-graniteリポジトリを眺めてみました。LlamaやMistral、Qwenなど選択肢が増える中で、I…
2026/01/21追記:CPU N100、12GBメモリのWindowsPCでllama.cppで動作したところ10tokens/sというスピードでした。 前回はGPUなしで動く!1GB小型LLM「LFM 2.5」の導入方法と実力検証という内容で、軽量なLLMモデルLFM 2.5をGPUのないノートPC環境で動かす方…
2026/01/21追記あり:LM Studioから直接モデルのダウンロードができる様になりました。 2026/01/21追記あり:N100CPUでの動作スピードを追記(約8tokens/s)。 最近、ローカルLLMを動かすためのGPUやメモリの価格が高騰していて、「新しくPC環境を揃えるのは…
修論まだ終わってないのに… 現在、絶賛修論執筆中の身ですが、修論の研究でStreamlitでLLMを使った実験用のアプリを作っていたときに 「複数のLLM APIを呼び出して、結果が返ってくるの遅くない?」から始まった技術検証の話を書きます。 複数のプロンプトを…
この画像はエントリの内容ををNano Banana Proのインフォグラフィックスとなります なぜ今さら"規格"の話が大事なのか 2025年はAIエージェントの年になるって予想がいろいろ出ていましたよね。2026年1月現在の振り返ってみると、少なくともAIエージェントの…
ファインチューニング / LoRA / RAG は何が違うの? AIや大規模言語モデル(LLM)の話をしていると、次のような質問がありますよね。 ファインチューニング(Fine-Tuning) LoRA RAG 最近AIを勉強はじめた方と話をしていると、この3つの違いについて質問され…
これまで、OpenAI、Anthropic、Googleといったメジャーどころの生成AIモデルやサービスの動向を追ってきましたが、IBM関連の技術も追っているため、2025年のIBMのAI戦略と技術動向についてもまとめてみようと思います。 IBMのAI関連サービスは「watsonx」と…
OpenAI、Anthropicと振り返ってきたこのシリーズ、最後はGoogleです。 参考 uepon.hatenadiary.com uepon.hatenadiary.com 正直なところ、今年のGoogleを一言で表現するのは難しいと感じています。モデルの進化、エージェント機能、企業向けプラットフォーム…
前回の記事ではOpenAIの2025年を振り返りましたが、今回はAnthropic編です。 参考 uepon.hatenadiary.com 正直なところ、Anthropicに対しては「OpenAIほどリリースが派手じゃないよね」という印象を持っていた方も多いのではないでしょうか。私自身もそう感…
AI競争の火付け役であるOpenAI。2025年も数多くのリリースがありましたが、皆さんはどこまで追えていますか? 私自身、AIについては学んでいるつもりでしたが、振り返ってみると「知らなかった」「見落としていた」というものが結構ありました。 新モデルの…
今回は、BERTを使った感情分析に挑戦してみました。「BERTって難しそう...」と思っていたのですが、実際にやってみるとPython初心者でも意外と簡単に実装できたのでまとめてみました。 なぜBERT感情分析をやってみたのか? きっかけは... 大学の同期の方がBE…
このブログはからあげ帝国 Advent Calendar 2025の23日目の記事です。 qiita.com 今回は最新のAIのIDE環境であるIBM Project Bob(以下Project Bob)を使用してゲームを作成した感想とゲームの紹介となります。 これまで、Claude Codeや Gemini CLiなども使…
この記事は以下のエントリの継続的な記事になっています。 WikipediaAPIから情報を取得する方法 uepon.hatenadiary.com ChromaDB+GeminiAPIでRAGシステムを構築する方法 uepon.hatenadiary.com 2025年11月にリリースされたGoogle Gemini APIのFile Search T…
年末に向けて、生成AIのモデルのバージョンアップラッシュが続いていますね。ChatGPT 5.1、Claude 4.5、そしてGoogleのGemini 3.0Proなど、さまざまなAIモデルが登場しました。どれを使えばいいのか迷ってしまう方も多いのではないでしょうか 自分は研究でG…
先日はWikipediaAPIを使用して、Wikipediaの記事を取得する方法について書いてみました。今回はそのデータを活用して、RAG(Retrieval-Augmented Generation)システムを構築してみようと思います。 参考 uepon.hatenadiary.com RAGは、大規模言語モデル(LL…
アイデアを改良したい、もっと多角的に考えられないか——そんな悩みはありませんか? またかYO! 自分の研究がどんどんアイディエーション支援の領域に入ってきたこともあり、先日はTRIZのカスタムGPTを作成しましたが、今回はオズボーンのチェックリストを使…