RAG

【実践】ChromaDB + Gemini APIでRAGシステムを構築する方法【ソースコード付】

先日はWikipediaAPIを使用して、Wikipediaの記事を取得する方法について書いてみました。今回はそのデータを活用して、RAG(Retrieval-Augmented Generation)システムを構築してみようと思います。 参考 uepon.hatenadiary.com RAGは、大規模言語モデル(LL…

Wikipedia API活用術|Pythonで記事・カテゴリ・リンク情報を一括収集する方法

私の研究分野では十分にドキュメント化されていないジャンルを扱っているため、Wikipediaから基礎情報を収集することが度々あります。そこで、効率的にデータを取得する方法をまとめることにしました。 Wikipediaからデータを取得する方法はいくつかあります…

【AIリスキリング・60分ハンズオン】プログラミング不要・環境構築なし!ブラウザだけで作るローカルLLM×RAGチャットボット

以前作成したGitHub Codespaces上のローカルLLM&LangFlowの環境のハンズオンを作成してみました。 これを行うと、ブラウザだけでLLM&RAGノーコード開発が可能になります。ハンズオンは60分想定で作成しましたが、そんなにかからないと思います。 必要なの…

【AIリスキリング】50分で完成!LM Studio×LangChainで作る無料RAG対応チャットボット

先日はRAGとMCPの概念を学びました。今回は実際に手を動かして、LM StudioとLangChainを使ったRAGチャットボットを作成してみたいと思います。概念がわかっていても実際にプログラミングを行わないとわからないことが多いので今回は環境づくりやコーディング…

Introducing Docling — A Versatile Document‑Conversion Tool for RAG Workflows

During my participation in an IBM watsonx.ai Dojo session, I was introduced to an excellent conversion tool capable of handling various file formats. That tool is Docling! It appears to be quite effective for Retrieval-Augmented Generatio…

【メモ】RAGシステム構築の強い味方 - Doclingによるドキュメント変換入門

IBM watsonx.ai DojoでRAGとして様々なファイルのフォーマットを使用するための変換ツールを紹介していただきました。 それが今回紹介するDoclingです Doclingとは? Doclingは、簡単にいうならば様々なドキュメントに対応したHTML、Markdown、JSONへのコン…