RAGとは、AIによるテキスト生成を特定のデータソースからの情報で補完する技術のことです。
これにより、ハルシネーション(AIが誤情報を出力すること)を一定程度防ぐことを目指すものです。
(注:必ずしもハルシネーションを防げるわけでもなければ、必ずしも防げる確率を上げるわけでもありません。ユースケースによって精度がかなり変わります。いわゆるPOCフェーズで検証する必要があります。)
精度の高いRAGを実現するためにベクトルデータベースが使われることが多いです。
ベクトルデータベースは、簡単に言えば情報を検索するのが得意なデータベースです。そのため、このデータベースに独自データを保存することで、RAGのデータソースとすることが多いのです。
しかし、ベクトルデータベースは面倒です。エンベディング処理をおこなったり、新たにデータベースを用意したりする必要があります。つまり、ベクトルデータベースを採用することによる追加の運用保守費用や、開発工数が発生してしまうのです。
では、