| サンプル集 |
|
■VC ■C# ■Java ■BorlandC ■LinuxC ■MS-DOS ■bash ■Excel VBA ■VBScript ■PHP ■HTML ■perl ■iPhone ■Android ■Lua ■WordPress ■PowerShell ■Python ■Flutter ■Rust ■Node.js ■ReactNative ■other |
| Linuxコマンド |
| 用語集 |
| debian メモ |
| apache2 メモ |
| MySQL メモ |
| Oracle メモ |
| PostgreSQL |
| HOME |
コンテンツをベクトル化して保存してみます。
◆環境| OS | Windows 10 Home 22H2 64bit OS x64 プロセッサ |
|---|---|
| Python | 3.13.1 |
| VS Code | 1.106.0 |
必要なモジュールをインストールするコマンドです。
pip install llama-index openai chromadb python-dotenv
コマンドを実行します。
> pip install llama-index openai chromadb python-dotenv
Requirement already satisfied: llama-index in c:\users\ymlib\appdata\
local\programs\python\python313\lib\site-packages (0.14.8)
Requirement already satisfied: openai in c:\users\ymlib\appdata\local
\programs\python\python313\lib\site-packages (2.8.1)
Collecting chromadb
:
略
:
tokenizers-0.22.1 typer-0.20.0 typer-slim-0.20.0 urllib3-2.3.0 uvi
corn-0.38.0 watchfiles-1.1.1 websocket-client-1.9.0 websockets-15.0
.1 zipp-3.23.0
Requirement already satisfied: llama-index in c:\users\ymlib\appdata\
local\programs\python\python313\lib\site-packages (0.14.8)Requirement already satisfied: openai in c:\users\ymlib\appdata\local
\programs\python\python313\lib\site-packages (2.8.1)Collecting chromadb
:
略
:
tokenizers-0.22.1 typer-0.20.0 typer-slim-0.20.0 urllib3-2.3.0 uvi
corn-0.38.0 watchfiles-1.1.1 websocket-client-1.9.0 websockets-15.0
.1 zipp-3.23.0Open AIのEmbeddingモデルを利用してベクトルを生成し保存します。
| build_index.py | ||
|
dataフォルダにベクトル化したいコンテンツを格納します。 今回はpdfファイルを2つ読み込ませてみます。
| コンテンツ | ページ数 | 容量 |
|---|---|---|
| エアコンのマニュアル | 64ページ | 8.29MB |
| プリンターのマニュアル | 56ページ | 6.09MB |
実行してみます。
> py .\build_index.py
2025-11-23 11:02:36,785 - INFO - HTTP Request: POST https://api.opena
i.com/v1/embeddings "HTTP/1.1 200 OK"
2025-11-23 11:02:38,553 - INFO - HTTP Request: POST https://api.opena
i.com/v1/embeddings "HTTP/1.1 200 OK"
index created!
実行時間: 0:00:25.263690 ms
2025-11-23 11:02:36,785 - INFO - HTTP Request: POST https://api.opena
i.com/v1/embeddings "HTTP/1.1 200 OK" 2025-11-23 11:02:38,553 - INFO - HTTP Request: POST https://api.opena
i.com/v1/embeddings "HTTP/1.1 200 OK" index created!
実行時間: 0:00:25.263690 ms
\storageフォルダが作成され、以下のファイルが生成されました。 生成されたファイルは合計で約11.8MB程度でした。
| ファイル名 | 容量(byte) |
|---|---|
| default__vector_store.json | 11,677,086 |
| docstore.json | 771,700 |
| graph_store.json | 18 |
| image__vector_store.json | 72 |
| index_store.json | 14,359 |
ファイルの内容を見ても正しいのかどうか分かりませんでした。 PCのスペックによるとは思いますが、pdfで120ページのマニュアルを処理するのに25秒弱かかりました。
Copyright (C) 2025 ymlib.com
