cloud studio を利用して構築したプライベート知識庫
Cloud Studio + ollama + deepseek + nomic-embed-text + anythingllm + プライベート知識 === ai プライベート知識庫
必要なことは実際に上でほぼ伝えられていますので、操作を始めましょう。
まずは私たちの古い友達Cloud Studioを開きます。今、私たちの中には cloud studio を cs と略称する人もいます。cs が大きく成長し、再び輝かしい成果を上げることを願っています。私たちの地元の colab を作り上げましょう。
引き続きホームページのバナーを選択し、直接 32b モデルを選びます。
リソースの割り当てを待ち、起動します。
完了後は以下のようになります。
cloud studio はすでに anythingllm を内蔵しています。もし自分のローカルコンピュータにインストールして使用したい場合は、anythingllm をダウンロードしてインストールする必要があります。もちろん、単に簡単に体験したいだけなら、ダウンロードする必要はなく、cs が提供する内蔵 web を直接使用すれば大丈夫です。
私たちはブラウザで内蔵の anythingllm ページを開くだけで良いです。
deepseek-r1:32b を引き出すこのステップは省略できます。なぜなら cs がすでにモデルをダウンロードしてくれているからです。前提としてその 32 のプランを選択している必要があります。もし 32b を使用したい場合は、ollama pull deepseek-r1:32b
をダウンロードして引き出す必要があります。
nomic-embed-text を引き出すにはollama pull nomic-embed-text
を実行します。
ローカルで使用する場合は、anythingllm クライアントをダウンロードしてください。
初期化を開きます。
anythingllm がローカルにインストールされている場合のみ初期化が必要です。cloud studio を使用する場合は、デフォルトで初期化されています。ただし、上記の引き出しは必ず cloud studio のターミナルで実行してください。速度は少し遅くなるかもしれませんが、リソースは海外のサーバーにあるためです。
開始をクリックします。
下にスクロールして ollama を選択します。
前回の記事で言った ollama を使って deepseekr1 をデプロイして api を提供することを覚えていますか?ここでの url は api アドレスを入力する必要があります。どう入力するかわからない場合は、cloud studio を開いてポートをクリックします。
どのポートが ollama サービスを提供しているかを確認し、小さな地球をクリックして新しいページを開きます。
ここでの url をコピーします。私のはhttps://ottzkl-pkzulq-8434.app.cloudstudio.work です。anythingllm のクライアントに貼り付けます。
注意、必ず url の後ろのスラッシュを取り除いてください。スラッシュなしで、https://ottzkl-pkzulq-8434.app.cloudstudio.work です。
url を入力すると、上のモデルが自動的に認識します。下にスクロールして適切なモデルを選択します。例えば、32b を選びます。他のパラメータはデフォルトのままで大丈夫です。パラメータの変更はこの記事の範囲外です。
その後、初期化が完了するまで次へ進みます。
簡単な設定を始めましょう。
アイコンの小さなレンチをクリックします。
2025/2/17 15:20
この時の操作は web ページの操作と一致しています。
embedder をクリックして、埋め込みの選択をします。
ollama を選択し、アドレスは以前の api アドレスと同じです。貼り付けて、nomic-embed-text を選択し、変更を保存します。
小さなレンチの位置をクリックすると、今は戻る矢印になります。クリックして、ホームページに戻ります。
ホームページで新しいワークスペースを作成します。
ワークスペースの名前を入力し、保存をクリックします。
まずテストして、deepseek が正常に呼び出せるか確認します。
ok、正常です。私たちが作成したワークスペースの隣にあるアップロードボタンをクリックして資料をアップロードします。
サポートされているファイル形式は多く、txt、doc、csv、xls、docx、xlsx、pdf、ウェブサイトなどがあり、音声や動画ファイルもサポートしています。テキストファイルのような形式が最も良いです。そうすれば、認識がより便利で迅速かつ正確になります。
私はここで適当にいくつかの pdf ファイルをインターネットで探しました。
ドラッグ&ドロップして、すべて選択し、ワークスペースに移動します。
下にスクロールして保存を選択します。
少し待って、ワークスペースのデータがアップロードされるのを待ちます。
成功のメッセージが表示されたら、アップロードしたファイルにピンを付けてください。そうすれば、私たちの資料が優先的に呼び出されます。
ダイアログを閉じて、質問を行います。
hide citations をクリックすると、現在引用している資料が表示されます。
これで、プライベート知識庫の構築が完了しました。