lmdeploy 部署 OpenGVLab/InternVL3-2B-Instruct 大模型

开通Hai服务器，CS显存不够，所以就没有使用CS来部署。

wget https://repo.anaconda.com/archive/Anaconda3-2024.10-1-Linux-x86_64.sh

baKvP2

chmod +x Anaconda3-2024.10-1-Linux-x86_64.sh && ./Anaconda3-2024.10-1-Linux-x86_64.sh -b

93Sgj7

source /home/ubuntu/anaconda3/bin/activate

conda create -n ocr python=3.11 -y && conda activate ocr 
pip install lmdeploy -i https://pypi.org/simple/

lFe7RC

PH8Ybe

pip install partial_json_parser timm -i https://pypi.org/simple/

DNDrH1

lmdeploy serve api_server OpenGVLab/InternVL3-2B-Instruct --backend turbomind  --server-port 8888 --tp 1

lAvKue

不知道为什么，我这边不能直接打开这个端口，所以需要用到穿透服务，
创建密钥

ssh-keygen -t ed25519

FjUynM
默认回车就好

执行穿透命令

ssh srv.us -R 1:localhost:8888

v3QaTf

这里的 8888 端口就是上面部署成功的，我们打开穿透的网址
uE0DF0

部署成功，之后我们使用 open-webui 来进行调用

pip install open-webui -i https://pypi.python.org/simple

J4ulPU

open-webui serve

在执行一次穿透命令
这次是穿透 open-webui

ssh srv.us -R 1:localhost:8080

作者在此建议，可以把两次穿透命令和在一起一次执行。

ssh srv.us -R 1:localhost:8888 -R 2:localhost:8080

y8lusC

之后分别打开上面的地址，open-webui 需要进行初始化即创建管理员账号
oeln4f
上图的箭头指示是开源设置密钥，这个需要在 open-webui 添加模型是使用。

设置参考如图
30lbcC

完成后，返回，我们新创建对话，选择我们的模型 OpenGVLab/InternVL3-2B-Instruct
C8SrhT

到此部署完成，由于测试出现了一些 bug，也不清楚是哪里出了问题，等下次有时间，再补上。