在Ubuntu24.04上运行Qwen2.5大模型

发表于 2024-09-24 更新于 2024-10-18 分类于编程开发

思路：

OS : Ubuntu24.04
CPU : 13700k
显卡：RTX3090 24G显存

1 2	sudo apt update sudo apt install -y nvidia-container-toolkit

1 2	git clone https://github.com/valiantlynx/ollama-docker.git cd ollama-docker

此项目库里有2个docker compose文件：

docker-compose.yml文件是没有GPU加速功能的，把它删除掉，并且把docker-compose-ollama-gpu.yaml这个文件改名为docker-compose.yml。

1 2	rm docker-compose.yml mv docker-compose-ollama-gpu.yaml docker-compose.yml

1	docker-compose up -d

这样，会自动下载ollama和Open WebUI。

安装完成后，打开http://localhost:8000，并进行后续设置

点击右上角图标，选择管理员面板

选择设置–模型

在从 Ollama.com 拉取一个模型里，输入qwen2.5:32b，这样会自动下载模型。

为什么要选择qwen2.5:32b这个模型呢？是因为32b的大小20G,正好在 RTX 3090 24G显存的范围内。而且经我实测，效果非常好。

通过docker compose这种方式安装，已经设置好了，可以从局域网内其它电脑上访问服务，这一点很方便。

至此，所有工作都已完成，愉快的和AI模型对话吧。