那些大型語言模型 (Large Language Model, LLM) 要踩的坑:Ollama、Dify、LangFlow、Flowise、RAGFlow、AnythingLLM、CrewAI、AutoGen
- 提供類似流程圖的任務編排視圖,能直接拖放節點來串聯對話及資料處理邏輯。
- 內建多種主流 LLM 模型供選擇,並可彈性切換。
- 支援使用者管理與登入機制,以及基本的系統監控與日誌功能。
- 提供外掛機制 (Plugin) 與向量資料庫整合,可將外部知識庫內容更有效率地植入。
- 可與第三方應用整合,並能通過 API 形式將對話功能嵌入至其他系統。

sudo vi /etc/systemd/system/ollama.serviceEnvironment="OLLAMA_MODELS=/path/to/ollama/models" (在最下方的service加上這行你要的路徑)sudo systemctl daemon-reloadsudo systemctl restart ollama.servicesudo systemctl status ollamaOLLAMA_HOST= ollama serve (或者是用變量來做 launchctl setenv OLLAMA_HOST "")如果是想要用 ngrok 來做服務,那就需要這樣ngrok http 11434 --host-header="localhost:11434"
- LLM 模型
- 115 GB:mixtral:8x22b-instruct-v0.1-q6_K
- 250 GB:deepseek-v2:236b-chat-q8_0
- 141 GB:llama3.1:70b-instruct-fp16
- 231 GB:llama3.1:405b (ollama link)
- 245 GB:mistral-large:123b-instruct-2407-fp16 (ollama link)
- Text Embedding 模型
- bge-reranker-large
- bge-large-zh-v1.5
- mxbai-embed-large:v1
- nomic-embed-text:v1.5
- OLLAMA_FLASH_ATTENTION:優化的,計算效率跟記憶體使用率都會比較好
- OLLAMA_ORGINS:用逗號分隔,來當作連線來源限制
- OLLAMA_KEEP_ALIVE:指的是模型能存活多久,有在用的就知道,有時會跑很久,就是因為整個重新 loading,當然如果 GPU 夠的話,其實可以活久一點啦
- OLLAMA_PORT:這個是指定 PORT,很好懂
- OLLAMA_NUM_PARALLEL:這個是同時要啟用幾個模型,如果GPU很夠用,是真的可以多開
- OLLAMA_MAX_QUEUE:默認512,如字面意思,就是可以排多長的隊啦
- OLLAMA_MAX_LOADED_MODELS:如字面意思,會合理分配,默認是1,也就是只會有一個模型在 VRAM 裡
- 預設上下文視窗大小為2048 tokens,可以透過指令/set parameter num_ctx 4096 將上下文視窗長度調整為4096 token
- ollama ps判斷模型時運行在CPU還是GPU上
from huggingface_hub import snapshot_download
model_id = "google/paligemma-3b-pt-896" # hugginFace's model name
把放 GGUF 檔目錄,再新增一個檔案 Modelfile,裡面寫 FROM ./模型檔名.gguf
- 強調可視化聊天流程設計:支援多階段對話與條件判斷,可配置較為複雜的對話邏輯。
- 內建多語種支援及部分翻譯功能,方便在多國際化專案中使用。
- 擁有多種資料來源的連接器,輕鬆將 Excel、資料庫、網路 API 等整合供 LLM 使用。
- 提供社群支援與插件庫,可快速擴充新功能或套用範例流程。
- 從系統層級可監控資源使用情況,並可視需要做水平或垂直擴充。
sudo npm install -g flowise[sudo] password for twman:npm WARN ERESOLVE overriding peer dependencynpm WARN ERESOLVE overriding peer dependencynpm WARN While resolving: flowise-react-json-view@1.21.7npx flowise startNeed to install the following packages:flowise@2.2.3Ok to proceed? (y) ynpx flowise start --FLOWISE_USERNAME=user --FLOWISE_PASSWORD=1234http://localhost:3000/
- 重視插件生態與二次開發彈性,允許開發者自行撰寫自訂節點或功能模組。
- 提供一套基礎向量查詢工具與文檔管理機制,用於多輪對話中的上下文引用。
- 強化前端可視化介面:提供節點連線預覽、工具提示等,使流程編排更直觀。
- 支援模型與資料庫分離式部署,方便處理機密資料或大型檔案時更為靈活。
- 可整合使用不同角色或權限管理,針對專案分工進行細緻控管。
記得確認一下 版本
Python >=3.10
安裝整個快速又簡單python -m pip install langflow -U Looking in indexes: https://pypi.org/simple, https://pypi.ngc.nvidia.com Collecting langflow Downloading langflow-1.1.1-py3-none-any.whl.metadata (8.5 kB) Collecting assemblyai<1.0.0,>=0.33.0 (from langflow) Downloading assemblyai-0.36.0-py3-none-any.whl.metadata (29 kB) Collecting astra-assistants~=2.2.6 (from astra-assistants[tools]~=2.2.6->langflow) Downloading astra_assistants-2.2.9-py3-none-any.whl.metadata (4.7 kB)
python -m langflow run
docker pull mintplexlabs/anythingllmexport STORAGE_LOCATION=$HOME/anythingllm && \mkdir -p $STORAGE_LOCATION && \touch "$STORAGE_LOCATION/.env" && \docker run -d -p 3001:3001 \--cap-add SYS_ADMIN \-v ${STORAGE_LOCATION}:/app/server/storage \-v ${STORAGE_LOCATION}/.env:/app/server/.env \-e STORAGE_DIR="/app/server/storage" \mintplexlabs/anythingllm
sudo apt update
sudo apt install nodejs npm
npm install -g gatsby-cli
npm install --global yarn
cd frontend
yarn install
yarn build
npm ERR! errno 1
npm ERR! lmdb@2.5.3 install: `node-gyp-build-optional-packages`
npm ERR! Exit status 1
npm ERR!
npm ERR! Failed at the lmdb@2.5.3 install script.
npm ERR! This is probably not a problem with npm.
There is likely additional logging output above.
最後只好乾脆 build 一個它的 docker 來用了
sudo docker build -f .devcontainer/full/Dockerfile -t autogen_full_img https://github.com/microsoft/autogen.git
sudo docker run -it --name autogen -v /opt/data:/opt/data -p 9999:9999 -p 8889:8889 --shm-size=32g autogen_full_img:latest /bin/bash
sudo docker exec -i -t autogen /bin/bash
conda create -n autogen python=3.10
git clone https://github.com/microsoft/autogen.git
cd autogen
pip install -e .cd samples/apps/autogen-studio/
pip install -e .
jupyter notebook --generate-config
(首先就是先生成 config 檔)
vi ~/.jupyter/jupyter_notebook_config.py
# Default: False
c.NotebookApp.allow_remote_access = True
jupyter notebook password
Enter password: ****
Verify password: ****
[NotebookPasswordApp] Wrote hashed password to ~/.jupyter/jupyter_notebook_config.json
c.NotebookApp.port = xxxx
(這個就是 port 號)
ipython kernel install --name "deepspeed" --user
(我有個 conda env 叫 deepspeed,這樣就能加到 jupyter)接著就是直接啟動啦jupyter notebook至於 autogen 嘛,啟動指令是這樣
autogenstudio ui --port 9872
2024/05/20 想起了這個也蠻方便的 tunel 的用法 " TryCloudflare "
- Autogen: While Autogen excels in creating conversational agents capable of working together, it lacks an inherent concept of process. In Autogen, orchestrating agents' interactions requires additional programming, which can become complex and cumbersome as the scale of tasks grows.
- Autogen 代理只能按照它們被編程的方式進行互動。如果需要代理以不同的方式交互,則需要進行額外的編程。 程式設計複雜:程式設計Autogen 代理程式的互動可能非常複雜,尤其是對於複雜的任務及邏輯。 可擴展性差:Autogen 代理的程式設計方式不利於可擴展性。隨著任務規模的成長,程式設計代理的互動變得更加困難。
總的來說,相對於Autogen 和ChatDev 創建會話代理的工具,CrewAI 的構建以生產為中心,既提供了Autogen 對話代理的靈活性,又採用了ChatDev 的結構化流程方法,但又不失靈活性。 CrewAI 基於動態的流程設計理念,具有很強的適應性,可以無縫地融入開發和生產工作流程,以使得工作流程可以根據需求進行調整和優化,以適應不同的工作場景和業務需求。 - ChatDev: ChatDev introduced the idea of processes into the realm of AI agents, but its implementation is quite rigid. Customizations in ChatDev are limited and not geared towards production environments, which can hinder scalability and flexibility in real-world applications.
- ChatDev 中的自訂是有限的。這意味著ChatDev 可能難以滿足複雜應用程式的需求。 不適合生產環境:ChatDev 不適合生產環境。這意味著ChatDev 可能難以滿足實際應用程式的要求。 可擴展性差:ChatDev 的實作不利於可擴展性。隨著任務規模的成長,ChatDev 可能難以滿足應用程式的需求。
