-
【2023.11.24】 支持 llama-cpp-python 推理,使用文档
-
【2023.11.03】 支持
chatglm3
和qwen
模型的function call
调用功能,同时支持流式和非流式模式, 工具使用示例, 网页demo
已经集成到 streamlit-demo -
【2023.09.27】 添加 Qwen-14B-Chat-Int4 模型支持,启动方式链接
-
【2023.08.28】 添加
transformers.TextIteratorStreamer
流式输出支持,只需将环境变量修改为USE_STREAMER_V2=true
-
【2023.08.26】 添加 code-llama 模型支持,启动方式,示例
-
【2023.08.22】 添加 xverse-13b-chat 模型支持,启动方式
-
【2023.08.03】 添加 qwen-7b-chat 模型支持,启动方式
-
【2023.07.12】 添加 baichuan-13b-chat 模型支持,启动方式
-
【2023.06.26】 添加 ChatGLM2-6b 模型
-
【2023.06.12】 使用 m3e 中文嵌入模型(在中文文本分类和文本检索上都优于
openai-ada-002
)