
新模型介绍
-
BGE-M3: 由北京智源研究院(BAAI)开发的大型嵌入模型,其特点在于能够多功能、多语言和多粒度的广泛适用性。
-
BGE-Large: 一款英文训练的大型嵌入模型。
-
Paraphrase-Multilingual: 一款支持50多种语言的多语言嵌入模型,基于平行数据训练。
全新支持批处理的嵌入API
Ollama 新增了一个API端点 /api/embed,专门用于生成嵌入信息:
curl <http://localhost:11434/api/embed> -d '{"model": "all-minilm","input": ["Why is the sky blue?", "Why is the grass green?"]}'
这个API端点新增了以下特性:
-
批量处理:一次请求即可为多篇文档生成嵌入信息
-
标准化嵌入:嵌入信息现已标准化,进而提升了相似度测量的准确性
-
截断功能:新增了一个截断参数,若设为false则会报错
-
性能指标:响应结果中会包含 load_duration(加载时长)、total_duration(总时长)和 prompt_eval_count(提示评估计数)等性能指标
更新内容
-
修复了 Windows 上初始下载速度慢的问题
-
NUMA 支持现在会被 Ollama 自动侦测,以提升性能
-
解决了 /api/embed 有时返回乱序嵌入结果的问题

? 合作/加群方式
? 往期好文推荐?


