Lamini

新品

Lamini 是面向开发者和企业的 mini-agent 与模型优化平台,提供 Memory Tuning、Memory RAG、Classifier Agent Toolkit、OpenAI 兼容推理和自托管部署。

编程开发 部分免费 23 9
访问 Lamini 官网

Lamini 是什么?

Lamini 的重点是构建高准确率 mini-agents。文档展示了 Memory Tuning、Memory RAG、Classifier Agent Toolkit、推理 API、OpenAI API 兼容、JSON 输出、批处理、流式、性能调优和自托管部署。它强调在更小模型和专门任务上提高准确率、减少幻觉,适合把企业知识、分类和 RAG 应用做得更可靠。

核心能力

Memory Tuning

把精确事实注入模型,减少幻觉并提升专门任务准确率。

Memory RAG

简化 RAG 设置,用数据迭代提升知识问答效果。

Classifier Agent

构建可扩展分类器,用于企业分类、审核和路由任务。

自托管部署

支持在自有 GPU、Kubernetes、AWS EKS、GCP GKE 等环境部署。

适合 / 不适合

适合
  • 需要把 LLM 调到特定业务数据上,并提高准确率的开发团队。
  • 构建 RAG、文本到 SQL、分类器和企业 mini-agent 的团队。
  • 希望用 OpenAI 兼容接口、SDK 和 REST API 接入应用的人。
  • 有自托管、安全和企业部署需求的组织。
不适合
  • 只想使用简单聊天工具,不需要调优和部署的人。
  • 没有高质量事实、样本和评估集,却希望模型自动变准的人。
  • 不具备模型工程、API 或 Kubernetes 维护能力的个人用户。
  • 需要图像视频生成作为核心能力的创意团队。

产品信息

开发方
Lamini
产品形态
Python SDK;REST API;平台;自托管 Kubernetes;特殊形态:Memory Tuning 与 mini-agent 开发平台
价格状态
部分免费:文档显示提供免费 credits;平台用量、自托管、企业部署和 GPU 成本以 Lamini 页面为准
关键标签
部分免费、Memory Tuning、Memory RAG、Mini Agents、分类器、自托管
注意事项

Lamini 的价值在专门任务准确率提升;必须配合高质量数据、评估集和上线监控。

适用场景

怎么用更好

1

先准备小而准的事实和示例,再逐步扩展到更大数据集。

2

每次调优都要用固定评估集验证,不能只看主观体验。

3

RAG 和 Memory Tuning 应按任务选择,不要所有问题都套同一方案。

4

自托管前确认 GPU 资源、鉴权、模型管理和运维责任。

典型使用场景

企业知识问答

用 Memory RAG 构建更可靠的资料问答。

Text to SQL

围绕数据库和业务问题生成查询并调试。

文本分类

构建客服、合规、工单或路由分类器。

自托管模型

在自有基础设施上部署 Lamini 平台。

编程开发的其他工具

qwqqq AI Coding Plan
qwqqq AI Coding Plan
qwqqq AI Coding Plan 指向 gpt.qwqqq.cn 的 New API 模型聚合与分发网关,支持将多种大语言模型转换为 OpenAI、Claude、Gemini 兼容接口。
GitHub Copilot
GitHub Copilot
GitHub Copilot 是 GitHub 的 AI 编程助手,覆盖编辑器补全、Chat、Agent Mode、Coding Agent、CLI、代码审查和 GitHub 工作流集成。
TRAE
TRAE
TRAE 是字节跳动推出的 AI IDE,面向代码生成、补全、重构、调试、项目理解、Agent 模式和多模型辅助开发。
Claude Code
Claude Code
Claude Code 是 Anthropic 的 agentic coding 系统,可在终端、IDE、Web 和远程环境中读取代码库、修改文件、运行测试、提交 PR 并接入 MCP。
v0.app
v0.app
v0.app 是 Vercel 推出的 AI UI 与应用生成平台,可通过自然语言生成 React/Next.js 界面、组件、应用原型和可继续部署的前端代码。
Cursor
Cursor
Cursor 是基于 VS Code 体验的 AI 代码编辑器,提供 Tab 补全、Agent、Ask、Composer/Chat、代码库理解、终端命令和多模型开发工作流。
Bolt.new
Bolt.new
Bolt.new 是 StackBlitz 推出的 AI 全栈 Web 开发平台,基于浏览器 WebContainer 运行环境,用提示词生成、运行、调试和部署应用。
无问芯穹 Coding Plan
无问芯穹 Coding Plan
无问芯穹 Coding Plan 是无问芯穹面向 GenStudio 和 AI 编程工具的模型调用订阅入口,适合接入 Claude Code、OpenCode、Cursor、Cline 等开发工作流。
京东云 Coding Plan
京东云 Coding Plan
京东云 Coding Plan 是京东云 JoyBuilder 模型开发平台的 AI 编程订阅服务,支持多模型切换,并可接入 Claude Code、Cursor、OpenClaw、Roo Code 等工具。
联通云 Coding Plan
联通云 Coding Plan
联通云 Coding Plan 是联通云推出的 AI 编程订阅套餐,公开信息显示支持 GLM-5、MiniMax、Qwen、DeepSeek 等模型,并适配 OpenCode、Claude Code、OpenClaw、CoPaw 等工具。
Lamini

Lamini

编程开发

前往官网
docs.lamini.ai/

数据统计

浏览量 23
点击量 9
收录时间 2026-05-14
更新时间 2026-05-27