随着生成式大语言模型(下文简称为:LLM)的成熟,LLM 应用的生态呈现爆炸式的增长,相应监控工具的需求也随之上升。由于 LLM 对算力要求过高,性能优化复杂,如何提供稳定可靠的服务并保证优越的用户体验极具挑战,因此在延迟、吞吐和成本等方面的实时监控能力对于 LLM 应用开发者来说至关重要。此外,目前市面上可观测性/监控工具缺乏对 LLM 领域的深层知识,也缺少业务决策的着力点,最终阻碍了应用的可持续性。
GreptimeAI 的具体信息
针对上述问题,基于早前的时序数据库产品——GreptimeDB,Greptime(格睿科技)推出了一款为 LLM 应用量身定制的可观测性解决方案——GreptimeAI,开发者可以通过该方案全面、深入地了解应用的成本、性能、流量和安全情况,在保证低成本和高性能的条件下提供高效可靠的分析能力,同时还保留时序数据库的灵活性。
GreptimeAI 提供以下一系列的跟踪和分析能力,让 LLM 应用开发者可以全面掌握各模块的运行状态:
1
成本
对成本细目进行深入分析,实时掌握成本去向,并通过分析用户的使用模式优化 Prompting 方案来降低成本。
2
生成 (Generation)
通过持续跟踪和分析模型的 Prompt Token 和 Completion Token 行为,不断调整 Prompting 方案,深度挖掘模型价值。
3
性能
监控应用中各个模块的耗时情况,快速定位性能瓶颈,提升应用表现。
04
用户
分析用户行为,收集用户反馈,不断完善 Prompting 方案,增强用户粘性。
05
Trace
利用 Trace 信息快速定位并解决根源问题,保障应用的高稳定性和高可靠性。
关于 Greptime
Greptime 格睿科技于创立于 2022 年,致力于数据库的开发工作,目前正在完善和打造时序数据库 GreptimeDB, Greptime Cloud 两款时序数据库产品和一款更适合 AI 应用的可观测工具 GreptimeAI。
GreptimeDB 是一款用 Rust 语言编写的时序数据库,具有分布式,开源,云原生,兼容性强等特点,能够帮助企业在实时读写、处理和分析时序数据的同时,降低长期存储的成本。
GreptimeCloud 基于开源的 GreptimeDB,为用户提供全托管的 DBaaS,能够与可观测性、物联网等领域结合的应用产品结合。利用云提供软件和服务,可以达到快速的自助开通和交付,标准化的运维支持,和更好的资源弹性。GreptimeCloud 已正式公测,欢迎关注公众号或官网了解最新动态!
GreptimeDB 于 2022.11.16 日在 GitHub 宣布开源,第二天即在 GitHub Global Trending 排名第一,并持续一周保持热度。截止目前,已有超 40 个活跃外部开发者持续贡献了逾百个 PR,3000+ GitHub Star。
希望更多的开发者和用户能加入我们的社区生态,共创更实用和更强大的数据库产品。
官网:https://greptime.cn/
GitHub: https://github.com/GreptimeTeam/greptimedb
文档:https://docs.greptime.cn/
Twitter: https://twitter.com/Greptime
Slack: https://greptime.com/slack
LinkedIn: https://www.linkedin.com/company/greptime
领取专属 10元无门槛券
私享最新 技术干货