首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

AI创企Arthur开源大模型性能评估工具

纽约AI初创公司Arthur于当地时间8月17日发布开源AI模型评估工具Bench,用于比较生成文本模型的大型语言模型(LLM)、提示和超参数。据称,Arthur Bench可以帮助企业进行模型选择和验证、预算和隐私优化以及将学术基准转化为实际应用。Arthur同时推出了生成评估项目GAP,旨在对OpenAI、Anthropi和Meta等AI领先企业提供的语言模型产品的优缺点进行排名。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OU2DHLZk37MnjUaZFFMrUDeQ0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券