首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
首页标签自动推理

#自动推理

DeepSeek 笔记:推理新范式 query+cot+answer 支持新的 scaling law 吗?

立委

老友张俊林《从Deepseek R1看Scaling Law的未来》一文,引起老友热议。

14110

DeepSeek 笔记:R1 部署阶段的推理机制

立委

- 生成多条路径:模型在单次推理时,可能隐式生成多条潜在的推理路径(CoT+Answers),但仅选择其中一条输出。 - 技术实现:通过调整解码策略(如束搜索宽...

12910

推理强化学习是端到端的监督,推理过程的非监督

立委

DeepSeek R1 的数学和代码数据究竟是有监督还是无监督?是人造数据还是再生数据?

15610

推理强化学习是端到端的监督,推理过程的非监督

立委

DeepSeek R1 的数学和代码数据究竟是有监督还是无监督?是人造数据还是再生数据?

15610

NeurIPS’23 Paper Digest | 如何把 LLM 的推理能力应用于事件序列预测?

可信AI进展

为期一周的人工智能和机器学习领域顶级会议 NeurlPS 正在美国路易斯安那州新奥尔良市举办中。蚂蚁集团有 20 篇论文被本届会议收录,其中《Language

29800

教你快速上手Xinference分布式推理框架

码之有理

腾讯 | 后台开发 (已认证)

Xorbits Inference(Xinference)是一个性能强大且功能全面的分布式推理框架。可用于大语言模型(LLM),语音识别模型,多模态模型等各种模...

16.2K20
领券