社区首页 >问答首页 >从函数自动构建决策树

问从函数自动构建决策树
EN

Stack Overflow用户

提问于 2019-06-04 05:33:42

回答 1查看 130关注 0票数 0

(如果这个问题有点头脑风暴，很抱歉)

我有一个函数F，参数是a_1, a_2...和b，它输出x。该函数还由可能在我工作期间更改的一系列p_1, p_2...参数定义。

F(a_1, a_2... , b) = x

考虑到a_1, a_2...，我想要构建一个决策树算法，该算法可以为函数F找到最小化x的b。我想自动化这个决策树构建器，以便容纳F的更改(通过p_1, p_2...)。

自动化过程非常重要，因为在实践中，a_x可以是任何东西(整数、连续数、离散参数)，而F是高度非线性的。

我本能的想法之一是建立假样本，并在数据集上学习决策树，这将给我所需的决策树。但是，这似乎过于复杂，因为我已经访问了生成此问题的函数。

如果有人有任何想法或指点我在任何方向，可以帮助我解决我的问题，这将是非常感谢的。

编辑:

我正在改变我的问题的范围：

假设从最初的问题开始，您得到了函数F'，它将a_1, a_2...映射为b (b是离散的)。是否会有一个算法试图通过一个以F'为节点的决策树来“简化”a_1, a_2...。

例如，一个决策树，它会说if a_2 = "type2" and a_1 < 6 -> 3等。我不是在寻找一个精确的分区，一个体面的估计是足够的。

我正在考虑使用ML算法来构建决策树，使用由F'蒙特卡罗模拟生成的假样本。这有道理吗？

algorithm

automation

decision-tree

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-06-11 21:34:52

如果您想要F'的快速和贪婪的近似，那么您的想法是有意义的，但是您应该注意正确地实现它：

1)当你说你的变量可能是绝对的和数值的，你应该考虑如何绑定这些变量。对于高度非线性的函数，普遍接受的线性二值化不是最优。

2)由于决策树在处理相关变量方面存在困难，一些预处理可能有助于提高决策树的处理效率。从PCA开始。

至于使用实际数据或从原始函数生成数据，我认为不应该有明显的差别。如果您看到在某些“区域”中，您的数据表示不足，您可能希望在这里和那里扩展初始培训数据集。

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/56445026

复制

MySQL浮点数与定点数

云数据库 SQL Server sql 数据库

浮点数一般用于表示含有小数部分的数值。当一个字段被定义为浮点类型后，如果插入数据的精度超过该列定义的实际精度，则插入值会被四舍五入到实际定义的精度值，然后插入，四舍五入的过程不会报错。在MySQL中float和double用来表示浮点数。

秋白

2019/02/21

1.3K0

zTree实现访问到第一节点在相同水平当前所选节点数目

https java 网络安全

发布者：全栈程序员栈长，转载请注明出处：https://javaforall.cn/117238.html原文链接：https://javaforall.cn

全栈程序员站长

2022/07/06

4190

定点数与浮点数表示

python

定点数与浮点数据表示 <1> 定点数据表示可表示定点小数和整数表现形式：X0.X1X2X3 ... Xn（定点小数）定点小数的表示数的范围(补码为例)：-1 $\leq$ x $\leq$ 1-2n 定点整数表示数的范围(补码为例)： -2n $\leq$ x $\leq$ 2n - 1 顶点数据表示数的不足：数据表示范围受

ruochen

2021/05/16

8390

基于System Generator的浮点数与定点数设计（实现与分析）

javascript node.js

打开System Generator，然后将第一次设计的滤波器文件Copy一份然后进行一些更改，或直接新建模型，以可以参考前几篇文章

狂人V

2020/06/29

8250

编辑器对于内存的使用——数据的保存与访问使用（浮点数篇）

编辑器二进制计算机内存数据

在上一篇文章中我们已经讨论了整形在编辑器中是如何使用和保存的了，详情请见这篇文章——

比特大冒险

2023/04/16

2890

☆打卡算法☆LeetCode 149. 直线上最多的点数算法解析

编程算法

给你一个数组 points ，其中 points[i] = [xi, yi] 表示 X-Y 平面上的一个点。求最多有多少个点在同一条直线上。

恬静的小魔龙

2022/08/07

3520

第十节、Python中整数和浮点数《Python学习》

python

Python支持对整数和浮点数直接进行四则混合运算，运算规则和数学上的四则运算规则完全一致。

申霖

2019/12/27

7580

【学点数据结构和算法】05-树

数据结构编程算法二叉树

通过【学点数据结构和算法】系列的1-4，我们已经学习了数据结构中常用的线性结构。从物理存储方面来说，它们又分为顺序存储和链式存储结构。他们各自有自己的优缺点，顺序存储结构读快写慢，链式存储结构写快读慢。但是这些数据元素之间的关系都为一对一的关系，而我们生活中关系不止是一对一，有可能是一对多，多对多的情况… 本篇博客，我们就要学习一种新的数据结构——树，它将为我们展示一个全新的“世界”。

大数据梦想家

2021/01/27

3940

【唯实践】基于Alluxio优化电商平台热点数据访问性能

大数据 hive 数据分析 sql spark

在互联网电商平台上，广告是提升成交总额（Gross Merchandise Volume）和拉取新客的常见途经。在广告系统或广告运营中都需要基于人群数据分析进行定向的用户广告投放。在第三方平台进行广告投放，同样需要使用人群数据分析计算。根据计算分析方的不同，可以分为两类，第一类是基础数据全部发送给第三方广告平台，如抖音，腾讯等，由第三方在投放人群时候进行人群计算并作选择；第二类是人群计算工作在电商平台内部完成，推送给第三方的只是单个的人群包数据（设备数据）。在唯品会，我们目前采用第二类方式进行人群计算投放。我们每天需要完成数万的人群包计算，这些计算都是基于几张位于HDFS的之上的Hive 表完成，这些表每天通常都需要被访问上万次。

Spark学习技巧

2021/03/05

6080

浮点数原理与精度损失问题

https 网络安全 html 存储

计算机中小数的表示按照小数点的位置是否固定可以分为浮点数和定点数。为了方便和float32浮点数做对比，我们构造一个32位精度的定点数，其中小数点固定在23bit处：

TOMOCAT

2020/10/29

3.2K0

算法分析----第一节

编程算法

O(n)不是算法，它是一个函数，是一个表征算法时间复杂度的一个函数。计算机科学中，算法的时间复杂度是一个函数，它定性描述了该算法的运行时间。这是一个关于代表算法输入值的字符串的长度的函数。时间复杂度常用大O符号表述，不包括这个函数的低阶项和首项系数。使用这种方式时，时间复杂度可被称为是渐近的，它考察当输入值大小趋近无穷时的情况。

Dream城堡

2019/03/20

3960

ACM算法竞赛——浮点数二分（模板）

腾讯微信算法大赛

浮点数二分算法代码比整数二分算法简洁易懂，也不需要处理复杂的边界问题 bool check(double x) {/* ... */} // 检查x是否满足某种性质 double bsearch_3(double l, double r) { const double eps = 1e-6; // eps 表示精度，取决于题目对精度的要求 while (r - l > eps) { double mid = (l + r) / 2; if (ch

战士小小白

2022/05/14

2760

【学点数据结构和算法】02-链表

编程算法

上一篇博客博主为大家带来了数组的内容分享，本篇博客我们来学习另外一个重要的数据结构——链表!

大数据梦想家

2021/01/27

5480

【学点数据结构和算法】01-数组

编程算法数据结构 https 大数据网络安全

先来解释下博主为什么会在这个时候开设一个专栏来学习【数据结构和算法】。

大数据梦想家

2021/01/27

5800

定点数和浮点数_定点数和浮点数哪个精度高

https 网络安全

计算机中常用的数据表示格式有两种，一是定点格式，二是浮点格式。所谓定点数和浮点数，是指在计算机中一个数的小数点的位置是固定的还是浮动的：如果一个数中小数点的位置是固定的，则为定点数；如果一个数中小数点的位置是浮动的，则为浮点数。一般来说，定点格式可表示的数值的范围有限，但要求的处理硬件比较简单。而浮点格式可表示的数值的范围很大，但要求的处理硬件比较复杂。

全栈程序员站长

2022/11/03

1.1K0

小朋友学C语言（4）：单精度浮点数与双精度浮点数

c 语言

上节课简单介绍了浮点数。计算机程序中的浮点数分为单精度浮点数和双精度浮点数。单精度和双精度精确的范围不一样。计算机里的最基本的存储单位用位(bit)来表示。bit只能用来存储0或1。稍大一点的单位是字节(Byte，简写为B）。再大一级的是千字节(kilo Bytes)，用k来表示。再大一级的单位是兆字节(Mega Bytes)，用M来表示。一张照片的大小通常为1~3M。再大一级的单位为G。一部高清电影的大小通常为1~2G。再大一级的单位为T。换算关系为： 1B = 8bit 1k =

海天一树

2018/04/17

2.8K0

【学点数据结构和算法】04-散列表

hashmap java 数据结构编程算法 jdk

前面已经陆陆续续写了几篇介绍数据结构的博客，包含数组，链表，栈和队列…本篇博客，我们再来学习一种有趣的数据结构——散列表。

大数据梦想家

2021/01/27

4600

浮点数与十六进制互相转换

利用强制转换类型实现。浮点数转十六进制实现： float f = 123.45f; unsigned char *hex = (unsigned char *)&f; 打印输出： for(int i = 0; i < 4; i++) printf("0x%02X ", hex[i]); printf("\n"); 十六进制转浮点数实现： unsigned char hex[] = { 0x66, 0xE6, 0xF6, 0x42 }; float f = *(float *)hex;

Qt君

2019/09/10

4.2K0

点击加载更多

相似问题

如何在Visual Studio C#窗体中创建滚动平铺

137

创建可滚动窗口窗体C#

列表视图xamarin窗体滚动中的图像消失

我们如何在c#窗体中弹出图片框，如bing图像搜索

310

如何在C#窗口窗体中创建选项窗体？

添加站长进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

问从函数自动构建决策树
EN