腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(267)
视频
沙龙
2
回答
在spark sql中注册
UDAF
、
我想注册一个
UDAF
类(用Scala或Python编写),并在Spark SQL中使用它。例如:// mock code:...然后我可以直接在spark sql中使用
udaf
,如下所示: spark.sql("select
浏览 2
提问于2019-02-01
得票数 1
1
回答
PyFlink
UDAF
InternalRow与行
、
、
我正在尝试通过PyFlink中的自定义
UDAF
调用外部函数。我使用的函数要求数据在字典对象中。我尝试使用row(t.rowtime, t.b, t.c).cast(schema)来达到这样的效果。在
UDAF
之外,这个表达式工作得很好。在
UDAF
中,此表达式被转换为InternalRow,而不能转换为字典对象。 有没有办法强制使用Row而不是InternalRow?import row, col, lit, row_intervalfrom pyflink.ta
浏览 43
提问于2021-06-18
得票数 1
回答已采纳
1
回答
大数据分布式计算--数据处理
、
、
我有一个巨大的时间序列数据,我想使用spark`s的并行处理/分布式计算来进行数据处理。需求是逐行查看数据以确定如下所需结果部分下指定的组,如果执行器之间没有某种协调,我就不能真正让spark分发这些数据lat-latitude,例如:取一小部分样本数据集来解释情况0 27 2810 27 2820 29 4930 27 28 Lat-long interva
浏览 1
提问于2018-07-19
得票数 7
1
回答
如何在Scala SPARK中找到groupBy之后的agg()函数中的分位数
、
、
、
、
我有一个数据帧,我想在其中groupBy列A,然后找到不同的统计数据,如平均值,最小值,最大值,标准差和分位数。 我可以使用以下代码找到最小值、最大值和平均值:df.groupBy("A").agg(min("B"), max("B"), mean("B")).show(50, false) 但是我找不到分位数(0.25,0.5,0.75)。我尝试了approxQuantile和percentile,但它给出了以下错误: 错误:未找到:值approxQuantile
浏览 91
提问于2019-09-03
得票数 1
回答已采纳
1
回答
spark scala dataframe函数超过分区
、
、
、
我有200Mil行,其中有1K个组,如下所示group1 0.054464866 0.002248819 0.299069804 0.763352879 0.395905106group1 0.839928517 0.290339179 0.050407454 0.75837838 0.495466007 group1 0.
浏览 3
提问于2017-06-24
得票数 1
1
回答
Apache -如何在3之后定义UserDefinedAggregateFunction?
、
、
最初,我认为使用新的Aggregator和
udaf
可以解决这个问题(如所示),但
udaf
返回的是UserDefinedFunction,而不是UserDefinedAggregateFunction。
浏览 3
提问于2021-03-25
得票数 2
回答已采纳
4
回答
如何在不使用
udaf
的情况下创建映射列来计算出现次数
、
、
1|[a -> 2.0, b -> 1.0]|+---+--------------------+ 目前,在Spark 2.4.6中,我能够使用
udaf
当我碰到Spark3时,我想知道我是否可以摆脱这个
udaf
(我尝试使用新方法aggregate,但没有成功)。 有没有一种有效的方法来做到这一点?(对于效率部分,我可以很容易地进行测试)
浏览 55
提问于2020-10-14
得票数 3
回答已采纳
1
回答
如何在PySpark中定义用户定义的聚合函数?
、
、
、
、
# do something very complicated heresource_df.groupBy("Foo_ID").agg(
UDAF
(process_data)) 现在的问题是-我应该用什么来代替
UDAF
浏览 7
提问于2022-09-22
得票数 0
1
回答
Apache Spark SQL中的moving median as a window function (
UDAF
)
、
、
我正在尝试在Scala中将其实现为
UDAF
。Spark的版本是1.6.1。我尝试了两种方式调用我的
UDAF
(“中位数”):val timeSeries = ... // get a DataFrametimeSeries.registerTempTable有没有办法使用
UDAF
作为窗口函数?例如,计算移动中位数(不是移动平均值,而是中位数)。
浏览 2
提问于2016-06-06
得票数 2
1
回答
如何收集单行数据帧并将字段用作常量
、
、
我尝试从Hive表中读取一行,并在Spark应用程序的其余部分中将其字段用作常量。 object IniConstHive extends Serializable { val firstrow: Row = techTbl.head val my_firstfield: Double = firstrow.getAs[java.math.BigDecimal](0).d
浏览 7
提问于2019-06-25
得票数 1
1
回答
表达式不在具有
UDAF
的GROUP BY键中
、
、
我的
UDAF
返回一个数组,但我得到的是一个SemanticException,所以这可能并不重要。ADD JAR
udaf
.jar; sum(i) i, myUDAF(f
浏览 1
提问于2016-05-27
得票数 0
2
回答
PySpark SQL中的用户定义聚合函数
、
、
、
、
pyspark version = 3.0.2作为一个最小的例子,我想用一个
UDAF
替换AVG聚合函数:sqltoPandas()In [2]: rv id avg(value)1 2 3.5rv = sql.sql('SELECT id, udf_avg(value) FROM df GROU
浏览 24
提问于2021-03-09
得票数 4
回答已采纳
3
回答
在Scala中编写Spark
UDAF
以返回数组类型作为输出
、
、
我想为这个逻辑实现一个
UDAF
。我想把这个叫
UDAF
-+---+-------++---+-------+| 2|[D,A,C]|我正在尝试写一个
UDAF
浏览 0
提问于2018-04-05
得票数 1
1
回答
用于实现通用
UDAF
的已弃用接口
、
、
我想实现我自己的自定义
UDAF
。https://hive.apache.org/javadocs/r3.1.2/api/org/apache/hadoop/hive/ql/exec/
UDAF
.html此文档说: Deprecated.
浏览 78
提问于2021-11-07
得票数 2
1
回答
将Hive表中的多条记录转换为嵌套JSON
、
、
我在hive中有一个类似这样的表结构:1 A 26我希望将这些记录转换为与id对应的嵌套JSON,即,对于每个id,我的代码应该将对应的记录组合到一个JSON对象中。
浏览 2
提问于2015-07-27
得票数 0
2
回答
用java编写的hive udf,udf,udtfs是如何在像eclipse这样的ide中调试的?
、
、
、
例如,对于调试猪udfs,这是可行的: 我有一个hive脚本,我在其中使用了我的
udaf
,它失败了,所以我想单步执行udf代码。
浏览 7
提问于2016-05-09
得票数 2
1
回答
在蜂巢中,简单的和通用的联非新议程有什么区别?
、
这里有文档页面:如果可能的话,请举出一些例子。
浏览 1
提问于2014-09-08
得票数 2
回答已采纳
1
回答
执行错误,从org.apache.hadoop.hive.ql.exec.FunctionTask返回代码-101
、
当hive解析代码时,我得到了错误(如下所示):CREATE TEMPORARY FUNCTION foo AS "com.mytest.
udaf
.HelloWorldFoo"; [
浏览 0
提问于2014-08-25
得票数 0
回答已采纳
1
回答
提供通过UDF在配置单元中使用计数器的方法
、
有没有办法在配置单元中为UDF/
UDAF
/UDTF添加用户定义的计数器?
浏览 1
提问于2017-12-22
得票数 0
1
回答
mariadb用户定义聚合函数
、
、
我正在使用MariaDB10.3.9,并创建了一个用户定义的聚合函数(
UDAF
),并将其放置在common_schema中。此架构包含我的实用程序函数,供同一服务器上的其他架构/数据库使用。
浏览 2
提问于2018-10-01
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python实现MaxCompute UDF/UDAF/UDTF
udf,udaf,udtf之间的区别
Hive之UDF
2018年全新大数据Hadoop和hive的知识点学习
Hadoop-Hive基础知识整理
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券