我正在尝试使用时间更新PySpark数据帧中的列。我正在使用数组检查多个条件。我得到了错误'Cannot convert column into bool'。我假设这是因为我使用in来检查一个值列表。该错误提供了其他选项,如和(&)和(或),但不能用于in。是否有什么方法可以对所有的值进行检查,而不是链接几个there语句</e
这可能是没有意义的,但我希望在一个查询中,当合格等于1时,只需要第二个值,但总是更新第一个值。因此,如果合格的值已经是0(或其他值),就不要更新合格的值。我可以在一个查询中做到这一点吗?---Looping through this SET p.first= 'C', p.eligible = 0
WHERE i