我有个挑战。我想按购买量对产品品牌进行分组。问题是,我的数据集中的许多品牌都有“双”名称,填充的"Bio“和"Non”如下:
购买量品牌
2 Bakoma Bio
1个Bakoma Non Bio
2 Dorritos Bio
3 Dorritos非生物
我想要创建一个功能,它将按品牌的名称分组,不管它们是否添加了bio或没有Bio。
示例输出:
购买量品牌
3巴科马
5 Dorritos
(谢谢你的帮助:)
我的数据集包含以下列:- person_ID - brand - purchase_date 现在,我想使用Google Data Studio创建一个仪表板,显示购买了X品牌的人还购买了哪些其他品牌。 with identification as
(
select person_ID
where brand = 'X'
from dataset
)
select count(distinct(data.person_ID)), data.brand
from dataset data
inner join identification ident on data
我有一个面板数据集,其中的产品购买标识为唯一的家庭if,并且需要生成一个虚拟变量“品牌忠诚”,如果家庭在前一段时间购买了相同的品牌,则该变量将等于1。我的经期不是平均的。对于一些家庭来说,它可以是1周,对于另一些家庭来说- 10周。这段代码听起来是否正确?:
panid - unique household id
l5 - brand name
loy - wanted dummy
bysort panid week: egen loy=1 if l5=l5[_n-1]
我希望从同一列中获得多个状态的摘要。 select c.brand
sum amount as total
from charges as c
where c.invoive_id is not null
and c.paid = true
group by c.brand 获取按品牌分组的所有已完成购买的总和。我希望在同一查询中有一个单独的列,按品牌对"c.paid = false“求和,因此我将拥有: Brand Total(true) Total(false)
b_one 25 12
b_two 38