首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    每日论文速递 | 【ICLR24】用语言模型预测表格Tabular

    摘要:深度神经网络(DNNs)的可迁移性在图像和语言处理领域取得了显著进展。然而,由于表格之间的异构性,这种DNN的优势在表格数据预测(例如回归或分类任务)方面仍未充分利用。语言模型(LMs)通过从不同领域提炼知识,具有理解来自各种表格的特征名称的能力,有望成为在不同表格和多样化预测任务之间转移知识的多才多艺的学习者,但它们的离散文本表示空间与表格中的数值特征值不兼容。在本文中,我们介绍了TP-BERTa,这是一个专门针对表格数据预测进行预训练的LM模型。具体而言,一种新颖的相对大小标记化将标量数值特征值转换为精细离散的高维标记,而一种内部特征注意方法则将特征值与相应的特征名称集成在一起。全面的实验证明,我们的预训练TP-BERTa在表格DNNs中表现出色,并且在典型的表格数据领域与梯度提升决策树模型相竞争。

    01

    【2023新书】现代深度学习表格数据处理:常见建模问题的新方法

    来源:专知本文为书籍介绍,建议阅读5分钟这本书提供了一个强大的概念和理论工具包来解决具有挑战性的表格数据问题。 深度学习是现代人工智能领域最强大的工具之一。虽然主要应用于高度专业化的图像、文本和信号数据集,但本书对一个看似不太可能的领域——表格数据,合成并提出了新的深度学习方法。无论是在金融、商业、安全、医学还是无数其他领域,深度学习都可以帮助挖掘和建模表格数据中的复杂模式——这是一种非常普遍的结构化数据形式。 本书的第一部分提供了与整体建模和操作表格数据相关的机器学习原则、算法和实现技能的严格概述。第二

    01

    传递数据背后的故事——图表设计

    图表设计是数据可视化的一个分支领域,是对数据进行二次加工,用统计图表的方式进行呈现。数据是事实或观察的结果,是对客观事物的逻辑归纳,通常一个具体的数字比一个模糊的说法更加具有可信度和说服力。但单纯的数字本身并不能提供足够的影响力,假设一个淘宝女装卖家3月份的成交金额是50万,这个数据本身并不能说明什么问题,但是当你加上4月份60万,5月份的成交金额70万等多个月的数据,通过折线图的方式呈现,可以判断出成交金额是上升趋势,再结合去年同时段的销售曲线进行对比和其他维度信息的补充(图1-1),可能推断出是因为换季所带来得销量增长,店铺可以考虑加大夏季款的上新。所以我们说图表是解读数字的一种强有力的手段。

    01
    领券