我正在建立一个包含客户信息的数据库。数据库将处理客户数据(客户id、地址、电话号码等)以及关于特定客户受到了哪种广告的一些基本信息,以及他们对此的反应。
数据将从中央数据仓库维护,但有关客户和广告的其他信息也将从其他来源更新。例如,如果一个外部广告代理运行一项活动,我希望他们能够反馈有关OptOuts、电子邮件退回等的数据。我想我需要的是一个可以轻松分发给任何数量的代理的应用程序接口。
我的第一个想法是为所有外部源设置一个web服务API,但由于我们可能会讨论大量数据(每批数百万条记录),我不确定web服务是最好的选择。
所以我的问题是,这里的最佳实践是什么?我需要一个足够简单的解决方案为广告机构(可能与中等熟练的IT人员)来使用。简单性是最重要的-在这种情况下,我的意思是“简单性优于性能”。如果设置变得太复杂,它将无法工作。
该系统很可能是基于微软的技术。
有什么建议吗?
发布于 2010-05-11 16:44:38
您所描述的过程通常称为使用ETL过程的数据集成。ETL代表Extract-Transform-Load。其思想是通过从大量不同的数据源提取信息,转换信息,然后将其加载到您的数据仓库中,从而建立您的中央数据仓库。
有各种(也有图形化的)工具可以实现这样的过程。由于您说您可能会运行Microsoft堆栈,因此我建议您考虑一下Sql Server Integration Services (SSIS)。
关于您关于使用web服务实现集成的建议,我也不认为这是一个好主意。同样,我也不认为将数据集成的负担转移给您的客户是一个好主意。你应该与你的客户就某种形式的数据交换格式达成一致,它可以像CSV文件,或者XML,Excel表格,Access数据库一样简单,使用任何适合你需要的。
任何像SSIS这样的现代ETL工具都能够处理这些不同的数据源。
https://stackoverflow.com/questions/2809106
复制相似问题