我正在写我的研究生工作,内容是关于从文件导入数据到SQL Server表的方法。我已经创建了自己的程序,现在我正在比较它与一些标准方法,如bcp,批量插入,插入...SELECT * FROM OPENROWSET(BULK...)我的程序从源文件中读入行,解析它们,然后使用普通的插入逐个导入它们。该文件包含100万行,每行4列。现在我遇到了这样的情况,我的程序需要160秒,而标准方法需要5-10秒。
假设您有一个非常大的数据库,为了简化,假设它由一个主要表组成,您将使用一个(而且只有一个)主键字段pk进行查找。考虑到所有的查找基本上都将是SELECT * FROM table_name WHERE pk=someKeyValue,为最快的查找优化这个数据库的最佳方法是什么?编辑:只是更多的细节--INSERT和UPDATE是非常不频繁的,所以我不介意牺牲那里的性能来获得更好的查找性能。
而且,似乎聚类是可行的方法。你有什么例子说明我可以用这种方法来提高性能吗?