我遇到了Entity Framework的一个有趣的性能问题。我使用Code First。
下面是我的实体的结构:
一本书可以有许多评论。一篇评论与一本书相关。审阅可以有一个或多个注释。一条评论与一条评论相关联。
public class Book
{
public int BookId { get; set; }
// ...
public ICollection<Review> Reviews { get; set; }
}
public class Review
{
public int ReviewId { get; set; }
public int BookId { get; set; }
public Book Book { get; set; }
public ICollection<Comment> Comments { get; set; }
}
public class Comment
{
public int CommentId { get; set; }
public int ReviewId { get; set; }
public Review Review { get; set; }
}
我用大量数据填充了我的数据库,并添加了适当的索引。我正在尝试使用以下查询检索一本有10,000条评论的书:
var bookAndReviews = db.Books.Where(b => b.BookId == id)
.Include(b => b.Reviews)
.FirstOrDefault();
这本书有一万条评论。该查询的性能大约为4秒。运行完全相同的查询(通过SQL Profiler)实际上会立即返回。我使用相同的查询、SqlDataAdapter和自定义对象来检索数据,它在不到500毫秒内完成。
使用ANTS Performance Profiler,看起来大部分时间都花在了做一些不同的事情上:
方法被调用了5000万次。
有人知道为什么它需要调用5000万次吗?我如何才能提高性能?
发布于 2011-09-14 00:04:05
为什么
会被调用5000万次?
这听起来很可疑。你在Equals
上有10.000条评论和50.000.000个电话。假设这是由EF内部实现的标识映射引起的。标识映射确保每个具有唯一键的实体只被上下文跟踪一次,因此如果上下文已经具有与从数据库加载的记录具有相同键的实例,它将不会物化新的实例,而是使用现有的实例。那么,这怎么可能与这些数字相吻合呢?我可怕的猜测是:
=============================================
1st record read | 0 comparisons
2nd record read | 1 comparison
3rd record read | 2 comparisons
...
10.000th record read | 9.999 comparisons
这意味着每条新记录都会与身份映射中的每条现有记录进行比较。通过应用数学来计算所有比较的和,我们可以使用称为“算术序列”的东西:
a(n) = a(n-1) + 1
Sum(n) = (n / 2) * (a(1) + a(n))
Sum(10.000) = 5.000 * (0 + 9.999) => 5.000 * 10.000 = 50.000.000
我希望我的假设或计算没有出错。等等!我希望我弄错了,因为这看起来不太好。
尝试关闭更改跟踪=希望关闭身份映射检查。
这可能会很棘手。从以下内容开始:
var bookAndReviews = db.Books.Where(b => b.BookId == id)
.Include(b => b.Reviews)
.AsNoTracking()
.FirstOrDefault();
但是您的导航属性很有可能不会被填充(因为它是由更改跟踪处理的)。在这种情况下,请使用以下方法:
var book = db.Books.Where(b => b.BookId == id).AsNoTracking().FirstOrDefault();
book.Reviews = db.Reviews.Where(r => r.BookId == id).AsNoTracking().ToList();
不管怎样,你能看到传递给Equals的对象类型是什么吗?我认为它应该只比较主键,即使是5000万个整数比较也不应该是这样的问题。
顺便说一句,EF很慢--这是众所周知的事实。当物化实体时,它也在内部使用反射,所以仅仅10.000条记录就可能需要“一些时间”。除非您已经这样做了,否则您还可以关闭动态代理创建(db.Configuration.ProxyCreationEnabled
)。
发布于 2011-09-13 22:52:55
我知道这听起来有点扯,但你有没有试过另一种方式,例如:
var reviewsAndBooks = db.Reviews.Where(r => r.Book.BookId == id)
.Include(r => r.Book);
我注意到,当您以这种方式处理查询时,EF有时会有更好的性能(但我还没有时间找出原因)。
https://stackoverflow.com/questions/7403149
复制相似问题