问题描述
我对 OData v3/v4 还是很陌生,使用 Visual Studio 中的 OData Connect 服务从 OData 服务器获取数据。现在我的问题是获取数据的最佳、最快方法是什么,然后使用自己的集合对其进行验证?
例如,我们有一个 Microsoft.OData.Client.DataServiceQuery
类型为 Employee
,我们希望从服务器获取所有员工,并将其与我们的本地数据集进行比较,例如来自另一个 CRM 系统的 List(Of Employee)
>
要从 OData 服务获取数据,我们必须设置 DataServiceQuery
,例如:获取所有员工的简单方法是 DataServiceQuery.GetAllPages
这将返回一个 IEnumerable(Of Employee)
,我们可以在其上调用.ToList
函数。在此之后,我们可以使用 LINQ 和/或 LAMBDA 在两个列表之间进行每次比较和更新集合。
但是现在,如果我通过使用 DataServiceQuery.Take(Number)
更改方法,那么它返回一个 IQueryable(Of Employee)
,我们也可以在其上调用 .ToList
或者使用 IQueryable
是不必要的吗?
所以我的问题是从 OData v4 服务器获取所有数据,然后将其填充到内存中,然后使用 LINQ 和/或 LAMBDA 进行比较的最佳方法是什么?
解决方法
您的两种解决方案实际上都会做相同的事情,唯一的区别是,在这种情况下,通过使用 .Take()
,您正在编写一个查询,该查询将从服务器,您可能更熟悉这被称为 Paging。
在 OData 服务器逻辑中,IEnumerable 和 IQueryable 之间的区别是显着的,因为 IQueryable 被推迟直到您迭代查询,像 .ToList()
这样的调用将强制进行此迭代。 >
然而,在客户端,即使数据类型是 Linq IQueryable
类型,当您完成查询时,您只能迭代它一次,这也适用于IEnumerable
的 DataServiceQuery
响应。
但是现在,如果我通过使用 DataServiceQuery.Take(Number) 更改方法,那么它返回一个 IQueryable(Of Employee),我们也可以在其上调用 .ToList 或者使用 IQueryable 是不必要的吗?
特别是对于DataServiceQuery
,鉴于我们只能迭代一次响应,作为一般模式,我们通常DO调用.Tolist()
来强行接收来自服务器的响应,所以很明显这是我们的意图。
- 这不是必要与否的问题,而是有意下载一次数据,并将其存储在允许我们再次迭代的列表变量中。
IQueryable
响应允许您在将其发送到服务器之前构建过滤器、顺序和投影表达式,在 OData 术语中,这应转换为 $filter
、$orderby
、{{1 }}、$expand
、$select
和 $skip
查询选项与 HTTP 请求一起发送。如果您打算应用其中任何一个,它会提高性能,但在这里似乎并不适用。
因此,对于您的问题,由于您正在获取所有的数据,因此 $top
的这两种类型的响应之间没有性能差异。如果您不想要 ALL 行,则需要考虑一个事实:
如果您使用 DataServiceQuery
或 Where()
或 ApplyQueryOption()
限制记录数,那么由于有效负载将小于非限制查询,因此返回速度会更快,纯粹是凭借网络上的数据负载较小。
如果您调用 .Take()
并然后应用过滤或限制,则必须先下载整个集合,然后才能评估您的过滤器,以便获得最佳性能通过使用 .ToList()
并在执行它之前应用过滤条件。
同样,对于您的特定任务,因为它涉及对整个集合进行迭代,这些都没有任何内在的好处。如果记录集很大,我鼓励您使用批处理/分页来处理较小集中的记录,以免锁定服务器资源,并且不会耗尽内存试图在单个操作中反序列化整个结果集。
无论哪种方式运行,这些类型的数据同步通常都是昂贵的过程,但是通过在客户端上执行此操作,您可能选择了效率最低的机制。
如果可以的话,这个任务应该在服务器端执行,这样你就可以减少一整趟数据比较
如果无法在服务器上进行比较,那么也许您可以将比较公式化为 IQueryable
表达式并仅返回匹配或不匹配的结果,这就是 {{ 1}} 来玩,它会把表达式传给服务器,直接在数据库中进行比较。