歡迎您光臨本站 註冊首頁

Django QuerySet查詢集原理及代碼實例

←手機掃碼閱讀     f2h0b53ohn @ 2020-06-14 , reply:0

一 概念
 

Django的ORM中存在查詢集的概念。

查詢集,也稱查詢結果集、QuerySet,表示從數據庫中獲取的對象集合。

當調用如下過濾器方法時,Django會返回查詢集(而不是簡單的列表):

  • all():返回所有數據。

  • filter():返回滿足條件的數據。

  • exclude():返回滿足條件之外的數據。

  • order_by():對結果進行排序。

對查詢集可以再次調用過濾器進行過濾,也就意味著查詢集可以含有零個、一個或多個過濾器。過濾器基於所給的參數限制查詢的結果。

從SQL的角度講,查詢集與select語句等價,過濾器像where、limit、order by子句。

二 兩大特性
 

1)惰性執行
 

  創建查詢集不會訪問數據庫,直到調用數據時,才會訪問數據庫,調用數據的情況包括迭代、序列化、與if合用

  例如,當執行如下語句時,並未進行數據庫查詢,只是創建了一個查詢集qs

  # 查詢BookInfo模型類中的所有數據  qs = BookInfo.objects.all()   # 繼續執行遍歷迭代操作後,才真正的進行了數據庫的查詢  for book in qs:    print(book.btitle)

 

2)緩存
 

  使用同一個查詢集,第一次使用時會發生數據庫的查詢,然後Django會把結果緩存下來,再次使用這個查詢集時會使用緩存的數據,減少了數據庫的查詢次數。

  情況一:如下是兩個查詢集,無法重用緩存,每次查詢都會與數據庫進行一次交互,增加了數據庫的負載。

from booktest.models import BookInfo
 # 每個列表內都為一個獨立的查詢集,兩次查詢集之間如果有數據插入,可能數據集會不同
 [book.id for book in BookInfo.objects.all()]

[book.id for book in BookInfo.objects.all()]
 

  情況二:經過存儲後,可以重用查詢集,第二次使用緩存中的數據。

  # 首先獲得一個查詢集  qs=BookInfo.objects.all()    # 第一次讀取數據,會查詢數據庫,然後增加緩存  [book.id for book in qs]  # 第二次讀取數據,直接查詢緩存  [book.id for book in qs]

 

3)何時查詢集不會被緩存?
 

  查詢集不會永遠緩存它們的結果。當只對查詢集的部分進行求值時會檢查緩存, 如果這個部分不在緩存中,那麼接下來查詢返回的記錄都將不會被緩存。所以,這意味著使用切片或索引來限制查詢集將不會填充緩存。

  情況一:重複獲取查詢集對象中一個特定的索引將每次都查詢數據庫:

queryset = BookInfo.objects.all()

queryset[5] # 查詢數據庫
 queryset[5] # 再一次查詢數據庫
 

  情況二:如果已經對全部查詢集求值過,則將檢查緩存:  

  # 獲取查詢集  queryset = BookInfo.objects.all()  [entry for entry in queryset] # 查詢數據庫  print queryset[5] # 使用緩存   print queryset[5] # 使用緩存

 

   情況三:下面是一些其它例子,它們會使得全部的查詢集被求值並填充到緩存中:

  # 獲取查詢集  queryset = BookInfo.objects.all()  [entry for entry in queryset]  bool(queryset)  entry in queryset  list(queryset)

 

  注:簡單地打印查詢集不會填充緩存。  

queryResult=models.Article.objects.all()
 print(queryResult) # 查詢數據庫
 print(queryResult) # 查詢數據庫 
 

三 限制查詢集
 

  1)、可以對查詢集進行取下標或切片操作,等同於sql中的limit和offset子句。
 

注意:不支持負數索引。
   對查詢集進行切片後返回一個新的查詢集,不會立即執行查詢。

  如果獲取一個對象,直接使用[0],等同於[0:1].get(),但是如果沒有數據,[0]引發IndexError異常,[0:1].get()如果沒有數據引發DoesNotExist異常。

  示例:獲取第1、2項,運行查看。

qs = BookInfo.objects.all()[0:2]
 

  2)、exists()方法:判斷某一個查詢集中是否有數據:
 

  簡單的使用if語句進行判斷也會完全執行整個queryset並且把數據放入cache,雖然你並不需要這些 數據!為了避免這個,可以用exists()方法,判斷查詢集中是否有數據,如果有則返回True,沒有則返回False。

if queryResult.exists():
 #SELECT (1) AS "a" FROM "blog_article" LIMIT 1; args=()
 print("exists...")
 

  3)、terator()方法: 來獲取數據,處理完數據就將其丟棄。
 

  當queryset非常巨大時,cache會成為問題。
 

  處理成千上萬的記錄時,將它們一次裝入內存是很浪費的。更糟糕的是,巨大的queryset可能會鎖住系統 進程,讓你的程序瀕臨崩潰。要避免在遍歷數據的同時產生queryset cache,可以使用iterator()方法 來獲取數據,處理完數據就將其丟棄。

  objs = BookInfo.objects.all().iterator()  # iterator()可以一次只從數據庫獲取少量數據,這樣可以節省內存  for obj in objs:    print(obj.title)  #BUT,再次遍歷沒有打印,因為迭代器已經在上一次遍歷(next)到最後一次了,沒得遍歷了  for obj in objs:    print(obj.title)

 

  注:(1) 使用iterator()方法來防止生成cache,意味著遍歷同一個queryset時會重複執行查詢。所以使 #用iterator()的時候要當心,確保你的代碼在操作一個大的queryset時沒有重複執行查詢。

    (2) queryset的cache是用於減少程序對數據庫的查詢,在通常的使用下會保證只有在需要的時候才會查詢數據庫。 使用exists()和iterator()方法可以優化程序對內存的使用。不過,由於它們並不會生成queryset cache,可能 會造成額外的數據庫查詢。


[f2h0b53ohn ] Django QuerySet查詢集原理及代碼實例已經有273次圍觀

http://coctec.com/docs/python/shhow-post-238533.html