歡迎您光臨本站 註冊首頁

python實現一次性封裝多條sql語句(begin end)

←手機掃碼閱讀     niceskyabc @ 2020-06-10 , reply:0

python封裝利用begin end執行多條sql

因為業務需求,優化模型運行時間。考慮到sql語句每一次執行都要建立連接,查詢,獲取數據耗時過多。就想到將sql一起提交上去運行,能夠節省很多時間。原本1.6-2.5秒耗時的sql語句經過修改後時間降到0.3-0.6秒,感覺性能提升挺好的。

當然還有一種想法,如果有python框架的orm可能會更快,相比來說耗時基本看不到了吧,這只是我的猜想,僅僅為了優化一個模型寫一個框架的話 代碼可能需要改的比較多,自我感覺付出和收穫不一定會成正比,當然以後有時間可以試試。

這次優化基本代碼邏輯沒有動,利用了begin end進行sql整合。

公司用的是oracle,之前沒用過但是感覺和mysql基本類似,如果是mysql的話該方法也可用

sql_str = ‘begin '
 sql_str += ‘這裡時需要執行的sql語句'
 sql_str += ‘ commit;end;'

中間sql有多少條無所謂,看了一下運行時間感覺 我的一千行sql耗時 幾乎就是這一千行裡面耗時最長那個時間。是異步完成還是什麼這個就不是很清楚了,主要是一次建立連接,省去網絡傳輸數據和請求數據庫的過程

網上好多begin end都是在可視化工具中的sql執行的,並不能在command中執行,這就意味中我們代碼中封裝的語句沒有卵用,還好沒放棄當時就研究了一下找到了解決辦法

在end 提交一下就ok了,如果在command中運行一直未結束的話加一個 / 斜線就ok了

本次內容就此結束,下面是一些題外話。

在說一個其中遇到的問題吧,在進行sql封裝後,其中很多表都很亂,約束很亂 而且邏輯並不嚴謹,但是模型正在運行還不讓動 那隻能按照這個規則來了

ORA 00001 違反唯一約束條件 其中出現了這個問題,意思就是唯一約束重複了,因為模型輸入問題,處理出來的結果之前可能剛插入到數據庫中(也就是 上面的sql_str 出現了兩天相同的insert),這個東西很簡單,加一個set判斷一下就行,但是到這之後,一個bug就跳出來了,這個腳本計算的是因子重要度,結果預測可能每次都不相同,有些數據很小的可能就當成0扔進去了,所以我需要做的是將 相同數據的情況下插入較為重要的因子重要度(也無需要 ),這樣的話簡簡單單的set就不行了,但是也不難 用來一下字典

   importance_map = {}   實現創建好字典   if feature in importance_map:          if importance_map[feature] < importance:            sql_str +=‘***************‘'' 這裡就是insert語句了          else:            continue        else:          importance_map[feature] = importance

 

其實這個東西也沒有什麼難點,但是做到這之後就有很多想法折射出來。

數據處理原本也可以用pandas進行,但是pandas是對所有數據進行操作,我一個set只對重複數據進行操作,切pandas內存消耗極為嚴重,前兩天寫的特徵工程內存炸裂。表數據用完後內存並沒有得到釋放,這裡面就涉及到python的垃圾回收,用法至今沒有搞懂,還需要研究研究,gc是對循環引用進行垃圾回收,內存釋放。但是這個pandas並不是循環引用,我認為是在存儲在緩存區中,位置佔死了,就很煩

模型畢竟是在服務器上面跑,儘量快切省內存,不然你把內存佔了 別人的項目怎麼玩。所以就用這種方法。

很少寫博客,主要是記錄一下問題以後 再出現了好應對。當然如果能夠幫助正在修復bug中的你,也是樂意至極。那塊說的有問題或者解釋不清楚,可以留言。
 

補充知識:postgreSQL sql使用 %s時務必加引號,即為‘%s',否則報錯

postgre sql使用 %s時務必加引號,即為‘%s',否則報錯

if name == ‘main':

  t="TDD-LTE_MRO"  sql="select * from lastftp where enbid = %d and keytype = %s"%(110001,t)    print(selectOperate(sql))

 

結果:

  Traceback (most recent call last):  File “/home/eyann/mypython/t1/pgSQLoperate.py”, line 84, in  print(selectOperate(sql))  File “/home/eyann/mypython/t1/pgSQLoperate.py”, line 45, in selectOperate  cursor.execute(sql)  psycopg2.ProgrammingError: column “tdd” does not exist  LINE 1: …* from lastftp where enbid = 110001 and keytype = TDD-LTE_MR…  ^

 

if name == ‘main':

  t="TDD-LTE_MRO"  sql="select * from lastftp where enbid = %d and keytype = '%s'"%(110001,t)    print(selectOperate(sql))

 

結果:

[(‘test3', ‘TDD-LTE_MRO', ‘0114123000', ‘0012', 110001)]
 [Finished in 0.1s]



[niceskyabc ] python實現一次性封裝多條sql語句(begin end)已經有258次圍觀

http://coctec.com/docs/python/shhow-post-237915.html