歡迎您光臨本站 註冊首頁

基於python實現檢索標記敏感詞並輸出

←手機掃碼閱讀     hongdian2012 @ 2020-05-08 , reply:0

一些帶有過度宣傳的詞,在淘寶、京東對商品的宣傳有一定的限制,這些最佳,最大、盜版、水貨等詞語都不能用於產品的宣傳,可以使用程序檢測敏感詞,以下既是具體代碼。
#檢索敏感詞並描紅輸出 #輸入 word = input("請輸入或拷貝含有敏感詞的宣傳文字:") #敏感詞庫 sensitive = ['第一','國家級','最高級','最佳','獨一無二','一流','僅此一次','頂級', '頂尖','尖端','極品','極佳','絕佳','絕對','終極','極致','首個','首選', '獨家','首發','首次'] #在輸入語句中發現的敏感詞,放在列表中 sensitive_find = [] #newword用於標紅敏感詞,word用於循環 newword = word #遍歷敏感詞庫 for item in sensitive: #將至少出現一次的敏感詞放到sensitive_find中,然後標紅 

if word.count(item)>0: sensitive_find.append(item+':'+str(word.count(item))+'次') #newword存放標紅後的整段話,word則不變 newword = newword.replace(item,' 33[1;31m'+item+'33[0m') print('發現敏感詞如下:') for item in sensitive_find: print(item) print('敏感詞位置已用星號進行標註:
'+newword)
結果(ps結果中有標紅的部分,這裡未顯示,下面用部分截圖說明一下):
請輸入或拷貝含有敏感詞的宣傳文字:天貓首發,耀世登場,世界品質,慶偉製造。本產品目前是同類產品中最高級的。2018年全網銷售量第一,瑤瑤領先同類產品。國內外頂級大師鼎力支持,是您居家生活的唯一選擇。
發現敏感詞如下:
第一:1次
最高級:1次
頂級:1次
首發:1次
敏感詞位置已用星號進行標註:
天貓 首發,耀世登場,世界品質,慶偉製造。本產品目前是同類產品中 最高級的。2018年全網銷售量 第一,瑤瑤領先同類產品。國內外 頂級大師鼎力支持,是您居家生活的唯一選擇。


[hongdian2012 ] 基於python實現檢索標記敏感詞並輸出已經有273次圍觀

http://coctec.com/docs/python/shhow-post-233295.html