日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

算法 代码拷来终觉浅,绝知此事要躬行

發(fā)布時(shí)間:2023/12/20 编程问答 33 豆豆
生活随笔 收集整理的這篇文章主要介紹了 算法 代码拷来终觉浅,绝知此事要躬行 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

-3、GoogLeNet?Inception_v1:大約只有500萬(wàn)參數(shù),只相當(dāng)于Alexnet的1/12(GoogLeNet的caffemodel大約50M,VGGNet的caffemodel則要超過(guò)600M

Inception_v2:大卷積核換成小卷積核 ? ??5x5卷積核參數(shù)是3x3卷積核的25/9=2.78倍。為此,作者提出可以用2個(gè)連續(xù)的3x3卷積層(stride=1)組成的小網(wǎng)絡(luò)來(lái)代替單個(gè)的5x5卷積層,(保持感受野范圍的同時(shí)又減少了參數(shù)量,減少計(jì)算量) ? ? ??大量實(shí)驗(yàn)可以表明不會(huì)造成表達(dá)缺失

? ? ?任意nxn的卷積都可以通過(guò)1xn卷積后接nx1卷積來(lái)替代。?中度大小的feature map上使用效果才會(huì)更好

-2、利用圖像指紋檢測(cè)高相似度的圖像:圖像哈希法 ?difference hash ?dHash著力探究相鄰像素之間的區(qū)別

-1、用什么算法 看應(yīng)用場(chǎng)景、看數(shù)據(jù)量。

0、線性模型:Glmnet>LASSO(L1)>Ridge(L2)>LR/Logistic。 ? L1得到的系數(shù)0多,L2得到的系數(shù)只是接近0的多。

? ? ?復(fù)雜模型:XGBoost>=GBDT>=RF ?RF在Kaggle中很少見(jiàn)。 ? ?Xgboost比GBDT的優(yōu)點(diǎn):基分類(lèi)器可以選擇線性分類(lèi)器;優(yōu)化求解時(shí),用一階導(dǎo)數(shù)的同時(shí),還利用了二階導(dǎo)數(shù)信息;代價(jià)函數(shù)中加入了正則項(xiàng),控制模型的復(fù)雜度;

GBDT(GBDT的每棵樹(shù)是按照順序生成的(這個(gè)和RF完全不一樣,RF并行生成就Ok),每棵樹(shù)的生成都利用上之前生成的數(shù)留下的信息)和random forest(一個(gè)bagged tree充分利用近1/3-2/3的樣本集)等集成學(xué)習(xí)方法并不比SVM、LogiticRegression更容易過(guò)擬合。

森林的缺點(diǎn):缺點(diǎn)在于其隨機(jī)性,同一個(gè)數(shù)據(jù)集,運(yùn)行兩次,得到兩個(gè)不同的結(jié)果,導(dǎo)致不能知道結(jié)果是因?yàn)檫x擇更好的特征導(dǎo)致的還是由于選擇樣本時(shí)的隨機(jī)性導(dǎo)致的。

樹(shù):分裂時(shí),找到使不純度下降最快的分裂變量和分裂點(diǎn)。通過(guò)變量選擇迭代地建立一棵分類(lèi)樹(shù),使得每次分類(lèi)平面能最好地將剩余數(shù)據(jù)分為兩類(lèi)。

? ? ? ?優(yōu)點(diǎn):可以進(jìn)行變量選擇,可以克服缺失值;缺點(diǎn):不穩(wěn)定。

邏輯回歸過(guò)擬合的話,可以??????減小??????LinearSVC中的C參數(shù)

100個(gè)以上變量,以下兩個(gè)模型出現(xiàn)了過(guò)擬合(測(cè)試集、訓(xùn)練集效果相差較大):增加樣本、減少維度(降低模型的復(fù)雜度,而更不容易刻畫(huà)到噪聲數(shù)據(jù)的分布。

? ? ? RF:在N個(gè)樣本中用Booststrap采樣選出n個(gè)樣本,建立CART;在樹(shù)的每個(gè)節(jié)點(diǎn)上,從屬性中隨機(jī)選擇K個(gè)屬性subspace,選擇出最佳分割屬性作為節(jié)點(diǎn)。

? ? ? GBDT:Gradient Boosting Decision Tree,boosting的一種。每次建立一個(gè)弱的模型,都是在之前模型的損失函數(shù)的梯度方向(bossting:更在意之前錯(cuò)分的點(diǎn)),使損失函數(shù)不斷下降。

1、PageRank網(wǎng)頁(yè)排名:用來(lái)計(jì)算網(wǎng)頁(yè)的重要性。網(wǎng)頁(yè)之間的鏈接關(guān)系用圖表示。網(wǎng)頁(yè)A的重要性為:鏈接至A的網(wǎng)頁(yè)的重要性的加權(quán)和

2、遷移學(xué)習(xí):源訓(xùn)練好的模型 遷移應(yīng)用到 目標(biāo)待求解問(wèn)題。適用于目標(biāo)問(wèn)題的y不易得到,而源模型好得到的情況

3、SVM

4、蒙特卡羅采樣算法

5、缺失值填充:略過(guò),填中位數(shù)、均值,回歸插補(bǔ)

6、LDA主題模型

jieba中文自然語(yǔ)言處理:分詞、調(diào)整詞典、提取關(guān)鍵詞、詞性標(biāo)注、返回詞語(yǔ)在原文的起止位置?

? ? ? ??import jieba

seg_list = jieba.cut("您好!請(qǐng)轉(zhuǎn)告任輝:我們是銀行委托代理人,關(guān)于任輝的欠款數(shù)額較大,拖欠時(shí)間較久,且任輝拒不接聽(tīng)電話,有惡意逃避嫌疑,因案情緊急特通知您轉(zhuǎn)告務(wù)請(qǐng)配合我方調(diào)查,簽收法律文書(shū),二日內(nèi)還清欠款。如在限定時(shí)間內(nèi)仍不清還欠款,我方將全面啟動(dòng)法律程序,將向任輝老家派出所、政府、村委(或居委)等有關(guān)部門(mén)發(fā)送協(xié)助函要求協(xié)助調(diào)查,并將電話聯(lián)系村干部(居委干部)、派出所了解情況,調(diào)查組將立即出發(fā)到任輝單位及老家展開(kāi)調(diào)查,根據(jù)調(diào)查結(jié)果涉嫌犯罪的,將向公安機(jī)關(guān)報(bào)案。黃勇先生/小姐:我們是銀行代理人,您拒不接聽(tīng)電話有逃避嫌疑,因案情緊急特通知您,務(wù)請(qǐng)配合我方調(diào)查,簽收法律文書(shū),二日內(nèi)還清欠款。如在限定時(shí)間內(nèi)仍不清還欠款,我們將全面啟動(dòng)法律程序,包括但不限于催告函(律師函),向您老家派出所、政府、村委(或居委)等有關(guān)部門(mén)發(fā)送協(xié)助函要求協(xié)助調(diào)查,并將電話聯(lián)系村干部(或居委干部)、派出所了解情況,調(diào)查組將立即出發(fā)到單位及老家展開(kāi)調(diào)查,根據(jù)調(diào)查結(jié)果,將立即向人民法院起訴,查封財(cái)產(chǎn)。如涉嫌詐騙犯罪的,將向公安機(jī)關(guān)報(bào)案。",cut_all=False,HMM=True)
print "新詞識(shí)別:", "/ ".join(seg_list) ? ? #分詞

for co in sample['sample_content']:
? ? big_string+=co
seg_list = jieba.cut(big_string,cut_all=False,HMM=True)
a=", ".join(seg_list)
b=a.split(',')
c=pd.DataFrame(b)
d=c[0].value_counts() ? ? ? ? ? ? ? ? ? ? ? #對(duì)sample_content列進(jìn)行分詞,看詞語(yǔ)的出現(xiàn)頻次

import jieba.analyse

jieba.analyse.set_stop_words('D:\\Python27\\stopword.txt')

jieba.analyse.extract_tags('【臻信事務(wù)所】姓名:蘇城關(guān)于你辦理消費(fèi)分期逾期一案。已多次通知公示并發(fā)函至戶籍地:云南省大理白族自治州漾濞彝族自治縣蒼山西鎮(zhèn)

蒼山中路5號(hào)村[居]委、派出所上門(mén)調(diào)查完畢。如你繼續(xù)拖欠,將擬向深圳市福田區(qū)人民法院立案庭進(jìn)行排期審理,當(dāng)事人如收到法院傳票應(yīng)于2016年12月26日15點(diǎn)前持應(yīng)訴

通知書(shū)及申請(qǐng)合同資料、個(gè)人證件、答辯狀處理。若當(dāng)事人無(wú)正當(dāng)理由拒不到庭,法院將有權(quán)當(dāng)庭做被告缺席審理,判決被告方敗訴并承擔(dān)所有費(fèi)用。案件負(fù)責(zé)人:余助理電

話:0755-25199252手機(jī):18938079992(若非本人敬請(qǐng)轉(zhuǎn)達(dá))',withWeight=True)

print?pd.DataFrame(tags) ? ? ? ? ? ? ? ? ?#TF-IDF權(quán)重最大 提取關(guān)鍵詞

a=jieba.analyse.textrank('【臻信事務(wù)所】姓名:蘇城關(guān)于你辦理消費(fèi)分期逾期一案。已多次通知公示并發(fā)函至戶籍地:云南省大理白族自治州漾濞彝族自治縣蒼山西鎮(zhèn)蒼山中路5號(hào)村[居]委、派出所上門(mén)調(diào)查完畢。如你繼續(xù)拖欠,將擬向深圳市福田區(qū)人民法院立案庭進(jìn)行排期審理,當(dāng)事人如收到法院傳票應(yīng)于2016年12月26日15點(diǎn)前持應(yīng)訴通知書(shū)及申請(qǐng)合同資料、個(gè)人證件、答辯狀處理。若當(dāng)事人無(wú)正當(dāng)理由拒不到庭,法院將有權(quán)當(dāng)庭做被告缺席審理,判決被告方敗訴并承擔(dān)所有費(fèi)用。案件負(fù)責(zé)人:余助理電話:0755-25199252手機(jī):18938079992(若非本人敬請(qǐng)轉(zhuǎn)達(dá))',withWeight =True)

c=pd.DataFrame(a)? #TextRank提取關(guān)鍵詞

7、尋找文本中的關(guān)鍵詞TextRank:傾向于將頻繁詞作為關(guān)鍵詞

??詞匯的共現(xiàn)通常可分為同義、反義、互補(bǔ)、上下義、組合等,這些搭配關(guān)系有別于傳統(tǒng)意義上的語(yǔ)法搭配和習(xí)慣用法搭配,而是在一特定的語(yǔ)境中存在某種語(yǔ)義上的聯(lián)系,它圍繞著某一主題展開(kāi),就某一話題出現(xiàn)的相關(guān)詞匯。

8、文本的情感分析:微博和商品評(píng)論本身就一定存在強(qiáng)烈的情感色彩。

8.1基于詞典的情感分析步驟:

分解句子中的詞匯;搜索情感詞并標(biāo)注和計(jì)數(shù);搜索情感詞前的程度詞,根據(jù)程度大小,賦予不同權(quán)值;搜索情感詞前的否定詞,賦予反轉(zhuǎn)權(quán)值(-1);計(jì)算句子的情感得分

8.2基于機(jī)器學(xué)習(xí)的情感分析

文本向量化后,訓(xùn)練模型后用于預(yù)測(cè)。

8.3判斷是不是催收短信:收集詞庫(kù)(催收?qǐng)鼍暗脑~語(yǔ)、委外催收的詞語(yǔ)、非催收?qǐng)鼍暗脑~語(yǔ)),分解短信;各種詞語(yǔ)標(biāo)記、計(jì)數(shù);

9、長(zhǎng)短期記憶網(wǎng)絡(luò)LSTM

10、

A卡(Application score card)申請(qǐng)?jiān)u分卡

B卡(Behavior score card)行為評(píng)分卡

C卡(Collection score card)催收評(píng)分卡

11、為什么要遷移學(xué)習(xí):數(shù)據(jù)量不一定都大;提高模型的adaptive能力。

學(xué)生學(xué)會(huì)了一道題,要遷移到新的題目的求解上面。知識(shí)(模型、參數(shù))的流轉(zhuǎn)。

本質(zhì):找出問(wèn)題的不變量。

實(shí)例:用銀行小額貸款用戶的模型 遷移到 銀行大額貸款營(yíng)銷(xiāo)模型, ?使得響應(yīng)率提高了1倍。

12、圖模型(關(guān)系) 結(jié)合 深度學(xué)習(xí) 風(fēng)險(xiǎn)預(yù)測(cè)及監(jiān)控 ? ? ? 深度學(xué)習(xí)需要大樣本,訓(xùn)練集、測(cè)試機(jī)要比較一致,無(wú)可解釋性

13、螞蟻金服:模型服務(wù)平臺(tái) ? ?車(chē)輛定損寶:判斷車(chē)輛維修價(jià)格

14、基于哈希的海量特征提取

15、深度強(qiáng)化學(xué)習(xí):時(shí)序決策——營(yíng)銷(xiāo)與推薦

16、增強(qiáng)學(xué)習(xí)

總結(jié)

以上是生活随笔為你收集整理的算法 代码拷来终觉浅,绝知此事要躬行的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。