日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

Capital one TPS整理

發(fā)布時(shí)間:2025/5/22 编程问答 19 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Capital one TPS整理 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

Credit Card Fraud Detection 7 times from 2015 to 2017

What machine learning model would you use to classify fraudulent transactions on credit cards?

feature selection

how to use classification method, which one is good to use?Later there will also be a problem which method is the least useful.?

bias variance trade off -?What does regularization do?

target missing

false positive/false negative -?Are false positives or false negatives more important??What is the effect of FP and FN?

What is VIF (in regression output)?

potential issues

exploratory analysis and data cleaning

How would you handle missing or garbage data?

How would you use existing features to add new features?

Logistic regression, random forests

Difference between random forest and gradient boosted tree.

Anomaly detection/novelty detection techniques might be also helpful because of the huge data imbalance that normally exists in such scenarios.

Asked a lot of possible problems with the model and how should you deal with that when time?is limited.

Couple things to keep in mind regarding fraud:
1) you're dealing with an imbalanced data set (your fraud cases may be 3-5% of all your data). So, consider either oversampling, or giving higher weight to your fraud cases.
2) you data may not have all the true fraud cases - in other words, there maybe actual fraud cases not captured in your data. So, some form of anomaly detection may be needed.

?

預(yù)測(cè)用戶是否會(huì)注銷信用卡 -3 times in 2018

如果給你一堆dataset,比如信用卡一年的交易記錄、客戶個(gè)人信息,銀行想預(yù)測(cè)客戶會(huì)不會(huì)在一個(gè)月之內(nèi)關(guān)戶,如果會(huì)的話,銀行打算發(fā)一點(diǎn)cashback rewards給這些人挽留一下。讓你建模預(yù)關(guān)戶。??以下是面試官的問(wèn)題:

1.? ? ? ? 你會(huì)選哪些feature?(感覺(jué)是隨便說(shuō),只要有關(guān)系。追問(wèn)如果是一堆transaction的日期之類的,應(yīng)該怎樣rebuild feature)
2.? ? ? ? 怎么做data cleaning:?
? ? a.? ? ? ?? ???怎樣detect outlier?. From 1point 3acres bbs
? ? b.? ? ? ?? ???怎樣fill in missing data?(我說(shuō)可以填constant比如mean,然后他追問(wèn)填mean在什么情況下不合適、怎樣更好)
? ? c.? ? ? ?? ???如果target value也missing了怎么辦
3.? ? ? ? 你選什么model?(我說(shuō)decision tree,然后他讓我說(shuō)有沒(méi)有其他model,優(yōu)缺點(diǎn)分別是什么,target是什么。target應(yīng)該是一個(gè)binary的值whether the customer will close the account in one month,如果regression得到了0~1之間的值就代表how likely)
4.? ? ? ? 怎么看model 的performance,用什么package. From 1point 3acres bbs
5.? ? ? ? 如果data size很大有1TB,怎樣sample,用什么package. From 1point 3acres bbs
6.? ? ? ? 如果model不準(zhǔn)確,會(huì)給銀行造成什么損失?
7.? ? ? ? 如果用model predict得到了一堆target的值,應(yīng)該怎樣根據(jù)target發(fā)rewards (我說(shuō)畫個(gè)distribution,給最可能關(guān)戶的百分之幾客戶發(fā)rewards。追問(wèn)除了這種方式還有什么方式,我也不確定是考modeling還是business sense)
8.? ? ? ? 最后一個(gè)是地里看到的一模一樣的open question,兩人都有5000limit,但是一個(gè)用100%一個(gè)只用2%,這兩人有沒(méi)有可能都在一月之內(nèi)關(guān)戶。面試官應(yīng)該看你第一反應(yīng)是考慮model的問(wèn)題還是考慮其他方面。

從feature engineering 到 最后 model tuning and validation 的所有步驟。

如何建model,用了哪些parameter,結(jié)果如何 還有為什么要選這個(gè)model

credit card churn model
? ?? ?1. Feature engineering,比如從start date算出tenure 等等
? ?? ?2. Missing value
? ?? ?3. 用什么模型,為什么
? ?? ?4. 現(xiàn)在數(shù)據(jù)量加大,怎么辦?spark。如果你要選,用RSpark還是PySpark?為什么
? ?? ?5. 現(xiàn)在模型output出來(lái),一個(gè)credit limit 使用率0%的用戶和使用率95%的用戶都很危險(xiǎn),都很可能馬上就關(guān)掉信用卡,你會(huì)怎么處理?我回答churn model是起點(diǎn),一般marketing department會(huì)根據(jù)churn model的結(jié)果設(shè)計(jì)retention program。對(duì)于這兩類危險(xiǎn)用戶,需要設(shè)計(jì)不同的incentive plan。
? ?? ?? ?? ? 1)使用率0%的用戶,基本上很難挽回。
? ?? ?? ?? ? 2)使用率95%的用戶大概率可以挽回,降低利率,增加cashback等等。。。
? ?? ?? ?? ? 3)可以根據(jù)測(cè)試結(jié)果再搞個(gè)uplift model,看哪些high churn users可以挽回的,著重施加treatment。

  • tell me some useful packages you use in R/python? ?1 Answer
  • how do you detect multicollinearity? ?1 Answer
  • how do you join two data sets???

?

Other questions:

  • our sever run cost is xxx, 其他固定成本是xxx,能容納xxx TB流量。 我們大概有xxx個(gè)客戶,每個(gè)客戶交付給我們server使用費(fèi)為xxx/month。我們給每個(gè)用戶分配xxxGB,但是平均每個(gè)用戶只會(huì)用掉期中的xx%,所以我們可以把剩下的空間再去接納更多的客戶。問(wèn):每年盈利是多少?現(xiàn)有另外一種server b, cost is xxx,capacity is xxx。。。請(qǐng)權(quán)衡比較我們要不要把已有server換成server b-baidu?
  • 題目是有一個(gè)運(yùn)動(dòng)產(chǎn)品的零售商,來(lái)找你優(yōu)化他們的在線廣告競(jìng)拍系統(tǒng),提高response rate。假設(shè)你有的數(shù)據(jù)是3, 000, 000用戶的訪問(wèn)數(shù)據(jù),每行數(shù)據(jù)有150多個(gè)column,已知overall的response rate是1/1000。被問(wèn)的問(wèn)題有:
    1. 選什么作為target?
    Response or not
    2. 選什么metrics?
    AUC-ROC
    3. 怎么處理NA??
    It depends. If NA is meaningful, leave it there. If NA is missing due to data extracation, do some simple if-else condition/mean(median)/regression to fill
    4. 怎么做feature engineering??
    Encode categorical varaible, use 'groupby' and 'mean/medium/std' to generate some features
    4. 數(shù)據(jù)量特別大怎么辦?
    mapreduce,但是我沒(méi)用過(guò),就拿本地并行優(yōu)化舉了個(gè)例子,怎么分配數(shù)據(jù)給各個(gè)線程,然后怎么把數(shù)據(jù)收回來(lái)合并。
    5. 模型用什么?
    GBDT,lightGBM/XGB
    6. 怎么評(píng)估模型表現(xiàn)?
    k-fold CV
    7. Overfitting/underfitting怎么辦?
    分別討論了一下。想辦法獲取更多的數(shù)據(jù),調(diào)整hyper-parameter。
    8. 如果模型預(yù)測(cè)出了問(wèn)題,會(huì)有什么影響?
    分情況討論了一下整體上會(huì)有什么變化,對(duì)單個(gè)用戶有什么影響。

?

  • Given a dataset, how would you model it to extract a particular information. How would you architect the pipeline.

?

?

?false positive/false negative, regularization, and potential issues

轉(zhuǎn)載于:https://www.cnblogs.com/ffeng0312/p/10275071.html

總結(jié)

以上是生活随笔為你收集整理的Capital one TPS整理的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 亚洲少妇一区二区 | 一级做a视频 | 日韩av线上 | 欧美精品xxx| 亚洲产国偷v产偷v自拍涩爱 | av中字 | 欧美黄色激情 | 懂色aⅴ一区二区三区免费 国产精品99在线观看 | 亲女禁h啪啪宫交 | 国产日韩欧美精品一区 | 亚洲av无码乱码国产精品fc2 | 国产熟妇一区二区三区aⅴ网站 | 久久九九热 | av久草| 丁香色综合 | 久久精品a | 成人国产综合 | 国产精品久久久久久久天堂 | 精品无码一区二区三区爱欲 | 绯色av一区二区三区高清 | 国产一区二区三区精品在线观看 | 国产人妻久久精品一区二区三区 | 久草青青草| 人人操在线播放 | 亚洲涩色 | 国产精品自慰网站 | 亚洲人成亚洲人成在线观看 | www黄在线观看 | 深夜福利网站 | 欧洲最强rapper网站直播 | 成人免费在线看片 | 黄色另类小说 | 丰满熟女人妻一区二区三区 | 热精品 | 欧洲成人在线视频 | av资源新版在线天堂 | 欧美亚洲国产一区二区三区 | 国产精品第六页 | sm在线观看 | 免费a视频 | 手机免费在线观看av | 国产第四页 | 欧美精品一区二区在线观看 | 美女福利视频导航 | 少妇毛片视频 | 红桃视频一区二区三区免费 | 亚欧在线观看 | 国产麻豆精品一区 | av最新资源 | 少妇的性事hd | 91在线精品秘密一区二区 | 黑人黄色录像 | 天天色小说 | 男人影院在线观看 | 日本高清不卡在线观看 | 大香蕉视频一区二区 | 精品美女www爽爽爽视频 | ass东方小嫩模pics | 乱色熟女综合一区二区三区 | 久草视频在线看 | 玖玖精品在线视频 | 一级视频毛片 | 久久国产精品无码一区二区 | 色婷婷综合久久久久中文一区二区 | 国产不卡视频一区二区三区 | 四虎影院色 | 日本一级淫片1000部 | 97国产视频 | 国产一级伦理片 | 美女扒开腿让男生桶 | 欧美激情一区二区三区p站 欧美mv日韩mv国产网站app | 日本欧美在线 | 亚洲一区在线观看视频 | 国产又黄视频 | 一节黄色片 | 奶水喷溅虐奶乳奴h文 | 极品美女一区二区三区 | 日韩国产精品一区二区 | 亚洲 欧美 日韩在线 | 欧美日韩大片在线观看 | 欧美一区二区成人 | 噼里啪啦免费高清看 | 撸撸在线视频 | 国内精品视频在线 | 国产成年人 | 国产精品一二三四 | 国产乱子伦一区二区 | 久久99网| 国产主播在线播放 | ass日本粉嫩pics珍品 | 青青成人 | 亚洲免费黄色片 | 自拍偷拍 国产 | 国产无遮挡又黄又爽免费网站 | 波多野结衣中文在线 | 悠悠色在线 | 精品三级av | 国产av 一区二区三区 | 熟妇人妻久久中文字幕 |