《一种面向主题的 Flickr 组内照片浏览方法》阅读笔记
《一種面向主題的 Flickr 組內(nèi)照片瀏覽方法》
創(chuàng)新點(diǎn)/意義:提出一種面向主題的照片瀏覽算法,解決Flickr里缺乏明確主題的組中的照片瀏覽。
研究思路:1.建立“標(biāo)簽——照片”的矩陣空間;
2.非負(fù)矩陣分解NMF,學(xué)習(xí)照片之間的潛在語義關(guān)聯(lián),找出主題;
3.綜合照片的各種屬性建立主題內(nèi)照片印象力計(jì)算模型;
4.在Flickr數(shù)據(jù)集上對該方法進(jìn)行驗(yàn)證。
文章架構(gòu):
1.引言部分:技術(shù)發(fā)展促進(jìn)了Flickr網(wǎng)站的流行->介紹Flickr的實(shí)現(xiàn),引出組
->對組的概念細(xì)分,引出本文的主要研究對象:缺乏明確主題的組
->主題明確的組的研究:{Ne- goescu:采用LDA將相同主題的組進(jìn)行聚類,提出基于主題的組的瀏覽方式}
{鄭楠老師前期的研究:通過三維標(biāo)注關(guān)系,提出一種基于張量分解的個(gè)性化組推薦模型}
->缺乏明確主題的組:本文提出一種面向主題的照片瀏覽方法
2.面向主題的照片瀏覽方法:
2.1建立矩陣空間:
1.Z ∈ R(I×J)其中 I,J 分別表示標(biāo)簽和照片的個(gè)數(shù);
2.矩陣的元素表示用戶使用了標(biāo)簽i標(biāo)注了照片j的次數(shù),如果沒有就設(shè)為0;
3.每一列表示某一張照片被打上的標(biāo)簽的集合(集合里面的數(shù)值表示被對應(yīng)的標(biāo)簽標(biāo)注的次數(shù));
每一行表示被該標(biāo)簽標(biāo)注過的圖片的集合(非0值表示被標(biāo)注過)
2.2基于非負(fù)矩陣分解的照片主題發(fā)現(xiàn)
1.非負(fù)矩陣分解早期的研究證明了該算法在挖掘標(biāo)簽語義方面的可行性;
2.非負(fù)矩陣分解是在進(jìn)行數(shù)據(jù)預(yù)處理:{
1.非負(fù)矩陣分解的思想:用兩個(gè)非負(fù)矩陣的乘積逼近原始矩陣 Z,將IJ的的矩陣分解成IR和R*J的兩個(gè)矩陣,R是分解的主題數(shù)目;
2.通過乘性迭代規(guī)則達(dá)成將損失函數(shù)最小化的非負(fù)矩陣分解目標(biāo);
這部分要不斷地迭代(為了逼近所需目標(biāo)或結(jié)果,不斷重復(fù)反饋),設(shè)最大迭代步數(shù)為M;
通過對非負(fù)矩陣誤差的不斷迭代,找出當(dāng)誤差變化幅度很小時(shí)的R與M。
3.將系數(shù)矩陣的每一行歸一化后,矩陣中相應(yīng)位置的值代表對應(yīng)照片在相應(yīng)主題中所占的權(quán)重,權(quán)重越大表示照片在相應(yīng)主題的重要性越大;
4.排序,選取權(quán)重較大的值構(gòu)成屬于該主題的照片集合。
}
2.3照片影響力要素分析及計(jì)算模型——數(shù)據(jù)分析
照片的質(zhì)量和上傳照片的時(shí)間反映了照片的影響力
1.照片的質(zhì)量:
Att:根據(jù)照片瀏覽次數(shù)計(jì)算照片關(guān)注度
Pref:根據(jù)照片好評次數(shù)計(jì)算照片喜好度
Qua = a × Pref + b × Att a+b=1,80/20法則;
好評信息的數(shù)量更能體現(xiàn)照片的質(zhì)量;
2.時(shí)間影響:
Inf = Time( tlast,tthis) × Qua
通過使用指數(shù)遺忘函數(shù)定義時(shí)間參數(shù),來平衡上傳時(shí)間越長的照片,瀏覽次數(shù)和好評次數(shù)越多所帶來的不公平;
1.通過瀏覽組內(nèi)照片,對涉及的領(lǐng)域更直觀的了解;
2.更快速定位相關(guān)主題的照片;
3.模型基于照片的質(zhì)量與新穎度對照片的進(jìn)行更有效的排序,可以更便利的瀏覽最新的高質(zhì)量照片;
4.簡單的分類導(dǎo)航貼近用戶的實(shí)際需求,更快速的獲取信息。
5.照片和標(biāo)簽都是動(dòng)態(tài)變化的,后臺(tái)定期更新的機(jī)制,在后臺(tái)定期采用非負(fù)矩陣分解方法提取照片的主題。
4.結(jié)束語:對本文提出的實(shí)驗(yàn)方法再次總結(jié)論述。
補(bǔ)充學(xué)習(xí):
Web2.0技術(shù)具備的要素:
*網(wǎng)站應(yīng)該能夠讓用戶把數(shù)據(jù)在網(wǎng)站系統(tǒng)內(nèi)外倒騰?!赗SS/ATOM/RDF/FOAF等XML數(shù)據(jù)的同步、聚合和遷移。
*用戶在網(wǎng)站系統(tǒng)內(nèi)擁有自己的數(shù)據(jù)——微內(nèi)容:英文是microcontent。用戶所生產(chǎn)的任何數(shù)據(jù)都算是微內(nèi)容。
*完全基于Web,所有的功能都能透過瀏覽器完成?!ㄟ^openapi,數(shù)據(jù)提供商開放了自己的數(shù)據(jù),通過mashup將信息孤島連接起來。
以 Flickr、 Delicious 等為代表的社會(huì)標(biāo)注類網(wǎng)站:
服務(wù)于用戶個(gè)體的微內(nèi)容的收集、創(chuàng)建、發(fā)布、管理、分享、合作、維護(hù)等的平臺(tái)。
比如說:微博,FaceBook,QQ空間
網(wǎng)絡(luò)應(yīng)用程序的三層結(jié)構(gòu):
三層網(wǎng)絡(luò)架構(gòu)設(shè)計(jì)的網(wǎng)絡(luò)有三個(gè)層次:核心層(網(wǎng)絡(luò)的高速交換主干)、匯聚層(提供基于策略的連接)、接入層 (將工作站接入網(wǎng)絡(luò))。
JSP(全稱JavaServer Pages):
JSP部署于網(wǎng)絡(luò)服務(wù)器上,可以響應(yīng)客戶端發(fā)送的請求,并根據(jù)請求內(nèi)容動(dòng)態(tài)地生成HTML、XML或其他格式文檔的Web網(wǎng)頁,然后返回給請求者。JSP技術(shù)以Java語言作為腳本語言,為用戶的HTTP請求提供服務(wù),并能與服務(wù)器上的其它Java程序共同處理復(fù)雜的業(yè)務(wù)需求。
JSP將Java代碼和特定變動(dòng)內(nèi)容嵌入到靜態(tài)的頁面中,實(shí)現(xiàn)以靜態(tài)頁面為模板,動(dòng)態(tài)生成其中的部分內(nèi)容。也可以創(chuàng)建JSP標(biāo)簽庫,然后像使用標(biāo)準(zhǔn)HTML或XML標(biāo)簽一樣使用它們。標(biāo)簽庫能增強(qiáng)功能和服務(wù)器性能,而且不受跨平臺(tái)問題的限制。
JSP文件在運(yùn)行時(shí)會(huì)被其編譯器轉(zhuǎn)換成更原始的Servlet代碼。JSP編譯器可以把JSP文件編譯成用Java代碼寫的Servlet,然后再由Java編譯器來編譯成能快速執(zhí)行的二進(jìn)制機(jī)器碼,也可以直接編譯成二進(jìn)制碼。
Servlet:
Java Servlet 是運(yùn)行在 Web 服務(wù)器或應(yīng)用服務(wù)器上的程序,它是作為來自 Web 瀏覽器或其他 HTTP 客戶端的請求和 HTTP 服務(wù)器上的數(shù)據(jù)庫或應(yīng)用程序之間的中間層。
使用 Servlet,可以收集來自網(wǎng)頁表單的用戶輸入,呈現(xiàn)來自數(shù)據(jù)庫或者其他源的記錄,還可以動(dòng)態(tài)創(chuàng)建網(wǎng)頁。
總結(jié)
以上是生活随笔為你收集整理的《一种面向主题的 Flickr 组内照片浏览方法》阅读笔记的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: uniapp监听视频播放进度,完成视频试
- 下一篇: Jmeter断言操作