M2 Planning Day3
今天中午的時候有和鄒欣老師的Lunch Discussion,討論了很多東西,有很多收獲。
首先確定的是page cluster之類的事情是不需要做了,而之前相對比較糾結的就是這一點,是否要做cluster,如何cluster是很蛋疼的問題。討論的過程中我們注意到其實M2的重點也可以不是這里,雖然將網頁聚類并產生新的keywords是非常激動人心的事情,但我們畢竟不是在做research,對于grow search而言,更多的可能還是要考慮用戶可能會需要什么。
晚上的討論里我們又將中午的內容稍微總結了一下,基本上清楚M2我們要做的東西:
1 對于長得過于茂盛的樹,我們決定將比較舊的結果周期性地聚為一個葉節點,當然這個葉節點不同于普通的葉節點,當在上面點擊的時候應該可以得到被收入內容的枝條。這樣做的好處是樹本身不會過于“繁茂”而且被收縮的節點會使得樹本身有著更深的層次,而非現在的a tree of depth 2。至于何時進行收縮現在有集中想法:按照時間,譬如每一小時收縮一次;按照節點個數,譬如每100個節點收縮一次。但無論如何將收縮功能實現和收縮的criteria無關,但是對于如何“優雅地”收縮枝條,大概是一個需要很多嘗試的有難度的事情。
2 應當允許用戶剪掉枝條。樹長得過于茂盛的時候如果用戶可以修剪,好像修剪現實生活中的樹那樣的話,應該是很有趣的事情。至于修剪的方法當然可以是像割繩子游戲里那樣用鼠標劃一下就刷刷剪掉,不過我們暫時也還沒想要做到那樣,點擊枝條能刪除這樣的程度就可以了吧。
3 多棵樹。之前我們本來打算放棄多棵樹的,但是中午的時候聽鄒老師提到了“花園”之類的東西,又開始覺得加入多棵樹的話也許也不錯,而且既然現在既然丟掉了網頁聚類的設想,那么實際上一棵樹并非會變成一個knowledge graph,換句話講不會非常地占據空間,所以多棵樹還是有必要的,不然只有一棵樹未免單調。
4 關于數據來源,之前一直使用的是BingAPI獲取的數據進行按時間的排序后再進行顯示。但是這樣的問題是按照時間排序后會丟失掉原本search engine對結果的排序,而對于搜索新聞的用戶而言想要的還是rank最高的排序。之后我們打算使用的數據是BingNews的RSS訂閱,今天驚喜地發現自己的關鍵詞也可以使用RSS訂閱了,但是因為在最下面所以昨天沒有發現,以為只能按類別去訂閱。使用RSS訂閱的好處是內容會比較make sense。但愿。。。
雖然對于要做的東西有了一些初步的想法,但是仔細看看哪一個都絕非能夠輕易實現的東西,所以今天之后隊員們都去各自探索各自的內容,看看需要做的東西我們能不能做到,看看我們能做到哪里,再確定具體的計劃。
以上。
轉載于:https://www.cnblogs.com/smart-code/archive/2012/10/31/2748713.html
總結
以上是生活随笔為你收集整理的M2 Planning Day3的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: AS 3.0小事件处理 八
- 下一篇: sqlserver结果集转为字符串