wordcount.java_mapreduce中wordcount的java实现
用java模擬詞頻統計。
有3個文件:text1: hello world
text2:hello hadoop
text3:hello mapreduce
對上面的文件進行詞頻統計:結果應該是:hello:3;????hadoop:1;????world:1;????mapreduce:1
代碼實現如下:
package?count;
import?java.util.Hashtable;
import?java.util.Iterator;
import?java.util.StringTokenizer;
public?class?Count?{
public?static?void?main(String[]?args)?{
String?[]?text?=?new?String[]{"hello?world",?"hello?hadoop",?"hello?mapreduce"};
Hashtable?ht?=?new?Hashtable();
for(int?i=0;?i<3;?i++){
StringTokenizer?st?=?new?StringTokenizer(text[i]);
while(st.hasMoreTokens()){
String?word?=?st.nextToken();
if(!ht.containsKey(word))
ht.put(word,?new?Integer(1));
else{
int?wc?=?((Integer)ht.get(word)).intValue()?+?1;
ht.put(word,?new?Integer(wc));
}
}
}
for(Iterator?itr?=?ht.keySet().iterator();?itr.hasNext();){
String?word?=?(String)itr.next();
System.out.print(word?+?":"?+?(Integer)ht.get(word)+";?");
}
}
}
總結
以上是生活随笔為你收集整理的wordcount.java_mapreduce中wordcount的java实现的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: mysql数据库优化语句_mysql数据
- 下一篇: 华硕服务器主板型号命名规则,常见主板命名