关于memcached的收集
關于memcached的收集
Memcached是什么?
Memcached是高性能的,分布式的內存對象緩存系統,用于在動態應用中減少數據庫負載,提升訪問速度。Memcached由Danga Interactive開發,用于提升LiveJournal.com訪問速度的。LJ每秒動態頁面訪問量幾千次,用戶700萬。Memcached將數據庫負載大幅度降低,更好的分配資源,更快速訪問。
如何使用memcached-Server端?
在服務端運行:# ./memcached -d -m 2048 -l 10.0.0.40 -p 11211
這將會啟動一個占用2G內存的進程,并打開11211端口用于接收請求。由于32位系統只能處理4G內存的尋址,所以在大于4G內存使用PAE的32位服務器上可以運行2-3個進程,并在不同端口進行監聽。
如何使用memcached-Client端?
在應用端包含一個用于描述Client的Class后,就可以直接使用,非常簡單。PHP Example:
$options["servers"] = array("192.168.1.41:11211", "192.168.1.42:11212");
$options["debug"] = false;
$memc = new MemCachedClient($options);
$myarr = array("one","two", 3);
$memc->set("key_one", $myarr);
$val = $memc->get("key_one");
print $val[0]."\n"; // prints 'one‘
print $val[1]."\n"; // prints 'two‘
print $val[2]."\n"; // prints 3
為什么不使用數據庫做這些?
暫且不考慮使用什么樣的數據庫(MS-SQL, Oracle, Postgres, MysQL-InnoDB, etc..), 實現事務(ACID,Atomicity, Consistency, Isolation, and Durability )需要大量開銷,特別當使用到硬盤的時候,這就意味著查詢可能會阻塞。當使用不包含事務的數據庫(例如Mysql-MyISAM),上面的開銷不存在,但 讀線程又可能會被寫線程阻塞。
Memcached從不阻塞,速度非常快。
為什么不使用共享內存?
最初的緩存做法是在線程內對對象進行緩存,但這樣進程間就無法共享緩存,命中率非常低,導致緩存效率極低。后來出現了共享內存的緩存,多個進程或者線程共享同一塊緩存,但畢竟還是只能局限在一臺機器上,多臺機器做相同的緩存同樣是一種資源的浪費,而且命中率也比較低。Memcached Server和Clients共同工作,實現跨服務器分布式的全局的緩存。并且可以與Web Server共同工作,Web Server對CPU要求高,對內存要求低,Memcached Server對CPU要求低,對內存要求高,所以可以搭配使用。
Mysql 4.x的緩存怎么樣?
Mysql查詢緩存不是很理想,因為以下幾點:當指定的表發生更新后,查詢緩存會被清空。在一個大負載的系統上這樣的事情發生的非常頻繁,導致查詢緩存效率非常低,有的情況下甚至還不如不開,因為它對cache的管理還是會有開銷。
在32位機器上,Mysql對內存的操作還是被限制在4G以內,但memcached可以分布開,內存規模理論上不受限制。
Mysql上的是查詢緩存,而不是對象緩存,如果在查詢后還需要大量其它操作,查詢緩存就幫不上忙了。
如果要緩存的數據不大,并且查詢的不是非常頻繁,這樣的情況下可以用Mysql 查詢緩存,不然的話memcached更好。
數據庫同步怎么樣?
這里的數據庫同步是指的類似Mysql Master-Slave模式的靠日志同步實現數據庫同步的機制。你可以分布讀操作,但無法分布寫操作,但寫操作的同步需要消耗大量的資源,而且這個開銷是隨著slave服務器的增長而不斷增長的。
下一步是要對數據庫進行水平切分,從而讓不同的數據分布到不同的數據庫服務器組上,從而實現分布的讀寫,這需要在應用中實現根據不同的數據連接不同的數據庫。
當這一模式工作后(我們也推薦這樣做),更多的數據庫導致更多的讓人頭疼的硬件錯誤。
Memcached可以有效的降低對數據庫的訪問,讓數據庫用主要的精力來做不頻繁的寫操作,而這是數據庫自己控制的,很少會自己阻塞 自己。
Memcached快嗎?
非常快,它使用libevent,可以應付任意數量打開的連接(使用epoll,而非poll),使用非阻塞網絡IO,分布式散列對象到不同的服務器,查詢復雜度是O(1)。
參考資料:
Distributed Caching with Memcached | Linux Journal
http://www.danga.com/
肖理達 (KrazyNio AT hotmail.com), 2006.04. 06, 轉載請注明出處
一、memcached 簡介
在很多場合,我們都會聽到 memcached 這個名字,但很多同學只是聽過,并沒有用過或實際了解過,只知道它是一個很不錯的東東。這里簡單介紹一下,memcached 是高效、快速的分布式內存對象緩存系統,主要用于加速 WEB 動態應用程序。
二、memcached 安裝
首先是下載 memcached 了,目前最新版本是 1.1.12,直接從官方網站即可下載到 memcached-1.1.12.tar.gz。除此之外,memcached 用到了 libevent,我下載的是 libevent-1.1a.tar.gz。
接下來是分別將 libevent-1.1a.tar.gz 和 memcached-1.1.12.tar.gz 解開包、編譯、安裝:
[cmd]
# tar -xzf libevent-1.1a.tar.gz
# cd libevent-1.1a
# ./configure --prefix=/usr
# make
# make install
# cd ..
# tar -xzf memcached-1.1.12.tar.gz
# cd memcached-1.1.12
# ./configure --prefix=/usr
# make
# make install
[/cmd]
安裝完成之后,memcached 應該在 /usr/bin/memcached。
三、運行 memcached 守護程序
運行 memcached 守護程序很簡單,只需一個命令行即可,不需要修改任何配置文件(也沒有配置文件給你修改 ):
[cmd]
/usr/bin/memcached -d -m 128 -l 192.168.1.1 -p 11211 -u httpd
參數解釋:
-d 以守護程序(daemon)方式運行 memcached;
-m 設置 memcached 可以使用的內存大小,單位為 M;
-l 設置監聽的 IP 地址,如果是本機的話,通常可以不設置此參數;
-p 設置監聽的端口,默認為 11211,所以也可以不設置此參數;
-u 指定用戶,如果當前為 root 的話,需要使用此參數指定用戶。
當然,還有其它參數可以用,man memcached 一下就可以看到了。
[/cmd]
四、memcached 的工作原理
首先 memcached 是以守護程序方式運行于一個或多個服務器中,隨時接受客戶端的連接操作,客戶端可以由各種語言編寫,目前已知的客戶端 API 包括 Perl/PHP/Python/Ruby/Java/C#/C 等等。PHP 等客戶端在與 memcached 服務建立連接之后,接下來的事情就是存取對象了,每個被存取的對象都有一個唯一的標識符 key,存取操作均通過這個 key 進行,保存到 memcached 中的對象實際上是放置內存中的,并不是保存在 cache 文件中的,這也是為什么 memcached 能夠如此高效快速的原因。注意,這些對象并不是持久的,服務停止之后,里邊的數據就會丟失。
三、PHP 如何作為 memcached 客戶端
有兩種方法可以使 PHP 作為 memcached 客戶端,調用 memcached 的服務進行對象存取操作。
第一種,PHP 有一個叫做 memcache 的擴展,Linux 下編譯時需要帶上 –enable-memcache[=DIR] 選項,Window 下則在 php.ini 中去掉 php_memcache.dll 前邊的注釋符,使其可用。
除此之外,還有一種方法,可以避開擴展、重新編譯所帶來的麻煩,那就是直接使用 php-memcached-client。
本文選用第二種方式,雖然效率會比擴展庫稍差一些,但問題不大。
四、PHP memcached 應用示例
首先 下載 memcached-client.php,在下載了 memcached-client.php 之后,就可以通過這個文件中的類“memcached”對 memcached 服務進行操作了。其實代碼調用非常簡單,主要會用到的方法有 add()、get()、replace() 和 delete(),方法說明如下:
add ($key, $val, $exp = 0)
往 memcached 中寫入對象,$key 是對象的唯一標識符,$val 是寫入的對象數據,$exp 為過期時間,單位為秒,默認為不限時間;
get ($key)
從 memcached 中獲取對象數據,通過對象的唯一標識符 $key 獲取;
replace ($key, $value, $exp=0)
使用 $value 替換 memcached 中標識符為 $key 的對象內容,參數與 add() 方法一樣,只有 $key 對象存在的情況下才會起作用;
delete ($key, $time = 0)
刪除 memcached 中標識符為 $key 的對象,$time 為可選參數,表示刪除之前需要等待多長時間。
下面是一段簡單的測試代碼,代碼中對標識符為 ‘mykey’ 的對象數據進行存取操作:
//?????包含?memcached?類文件
require_once(‘memcached-client.php’);
//?????選項設置
$options?=?array(
?????’servers’?=>?array(‘192.168.1.1:11211′),?//memcached?服務的地址、端口,可用多個數組元素表示多個?memcached?服務
?????‘debug’?=>?true,?????//是否打開?debug
?????‘compress_threshold’?=>?10240,?????//超過多少字節的數據時進行壓縮
?????‘persistant’?=>?false?????//是否使用持久連接
?????);
//?????創建?memcached?對象實例
$mc?=?new?memcached($options);
//?????設置此腳本使用的唯一標識符
$key?=?‘mykey’;
//?????往?memcached?中寫入對象
$mc->add($key,?’some?random?strings’);
$val?=?$mc->get($key);
echo?“n”.str_pad(‘$mc->add()?’,?60,?‘_’).“n”;
var_dump($val);
//?????替換已寫入的對象數據值
$mc->replace($key,?array(’some’=>‘haha’,?‘array’=>‘xxx’));
$val?=?$mc->get($key);
echo?“n”.str_pad(‘$mc->replace()?’,?60,?‘_’).“n”;
var_dump($val);
//?????刪除?memcached?中的對象
$mc->delete($key);
$val?=?$mc->get($key);
echo?“n”.str_pad(‘$mc->delete()?’,?60,?‘_’).“n”;
var_dump($val);
?>
是不是很簡單,在實際應用中,通常會把數據庫查詢的結果集保存到 memcached 中,下次訪問時直接從 memcached 中獲取,而不再做數據庫查詢操作,這樣可以在很大程度上減輕數據庫的負擔。通常會將 SQL 語句 md5() 之后的值作為唯一標識符 key。下邊是一個利用 memcached 來緩存數據庫查詢結果集的示例(此代碼片段緊接上邊的示例代碼):
PHP代碼: <?php$sql?=?‘SELECT?*?FROM?users’;
$key?=?md5($sql);?????//memcached?對象標識符
if?(?!($datas?=?$mc->get($key))?)?{
?????//?????在?memcached?中未獲取到緩存數據,則使用數據庫查詢獲取記錄集。
?????echo?“n”.str_pad(‘Read?datas?from?MySQL.’,?60,?‘_’).“n”;
?????$conn?=?mysql_connect(‘localhost’,?‘test’,?‘test’);
?????mysql_select_db(‘test’);
?????$result?=?mysql_query($sql);
?????while?($row?=?mysql_fetch_object($result))
?????????????$datas[]?=?$row;
?????//?????將數據庫中獲取到的結果集數據保存到?memcached?中,以供下次訪問時使用。
?????$mc->add($key,?$datas);
}?else?{
?????echo?“n”.str_pad(‘Read?datas?from?memcached.’,?60,?‘_’).“n”;
}
var_dump($datas);
?>
可以看出,使用 memcached 之后,可以減少數據庫連接、查詢操作,數據庫負載下來了,腳本的運行速度也提高了。
之前我曾經寫過一篇名為《PHP 實現多服務器共享 SESSION 數據》文章,文中的 SESSION 是使用數據庫保存的,在并發訪問量大的時候,服務器的負載會很大,經常會超出 MySQL 最大連接數,利用 memcached,我們可以很好地解決這個問題,工作原理如下:
用戶訪問網頁時,查看 memcached 中是否有當前用戶的 SESSION 數據,使用 session_id() 作為唯一標識符;如果數據存在,則直接返回,如果不存在,再進行數據庫連接,獲取 SESSION 數據,并將此數據保存到 memcached 中,供下次使用;
當前的 PHP 運行結束(或使用了 session_write_close())時,會調用 My_Sess::write() 方法,將數據寫入數據庫,這樣的話,每次仍然會有數據庫操作,對于這個方法,也需要進行優化。使用一個全局變量,記錄用戶進入頁面時的 SESSION 數據,然后在 write() 方法內比較此數據與想要寫入的 SESSION 數據是否相同,不同才進行數據庫連接、寫入數據庫,同時將 memcached 中對應的對象刪除,如果相同的話,則表示 SESSION 數據未改變,那么就可以不做任何操作,直接返回了;
那么用戶 SESSION 過期時間怎么解決呢?記得 memcached 的 add() 方法有個過期時間參數 $exp 嗎?把這個參數值設置成小于 SESSION 最大存活時間即可。另外別忘了給那些一直在線的用戶延續 SESSION 時長,這個可以在 write() 方法中解決,通過判斷時間,符合條件則更新數據庫數據。
五、相關資源
memcached 官方網站
PHP memcached client
下載 memcached-client.php
總結
以上是生活随笔為你收集整理的关于memcached的收集的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 转一个网络软件开发的广告
- 下一篇: 调查一下 大家用vs时做网页时,都用的什