當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

阿里研究员谷朴：API 设计最佳实践的思考

發布時間：2023/12/31 编程问答 31 豆豆

生活随笔收集整理的這篇文章主要介紹了阿里研究员谷朴：API 设计最佳实践的思考小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

2019獨角獸企業重金招聘Python工程師標準>>>

API是軟件系統的核心，而軟件系統的復雜度Complexity是大規模軟件系統能否成功最重要的因素。但復雜度Complexity并非某一個單獨的問題能完全敗壞的，而是在系統設計尤其是API設計層面很多很多小的設計考量一點點疊加起來的（也即John Ousterhout老爺子說的Complexity is incremental【8】）。成功的系統不是有一些特別閃光的地方，而是設計時點點滴滴的努力積累起來的。

因此，這里我們試圖思考并給出建議，一方面，什么樣的API設計是__好__的設計？另一方面，在設計中如何能做到？

API設計面臨的挑戰千差萬別，很難有處處適用的準則，所以在討論原則和最佳實踐時，無論這些原則和最佳實踐是什么，一定有適應的場景和不適應的場景。因此我們在下面爭取不僅提出一些建議，也盡量去分析這些建議在什么場景下適用，這樣我們也可以有針對性的采取例外的策略。

范圍

本文偏重于__一般性的API設計__，__并更適用于遠程調用（RPC或者HTTP/RESTful的API）__，但是這里沒有特別討論RESTful API特有的一些問題。

另外，本文在討論時，假定了客戶端直接和遠程服務端的API交互。在阿里，由于多種原因，通過客戶端的SDK來間接訪問遠程服務的情況更多一些。這里并不討論SDK帶來的特殊問題，但是將SDK提供的方法看作遠程API的代理，這里的討論仍然適用。

API設計準則：什么是好的API

在這一部分，我們試圖總結一些好的API應該擁有的特性，或者說是設計的原則。這里我們試圖總結更加基礎性的原則。所謂基礎性的原則，是那些如果我們很好的遵守了就可以讓API在之后演進的過程中避免多數設計問題的原則。

A good API

__提供清晰的思維模型 provides a good mental model__：API是用于程序之間的交互，但是一個API如何被使用，以及API本身如何被維護，是依賴于維護者和使用者能夠對該API有清晰的、一致的認識。這種狀況實際上是不容易達到的。
__簡單 is simple__：“Make things as simple as possible, but no simpler.” 在實際的系統中，尤其是考慮到系統隨著需求的增加不斷的演化，我們絕大多數情況下見到的問題都是__過于復雜__的設計，而非過于簡單，因此強調簡單性一般是恰當的。
__容許多個實現 allows multiple implementations__：這個原則看上去更具體，但是這是我非常喜歡的一個原則。這是Sanjay Ghemawat常常提到的一個原則。一般來說，在討論API設計時常常被提到的原則是解耦性原則或者說松耦合原則。然而相比于松耦合原則，這個原則更加有可操作性：如果一個API自身可以有多個__完全不同的實現__，一般來說這個API已經有了足夠好的抽象，和自身的某一個具體實現無關，那么一般也不會出現和外部系統耦合過緊的問題。因此這個原則更本質一些。

最佳實踐

本部分則試圖討論一些更加詳細、具體的建議，可以讓API的設計更容易滿足前面描述的基礎原則。

想想優秀的API例子：POSIX File API

如果說API的設計實踐只能列一條的話，那么可能最有幫助的和最可操作的就是這一條。本文也可以叫做“通過File API體會API設計的最佳實踐”。

所以整個最佳實踐可以總結為一句話：“想想File API是怎么設計的。”

首先回顧一下File API的主要接口（以C為例，很多是Posix API，選用比較簡單的I/O接口為例【1】：

int open(const char *path, int oflag, .../*,mode_t mode */); int close (int filedes); int remove( const char *fname ); ssize_t write(int fildes, const void *buf, size_t nbyte); ssize_t read(int fildes, void *buf, size_t nbyte);

File API為什么是經典的好API設計？

File API已經有幾十年歷史（從1988年算起將近40年），盡管期間硬件軟件系統的發展經歷了好幾代，這套API核心保持了穩定。這是極其了不起的。
API提供了非常清晰的概念模型，每個人都能夠很快理解這套API背后的基礎概念：什么是文件，以及相關聯的操作（open, close, read, write），清晰明了；
支持很多的不同文件系統實現，這些系統實現甚至于屬于類型非常不同的設備，例如磁盤、塊設備、管道（pipe）、共享內存、網絡、終端terminal等等。這些設備有的是隨機訪問的，有的只支持順序訪問；有的是持久化的有的則不是。然而所有不同的設備不同的文件系統實現都可以采用了同樣的接口，使得上層系統不必關注底層實現的不同，這是這套API強大的生命力的表現。

例如同樣是打開文件的接口，底層實現完全不同，但是通過完全一樣的接口，不同的路徑以及Mount機制，實現了同時支持。其他還有Procfs, pipe等。

int open(const char *path, int oflag, .../*,mode_t mode */);

例如這里的cephfs和本地文件系統，底層對應完全不同的實現，但是上層client可以不用區分對待，采用同樣的接口來操作，只通過路徑不同來區分。

基于上面的這些原因，我們知道File API為什么能夠如此成功。事實上，它是如此的成功以至于今天的*-nix操作系統，everything is filed based.

盡管我們有了一個非常好的例子File API，但是__要設計一個能夠長期保持穩定的API是一項及其困難的事情__，因此僅有一個好的參考還不夠，下面再試圖展開去討論一些更細節的問題。

Document well 寫詳細的文檔

寫詳細的文檔，并保持更新。關于這一點，其實無需贅述，現實是，很多API的設計和維護者不重視文檔的工作。

在一個面向服務化/Micro-service化架構的今天，一個應用依賴大量的服務，而每個服務API又在不斷的演進過程中，__準確的記錄每個字段和每個方法，并且保持更新__，對于減少客戶端的開發踩坑、減少出問題的幾率，提升整體的研發效率至關重要。

Carefully define the "resource" of your API 仔細的定義“資源”

如果適合的話，選用“資源”加操作的方式來定義。今天很多的API都可以采用這樣一個抽象的模式來定義，這種模式有很多好處，也適合于HTTP的RESTful API的設計。但是在設計API時，一個重要的前提是對Resource本身進行合理的定義。什么樣的定義是合理的？Resource資源本身是對一套API操作核心對象的一個抽象Abstraction。

抽象的過程是__去除細節的過程__。在我們做設計時，如果現實世界的流程或者操作對象是具體化的，抽象的Object的選擇可能不那么困難，但是對于哪些細節應該包括，是需要很多思考的。例如對于文件的API，可以看出，文件File這個Resource（資源）的抽象，是“可以由一個字符串唯一標識的數據記錄”。這個定義去除了文件是如何標識的（這個問題留給了各個文件系統的具體實現），也去除了關于如何存儲的組織結構（again，留給了存儲系統）細節。

雖然我們希望API簡單，但是更重要的是__選擇對的實體來建模__。在底層系統設計中，我們傾向于更簡單的抽象設計。有的系統里面，域模型本身的設計往往不會這么簡單，需要更細致的考慮如何定義Resource。一般來說，域模型中的概念抽象，如果能和現實中的人們的體驗接近，會有利于人們理解該模型。__選擇對的實體來建模__往往是關鍵。結合域模型的設計，可以參考相關的文章，例如阿白老師的文章【2】。

Choose the right level of abstraction 選擇合適的抽象層

與前面的一個問題密切相關的，是在定義對象時需要選擇合適的Level of abstraction（抽象的層級）。不同概念之間往往相互關聯。仍然以File API為例。在設計這樣的API時，選擇抽象的層級的可能的選項有多個，例如：

文本、圖像混合對象
“數據塊” 抽象
”文件“抽象

這些不同的層級的抽象方式，可能描述的是同一個東西，但是在概念上是不同層面的選擇。當設計一個API用于與數據訪問的客戶端交互時，“文件File“是更合適的抽象，而設計一個API用于文件系統內部或者設備驅動時，數據塊或者數據塊設備可能是合適的抽象，當設計一個文檔編輯工具時，可能會用到“文本圖像混合對象”這樣的文件抽象層級。

又例如，數據庫相關的API定義，底層的抽象可能針對的是數據的存儲結構，中間是數據庫邏輯層需要定義數據交互的各種對象和協議，而在展示（View layer）的時候需要的抽象又有不同【3】。

Prefer using different model for different layers 不同層建議采用不同的數據模型

這一條與前一條密切關聯，但是強調的是不同層之間模型不同。

在服務化的架構下，數據對象在處理的過程中往往經歷多層，例如上面的View-Logic model-Storage是典型的分層結構。在這里我們的建議是不同的Layer采用不同的數據結構。John Ousterhout 【8】書里面則更直接強調：Different layer, different abstraction。

例如網絡系統的7層模型，每一層有自己的協議和抽象，是個典型的例子。而前面的文件API，則是一個Logic layer的模型，而不同的文件存儲實現（文件系統實現），則采用各自獨立的模型（如快設備、內存文件系統、磁盤文件系統等各自有自己的存儲實現API）。

當API設計傾向于不同的層采用一樣的模型的時候（例如一個系統使用后段存儲服務與自身提供的模型之間，見下圖），可能意味著這個Service本身的職責沒有定義清楚，是否功能其實應該下沉？

不同的層采用同樣的數據結構帶來的問題還在于API的演進和維護過程。一個系統演進過程中可能需要替換掉后端的存儲，可能因為性能優化的關系需要分離緩存等需求，這時會發現將兩個層的數據綁定一起（甚至有時候直接把前端的json存儲在后端），會帶來不必要的耦合而阻礙演進。

Naming and identification of the resource 命名與標識

當API定義了一個資源對象，下面一般需要的是提供命名/標識(Naming and identification)。在naming/ID方面，一般有兩個選擇（不是指系統內部的ID，而是會暴露給用戶的）：

用free-form string作為ID（string nameAsId)
用結構化數據表達naming/ID

何時選擇哪個方法，需要具體分析。采用Free-form string的方式定義的命名，為系統的具體實現留下了最大的自由度。帶來的問題是命名的內在結構（如路徑）本身并非API強制定義的一部分，轉為變成實現細節。如果命名本身存在結構，客戶端需要有提取結構信息的邏輯。這是一個需要做的平衡。

例如文件API采用了free-form string作為文件名的標識方式，而文件的URL則是文件系統具體實現規定。這樣，就容許Windows操作系統采用"D:\Documents\File.jpg"而Linux采用"/etc/init.d/file.conf"這樣的結構了。而如果文件命名的數據結構定義為

{disk: string,path: string }

這樣結構化的方式，透出了"disk"和"path"兩個部分的結構化數據，那么這樣的結構可能適應于Windows的文件組織方式，而不適應于其他文件系統，也就是說泄漏了實現細節。

如果資源Resource對象的抽象模型自然包含結構化的標識信息，則采用結構化方式會簡化客戶端與之交互的邏輯，強化概念模型。這時犧牲掉標識的靈活度，換取其他方面的優勢。例如，銀行的轉賬賬號設計，可以表達為

{account: numberrouting: number }

這樣一個結構化標識，由賬號和銀行間標識兩部分組成，這樣的設計含有一定的業務邏輯在內，但是這部分業務邏輯是__被描述的系統內在邏輯而非實現細節__，并且這樣的設計可能有助于具體實現的簡化以及避免一些非結構化的字符串標識帶來的安全性問題等。因此在這里結構化的標識可能更適合。

另一個相關的問題是，__何時應該提供一個數字unique ID?__ 這是一個經常遇到的問題。有幾個問題與之相關需要考慮：

是否已經有結構化或者字符串的標識可以唯一、穩定標識對象？如果已經有了，那么就不一定需要numerical ID；
64位整數范圍夠用嗎？
數字ID可能不是那么用戶友好，對于用戶來講數字的ID會有幫助嗎？

如果這些問題都有答案而且不是什么阻礙，那么使用數字ID是可以的，__否則要慎用數字ID__。

Conceptually what are the meaningful operations on this resource? 對于該對象來說，什么操作概念上是合理的？

在確定下來了資源/對象以后，我們還需要定義哪些操作需要支持。這時，考慮的重點是“__概念上合理(Conceptually reasonable)__”。換句話說，operation + resource?連在一起聽起來自然而然合理（如果Resource本身命名也比較準確的話。當然這個“如果命名準確”是個big if，非常不容易做到）。操作并不總是CRUD（create, read, update, delete）。

例如，一個API的操作對象是額度（Quota)，那么下面的操作聽上去就比較自然：

Update quota（更新額度），transfer quota（原子化的轉移額度）

但是如果試圖Create Quota，聽上去就不那么自然，因額度這樣一個概念似乎表達了一個數量，概念上不需要創建。額外需要思考一下，這個對象是否真的需要創建？我們真正需要做的是什么？

For update operations, prefer idempotency whenever feasible 更新操作，盡量保持冪等性

Idempotency冪等性，指的是一種操作具備的性質，具有這種性質的操作可以被多次實施并且不會影響到初次實施的結果“the property of certain operations in mathematics and computer science whereby they can be applied multiple times without changing the result beyond the initial application.”【3】

很明顯Idempotency在系統設計中會帶來很多便利性，例如客戶端可以更安全的重試，從而讓復雜的流程實現更為簡單。但是Idempotency實現并不總是很容易。

Create類型的idempotency
創建的Idempotency，多次調用容易出現重復創建，為實現冪等性，常見的做法是使用一個__client-side generated de-deduplication token（客戶端生成的唯一ID）__，在反復重試時使用同一個Unique ID，便于服務端識別重復。
Update類型的Idempotency
更新值(update）類型的API，應該避免采用"Delta"語義，以便于實現冪等性。對于更新類的操作，我們再簡化為兩類實現方式
- Incremental（數量增減），如IncrementBy(3)這樣的語義
- SetNewTotal（設置新的總量）
IncrementBy?這樣的語義重試的時候難以避免出錯，而SetNewTotal（3）（總量設置為x）語義則比較容易具備冪等性。
當然在這個例子里面，也需要看到，IncrementBy也有有點，即多個客戶請求同時增加的時候，比較容易并行處理，而SetTotal可能導致并行的更新相互覆蓋（或者相互阻塞）。
這里，可以認為更新增量和設置新的總量這兩種語義是不同的優缺點，需要根據場景來解決。如果必須優先考慮并發更新的情景，可以使用更新增量的語義，并輔助以Deduplication token解決冪等性。
__Delete類型idempotency__：Delete的冪等性問題，往往在于一個對象被刪除后，再次試圖刪除可能會由于數據無法被發現導致出錯。這個行為一般來說也沒什么問題，雖然嚴格意義上不冪等，但是也無副作用。如果需要實現Idempotency，系統也采用了Archive->Purge生命周期的方式分步刪除，或者持久化Purge log的方式，都能支持冪等刪除的實現。

Compatibility 兼容

API的變更需要兼容，兼容，兼容！重要的事情說三遍。這里的兼容指的是向后兼容，而兼容的定義是不會Break客戶端的使用，也即__老的客戶端能否正常訪問服務端的新版本（如果是同一個大版本下）不會有錯誤的行為__。這一點對于遠程的API（HTTP/RPC）尤其重要。關于兼容性，已經有很好的總結，例如【4】提供的一些建議。

常見的__不兼容__變化包括（但不限于）

刪除一個方法、字段或者enum的數值
方法、字段改名
方法名稱字段不改，但是語義和行為的變化，也是不兼容的。這類比較容易被忽視。
更具體描述可以參加【4】。

另一個關于兼容性的重要問題是，__如何做不兼容的API變更__？通常來說，不兼容變更需要通過一個__Deprecation process，在大版本發布時來分步驟實現__。關于Deprecation process，這里不展開描述，一般來說，需要保持過去版本的兼容性的前提下，支持新老字段/方法/語義，并給客戶端足夠的升級時間。這樣的過程比較耗時，也正是因為如此，我們才需要如此重視API的設計。

有時，一個面向內部的API升級，往往開發的同學傾向于選擇高效率，采用一種叫”同步發布“的模式來做不兼容變更，即通知已知的所有的客戶端，自己的服務API要做一個不兼容變更，大家一起發布，同時更新，切換到新的接口。這樣的方法是非常不可取的，原因有幾個：

我們經常并不知道所有使用API的客戶
發布過程需要時間，無法真正實現“同步更新”
不考慮向后兼容性的模式，一旦新的API有問題需要回滾，則會非常麻煩，這樣的計劃八成也不會有回滾方案，而且客戶端未必都能跟著回滾。

因此，對于在生產集群已經得到應用的API，強烈不建議采用“同步升級”的模式來處理不兼容API變更。

Batch mutations 批量更新

批量更新如何設計是另一個常見的API設計決策。這里我們常見有兩種模式：

客戶端批量更新，或者
服務端實現批量更新。
如下圖所示。

API的設計者可能會希望實現一個服務端的批量更新能力，但是我們建議要盡量避免這樣做。__除非對于客戶來說提供原子化+事務性的批量很有意義（all-or-nothing）__，否則實現服務端的批量更新有諸多的弊端，而客戶端批量更新則有優勢：

服務端批量更新帶來了API語義和實現上的復雜度。例如當部分更新成功時的語義、狀態表達等
即使我們希望支持批量事物，也要考慮到是否不同的后端實現都能支持事務性
批量更新往往給服務端性能帶來很大挑戰，也容易被客戶端濫用接口
在客戶端實現批量，可以更好的將負載由不同的服務端來承擔（見圖）
客戶端批量可以更靈活的由客戶端決定失敗重試策略

Be aware of the risks in full replace 警惕全體替換更新模式的風險

所謂Full replacement更新，是指在Mutation API中，用一個全新的Object/Resource去替換老的Object/Resource的模式。API寫出來大概是這樣的

UpdateFoo(Foo newFoo);

這是非常常見的Mutation設計模式。但是這樣的模式有一些潛在的風險作為API設計者必須了解。

使用Full replacement的時候，更新對象Foo在服務端可能已經有了新的成員，而客戶端尚未更新并不知道該新成員。服務端增加一個新的成員一般來說是兼容的變更，但是，如果該成員之前被另一個知道這個成員的client設置了值，而這時一個不知道這個成員的client來做full-replace，該成員可能就會被覆蓋。

更安全的更新方式是采用Update mask，也即在API設計中引入明確的參數指明哪些成員應該被更新。

UpdateFoo {Foo newFoo; boolen update_field1; // update maskboolen update_field2; // update mask }

或者update mask可以用repeated "a.b.c.d“這樣方式來表達。

不過由于這樣的API方式維護和代碼實現都復雜一些，采用這樣模式的API并不多。所以，本節的標題是“be aware of the risk“，而不是要求一定要用update mask。

Don't create your own error codes or error mechanism 不要試圖創建自己的錯誤碼和返回錯誤機制

API的設計者有時很想創建自己的Error code，或者是表達返回錯誤的不同機制，因為每個API都有很多的細節的信息，設計者想表達出來并返回給用戶，想著“用戶可能會用到”。但是事實上，這么做經常只會使API變得更復雜更難用。

Error-handling是用戶使用API非常重要的部分。為了讓用戶更容易的使用API，最佳的實踐應該是用標準、統一的Error Code，而不是每個API自己去創立一套。例如HTTP有規范的error code 【7】，Google Could API設計時都采用統一的Error code等【5】。

為什么不建議自己創建Error code機制？

Error-handling是客戶端的事，而對于客戶端來說，是很難關注到那么多錯誤的細節的，一般來說最多分兩三種情況處理。往往客戶端最關心的是"這個error是否應該重試(retryable)"還是應該繼續向上層返回錯誤，而不是試圖區分不同的error細節。這時多樣的錯誤代碼機制只會讓處理變得復雜
有人覺得提供更多的自定義的error code有助于傳遞信息，但是這些信息除非有系統分別處理才有意義。如果只是傳遞信息的話，error message里面的字段可以達到同樣的效果。

更多的Design patterns，可以參考[5] Google Cloud API guide，[6] Microsoft API design best practices等。不少這里提到的問題也在這些參考的文檔里面有涉及，另外他們還討論到了像versioning，pagination，filter等常見的設計規范方面考慮。這里不再重復。

參考文獻

【1】File wiki?https://en.wikipedia.org/wiki/Computer_file
【2】阿白，域模型設計系列文章，https://yq.aliyun.com/articles/6383
【3】Idempotency, wiki?https://en.wikipedia.org/wiki/Idempotence
【4】Compatibility?https://cloud.google.com/apis/design/compatibility
【5】API Design patterns for Google Cloud,?https://cloud.google.com/apis/design/design_patterns
【6】API design best practices, Microsoft?https://docs.microsoft.com/en-us/azure/architecture/best-practices/api-design
【7】Http status code?https://en.wikipedia.org/wiki/List_of_HTTP_status_codes
【8】A philosophy of software design, John Ousterhout

原文鏈接

轉載于:https://my.oschina.net/u/1464083/blog/2995094

創作挑戰賽新人創作獎勵來咯，堅持創作打卡瓜分現金大獎

總結

以上是生活随笔為你收集整理的阿里研究员谷朴：API 设计最佳实践的思考的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇：王者荣耀抽韩信要多少钻石
下一篇：适合0基础的web开发系列教程-文本格式