隨著基于人工智能與機(jī)器學(xué)習(xí)的應(yīng)用如雨后春筍般不斷涌現(xiàn),我們也看到有很多提供類似功能的 API 悄悄登上了舞臺。 API 是用于構(gòu)建軟件應(yīng)用的程序、協(xié)議以及工具的組合;本文是對2015 中這個(gè)列表的修正與完善,移除了部分被廢棄的 API ;我們也添加了最近由 IBM、Google、Microsoft 這些大廠發(fā)布的 API 。所有的 API 可以根據(jù)應(yīng)用場景進(jìn)行分組:
人臉與圖片識別。
文本分析,自然語言處理以及情感分析。
語言翻譯。
預(yù)測以及其他的機(jī)器學(xué)習(xí)算法。
在具體的每個(gè)分組內(nèi),我們根據(jù)首字母順序排序; API 的描述信息源自截止到 2017 年 2 月 3 日對應(yīng)主頁上的描述。如果你發(fā)現(xiàn)存在未被收錄的流行的 API 可以在評論中留言,我們會將其增補(bǔ)到列表中。
人臉與圖片識別
Animetrics Face Recognition:?該 API 能夠用于圖片中的人臉檢測,并且將其與已知的部分人臉進(jìn)行匹配分析;該 API 還支持從某個(gè)待搜索的集合中添加或者移除某個(gè)分類,或者從某個(gè)分類中添加或者刪除某張人臉圖片。
FaceRect: 提供了非常強(qiáng)力與完整的面部檢測的 API ,包括在正面照片與側(cè)面照片中檢測面部以及在單張照片中提取多個(gè)面部的功能;它還能將結(jié)果以 JSON 格式輸出,包括檢測到的眼睛、鼻子、嘴等等面部特征。
Google Cloud Vision API: 架構(gòu)于著名的?TensorFlow?之上,能夠高效地學(xué)習(xí)與預(yù)測圖片中的內(nèi)容。它能夠有助于用戶搜索最愛的圖片,并且獲取圖片中豐富的注釋。它還能將圖片按照船、獅子、埃菲爾鐵塔等等不同的類別進(jìn)行分類,并且對照片中不同表情的面部進(jìn)行識別,除此之外它還能將圖片中不同國家的語言打印出來。
IBM Watson Visual Recognition: 該 API 能夠輔助理解圖片內(nèi)容,包括圖片標(biāo)記、人臉識別、年齡估計(jì)以及性別判斷,還能根據(jù)人臉相似度進(jìn)行搜索。開發(fā)者能夠在該服務(wù)的基礎(chǔ)上結(jié)合自身業(yè)務(wù)特點(diǎn)定制出各式各樣奇妙的產(chǎn)品。
Microsoft Cognitive Service – Computer Vision: 該 API 能夠根據(jù)用戶輸入與用戶選擇分析可視化內(nèi)容。譬如根據(jù)內(nèi)容來標(biāo)記圖片、進(jìn)行圖片分類、人類識別并且返回他們的相似性、進(jìn)行領(lǐng)域相關(guān)的內(nèi)容識別、創(chuàng)建圖片的內(nèi)容描述、定位圖片中的文本、對圖片內(nèi)容進(jìn)行成人分級等。
Rekognition: 該 API 能夠根據(jù)社交圖片應(yīng)用的特點(diǎn)提供快速面部識別與場景識別。譬如基于人眼、嘴、面部以及鼻子等等特征進(jìn)行性別、年齡以及情緒預(yù)測。
Skybiometry Face Detection and Recognition: 該 API 提供人臉檢測與識別服務(wù),新版本的 API 還提供了深色微分功能。
文本分析,自然語言處理,情感分析
Bitext?提供了目前市場上來說幾乎最準(zhǔn)確的基于情感的多主題識別,目前包括四個(gè)語義服務(wù):實(shí)體與概念抽取、情感分析與文本分類;該 API 總共支持 8 種不同的語言。
Free Natural Language Processing Service: 提供了包括情感分析、內(nèi)容提取以及語言檢測等功能。它同樣是 mashape.com 這個(gè)大型云 API 市場中的暢銷產(chǎn)品之一。
Google Cloud Natural Language API: 該 API 提供了對于文檔的架構(gòu)與含義進(jìn)行分析的功能,包括情感分析、實(shí)體識別以及文本標(biāo)注等。
IBM Watson Alchemy Language: 該 API 能夠輔助電腦學(xué)習(xí)如何閱讀以及進(jìn)行一些文本分析任務(wù)。譬如將非結(jié)構(gòu)化數(shù)據(jù)按照領(lǐng)域模型轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù),使其能夠服務(wù)于社交媒體監(jiān)測、商業(yè)智能、內(nèi)容推薦、商業(yè)交易以及定向廣告等等服務(wù)。
MeaningCloud Text Classification: 該 API 提供了部分預(yù)分類的功能:文本提取、分詞、停用詞設(shè)置以及同義詞提取等等。
Microsoft Azure Text Analytics API?基于 Azure Machine Learning 實(shí)現(xiàn)的一系列文本分析服務(wù)。該 API 能夠用于情感分析、關(guān)鍵語句提取、語言檢測以及主題識別這些非結(jié)構(gòu)化文本的處理任務(wù)。該 API 并不需要使用者提供相關(guān)的訓(xùn)練數(shù)據(jù),能夠大大降低使用門檻。
Microsoft Cognitive Service – Text Analytics: 提供了情感檢測、關(guān)鍵語句提取、主題以及語言分析等功能。該分組中其他的 API 還包括?Bing 拼寫檢測、語言理解、文本分析、Web 語言模型等等。
Thomson Reuters Open Calais?: Calais 基于自然語言處理與機(jī)器學(xué)習(xí)技術(shù),能夠分類與關(guān)聯(lián)文檔中的實(shí)體信息(人名、地名、組織名等)、事實(shí)信息(員工 x 為公司 y 工作)、事件信息(員工 z 在 x 日被任命為 y 公司的主席) 。
IBM Watson Conversation?: 幫助構(gòu)建可以部署在多個(gè)消息平臺或者網(wǎng)頁上的,能夠理解自然語言的聊天機(jī)器人。其他類似的 API 還包括?Dialog、Natural Language Classifier、Personality Insights、Document Conversion以及?Tone Analyzer.
IBM Watson Speech?: 包含了?語音到文本?以及?文本到語音?之間的轉(zhuǎn)化功能(譬如創(chuàng)建語音控制的應(yīng)用)。
IBM Watson Data Insights: 該系列的服務(wù)包含了三個(gè) API :AlchemyData News、Discovery 以及 Tradeoff Analytics。AlchemyData 提供了對于大量的新聞、博客內(nèi)容的高級別定向搜索與趨勢分析的服務(wù)。Tradeoff Analytics 則是幫助用戶在多目標(biāo)優(yōu)化時(shí)進(jìn)行有效抉擇。
IBM Watson Retrieve and Rank: 開發(fā)者可以將自定義數(shù)據(jù)導(dǎo)入到服務(wù)中,并且使用相關(guān)的關(guān)聯(lián)發(fā)算法來訓(xùn)練機(jī)器學(xué)習(xí)模型。服務(wù)的輸出包括了一系列相關(guān)的文檔與元數(shù)據(jù),譬如某個(gè)聯(lián)絡(luò)中心的代理能夠基于該服務(wù)提高呼叫的平均處理時(shí)間。
indico: 提供了文本分析(情感分析、Twitter 參與度、表情分析等)以及 圖片分析(面部表情識別、面部定位)。indico 的 API 可以免費(fèi)試用并且不需要任何的訓(xùn)練數(shù)據(jù)。
Microsoft Azure Cognitive Service?API : 基于預(yù)測分析提供機(jī)器學(xué)習(xí)推薦服務(wù),譬如個(gè)性化產(chǎn)品推薦等,可以用來代替?zhèn)鹘y(tǒng)的 Azure Machine Learning Recommendations 服務(wù)。新版本提供了批處理支持,更好地 API 檢索服務(wù)、更清晰的 API 使用界面以及更好的注冊與賬單界面等。
Microsoft Azure Anomaly Detection API?: 能夠在序列數(shù)據(jù)中檢測出異常數(shù)據(jù),譬如檢測內(nèi)存使用過程中是否存在內(nèi)存泄露的情況。
Microsoft Cognitive Service – QnA Maker: 將信息提取為會話式的、易于瀏覽的數(shù)據(jù)形式。其他類似的 API 還包括?Academic Knowledge、Entity Linking、Knowledge Exploration以及Recommendations。
Microsoft Cognitive Service – Speaker Recognition: 幫助應(yīng)用來分析檢測出當(dāng)前的發(fā)言者。其他的類似于的 API 還包括Bing Speech?(將語音轉(zhuǎn)化為文本并且理解其大致含義)、?Custom Recognition?等等。
NuPIC?: 由 NuPIC 社區(qū)運(yùn)行與維護(hù)的開源項(xiàng)目,其基于 Python/C++ 實(shí)現(xiàn)了 Numenta’s Cortical Learning 算法并對外提供 API 服務(wù)。該 API 允許開發(fā)者能夠使用基本算法或者分層算法,也可以選擇使用其他的平臺功能。