容联CTO许志强:AI、5G让通讯更智能、更高效
LiveVideoStack采訪了容聯云通訊CTO許志強,分享了從一線研發到團隊leader的軟硬性能力提升經驗,解析了通訊行業音視頻技術難點、踩的坑以及優化方案,并展望了AI、5G為音視頻技術發展帶來的革新。
文 / 許志強
整理 / LiveVideoStack
LiveVideoStack:許總您好,首先非常感謝您接受采訪,還請您先介紹下自己和容聯云通訊。
許志強:本人畢業于華中理工大學自控系,中山大學MBA。先后就職于廣州新太科技任開發中心副總經理、高陽圣思園任云通訊項目技術負責人。目前主要負責容聯整體平臺設計與開發,互聯網/AI等前沿技術與通訊的融合跟進。
容聯是國內專業的企業通訊云服務提供商。容聯以云計算方式,為企業客戶提供通訊平臺服務(PaaS)、通訊軟件服務(SaaS)、行業新通訊解決方案和“AI+通訊”服務,助力企業精準獲客,提升終端用戶服務體驗;變革企業內部溝通協作方式,提升企業運營效率。驅動中國企業通訊產業實現互聯網化、云計算化、能力化、融合化和智能化。經過幾年的快速發展、積累,容聯平臺已聚集了超過15萬家企業客戶和30萬開發者用戶。容聯服務的客戶包括但不限于國家電網、中移在線、海爾控股、中國銀行、招商證券、中車集團、中國平安、騰訊、京東、百度、360、小米、今日頭條、瓜子二手車、順豐等,全面覆蓋金融、運營商、汽車、電商、O2O、在線教育、互聯網醫療、游戲、物流等眾多行業。
LiveVideoStack:從您的經歷來看,有著豐富的一線技術研發和管理經驗,站在研發和管理的層面來看待問題時,會有怎樣的不同?
許志強:這兩者確實有很大的不同,站在研發角度看問題時,通常會有兩個傾向:首先就是局部傾向,考慮問題時會不夠全面,如研發人員只單純考慮“功能是否實現”、“性能是否滿足要求”,而忽略了系統的可維護性、可擴展性等。第二個傾向是基于技術考慮的“完美”傾向,技術有很多理論、原則性的準則——這些原則一般是在相對理想情況下的,但在現實中很多情況是不理想的:如客戶提出的需求和原有系統架構設計出現沖突的時候,站在技術研發的角度是有本能的抵觸情緒;而站在管理的角度來看,則更多需要考慮如何以更低的成本、在不完美的限制條件下做一個最符合公司商業利益的選擇。
LiveVideoStack:從一線研發到團隊技術leader、再到CTO,在這樣一條發展路徑中,您認為有哪些關鍵點或者轉變可以分享給大家。
許志強:從普通研發人員到團隊leader,其中最關鍵的轉變有兩個:一個是技術能力的提升——需要從具體的模塊研發能力、到具體模塊的設計能力、再到負責一個系統整體的技術架構的能力,一步一步成長和轉變,通俗說就是從具體的“砌磚” 能力到“設計建筑圖紙”能力,這是思維層面的提升,需要在工作中多問為什么,不能知其然而不知其所以然。另外一個轉變就是管理能力的提升,也就是需要從被安排做事情,轉換到安排人做事情;從以單槍匹馬,到帶領團隊沖鋒陷陣。要在有限的資源配置和時間要求下,帶領團隊完成一個又一個的項目,這都需要個人管理能力的提升。
LiveVideoStack:您認為音視頻技術在企業通訊中發揮著怎樣的作用?在開發過程中遇到過哪些坑?
許志強:音視頻技術在企業中正發揮著越來越重要的作用,企業通訊一個很重要的環節就是溝通——有和外部的溝通,也有內部的溝通。而音視頻會議就是企業內部溝通中一個很重要的組成部分。
我認為在開發過程中最大的坑其實是架構的選擇,由于我們以前主要是為運營商做系統,采用的很多標準是電信行業的一些通用協議標準,而這些架構在互聯網情況下并不一定是最佳選擇。比如目前電信行業通用協議主流會采用SIP協議做呼叫控制,媒體連接信息在SIP信令里面進行傳遞,但是針對企業的內外網等復雜的網絡情況下,媒體流只能走特定的網絡路徑才能連通,或者在互聯網場景下,希望媒體流能夠動態根據網絡狀況實時選擇最優的路徑,這時通過SIP協議就比較難完成。對此我們進行了架構調整,因為媒體流是一個自治的網絡,信令交互里面帶的只是通訊雙方端點的網絡地址、端口,如果將媒體流在這兩個端點之間進行傳輸,從而使得媒體流這個網絡自己完成。
LiveVideoStack:國內網絡條件差異較大,往往還要面對多個運營商的情況,容聯是如何處理帶來的網絡抖動、丟包,從而保證低延遲和穩定性?
許志強:容聯是從兩個方案來解決網絡問題對音視頻質量的影響:一個是在網絡層面,我們構建了一個所謂的實時通訊網絡。根據用戶的接入情況,系統會智能的選擇離用戶最近的接入點(我們內部稱之為媒體接入點),保證用戶到我們系統的網絡接入質量能夠得到明顯的保障。在骨干網上我們采用類似SDWAN的技術在互聯網、專線的混合環境下構建了一個虛擬的網絡,它能夠自動判斷網絡路徑的情況選擇一個最優的路徑進行路由。另外一個是在算法層面,通過算法自動偵測網絡通訊的狀況,自動開啟FEC、NACK算法,自動調整音視頻流的碼率、幀率等,總體概況來講就是一個自適應的算法組合。
LiveVideoStack:近幾年人工智能很火熱,對于云通訊以及音視頻技術而言,它能產生怎樣的化學反應?
許志強:AI讓通訊具備感知、知道、知識的能力,成為連接、感知、計算三位一體的新型網絡。通訊是基礎、AI是大腦,兩者相輔相成。
從行業角度而言,很多應用場景急需“AI+通訊”去不斷的進行技術改革、智能化升級,提升效率,降低成本。比如客戶服務的智能化,通過AI賦能于客服,實現低成本高效運營,使得回復問題速度提升75%,客服工作效率提升52%,商機轉化率提升43%。再比如語音交互的智能化,包括自動主動聯絡、語音識別、全雙工實時交互、人工無縫接管、質檢服務等。此外還有企業辦公的智能化,企業內部的辦公溝通和相關服務,通過智能化也將變得更加方便便捷,提升工作效率。
從技術角度來看,AI也將帶來積極顯著的變化。以回聲消除來說,傳統的回聲消除在不同的手機硬件終端上都有可能需要做適配,但是我們看到在行業的最新研究上有采用深度學習的方式做回聲消除,取得的效果比傳統算法更好,同時在不同硬件情況下的適配性也更好。此外AI在音視頻編碼壓縮算法、噪聲抑制等音視頻底層技術方案也都有階段性的突破,未來會帶來很多顛覆性的改變。
LiveVideoStack:在您看來,未來云通訊領域在技術方面還會有哪些發展和突破?在即將到來的5G時代,音視頻將迎來怎樣的變化?
許志強:5G時代的來臨,會讓音視頻行業迎來更大的發展機遇。在5G時代下,網速限制將被徹底解除,用戶隨時隨地都能看到想看的短視頻、長視頻、直播、高清電影等,所以視頻行業將獲得更多的潛在用戶,市場將變得更大。而視頻會議也將迎來紅利,5G時代的音視頻穩定性、多方通話、安全性、外接音頻放大和視頻輸出,讓遠程音視頻及數據會議得以輕松完成。視頻會議系統也將更加智能、高效、方便、快捷,即使在網絡條件不如意的邊遠地區也能做到清晰“面對面”會議,全面提升各行業的信息化水平,真正做到跨行業、跨領域、跨地域的零距離交流。
新一代音視頻融合通訊平臺全接觸
如果你想了解更多關于通訊領域音視頻技術實現以及5G將帶來的革新,許志強老師還將在10月19日下午【新一代音視頻融合通訊平臺全接觸】專場,詳細解析音視頻技術在企業通信領域的發展與主要應用,并展望即將到來的5G時代中音視頻迎來的更廣闊的應用空間。
總結
以上是生活随笔為你收集整理的容联CTO许志强:AI、5G让通讯更智能、更高效的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: LiveVideoStackCon讲师热
- 下一篇: 用AI击破传统行业痛点 “百度大脑行业创