音视频技术开发周刊(第128期)
每周一期,縱覽音視頻技術領域的干貨和新聞投稿:contribute@livevideostack.com。
架構
大家都切換到 Unified Plan 了嗎??
忽悠,繼續忽悠統計的數據。
在 Chrome 中使用 WebRTC ICE 服務器進行端口掃描
這真是相當不錯的。不知道將開放多長時間。
淺談 WebRTC NetEQ
WebRTC Native 代碼里面有很多值得學習的寶藏,其中一個就是 WebRTC 的 NetEQ 模塊。根據 WebRTC 術語表 對 NetEQ 的解釋:
一種動態抖動緩沖區和錯誤隱藏(丟包補償)算法,用于去除網絡抖動和數據包丟失的負面影響。在保持最高語音質量的同時,保持盡可能低的延遲。NetEQ 其實就是音視頻處理中的 Jitter Buffer 模塊,在 WebRTC 的語音引擎中使用。這個模塊很重要,會影響播放時的體驗,同時也相當復雜。
里程碑式 Dubbo 2.7.5 版本發布,性能提升30%,支持 HTTP/2、TLS、Protobuf等特性
近日,備受矚目的 Apache Dubbo(以下簡稱 Dubbo)2.7.5 版本正式發布,在 2.7.5 版本中,Dubbo 引入了很多新的特性、對現有的很多功能做了增強、同時在性能上也有了非常大的提升,這個版本無論對 Dubbo 社區亦或是開發者來說,都將是一個里程碑式的版本。
傳輸網絡
TCP三次握手和四次揮手
TCP是一種面向連接的、可靠的、基于字節流的傳輸層通信協議,在發送數據前,通信雙方必須在彼此間建立一條連接。所謂的“連接”,其實是客戶端和服務端保存的一份關于對方的信息,如ip地址、端口號等。 一個TCP連接通常分為三個階段:連接、數據傳輸、退出(關閉)。通過三次握手建立一個鏈接,通過四次揮手來關閉一個連接。
為什么 TCP 協議有性能問題 · Why's THE Design?
TCP 協議可以說是今天互聯網的基石,作為可靠的傳輸協議,在今天幾乎所有的數據都會通過 TCP 協議傳輸,然而 TCP 在設計之初沒有考慮到現今復雜的網絡環境,當你在地鐵上或者火車上被斷斷續續的網絡折磨時,你可能都不知道這一切可能都是 TCP 協議造成的。本文會分析 TCP 協議為什么在弱網環境下有嚴重的性能問題。
APP網絡優化之DNS優化實踐
移動端APP網絡優化是客戶端技術優化方向中比較重要的一個方向之一,絕大多數APP都需要有網絡請求這一步,大多數APP在發起請求之前第一步要做的事情就是DNS域名解析,只有將域名解析成正確的IP后,才能進行后續的HTTP或HTTPS請求,因此DNS優化是移動端APP網絡優化中首要的一步。
編解碼
【Android 音視頻開發打怪升級:FFmpeg音視頻編解碼篇】FFmpeg so庫編譯
使用 GCC 或 CLANG 交叉編譯出Android平臺可以使用的FFmpeg so庫。為了很好的邁出 FFmpeg ?開發的第一步,不僅要知其然,更要知其所以然。不僅要知道怎么樣能成功編譯,更要知道為什么能成功編譯。在開始動手之前,建議先通讀整篇文章,相信本文定可以讓你有所感悟。
基于模型的率失真優化變換
本文是來自AOMedia Symposium 2019的演講,講者是來自USC的Keng-Shih Lu 和 Antonio Ortega。本次演講主要講述了基于模型的率失真優化變換,用圖像信號處理的角度來看待一些熟悉的概念。
視頻技術
移動開發者的必知音視頻基礎知識
作為移動開發者,大多數時候會需要接觸到音視頻相關的開發,而其實嚴格意義上我也并不是專職的音視頻開發工程師,只是在 2016 因為業務需要接觸到音視頻相關的領域,而開源的 GSYVideoPlayer 恰好火起來之后,為了解決系列問題成了“半桶水”的音視頻開發工程師。
HDR格式和趨勢
本文是來自Seattle Video Tech 2019的演講,講者是來自Amazon的Brian Alvarez,本次演講主要講述了HDR格式和趨勢。
基于運動的視頻插幀技術
本文是來自AOMedia Symposium 2019的演講,主要內容是基于運動的視頻插幀技術(Motion Based Video Frame Interpolation),演講內容來自YouTube/Google轉碼小組技術主管,同時也是都柏林圣三一大學教授的Anil Kokaram。演講中,Kokaram對用于視頻插幀工作的各類模型預測及其效果進行了分析,指出了對運動信息的處理仍是當前各類算法的基礎。
Demuxed 2019 演講視頻選
Dav1d編解碼器的性能和原因分析/字幕翻譯和web視頻文本跟蹤(VTT)/視頻和流媒體架構
Jean Baptiste首先介紹了Dav1d提出的原因和目標,然后比較了dav1d在多個平臺上的編碼性能對比,結果顯示Dav1d編碼速度相比aomdec快2-3倍,在ARMv8平臺上Dav1d比libgav1和libaom快3倍左右,在ARM v7平臺大約是libgav1的2倍。
Jeremy Brown首先介紹了參與過的大型體育賽事,然后講述了字幕生成和字幕翻譯之間的區別,接著給出了字幕翻譯工作的流程框圖,并給出了VTT字幕翻譯代理的特點,最后分享了一些視頻瞬間。
Phil Cluff首先回顧了Demuxed 2018時提出的流媒體框架,然后介紹了今年更新后的框架,相比18年,更新后的流媒體架構更加復雜,接著Phil Cluff主要講了新架構的一些改進和特點。
Intel Chip Chat 訪談音頻選
軟件處理釋放新工作流/視頻內容分發/深層神經網絡
第一段音頻的演講者Remi Beaudoin是Ateme的首席戰略官,在本次采訪中,Remi解釋了如何通過軟件處理釋放新工作流的能力,優化視頻交付的總成本,并提供新的個性化電視觀看體驗。Remi介紹了TITAN平臺如何應對行業中的宏觀變化,以提供靈活性,可擴展性和收斂性。
第二段音頻的演講者Eli Lubitch是Beamr的總裁,Beamr與英特爾合作,提供內容自適應比特技術,以滿足內容分發和視頻流行業最苛刻的要求。視頻內容分發正在全球范圍內進行,從內容創作者使用的數十億臺移動設備到地區和國際媒體公司和廣播公司,分發的內容都以不同的格式進行。Eli分享了他的看法,他認為該行業有機會進行突破,以實現4K和8K內容的分發。
第三段音頻的演講者Vinod Kannan是MulticoreWare機器學習解決方案的技術總監。MulticoreWare的LipSync技術使用深層神經網絡來確定內容是否正確同步,通過訓練的分類器查找人臉并將其與語音進行匹配。Vinod介紹了MulticoreWare參與即將推出的英特爾媒體分析精選解決方案的情況,通過Intel Xeon可擴展處理器和Intel Movidius Myriad X 視覺處理單元(VPU)為網絡邊緣提供實時視頻和深度學習處理。
AI智能
2020 年移動開發趨勢
本文翻譯自 AMIT MANCHANDA 的 12 Mobile App Development Trends to Watch Out for in 2020,可點擊原文參考閱讀。文章僅屬個人觀點,如有不同見解,歡迎留言討論
微軟北大聯合提出換臉 AI 和臉部偽造檢測器,演繹現實版「矛與盾」?
近日,微軟研究院與北京大學的研究小組共同提出了一種全新的 AI 換臉框架 FaceShifter,以及一種檢測偽造人臉圖像的方法 FaceX-Ray。前者可以極大提高換臉的高保真度,而后者則用于檢測出復雜偽造人臉圖像。
圖像
一款常用的Android圖像轉換操作庫
日常開發中,當涉及到 Android 的 Camera 或者圖像相關的開發,或多或少都會接觸一些圖像格式,這些不同的格式之間會涉及到各種各樣的操作,這里利用 Google 的開源框架 libyuv 封裝了一個圖像操作庫,涉及到了 Android 中常用的圖像轉換操作。
資源推薦
Android音視頻開發教程
本人在學習音視頻開發的過程中,深刻體會到了由于知識的分散,過渡斷層帶來的種種困惑和痛苦,因此,希望通過自己的理解,可以把音視頻開發相關的知識總結出來,并形成系列文章,循序漸進,剖析各個環節,一則對自己所學做一個總結和鞏固,二則希望可以幫助想入門音視頻開發的開發者小伙伴們。
ImageUtils
該圖像處理庫底層依賴的是 Google 開源的 libyuv 框架,因該框架功能之強大,支持圖像格式之繁多,目前這里只針對 Android 中常用的圖像格式之間互相操作進行了相關封裝操作,方便 Java / Kotlin 進行無縫調用。
點擊“閱讀原文”可查看更多詳細信息,請大家科學上網。
總結
以上是生活随笔為你收集整理的音视频技术开发周刊(第128期)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 英特尔与博雅睿视共同发布SVT-AVS3
- 下一篇: 视频API的发展方向