音视频技术开发周刊 | 170
每周一期,縱覽音視頻技術領域的干貨。
新聞投稿:contribute@livevideostack.com。
傳輸網絡
實時5G實時視頻流必不可少的6個原因
正如最近在博客中詳細討論的那樣,以視頻為中心的社交活動,沉浸式娛樂,教育,遠程醫療等方面的趨勢使網絡對實時視頻豐富的個人體驗的支持成為網絡空間新時代的特征。從分散的勞動力投入到視頻監控,再到在工程設計,建筑,培訓,手術和其他方面的沉浸式協作,實時視頻傳輸也正在成為商業生活中各種應用程序的重要組成部分。
https://www.red5pro.com/blog/6-reasons-real-time-5g-live-video-streaming-is-essential/
引入XDN(體驗交付網絡)
互聯網上無處不在的視頻使我們進入了一個過渡點,對實時視頻互動體驗的支持已開始定義在線參與的下一個時代。
https://www.red5pro.com/blog/introducing-xdn-experience-delivery-network/
Android
細數 2020 年官方對 Android 的那些重大更新
不知不覺,2020 年也已接近尾聲,今年雖然困難重重,但是 Android 社區的更新熱情卻并未消減 ,Google I/O 大會取消的同時,官方也為我們提供了一系列優質的節目:Now In Android[1] 、Kotlin Vocabulary[2]、11 Weeks of Android[3]。本篇文章就帶大家看一看今年以來,Android 相關最新的動態,嘗鮮我們今后可以使用的功能。
https://mp.weixin.qq.com/s/bh-lI7Ue5x_LmSfZBg_Hsg
編解碼
AV1生態現狀概覽
AV1(Alliance for Open Media Video 1)是 2018 年6月由AOM聯盟(Alliance for Open Media,開放媒體聯盟)發布的新一代視頻編碼標準。
https://mp.weixin.qq.com/s/NK2KFfGRD7zfEjANhn2LIw
JPEG Pleno圖像編碼技術
本篇來自ICIP2020,演講者是來自意大利Cagliari大學的Cristian Perra博士,演講主題是 JPEG Pleno圖像編碼技術。
https://mp.weixin.qq.com/s/kybALVa3OQ3imwuhwzDweA
Fraunhofer多功能視頻解碼器(VVdeC)
Fraunhofer多功能視頻解碼器(VVdeC)是一種快速的VVC x86軟件解碼器實現。解碼器支持Main10概要文件中可用的大多數標準功能,但對某些高級功能的支持仍需等待。
https://github.com/fraunhoferhhi/vvdec
騰訊開源國內首個H.266/VVC視頻播放器
騰訊O266player的開源不僅是騰訊視頻編解碼技術進展的又一個重要里程碑,更是騰訊在推動多媒體技術生態不斷演進的一個重要布局。未來騰訊多媒體將聯合各行業,通過標準制定與產品研發將最新技術輸出至行業,為數字化產業建設提供新的技術助力。
https://mp.weixin.qq.com/s/FiLF9b_m8COjahN8aKg9Nw
國內外視頻編解碼標準體系
針對國內外視頻編解碼標準,典型涉及的標準組織或聯盟包括MPEG、ISO、ITU、AOM、AVS等。從編解碼體系角度來看,現有標準組織可粗略分三個陣營。本文就來分別說說MPEG、ITU、AOM、AVS的演進歷程。
https://mp.weixin.qq.com/s/yNmKDUtDrNtkZgP_RHjwfw
ICIP2020:VVC幀內編碼復雜度分析
本文來自ICIP2020論文《COMPLEXITY ANALYSIS OF VVC INTRA CODING》。
https://mp.weixin.qq.com/s/-5YvoR2vRuzIqCLS_pK9Jg
音視頻技術
“云端一體”的智能媒體生產制作演講之路
智能媒體生產制作的鏈路當中,生產制作是核心,智能是輔助,那么AI技術是如何融入在整個生產制作流程當中的?阿里云智能視頻云 高級技術專家 鄒娟在LiveVideoStackCon 2020 北京站的演講中就智能媒體生產制作的技術演進之路,從三個部分為大家帶來詳細的講解。
https://mp.weixin.qq.com/s/E0AHuqT9IfkgNvrwst-bdA
Q音直播編譯優化與二進制集成方案
Q音直播抽離成pod庫分別引入到QQ音樂和Fan直播兩個獨立app中,而對于直播業務來講,直播SDK通過pod本地引入集成到Demo中進行日常直播業務的開發,通過Demo來精簡工程規模,提高研發效率。
https://mp.weixin.qq.com/s/5q_PLdLeuuuQnsLrbzaOeQ
大型多語言音像配音
實現嘴型同步對應的自動語言翻譯。
https://arxiv.org/abs/2011.03530
實時音視頻助力在線教育風口
TRTC全稱是騰訊實時音視頻,是在騰訊云上以SDK和REST API的方式提供售賣的云服務。騰訊云TRTC客戶端的產品架構師蔣磊,將從疫情影響下在線教育市場的變化情況出發,介紹實時音視頻實踐過程中的踩坑與填坑以及一些新的嘗試。
https://mp.weixin.qq.com/s/2XMYXVxoeIJ0irl9R-FPtg
主流VR頭顯FOV實測:與官方數據差別很大
為了對比15款VR頭顯實際FOV的大小,德國費爾巴赫的VDC(虛擬維度中心)利用特制的頭部模型來進行模擬測量,結果發現15款頭顯中Pimax 8K視場角達141.5°,Pico G2視場角僅78.5°,幾乎每款頭顯的實際FOV觀感都與官方規格有所出入。
https://mp.weixin.qq.com/s/RfTcHLeebTMYMDvQ2SQ7Fg
AI智能
YOLO V4 Tiny改進版來啦!速度294FPS精度不減YOLO V4 Tiny(附論文下載)
為了提高目標檢測的實時性,本文提出了一種基于YOLOv4-tiny的快速目標檢測方法。它首先使用ResNet-D網絡中的兩個ResBlock-D模塊,而不是Yolov4-tiny中的兩個CSPBlock模塊,從而降低了計算復雜度。其次,設計了輔助殘差網絡塊,以提取更多的物體特征信息,以減少檢測誤差。
https://mp.weixin.qq.com/s/fPlnMnwq2R-Pat5Jx1lFMg
算法
大規模視頻直播中的關鍵算法
伴隨著2020年大部分的體育賽事、音樂會、節日活動和其他聚集性活動的停滯,面向2021年我們會發現對支持大型活動的流媒體傳輸的潛在需求是巨大的。業界各公司將怎樣分發實時流事件來滿足這些潛在的史無前例的需求呢?最近發布在 Algorithm Series的文章深入研究了調整大規模實時視頻事件交付的數學和工作流決策算法。
https://mp.weixin.qq.com/s/EB7lccvXhRvcxb7KNA_tGg
活動推薦
LiveVideoStackCon 2020 美國站
灣區最原汁原味的技術,全球最前沿的應用實踐。
無需漂洋過海,我們在線上等您!
點擊【閱讀原文】了解更多大會信息
總結
以上是生活随笔為你收集整理的音视频技术开发周刊 | 170的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【LiveVideoStack线上分享】
- 下一篇: 【线上分享】基于人眼主观视觉的画质评价与