音视频技术开发周刊(第122期)
每周一期,縱覽音視頻技術領域的干貨和新聞投稿:contribute@livevideostack.com。
架構
PSA: WebRTC M79 發(fā)布
更改統(tǒng)計信息方式并為 mDNS 增加企業(yè)級策略控制。
IP 攝像頭直播視頻流: RTSP 轉 WebRTC
Red5 Pro 介紹了他們的 Restreamer 插件。
運用機器學習技術的免費嬰兒監(jiān)測系統(tǒng),且能夠保障數(shù)據(jù)傳輸安全
該方案使用了 WebRTC 技術,能在檢測到嬰兒哭聲的同時過濾掉周圍所有其他噪音。
新浪微博:大規(guī)模離線視頻處理系統(tǒng)的架構設計
微博視頻平臺在4億月活用戶吃瓜嗨聊的高并發(fā)、大流量背景下,既要保證用戶微博生產(chǎn)和消費體驗,又要支持業(yè)務快速迭代,確保正確性、穩(wěn)定性和高可用性。本次演將以微博視頻大規(guī)模視頻離線處理系統(tǒng)的架構設計為主題為大家?guī)泶笠?guī)模分布式系統(tǒng)的架構設計,性能優(yōu)化和高可用保障等一線實戰(zhàn)經(jīng)驗。
傳輸網(wǎng)絡
基于IP的媒體直播協(xié)議
本文來自VSF.tv 2019年十月的演講,演講者是來自Telecompro.tv的Wes Simpson和來自Q3 Media的Ed Calverley. 本次演講的主要內容是關于現(xiàn)代IP音視頻網(wǎng)絡的關鍵技術,ST2110, AES67, PTP和NMOS,以及它們是如何共同作用以實現(xiàn)全IP直播的。
在通信約束下從樣本中學習分布
演講者在本文中介紹了不同的通信協(xié)議,首先是獨立協(xié)議,也就是每個節(jié)點單獨決定如何編碼產(chǎn)生這k比特,所以這些每個節(jié)點的信息都是獨立的隨機變量,這也是獨立協(xié)議名字的由來。第二種是順序協(xié)議,這種協(xié)議下節(jié)點可以進行一定程度上的交互。
各種TCP擁塞控制算法
自從TCP擁塞控制的概念提出以來,TCP擁塞控制算法經(jīng)歷了一系列的演化。這里根據(jù)網(wǎng)上的資料大致總結一下各個TCP擁塞控制算法。
編解碼
淺析視頻編解碼技術的發(fā)展歷程和未來趨勢
視覺是人類獲取信息的主要途徑,圖像與視頻在人與計算機的交互過程中扮演著重要的角色。進入21世紀以后,人們面臨的是一個高速發(fā)展的信息化社會。數(shù)字化后的信息,尤其是數(shù)字化后的圖像和視頻信息具有數(shù)據(jù)海量性的特征,給數(shù)據(jù)存儲和傳輸造成了非常大的困難。基于現(xiàn)有的音視頻壓縮技術的不足,研究和開發(fā)新型有效的多媒體數(shù)據(jù)壓縮編解碼技術,以壓縮的形式存儲和傳輸這些數(shù)據(jù)刻不容緩。
SPRING—用于FASTQ數(shù)據(jù)的下一代壓縮器
本文是來自Stanford Compression Workshop 2019的演講,作者是來自斯坦福大學的博士畢業(yè)生,Shubham Chandak,他致力于基因組數(shù)據(jù)壓縮和DNA存儲方面的研究。本次演講主要講述了用于FASTQ數(shù)據(jù)的新一代壓縮器SPRING。
視頻技術
為您的 Squarespace 網(wǎng)站添加音視頻錄制功能?
我們需要更多這樣的能與網(wǎng)站建設者進行集成的功能。
既讓VR模糊后,Facebook:這次我們讓VR更清晰
近期Facebook Reality Labs再次公布了一項新的VR/AR視頻成像相關技術:DeepFovea。簡單來講,這是一個基于AI的注視點渲染方案,它可以通過較為稀疏的像素,來生成高清且逼真的圖像。
基于 Android 的可視頻控制的小車
由聲網(wǎng) Agora 舉辦的首屆AI in RTC 大賽,已在10 月 24 日圓滿落幕。其中,參與創(chuàng)意編程賽道的 100 多支參賽隊伍在 3 個多月里揮灑創(chuàng)意與熱情,帶來了許多用心的項目。我們邀請了獲獎的參賽隊伍們,逐一分享了他們的開發(fā)實踐。buggy 團隊基于 Android 手機、開發(fā)板、傳感組件等,開發(fā)了一個可通過手機遠程控制,支持視頻的小車。
人物專訪
Akamai Martin Hor?i?ka:最新網(wǎng)絡優(yōu)化技術及編程語言分析
在LiveVideoStackCon深圳站開場之前,我們邀請到了Akamai公司的研發(fā)經(jīng)理Martin Hor?i?ka來接受我們的采訪,采訪中Martin向我們分享了他早期關于UNIX相關的OS、網(wǎng)絡和開發(fā)的工作以及對于近幾年編程語言發(fā)展的看法。除此之外Martin還提供了關于multi-connection和P2P的一些技巧,最后,Martin還談到了Akamai最近的項目在基于UDP的安全傳輸協(xié)議做一些優(yōu)化。
張賢國:視頻壓縮還遠沒有達到最優(yōu)
正如張賢國所說,V265在MSU視頻編碼大賽取得成績的背后是騰訊內部多團隊合作的結果。在視頻編碼優(yōu)化這條路上還有許多工作要做,團隊合作就變得格外重要。本文是MSU2019視頻編碼大賽系列解讀的第一篇。
唐敏豪:我給MSU評測打9分
在唐敏豪看來,MSU視頻編碼大賽是目前業(yè)界規(guī)模最大的編碼器客觀評比平臺,對視頻編碼器的開發(fā)者和使用者都有很高的參考價值,但MSU的評測對于特定的業(yè)務場景不具有絕對的參考價值。
AI智能
NeurlPS 2019 | 曠視研究院推出可學習的樹狀濾波器,實現(xiàn)保留結構信息的特征變換
在圖像語義分割任務中,學習到有足夠判別力度的全局特征十分重要。現(xiàn)有大部分方法要么采用堆疊多層局部卷積層,要么使用非局部的block來獲取遠距離特征之間的語境。然而,由于這些方法都缺乏對空間結構信息的有效保留,在增大感受野的同時忽略了物體結構的具體信息。因此,在本文中,曠視研究院團隊提出了一個可學習的樹狀濾波器,它能夠在建模遠距離語境關系時依然保留細節(jié)信息。
深度學習在圖像處理的應用一覽
計算機視覺的底層,圖像處理,根本上講是基于一定假設條件下的信號重建。這個重建不是3-D結構重建,是指恢復信號的原始信息,比如去噪聲。這本身是一個逆問題,所以沒有約束或者假設條件是無解的,比如去噪最常見的假設就是高斯噪聲。
圖像
快速上手網(wǎng)易云音樂可視化
音頻可視化,顧名思義,就是通過獲取音頻的波形、頻率和其他來自音頻的數(shù)據(jù)轉換成圖像,再到屏幕上顯示出來。通過它,我們能夠制作一些炫酷的前端音樂界面。
資源推薦
Flutter實戰(zhàn)
一個基于 Flutter 的個人項目
活動推薦
硬派多媒體技術方案沙龍·2019深圳
從WebRTC、低延遲直播到邊緣計算,從編解碼Codec到AI加速,從全景視頻到沉浸式音頻,從5G到超高清,從金融、教育、制造等行業(yè)應用場景優(yōu)化到QoE用戶體驗......硬派多媒體技術方案沙龍(Impact of Multimedia Technology Solution Meetup)旨在甄選技術領先、成熟的方案與案例,推動技術傳播,連接多媒體技術生態(tài)上下游。
Xilinx視頻加速技術專場
從AI到編碼、轉碼,硬件加速方案正在扮演越來越重要的角色。本專題,將展現(xiàn)基于FPGA的硬件加速特性,在視頻、圖片編碼與轉碼以及AI計算方面帶來的收益。
點擊“閱讀原文”可查看更多詳細信息,請大家科學上網(wǎng)。
總結
以上是生活随笔為你收集整理的音视频技术开发周刊(第122期)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Zoe Liu:传统算法与深度学习各有所
- 下一篇: LiveVideoStackCon深圳-